A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-22 16:13:29 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-22 16:12:16 | 2026-03-22 16:13:29 | 1 min 13 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-22 16:12:16 | 2026-03-22 16:13:29 | 1 min 12 s | — |
| reviews | completed | 2026-03-22 16:12:56 | 2026-03-22 16:13:29 | 32 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-22 16:13:29 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "c8615433-2094-422a-8ac5-4c3e7fdb6b6e",
"input_url": "https://www.vbek.hu/",
"state_filename": "20260322_161215_vbek_hu.json",
"created_at": "2026-03-22T16:12:15.776306",
"updated_at": "2026-03-22T16:13:29.477424",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-22T16:12:16.120545",
"completed_at": "2026-03-22T16:13:29.076229",
"result": {
"metadata": {
"company_name": "Váci Belvárosi Egészségközpont",
"description": "A Váci Belvárosi Egészségközpont egy váci egészségügyi szolgáltató, amelynek honlapja JavaScript engedélyezését kéri (a megjelenő szöveg: \"You need to enable JavaScript to run this app\"). A weboldalon elérhető oldalak között szerepel egy \"About us\" aloldal és orvosi/kapcsolati profilok (például Fűrész Anita és Laczkovszki Győző). A rendelkezésre álló források alapján a weboldal elsősorban az intézmény bemutatására és kapcsolattartásra szolgál. Pontos részletekért — például nyitvatartás, szolgáltatások, árazás és elérhetőségek — kérlek keresd fel a weboldalt közvetlenül, mivel a jelenlegi forrásokból ezek az adatok nem olvashatók ki.",
"arlista_url": "N/A",
"varos": "Vác",
"iranyitoszam": "2600",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://www.vbek.hu/"
},
"llm_usage": {
"prompt_tokens": 754,
"completion_tokens": 1149,
"total_tokens": 1903,
"cost": 0.0024865
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-22T16:12:16.215796",
"completed_at": "2026-03-22T16:13:29.284029",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-22T16:12:56.809852",
"completed_at": "2026-03-22T16:13:29.174212",
"result": {
"reviews": {
"company_name": "Váci Belvárosi Egészségközpont",
"total_reviews": 14,
"average_rating": 4.2,
"reviews": [
{
"author": "LG Lili",
"rating": 2,
"text": "A legutóbbi alkalommal nem sikerült levennie a nőnek a vérem. Fél órán keresztül keresgélte a vénám, nagyon fájt, már közel voltam az ájuláshoz. Adott másik időpontot soron kívül (hajnali 6 órára), amire nem jött el.",
"date": null
},
{
"author": "Ildikó Moravcsik",
"rating": 2,
"text": "Kardiológiai rendelésre járok, vagyis szeretnék menni, amennyiben nem mondanák le már a 4. időpontom 1 vagy 2 nappal a rendelést megelőzően. Sajnálatos, hogy 2 páciensért nem fárad be a doktornő, amikor jómagam és valószínű betegtársaim is szabadságot, home office-t \"áldoznak\" a nem ingyenesen igénybe vehető szolgáltatásra.\nViszont szeretném kiemelni Erika asszisztens végtelen kedvességét, aki saját szabadidejét és energiáját nem sajnálva fáradozik egy újabb időpont lefoglalása, esetleg holter felrakása érdekében. Manapság hatalmas kincs a hölgy hozzáállása és jómagam itt is köszönetemet fejezem ki részére!",
"date": null
},
{
"author": "P K M",
"rating": 4,
"text": "good",
"date": null
},
{
"author": "Alex Geht",
"rating": 1,
"text": "Very loud radio in the waiting room.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "2600",
"city": "Vác",
"street": "Zrínyi Miklós u. 3",
"phone": ""
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-22T16:13:29.381639",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-22T16:13:29.477408",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: c8615433-2094-422a-8ac5-4c3e7fdb6b6e_*.log, CLI: pipeline_c8615433_*.log).
data/logs/c8615433-2094-422a-8ac5-4c3e7fdb6b6e_20260322_161216.log
2026-03-22 16:12:16 | INFO | Starting discovery-fetch-validation (async) for URL: https://www.vbek.hu/ 2026-03-22 16:12:16 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-22 16:12:16 | INFO | Async crawl starting: https://www.vbek.hu/ (max_depth=2, max_concurrent=10) 2026-03-22 16:12:16 | INFO | Crawled (depth 0): https://www.vbek.hu/ 2026-03-22 16:12:16 | INFO | Crawl finished: 1 URLs in 0.1s (success=1, errors=0) 2026-03-22 16:12:17 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-22 16:12:17 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-22 16:12:17 | INFO | Attempting fallback: original URL with trafilatura+markdown