A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-20 18:43:15 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-20 18:39:29 | 2026-03-20 18:43:15 | 3 min 45 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-20 18:39:29 | 2026-03-20 18:43:15 | 3 min 45 s | — |
| reviews | completed | 2026-03-20 18:40:10 | 2026-03-20 18:43:15 | 3 min 4 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-20 18:43:15 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "2ac0202e-52c1-4105-a15b-8b7fd371e6b2",
"input_url": "http://medprevent.hu/",
"state_filename": "20260320_183929_medprevent_hu.json",
"created_at": "2026-03-20T18:39:29.120182",
"updated_at": "2026-03-20T18:43:15.246194",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-20T18:39:29.299241",
"completed_at": "2026-03-20T18:43:15.067487",
"result": {
"metadata": {
"company_name": "MedPrevent",
"description": "Cégünk foglalkozás-egészségügyi főtevékenységét több évtizedes gyakorlattal rendelkező üzemi szakorvosok látják el. Orvosaink az üzemorvosi szakképesítésen kívül belgyógyász, háziorvos és szülész-nőgyógyász szakvizsgával is rendelkeznek. Szolgáltatásaink között megtalálható a tűz- és munkavédelemhez kapcsolódó átfogó tanácsadás és ellátás. Biztosítjuk a gépjármű-vezetői engedélyhez szükséges egészségügyi alkalmassági vizsgálatokat és az ehhez kapcsolódó orvosi igazolás kiállítását. Honlapunkon elérhető információk alapján a célunk, hogy a munkavállalók egészségét és a munkahelyi biztonságot szakmailag megalapozott módon segítsük.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "http://medprevent.hu/"
},
"llm_usage": {
"prompt_tokens": 780,
"completion_tokens": 825,
"total_tokens": 1605,
"cost": 0.001845
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-20T18:39:29.343845",
"completed_at": "2026-03-20T18:43:15.157360",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-20T18:40:10.573863",
"completed_at": "2026-03-20T18:43:15.110278",
"result": {
"reviews": {
"company_name": "MedPrevent",
"total_reviews": 46,
"average_rating": 4.9,
"reviews": [
{
"author": "Manc Asztalos",
"rating": 5,
"text": "Nagyon kedves a Doktornő és az asszisztens hölgy is! Mostmár elég régóta vidékről járok hozzá, de semmiért sem keresnék más orvost! Legjobb! Úgyhogy nálam a 10 pont is kevés! 😊",
"date": null
},
{
"author": "Ádám Boros",
"rating": 5,
"text": "Már egy ideje elköltöztema közelből ,de még így sem váltanék orvost semmi pénzért!A legjobb",
"date": null
},
{
"author": "L. Ildikó",
"rating": 5,
"text": "Ha lehetne hat csillagot adni, akkor annyit adnék. Szuperül berendezett váró (légtisztító, ivóvíz kút, tiszta mellékhelyiség), nagyon figyelnek arra, hogy a betegek a várakozás alatt a lehető legkellemesebben érezzék magukat. Doktornő és asszisztense egyaránt rendkívül segítőkész és nagy szakértelmű, igazi dream team az ő duójuk. Flottul dolgoznak össze, és mindig jó náluk a hangulat. A doktornő körültekintően vizsgál, ismeri a páciensek kórtörténetét, nem futószalagon gyógyít. Éppen ezért a várakozási idő nem rövid, de az alapos vizsgálatért ezt megéri beválllani.",
"date": null
},
{
"author": "Emese Sztelek",
"rating": 5,
"text": "Háziorvosi, üzemorvosi rendelő, van pszichológus (30/271-6282), gyógytornász(, dietetikus, masszőr. Igazán kitűnő szakemberek!!! (Utóbbiakhoz előre bejelentkezés szükséges!)",
"date": null
},
{
"author": "Bianka Németh",
"rating": 5,
"text": "A doktornő egy tündér,mindig segít mindenben,telefonon elérhető rendelési időben és az email-re is válaszol pár órán felül.",
"date": null
},
{
"author": "Ica Török",
"rating": 5,
"text": "Kulturált nagyon tiszta váró.A dr- nő és aszisztense rendkívül kedves,alapos,segítőkész.",
"date": null
},
{
"author": "Zsolt Mező",
"rating": 5,
"text": "Lelkiismeretes, alapos orvos és asszisztens. A laborvizsgálatot is megcsinálják. Masszázs lehetőség.",
"date": null
},
{
"author": "Noémi Vass-Kromek",
"rating": 5,
"text": "A doktornő és a nővérek mind kedvesek, empatikusak. Mindenféle problémára van legalább javaslatuk!",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "1103",
"city": "Budapest",
"street": "Gyömrői út 108-126",
"phone": "(06 1) 265 1137"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-20T18:43:15.200947",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-20T18:43:15.246181",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 2ac0202e-52c1-4105-a15b-8b7fd371e6b2_*.log, CLI: pipeline_2ac0202e_*.log).
data/logs/2ac0202e-52c1-4105-a15b-8b7fd371e6b2_20260320_183929.log
2026-03-20 18:39:29 | INFO | Starting discovery-fetch-validation (async) for URL: http://medprevent.hu/ 2026-03-20 18:39:29 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-20 18:39:29 | INFO | Async crawl starting: http://medprevent.hu/ (max_depth=2, max_concurrent=10) 2026-03-20 18:39:29 | INFO | Crawled (depth 0): http://medprevent.hu/ 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/foglalkozas-egeszsegugy 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/szolgaltatasok 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/referenciak 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/ajanlatkeres 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/orvosaink 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/elerhetosegek 2026-03-20 18:39:29 | INFO | Crawled (depth 1): http://medprevent.hu/rendeles 2026-03-20 18:39:30 | INFO | Crawl finished: 12 URLs in 0.7s (success=8, errors=0) 2026-03-20 18:39:32 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-20 18:39:32 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-20 18:39:32 | INFO | Attempting fallback: original URL with trafilatura+markdown