A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-24 10:40:55 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-24 10:37:11 | 2026-03-24 10:40:55 | 3 min 43 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-24 10:37:11 | 2026-03-24 10:40:54 | 3 min 43 s | — |
| reviews | completed | 2026-03-24 10:37:52 | 2026-03-24 10:40:55 | 3 min 2 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-24 10:40:55 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "e1120aab-f101-4deb-8723-ed355dce5911",
"input_url": "https://medibit.hu/",
"state_filename": "20260324_103711_medibit_hu.json",
"created_at": "2026-03-24T10:37:11.296310",
"updated_at": "2026-03-24T10:40:55.556725",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-24T10:37:11.833342",
"completed_at": "2026-03-24T10:40:54.923289",
"result": {
"metadata": {
"company_name": "Medibit 2003 Kft.",
"description": "2003-ban alapított foglalkozás-egészségügyi szolgáltató. Szakterületük a foglalkozás-egészségügyi alapszolgáltatások és szakrendelési tevékenységek működtetése, továbbá magánorvosi szakrendelések. Vezető orvosuk dr. Flórián Csaba (háziorvostan és foglalkozás-egészségügy szakorvosa), ügyvezető igazgató, valamint dr. Csonka Judit (foglalkozás-egészségügy szakorvosa). A rendelő előzetes bejelentkezés alapján fogad pácienseket (vonali telefonszám említve, de a konkrét szám nincs megadva). Az oldal tulajdonosa: Medibit 2003 Kft.; a weboldalt a Kreator készítette. Minden jog fenntartva.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "10000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://medibit.hu/"
},
"llm_usage": {
"prompt_tokens": 785,
"completion_tokens": 907,
"total_tokens": 1692,
"cost": 0.00201025
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-24T10:37:11.992446",
"completed_at": "2026-03-24T10:40:55.242010",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-24T10:37:52.140792",
"completed_at": "2026-03-24T10:40:55.081305",
"result": {
"reviews": {
"company_name": "Medibit 2003 Kft.",
"total_reviews": 0,
"average_rating": null,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "1221",
"city": "Budapest",
"street": "Korompai út 21",
"phone": "06 30 950 5741"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:40:55.401385",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:40:55.556711",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: e1120aab-f101-4deb-8723-ed355dce5911_*.log, CLI: pipeline_e1120aab_*.log).
data/logs/e1120aab-f101-4deb-8723-ed355dce5911_20260324_103712.log
2026-03-24 10:37:12 | INFO | Starting discovery-fetch-validation (async) for URL: https://medibit.hu/ 2026-03-24 10:37:12 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-24 10:37:12 | INFO | Async crawl starting: https://medibit.hu/ (max_depth=2, max_concurrent=10) 2026-03-24 10:37:12 | INFO | Crawled (depth 0): https://medibit.hu/ 2026-03-24 10:37:12 | INFO | Crawl finished: 1 URLs in 0.1s (success=1, errors=0) 2026-03-24 10:37:13 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-24 10:37:13 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-24 10:37:13 | INFO | Attempting fallback: original URL with trafilatura+markdown