A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-25 13:36:42 | — | Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s). |
| discovery_fetch_validation | failed | 2026-03-25 13:35:30 | 2026-03-25 13:36:42 | 1 min 11 s | Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s). |
| metadata_alt | completed | 2026-03-25 13:35:30 | 2026-03-25 13:36:41 | 1 min 11 s | — |
| reviews | completed | 2026-03-25 13:36:07 | 2026-03-25 13:36:42 | 34 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-25 13:36:42 | — | Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "1d887699-7beb-4ac4-b976-af829f47e82c",
"input_url": "https://aspermed.hu/",
"state_filename": "20260325_133529_aspermed_hu.json",
"created_at": "2026-03-25T13:35:29.833717",
"updated_at": "2026-03-25T13:36:42.349517",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-25T13:35:30.248564",
"completed_at": "2026-03-25T13:36:41.908381",
"result": {
"metadata": {
"company_name": "Asper-Med Kft.",
"description": "Asper-Med Kft. egy kiemelt magánegészségügyi szakellátó, amelynek mottója: „Központban az egészség – a prevenciótól a gyógyításig”. Az intézményt Dr. Rokszin Tibor érsebész álma alapján hozták létre, és 2023 novemberében vált valóra. Rendelőjükben hangsúlyt fektetnek a prevencióra, korszerű diagnosztikára és magas szintű szakmai ellátásra. Több szakterületen működő orvosokkal, empatikus betegellátással és folyamatosan bővülő szolgáltatáskínálattal várják a pácienseket. A honlap információi alapján céljuk, hogy a páciensek már az első kapcsolatfelvételtől biztonságban és megértésben részesüljenek.",
"arlista_url": "N/A",
"varos": "Gyula",
"iranyitoszam": "5700",
"utca": "Harruckern tér 3-4.",
"telefonszam": "+36 70 364 6167",
"email": "aspermedkft@gmail.com",
"website": "https://aspermed.hu/"
},
"llm_usage": {
"prompt_tokens": 1284,
"completion_tokens": 936,
"total_tokens": 2220,
"cost": 0.002193
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-25T13:35:30.356304",
"completed_at": "2026-03-25T13:36:42.133569",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-25T13:36:07.178970",
"completed_at": "2026-03-25T13:36:42.024107",
"result": {
"reviews": {
"company_name": "Asper-Med Kft.",
"total_reviews": 1,
"average_rating": 5,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "",
"city": "",
"street": "",
"phone": ""
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-25T13:36:42.241463",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-25T13:36:42.349503",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 1d887699-7beb-4ac4-b976-af829f47e82c_*.log, CLI: pipeline_1d887699_*.log).
data/logs/1d887699-7beb-4ac4-b976-af829f47e82c_20260325_133530.log
2026-03-25 13:35:30 | INFO | Starting discovery-fetch-validation (async) for URL: https://aspermed.hu/ 2026-03-25 13:35:30 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-25 13:35:30 | INFO | Async crawl starting: https://aspermed.hu/ (max_depth=2, max_concurrent=10) 2026-03-25 13:35:30 | INFO | Crawled (depth 0): https://aspermed.hu/ 2026-03-25 13:35:31 | INFO | Crawled (depth 1): https://aspermed.hu/nogyogyaszati-rendeles 2026-03-25 13:35:31 | INFO | Crawled (depth 1): https://aspermed.hu/ersebeszet 2026-03-25 13:35:31 | INFO | Crawled (depth 1): https://aspermed.hu/aneszteziologia 2026-03-25 13:35:31 | INFO | Crawled (depth 1): https://aspermed.hu/labor 2026-03-25 13:35:32 | INFO | Crawled (depth 1): https://aspermed.hu/ful-orr-gegeszet 2026-03-25 13:35:32 | INFO | Crawled (depth 1): https://aspermed.hu/sebeszet 2026-03-25 13:35:32 | INFO | Crawled (depth 1): https://aspermed.hu/radiologia 2026-03-25 13:35:32 | INFO | Crawl finished: 8 URLs in 1.7s (success=8, errors=0) 2026-03-25 13:35:36 | INFO | Crawl produced 3 URLs from BERT (threshold and above), fetching all 2026-03-25 13:35:36 | INFO | [URL 1/3] Fetching (BERT prob=1.00): https://aspermed.hu/ersebeszet 2026-03-25 13:35:36 | WARNING | [URL 1/3] Failed to fetch 2026-03-25 13:35:36 | INFO | [URL 2/3] Fetching (BERT prob=1.00): https://aspermed.hu/radiologia 2026-03-25 13:35:36 | WARNING | [URL 2/3] Failed to fetch 2026-03-25 13:35:36 | INFO | [URL 3/3] Fetching (BERT prob=1.00): https://aspermed.hu/sebeszet 2026-03-25 13:35:37 | WARNING | [URL 3/3] Failed to fetch 2026-03-25 13:35:37 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 3 URL(s). 2026-03-25 13:35:37 | INFO | Attempting fallback: original URL with trafilatura+markdown