A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-21 11:56:10 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-21 11:44:26 | 2026-03-21 11:56:05 | 11 min 39 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-21 11:44:26 | 2026-03-21 11:55:55 | 11 min 29 s | — |
| reviews | completed | 2026-03-21 11:45:36 | 2026-03-21 11:55:58 | 10 min 22 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-21 11:56:14 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "7096e622-6b1f-432b-b54c-5271d6d29efc",
"input_url": "http://www.csmmedical.hu/",
"state_filename": "20260321_114425_csmmedical_hu.json",
"created_at": "2026-03-21T11:44:25.833043",
"updated_at": "2026-03-21T11:56:14.895667",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-21T11:44:26.038456",
"completed_at": "2026-03-21T11:55:55.995711",
"result": {
"metadata": {
"company_name": "CSM Medical",
"description": "A CSM Medical három évtizedes tapasztalattal kínál orvostechnikai megoldásokat, elsősorban háziorvosok és egészségügyi szolgáltatók részére. Weboldalán termékekről (pl. arteriográf, lézer, centrifuga) és a szolgáltatásokhoz kapcsolódó műszaki információkról tájékozódhatnak az érdeklődők. A cég hangsúlyozza a szakértelmet és megbízhatóságot, valamint lehetőséget biztosít egyedi ajánlatkérésekre. A honlap külön menüpontot tart fenn háziorvosoknak szóló ajánlatoknak és a „Rólunk” résznek, ahol a vállalat háttere ismerteti. Termékkatalógus és részletes műszaki leírások PDF formátumban elérhetők, amelyeken keresztül a termékekhez tartozó további információk megtalálhatók.",
"arlista_url": "http://www.csmmedical.hu/assets/files/katal%C3%B3gus2019_email.pdf",
"varos": "N/A",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "http://www.csmmedical.hu/"
},
"llm_usage": {
"prompt_tokens": 48979,
"completion_tokens": 1067,
"total_tokens": 50046,
"cost": 0.01437875
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-21T11:44:26.086818",
"completed_at": "2026-03-21T11:56:05.139917",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-21T11:45:36.317809",
"completed_at": "2026-03-21T11:55:58.557810",
"result": {
"reviews": {
"company_name": "CSM Medical",
"total_reviews": 0,
"reviews": [],
"phone": null,
"error": "Command '['/usr/local/bin/google-maps-scraper', '-input', '/tmp/tmpka4twunq', '-results', '/tmp/tmpqg1gz5j0', '-json', '-extra-reviews', '-lang', 'hu', '-geo', '47.4979,19.0402', '-exit-on-inactivity', '2m']' timed out after 200 seconds"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T11:56:10.858570",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T11:56:14.894041",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 7096e622-6b1f-432b-b54c-5271d6d29efc_*.log, CLI: pipeline_7096e622_*.log).
data/logs/7096e622-6b1f-432b-b54c-5271d6d29efc_20260321_114426.log
2026-03-21 11:44:26 | INFO | Starting discovery-fetch-validation (async) for URL: http://www.csmmedical.hu/ 2026-03-21 11:44:26 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-21 11:44:26 | INFO | Async crawl starting: http://www.csmmedical.hu/ (max_depth=2, max_concurrent=10) 2026-03-21 11:44:26 | INFO | Crawled (depth 0): http://www.csmmedical.hu/ 2026-03-21 11:44:26 | INFO | Crawled (depth 1): http://www.csmmedical.hu/index.html 2026-03-21 11:44:26 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page3.html 2026-03-21 11:44:26 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page6.html 2026-03-21 11:44:26 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page1.html 2026-03-21 11:44:26 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page4.html 2026-03-21 11:44:26 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page8.html 2026-03-21 11:44:26 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page10.html 2026-03-21 11:44:26 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page5.html 2026-03-21 11:44:26 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page2.html 2026-03-21 11:44:28 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page7.html 2026-03-21 11:44:28 | INFO | Crawl finished: 11 URLs in 1.9s (success=11, errors=0) 2026-03-21 11:44:29 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-21 11:44:29 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-21 11:44:29 | INFO | Attempting fallback: original URL with trafilatura+markdown