A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-21 11:54:58 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-21 11:43:55 | 2026-03-21 11:54:57 | 11 min 2 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-21 11:43:55 | 2026-03-21 11:54:56 | 11 min 1 s | — |
| reviews | completed | 2026-03-21 11:44:35 | 2026-03-21 11:54:57 | 10 min 21 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-21 11:54:58 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "08c46840-3d77-4d7a-a93e-a8c9fac67e50",
"input_url": "http://www.csmmedical.hu/",
"state_filename": "20260321_114355_csmmedical_hu.json",
"created_at": "2026-03-21T11:43:55.106122",
"updated_at": "2026-03-21T11:54:58.996672",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-21T11:43:55.466889",
"completed_at": "2026-03-21T11:54:56.859510",
"result": {
"metadata": {
"company_name": "CSM Medical",
"description": "A CSM Medical szakértelmet és megbízhatóságot kínál a orvosi műszerek és berendezések területén, több mint három évtizedes tapasztalattal. Weboldaluk termékpalettáján olyan készülékek szerepelnek, mint az arteriográf, lézerrendszerek és centrifugák, továbbá kifejezetten háziorvosoknak szóló megoldásokat is kínálnak. Az oldalon elérhető menüpontok között megtalálhatóak a Termékek, Háziorvosoknak, Ajánlatkérés és Rólunk szekciók, valamint információk a kapcsolatfelvételi lehetőségekről és dokumentumokról. A CSM Medical hangsúlyt fektet a gyors ajánlatkérésre és a partnerekkel való közvetlen együttműködésre. A kommunikációs stílus és a honlap tartalma professzionális, célja a megbízható műszerek és szolgáltatások bemutatása az egészségügyi szakemberek számára.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "00000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "http://www.csmmedical.hu/"
},
"llm_usage": {
"prompt_tokens": 48467,
"completion_tokens": 842,
"total_tokens": 49309,
"cost": 0.01380075
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-21T11:43:55.684519",
"completed_at": "2026-03-21T11:54:57.986439",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-21T11:44:35.605645",
"completed_at": "2026-03-21T11:54:57.558351",
"result": {
"reviews": {
"company_name": "CSM Medical",
"total_reviews": 0,
"reviews": [],
"phone": null,
"error": "Command '['/usr/local/bin/google-maps-scraper', '-input', '/tmp/tmpi3vxjzlv', '-results', '/tmp/tmpj3zmnsaf', '-json', '-extra-reviews', '-lang', 'hu', '-geo', '47.4979,19.0402', '-exit-on-inactivity', '2m']' timed out after 200 seconds"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T11:54:58.440565",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T11:54:58.996625",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 08c46840-3d77-4d7a-a93e-a8c9fac67e50_*.log, CLI: pipeline_08c46840_*.log).
data/logs/08c46840-3d77-4d7a-a93e-a8c9fac67e50_20260321_114355.log
2026-03-21 11:43:55 | INFO | Starting discovery-fetch-validation (async) for URL: http://www.csmmedical.hu/ 2026-03-21 11:43:55 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-21 11:43:55 | INFO | Async crawl starting: http://www.csmmedical.hu/ (max_depth=2, max_concurrent=10) 2026-03-21 11:43:56 | INFO | Crawled (depth 0): http://www.csmmedical.hu/ 2026-03-21 11:43:56 | INFO | Crawled (depth 1): http://www.csmmedical.hu/index.html 2026-03-21 11:43:56 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page3.html 2026-03-21 11:43:56 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page1.html 2026-03-21 11:43:56 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page4.html 2026-03-21 11:43:56 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page5.html 2026-03-21 11:43:56 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page10.html 2026-03-21 11:43:56 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page6.html 2026-03-21 11:43:56 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page7.html 2026-03-21 11:43:56 | INFO | Crawled (depth 2): http://www.csmmedical.hu/page8.html 2026-03-21 11:43:57 | INFO | Crawled (depth 1): http://www.csmmedical.hu/page2.html 2026-03-21 11:43:57 | INFO | Crawl finished: 11 URLs in 1.6s (success=11, errors=0) 2026-03-21 11:43:59 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-21 11:43:59 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-21 11:43:59 | INFO | Attempting fallback: original URL with trafilatura+markdown