A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-21 07:27:26 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-21 07:25:57 | 2026-03-21 07:27:26 | 1 min 29 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-21 07:25:57 | 2026-03-21 07:27:26 | 1 min 29 s | — |
| reviews | completed | 2026-03-21 07:26:38 | 2026-03-21 07:27:26 | 48 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-21 07:27:26 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "0b25aec0-f9e2-4e5b-a0de-0506c0df0231",
"input_url": "http://www.szentkinga.hu/",
"state_filename": "20260321_072557_szentkinga_hu.json",
"created_at": "2026-03-21T07:25:57.303096",
"updated_at": "2026-03-21T07:27:26.550874",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-21T07:25:57.412024",
"completed_at": "2026-03-21T07:27:26.500206",
"result": {
"metadata": {
"company_name": "Szent Kinga Reumatológiai, Fizioterápiás és Rehabilitációs Járóbeteg Ellátó Gyógyintézet",
"description": "A Szent Kinga Reumatológiai, Fizioterápiás és Rehabilitációs Járóbeteg Ellátó Gyógyintézet mozgásszervi betegek kezelésére specializálódott intézmény. Kezeléseik kiterjednek reumás ízületi bántalmakra, porckorongsérvre, kopásos ízületi elváltozásokra, gerincferdülésre és csontritkulás okozta panaszokra, továbbá bénulásos, sérült és műtött betegek, amputáltak utókezelésére és orvosi rehabilitációra. Honlapjukon felhívják a figyelmet új, térítési díj köteles diagnosztikai szolgáltatásukra, az osteodenzitometriára (csontsűrűség mérés), amely időpont-egyeztetéssel beutaló nélkül igénybe vehető. Szakrendeléseik szakorvosai és fizioterapeutái háziorvosi vagy szakorvosi beutalás esetén térítésmentesen állnak rendelkezésre telefonon vagy személyesen előzetesen egyeztetett időpontban. A kezelések jól felszerelt terápiás egységekben, várólista nélkül, képzett gyógytornászokkal és gyógymasszőr fizioterapeutákkal, egyénre szabott módszerekkel és széles nyitvatartással érhetők el. \"Térjen be hozzánk egészsége megőrzése érdekében!\"",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "http://www.szentkinga.hu/"
},
"llm_usage": {
"prompt_tokens": 1103,
"completion_tokens": 1065,
"total_tokens": 2168,
"cost": 0.00240575
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-21T07:25:57.420539",
"completed_at": "2026-03-21T07:27:26.530576",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-21T07:26:38.358625",
"completed_at": "2026-03-21T07:27:26.516207",
"result": {
"reviews": {
"company_name": "Szent Kinga Reumatológiai, Fizioterápiás és Rehabilitációs Járóbeteg Ellátó Gyógyintézet",
"total_reviews": 12,
"average_rating": 4,
"reviews": [
{
"author": "Róbert Süpek",
"rating": 5,
"text": "Kedves, és segítőkész személyzet!",
"date": null
},
{
"author": "Sándor Tóth",
"rating": 5,
"text": "Csak jót mondhatok!",
"date": null
},
{
"author": "János Pongrácz",
"rating": 5,
"text": "Szinvonalas",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8500",
"city": "Pápa",
"street": "Bástya u. 11a",
"phone": "(06 89) 315 539"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T07:27:26.541409",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-21T07:27:26.550857",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 0b25aec0-f9e2-4e5b-a0de-0506c0df0231_*.log, CLI: pipeline_0b25aec0_*.log).
data/logs/0b25aec0-f9e2-4e5b-a0de-0506c0df0231_20260321_072557.log
2026-03-21 07:25:57 | INFO | Starting discovery-fetch-validation (async) for URL: http://www.szentkinga.hu/ 2026-03-21 07:25:57 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-21 07:25:57 | INFO | Async crawl starting: http://www.szentkinga.hu/ (max_depth=2, max_concurrent=10) 2026-03-21 07:25:57 | INFO | Crawled (depth 0): http://www.szentkinga.hu/ 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/csapatunk.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/index.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/bemutatkzas.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/kuldetes.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/ceginfo.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/nevadonkrol.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/legujabb_fejleszteseink.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/munkahely_bovites.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/amire_buszkek.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/nyertes_palyazataink.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/elerhetoseg.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/betegelojegyzes.html 2026-03-21 07:25:57 | INFO | Crawled (depth 2): http://www.szentkinga.hu/dr_csala_valeria.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/kepgaleria.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/csontsuruseg_meres.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/gyakornoki_program.html 2026-03-21 07:25:57 | INFO | Crawled (depth 2): http://www.szentkinga.hu/szakal_sandor.html 2026-03-21 07:25:57 | INFO | Crawled (depth 1): http://www.szentkinga.hu/szolgaltatas.html 2026-03-21 07:25:57 | INFO | Crawl finished: 22 URLs in 0.4s (success=19, errors=3) 2026-03-21 07:26:11 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-21 07:26:11 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-21 07:26:11 | INFO | Attempting fallback: original URL with trafilatura+markdown