A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-24 10:17:16 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-24 10:16:08 | 2026-03-24 10:17:16 | 1 min 7 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-24 10:16:08 | 2026-03-24 10:17:15 | 1 min 7 s | — |
| reviews | completed | 2026-03-24 10:16:41 | 2026-03-24 10:17:16 | 34 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-24 10:17:16 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "ce333db0-ed78-4fcc-bae0-5fa1c633f064",
"input_url": "https://csillag-praxis.hu/",
"state_filename": "20260324_101607_csillag-praxis_hu.json",
"created_at": "2026-03-24T10:16:07.717765",
"updated_at": "2026-03-24T10:17:16.291859",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-24T10:16:08.042910",
"completed_at": "2026-03-24T10:17:15.909755",
"result": {
"metadata": {
"company_name": "Csillag Praxis",
"description": "A csillag-praxis.hu weboldal jelenleg felfüggesztett (Account Suspended) állapotban van. A főoldalon és a kapcsolati aloldalakon az \"Account Suspended\" üzenet jelenik meg, így a honlapon nem érhetők el szolgáltatási vagy intézményi információk. A felsorolt oldalak azt tanácsolják, hogy a további tájékoztatásért lépjen kapcsolatba a tárhelyszolgáltatóval. A weboldalon megadott kapcsolat az webmaster@csillag-praxis.hu e-mail cím, amelyet erre az ügyre célszerű használni. A jelen állapot miatt nincs elérhető részletes leírás a szolgáltatásokról, árakról, címről vagy telefonszámról. Amennyiben részletes információra van szüksége a praxisról, javasolt az említett e-mail címen érdeklődni vagy alternatív forrásokat keresni.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "webmaster@csillag-praxis.hu",
"website": "https://csillag-praxis.hu/"
},
"llm_usage": {
"prompt_tokens": 817,
"completion_tokens": 851,
"total_tokens": 1668,
"cost": 0.00190625
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-24T10:16:08.138794",
"completed_at": "2026-03-24T10:17:16.104686",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-24T10:16:41.643877",
"completed_at": "2026-03-24T10:17:16.003979",
"result": {
"reviews": {
"company_name": "Csillag Praxis",
"total_reviews": 55,
"average_rating": 4.5,
"reviews": [
{
"author": "Hermina Zsók",
"rating": 5,
"text": "Precíz ellátás,empátia,kedvesség,tiszta szép környezet,online időpont foglalás.Évek óta járok vissza UH-ra a doktornőhöz!Maximálisan elégedett vagyok!Kiváló szakember!\nNagyon hálás vagyok az Ő munkájáért!\nSzívből ajánlom mindenkinek!",
"date": null
},
{
"author": "Diána Egervölgyi",
"rating": 5,
"text": "Nagyon kedves és alapos orvos, mindent részletesen elmagyarázott. Nem kellett sokat várni, emberileg és szakmailag is maximálisan elégedett vagyok. Szívből ajánlom!",
"date": null
},
{
"author": "beatrix stampfel",
"rating": 5,
"text": "Nagyon kedves a főorvos asszony,már többször jártam nála,mindig pontos időben,nagyon kedvesen és segítőkészen fogadott,legközelebb is csak Őt választom,mindenkinek tiszta szívből csak ajánlani tudom!",
"date": null
},
{
"author": "Krisztina Dénesné Rosta",
"rating": 5,
"text": "Csak jót mondhatok a doktornőről! Évek óta hozzá járok! Megbízható, kedves, megnyugtató a vele való kommunikáció! Ajánlom mindenkinek!😊",
"date": null
},
{
"author": "Lajos Fuksz",
"rating": 5,
"text": "A feleségem nagyon megelégedett, és feldobobódott hangulatban érkezett haza a vizsgálat után, mert a főorvosnő kedvessége és szaktudása rabul ejtette. Ajánljuk mindenkinek!",
"date": null
},
{
"author": "Tamás Salamon",
"rating": 5,
"text": "Hosszú ideje ide járok! Doktornő alapos,megbízható,kedves. Modern diagnosztikai eszközzel magas szintű tudás párosul! Csak ajánlani tudom!",
"date": null
},
{
"author": "Gabriella Bázsa",
"rating": 5,
"text": "Doktornő kiváló szakember, hálás vagyok a precíz diagnózisért és az empátiáért. Ajánlom mindenkinek! Köszönöm szépen! ★★★★★",
"date": null
},
{
"author": "Mark Nemeth",
"rating": 5,
"text": "Csakis ide! Kedves alapos gyors! Egy beteg nem is kívánhatna jobbat👍🤩",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8360",
"city": "Keszthely",
"street": "Pál u. 36/b",
"phone": "(06 83) 315 257"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:17:16.195566",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:17:16.291846",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: ce333db0-ed78-4fcc-bae0-5fa1c633f064_*.log, CLI: pipeline_ce333db0_*.log).
data/logs/ce333db0-ed78-4fcc-bae0-5fa1c633f064_20260324_101608.log
2026-03-24 10:16:08 | INFO | Starting discovery-fetch-validation (async) for URL: https://csillag-praxis.hu/ 2026-03-24 10:16:08 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-24 10:16:08 | INFO | Async crawl starting: https://csillag-praxis.hu/ (max_depth=2, max_concurrent=10) 2026-03-24 10:16:08 | INFO | Crawled (depth 0): https://csillag-praxis.hu/ 2026-03-24 10:16:08 | INFO | Crawl finished: 2 URLs in 0.2s (success=1, errors=0) 2026-03-24 10:16:09 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-24 10:16:09 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-24 10:16:09 | INFO | Attempting fallback: original URL with trafilatura+markdown