A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-24 10:34:53 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-24 10:33:51 | 2026-03-24 10:34:53 | 1 min 2 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-24 10:33:50 | 2026-03-24 10:34:53 | 1 min 2 s | — |
| reviews | completed | 2026-03-24 10:34:24 | 2026-03-24 10:34:53 | 28 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-24 10:34:54 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "bdf2c896-610a-4f1c-9f84-363cd2f918a8",
"input_url": "https://ivanmedical.hu/",
"state_filename": "20260324_103350_ivanmedical_hu.json",
"created_at": "2026-03-24T10:33:50.464866",
"updated_at": "2026-03-24T10:34:54.281607",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-24T10:33:50.883613",
"completed_at": "2026-03-24T10:34:53.331844",
"result": {
"metadata": {
"company_name": "Iván Medical",
"description": "Az Iván Medical (Iván Medical Center / Iván Implantológia Fogászati Központ) Zalaegerszegen működő magán egészségügyi központ, amely implantológiai és fogászati szolgáltatásokra, valamint rehabilitációs és általános orvosi ellátásra specializálódott. Intézményünk hangsúlyt helyez a személyre szabott figyelemre és a magas szakmai színvonalra — a honlap szerint Dr. Iván Gyula implantológus 25 éves tapasztalattal fogad pácienseket, akár komplex, nehéz implantológiai esetekre is, azonnali fogpótlás lehetőségével csontpótlás nélkül. Modern rendelői környezetet és segítőkész asszisztenciát kínálunk, valamint online időpontfoglalási lehetőséget a gyors betegirányításhoz. Célunk, hogy az egészség megőrzése legyen az általános állapot, és hogy pácienseink nyugodt, biztonságos környezetben kapjanak ellátást. Nyitvatartás: munkanapokon 08:00–20:00 (a honlapon megadott információk alapján).",
"arlista_url": "N/A",
"varos": "Zalaegerszeg",
"iranyitoszam": "8900",
"utca": "Göcseji út 12.",
"telefonszam": "+36309854366",
"email": "info@ivanmedical.hu",
"website": "https://ivanmedical.hu/"
},
"llm_usage": {
"prompt_tokens": 3615,
"completion_tokens": 1018,
"total_tokens": 4633,
"cost": 0.00293975
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-24T10:33:51.004816",
"completed_at": "2026-03-24T10:34:53.717431",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-24T10:34:24.870315",
"completed_at": "2026-03-24T10:34:53.533423",
"result": {
"reviews": {
"company_name": "Iván Medical",
"total_reviews": 3,
"average_rating": 5,
"reviews": [
{
"author": "G Ivan",
"rating": 5,
"text": "Ivan Medical\nFogorvosi és Magánorvosi centrum\n\nA modern külsőt és belsőt a legújabb orvosi eljárásokkal ötvözi az egészség centrum , miközben középpontba helyezi az embert. Az itt nyújtott ellátás nemcsak korszerű és hatékony, hanem páciensbarát is: a legmodernebb technológia a személyes törődéssel és gondoskodással együtt biztosítja a biztonságot, a kényelmet és a bizalmat.",
"date": "2025-9-8"
},
{
"author": "Réka Kovács",
"rating": 5,
"text": "Invisalign fogszabalyozot hasznalok, amit Veszelovszky Rita doktorno keszitett. Nagyon modern technikaval szkenneltek be a fogam, es elkeszitettek a 20 hetes tervemet, amivel egy applikacio segitsegevel mar elore latom, milyen szep lesz a fogam a kezeles vegen.\nKorabban ket alkalommal is volt hagyomanyos fogszabalyozom, de ezt sokkal jobban szeretem. Nagyon kenyelmes, konnyu tisztitani, es rendkivul praktikus. Nem kell gyakran visszajarni allitasra, mert tobb hetre elore megkapom a sineket, megis nagyon szepen es hatekonyan szabalyozza a fogam. Mindenkinek szivbol ajanlom. Az uj rendelojuk pedig gyonyoru.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8900",
"city": "Zalaegerszeg",
"street": "Göcseji út 12",
"phone": "06 30 985 4366"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:34:53.921921",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-24T10:34:54.281593",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: bdf2c896-610a-4f1c-9f84-363cd2f918a8_*.log, CLI: pipeline_bdf2c896_*.log).
data/logs/bdf2c896-610a-4f1c-9f84-363cd2f918a8_20260324_103351.log
2026-03-24 10:33:51 | INFO | Starting discovery-fetch-validation (async) for URL: https://ivanmedical.hu/ 2026-03-24 10:33:51 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-24 10:33:51 | INFO | Async crawl starting: https://ivanmedical.hu/ (max_depth=2, max_concurrent=10) 2026-03-24 10:33:51 | INFO | Crawled (depth 0): https://ivanmedical.hu/ 2026-03-24 10:33:51 | INFO | Crawl finished: 2 URLs in 0.7s (success=1, errors=0) 2026-03-24 10:33:53 | INFO | Crawl produced 0 URLs from BERT (threshold and above), fetching all 2026-03-24 10:33:53 | ERROR | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). 2026-03-24 10:33:53 | INFO | Attempting fallback: original URL with trafilatura+markdown