A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-29 10:44:41 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-29 10:43:41 | 2026-03-29 10:44:41 | 1 min | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 10:43:41 | 2026-03-29 10:44:41 | 59 s | — |
| reviews | completed | 2026-03-29 10:44:20 | 2026-03-29 10:44:41 | 20 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-29 10:44:42 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "44edee18-3bea-4111-8dd2-b609c1f944ca",
"input_url": "https://ivanmedical.hu/",
"state_filename": "20260329_104340_ivanmedical_hu.json",
"created_at": "2026-03-29T10:43:40.488618",
"updated_at": "2026-03-29T10:44:42.285306",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T10:43:41.235389",
"completed_at": "2026-03-29T10:44:41.034559",
"result": {
"metadata": {
"company_name": "Iván Medical",
"description": "Az Iván Medical (Iván Implantológia Fogászati Központ) Zalaegerszegen működő magánrendelő, amely implantológiai és fogászati szolgáltatásokra, valamint általános gyógyászati és rehabilitációs ellátásra specializálódott. Intézményükben személyre szabott figyelemmel, szakértelemmel és gondoskodással fogadják a pácienseket, kiemelve az egészség megőrzését mint alapértéket. Dr. Iván Gyula implantológus 25 éves tapasztalattal vállal komplex, nehéz implantológiai eseteket, akár azonnali fogpótlással csontpótlás nélkül. A rendelő modern környezetet, nyugodt légkört és figyelmes asszisztenciát biztosít a páciensek kényelme érdekében. Nyitvatartásuk munkanapokon 08:00–20:00 között, és könnyített időpontfoglalási lehetőséget kínálnak online.",
"arlista_url": "N/A",
"varos": "Zalaegerszeg",
"iranyitoszam": "8900",
"utca": "Göcseji út 12.",
"telefonszam": "+36 30 985 4366",
"email": "info@ivanmedical.hu",
"website": "https://ivanmedical.hu/"
},
"llm_usage": {
"prompt_tokens": 3650,
"completion_tokens": 891,
"total_tokens": 4541,
"cost": 0.0022913
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T10:43:41.435641",
"completed_at": "2026-03-29T10:44:41.528817",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T10:44:20.516451",
"completed_at": "2026-03-29T10:44:41.264665",
"result": {
"reviews": {
"company_name": "Iván Medical",
"total_reviews": 4,
"average_rating": 5,
"reviews": [
{
"author": "G Ivan",
"rating": 5,
"text": "Ivan Medical\nFogorvosi és Magánorvosi centrum\n\nA modern külsőt és belsőt a legújabb orvosi eljárásokkal ötvözi az egészség centrum , miközben középpontba helyezi az embert. Az itt nyújtott ellátás nemcsak korszerű és hatékony, hanem páciensbarát is: a legmodernebb technológia a személyes törődéssel és gondoskodással együtt biztosítja a biztonságot, a kényelmet és a bizalmat.",
"date": "2025-9-8"
},
{
"author": "Réka Kovács",
"rating": 5,
"text": "Invisalign fogszabalyozot hasznalok, amit Veszelovszky Rita doktorno keszitett. Nagyon modern technikaval szkenneltek be a fogam, es elkeszitettek a 20 hetes tervemet, amivel egy applikacio segitsegevel mar elore latom, milyen szep lesz a fogam a kezeles vegen.\nKorabban ket alkalommal is volt hagyomanyos fogszabalyozom, de ezt sokkal jobban szeretem. Nagyon kenyelmes, konnyu tisztitani, es rendkivul praktikus. Nem kell gyakran visszajarni allitasra, mert tobb hetre elore megkapom a sineket, megis nagyon szepen es hatekonyan szabalyozza a fogam. Mindenkinek szivbol ajanlom. Az uj rendelojuk pedig gyonyoru.",
"date": null
},
{
"author": "Katalin Bagladi",
"rating": 5,
"text": "Hosszú és nem egyszerű kezelésen vagyok túl, de a Professzor Úr és a csapata végig rendkívül türelmesek, kedvesek és profik voltak. Az implantáció eredménye tökéletes lett, minden várakozásomat felülmúlta. Csak ajánlani tudom őket – hálás köszönet!",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8900",
"city": "Zalaegerszeg",
"street": "Göcseji út 12",
"phone": "06 30 985 4366"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T10:44:41.902338",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T10:44:42.285279",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 44edee18-3bea-4111-8dd2-b609c1f944ca_*.log, CLI: pipeline_44edee18_*.log).
data/logs/44edee18-3bea-4111-8dd2-b609c1f944ca_20260329_104341.log
2026-03-29 10:43:41 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 44edee18-3bea-4111-8dd2-b609c1f944ca for URL: https://ivanmedical.hu/
2026-03-29 10:43:41 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://ivanmedical.hu/
2026-03-29 10:43:41 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:43:41 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://ivanmedical.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:43:41 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:43:41 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://ivanmedical.hu/
2026-03-29 10:43:41 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://ivanmedical.hu/
2026-03-29 10:43:42 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://ivanmedical.hu/
2026-03-29 10:43:42 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 0.7s (success=1, errors=0)
2026-03-29 10:43:42 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 1026 characters from main URL
2026-03-29 10:43:42 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:43:42 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'ivanmedical.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:43:43 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 10:43:43 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 10:43:43 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 5 results
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | Result 1: Időpontfoglalás / Iván Medical Center - https://www.ivanmedical.hu/fogaszat/informaciok/idopontfoglalas
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | Result 2: Kapcsolat / Iván Medical Center - https://www.ivanmedical.hu/fogaszat/informaciok/kapcsolat
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | Result 3: Üdvözlöm az Iván Implantológia Fogászati Központ honlapján! / Iván ... - https://www.ivanmedical.hu/
2026-03-29 10:44:09 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.ivanmedical.hu/fogaszat/informaciok/idopontfoglalas
2026-03-29 10:44:10 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1902 characters from contact page 1
2026-03-29 10:44:10 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.ivanmedical.hu/fogaszat/informaciok/kapcsolat
2026-03-29 10:44:10 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1969 characters from contact page 2
2026-03-29 10:44:10 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://www.ivanmedical.hu/
2026-03-29 10:44:11 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 3433 characters from contact page 3
2026-03-29 10:44:11 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:44:20 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Iván Medical
2026-03-29 10:44:20 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:44:20 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:44:20 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Iván Medical, varos=Zalaegerszeg
2026-03-29 10:44:20 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmpbdlg58y3
2026-03-29 10:44:20 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmpmcvw71gx
2026-03-29 10:44:20 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:44:40 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:44:40 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_104440_iván_medical_url_input.txt
2026-03-29 10:44:40 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_104440_iván_medical_url_output.json
2026-03-29 10:44:40 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 3 reviews
2026-03-29 10:44:41 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:44:41 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).