A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-29 18:01:19 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-29 17:59:46 | 2026-03-29 18:01:18 | 1 min 32 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 17:59:46 | 2026-03-29 18:01:18 | 1 min 32 s | — |
| reviews | completed | 2026-03-29 18:00:43 | 2026-03-29 18:01:18 | 35 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-29 18:01:19 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "3987a293-bacd-4780-bc3f-1aaf0f97c3ff",
"input_url": "https://www.macroklinika.hu/",
"state_filename": "20260329_175945_macroklinika_hu.json",
"created_at": "2026-03-29T17:59:45.254791",
"updated_at": "2026-03-29T18:01:19.446606",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T17:59:46.309409",
"completed_at": "2026-03-29T18:01:18.415094",
"result": {
"metadata": {
"company_name": "MacroKlinika",
"description": "MacroKlinika egy miskolci magán egészségügyi szolgáltató, amely a honlapon elérhető információk szerint különös figyelmet fordít a gyermekvizsgálatokra és a családbarát ellátásra. A kapcsolatfelvételi oldalon szerepel a felhívás: \"Lépjen velünk kapcsolatba. Szívesen segítünk.\" Időpontfoglalás és információk telefonon történnek a +36 70 500 1818-as számon, a megadott ügyfélfogadási idő hétköznap 08:00–20:00. A gyermekvizsgálatok oldalán megtalálhatók a kezelés előtti fontos tudnivalók; kérik, hogy a páciensek hozzák magukkal korábbi leleteiket, kórházi zárójelentésüket, valamint ultrahangos és röntgen felvételeiket. A honlapon közvetlen árlap található nem szerepel a megadott oldalak között (árlista: N/A).",
"arlista_url": "N/A",
"varos": "Miskolc",
"iranyitoszam": "3526",
"utca": "Arany János tér 1",
"telefonszam": "+36 70 500 1818",
"email": "mrc@macroklinika.hu",
"website": "https://www.macroklinika.hu/"
},
"llm_usage": {
"prompt_tokens": 884,
"completion_tokens": 1384,
"total_tokens": 2268,
"cost": 0.002989
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T17:59:46.563509",
"completed_at": "2026-03-29T18:01:18.906385",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T18:00:43.590391",
"completed_at": "2026-03-29T18:01:18.645289",
"result": {
"reviews": {
"company_name": "MacroKlinika",
"total_reviews": 207,
"average_rating": 3.6,
"reviews": [
{
"author": "Köteles Mária Kovácsné",
"rating": 1,
"text": "Ultrahangra érkeztem, pajzsmirigy vizsgálatra, a recepción kedvesek voltak, a doktornő viszont nem. Elvártam volna hogy kommentálja azt amit lát, a végén én kértem hogy mondjon már vagy két szót a leletemről. 29000 ft-ért azt kaptam mint egy állami intézményben 😥...még a magán telefonhívását is lebonyolította az alatt a pár perc alatt amig bent voltam.",
"date": null
},
{
"author": "Orsolya Chugyik-Veres",
"rating": 1,
"text": "88 eves mozgaskeptelen nagymamanak lett foglalva penteki napra idopont ideggyogyaszhoz, telefonon lebeszeltuk a holggyel, hogy messzirol megyunk maganmantovel, es ct is kell majd, amit egy fust alatt intezzunk el. A holgy mondta, hogy van ct is helyben. Eljott a nap megtortent a vizsgalat, doktorur mondta hogy kell ct mindenkeppen, de vissza kell menni mert penteken NINCS CT!!!!!! Egy vagyonba kerult a feljutas es a vizsgalat, es nem volt kepes a holgy szolni, hogy penteken nincs ct! A vizsgalattal nem volt gond de a szervezes egy nagy 0. Javaslok egy oktatast a telefont kezelo es idopontot ado kollegaknak arrol, hogy mikor mire van idopont, az ember azt gondolna h a maganklinikakon hozzaerto emberek dolgoznak es legalabb egy idopontot meg tudnak ugy szervezni, hogy ne kelljen visszajarni 100 kmrol egy nyugdijasnak ha mar fizet nem keves penzt. Nem kell hozza egyetemet vegezni....",
"date": null
},
{
"author": "Magyarangol Fordítás",
"rating": 1,
"text": "Igazi borsodi válasz a magánegészségügyre. Délután 3 órakor első beteg voltam, az orvos 10 perc késéssel érkezett, de ez valószínűleg normális a jelek szerint, mert elnézést sem kért. Nálunk egy bolti pénztáros bocsánatot kér ha 2 percnél többet kell sorakozni. A hely inkább hasonlít egy nem térítéses SZTKra, ahol bár egy asszisztens vezet el a vizsgálóig, de közben 2-3szor megáll sápitozni és valami halaszthatatlant megvitatni egy kollégával.Az orvos stílusa is inkább volt lekezelő és kioktató, sem mint segítőkész... De hát, akik egy ilyen rendszerben szocializalodtak.... Na hát a változásig meg szükség lesz egy pár generációra.",
"date": null
},
{
"author": "Ildikó Balajti",
"rating": 5,
"text": "Már a belépés pillanata nagyon fontos számomra , de a pultos hölgyek mosolygós, udvarias üdvözlése, segítőkészségük pozitív, jó benyomást keltett. :) Egy elég összetett kivizsgálásra érkeztem.\nAz ultrahangos főorvosnő, Dr. Fodor Krisztina alapossága, szakmai tudása, precizitása maximális volt.\nA sebész főorvos Dr. Berencsi Attila empátiája, szakmaisága kimagasló. A laboros hölgyek óvatosak, figyelmesek, és nagyon kedvesek.\nMaximálisan meg vagyok elégedve, és hálával tartozom nekik! Csak ajánlani tudom őket mindenkinek! Bármilyen gondom lesz csak ide jövök!",
"date": null
},
{
"author": "Fanni László",
"rating": 5,
"text": "Teljesen megvoltam elégedve nagyon kedvesek, mosolygósak voltak. Laborra menten de nagyon készségesek voltak segítettek, lesték minden kívánságomat, kérésemet. Egy rossz szót nem tudok írni senkiről és semmiről. Többször is voltam a klinikán mindig ilyen tapasztalattal távoztam.\nNyugodt szívvel őszintén tudom ajánlani.",
"date": null
},
{
"author": "Csabáné Sarkadi",
"rating": 5,
"text": "MR vizsgálati időpontra èrkeztem. A pultos hölgyek segítőkèszek, kedvesek voltak.\nA vizsgálat zökkenőmentes volt, maximális odafigyelèssel.\nA pénztáros hölgy gördülèkenyen, dinamikusan dolgozott\nCsak ajánlani tudom!",
"date": null
},
{
"author": "Faragó Ferenc",
"rating": 5,
"text": "Több féle vizsgálatra érkeztem, kevés várakozás után, minden gördülékenyen zajlott. A regisztrációnál a hölgyek kedvesek, segítőkészek voltak. A vizsgálaton is figyelmesek voltak.\nCsak ajánlani tudom.",
"date": null
},
{
"author": "Zsuzsanna Dobos",
"rating": 5,
"text": "Eddigi tapasztalataim alapján a legjobb ár-érték arányú magánegészségügyi ellátó. Mind az orvosok, mind az asszisztensek felkészültek, kedvesek és rugalmasan együttműködőek.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "3526",
"city": "Miskolc",
"street": "Arany János tér 1",
"phone": "06 70 500 1818"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T18:01:19.161830",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T18:01:19.446588",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 3987a293-bacd-4780-bc3f-1aaf0f97c3ff_*.log, CLI: pipeline_3987a293_*.log).
data/logs/3987a293-bacd-4780-bc3f-1aaf0f97c3ff_20260329_175946.log
2026-03-29 17:59:46 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 3987a293-bacd-4780-bc3f-1aaf0f97c3ff for URL: https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 17:59:46 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 17:59:46 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://www.macroklinika.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 17:59:46 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 1 URLs in 0.1s (success=1, errors=0)
2026-03-29 17:59:46 | WARNING | src.stages.stage_1_metadata_alt | Failed to extract content from main URL: https://www.macroklinika.hu/
2026-03-29 17:59:46 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 17:59:46 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'macroklinika.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 17:59:47 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 17:59:47 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 17:59:47 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 5 results
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Result 1: Kapcsolat - https://www.macroklinika.hu/elerhetoseg.html
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Result 2: MacroKlinika - https://www.macroklinika.hu/gyermek-vizsgalatok.html
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Result 3: MacroKlinika - https://www.macroklinika.hu/szolgaltatas.html?szolgID=Gyermekgy%C3%B3gy%C3%A1szat
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.macroklinika.hu/elerhetoseg.html
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 293 characters from contact page 1
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.macroklinika.hu/gyermek-vizsgalatok.html
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 35 characters from contact page 2
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://www.macroklinika.hu/szolgaltatas.html?szolgID=Gyermekgy%C3%B3gy%C3%A1szat
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 168 characters from contact page 3
2026-03-29 18:00:13 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 18:00:43 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: MacroKlinika
2026-03-29 18:00:43 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 18:00:43 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 18:00:43 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=MacroKlinika, varos=Miskolc
2026-03-29 18:00:43 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmp2xad55u0
2026-03-29 18:00:43 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp_lojfspo
2026-03-29 18:00:43 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 18:01:17 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 18:01:17 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_180117_macroklinika_url_input.txt
2026-03-29 18:01:17 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_180117_macroklinika_url_output.json
2026-03-29 18:01:17 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 18:01:18 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 18:01:18 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).