A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-29 09:46:16 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-29 09:45:07 | 2026-03-29 09:46:16 | 1 min 9 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 09:45:07 | 2026-03-29 09:46:16 | 1 min 8 s | — |
| reviews | completed | 2026-03-29 09:45:39 | 2026-03-29 09:46:16 | 36 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-29 09:46:16 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "7b903fef-384e-44a7-a6fc-d2b339cb745e",
"input_url": "https://elysia.hu/",
"state_filename": "20260329_094507_elysia_hu.json",
"created_at": "2026-03-29T09:45:07.146760",
"updated_at": "2026-03-29T09:46:16.711683",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T09:45:07.479525",
"completed_at": "2026-03-29T09:46:16.404682",
"result": {
"metadata": {
"company_name": "Elysia Laser Clinic",
"description": "N/A",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "1000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://elysia.hu/"
},
"llm_usage": {
"prompt_tokens": 672,
"completion_tokens": 574,
"total_tokens": 1246,
"cost": 0.001316
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T09:45:07.553241",
"completed_at": "2026-03-29T09:46:16.565748",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T09:45:39.988486",
"completed_at": "2026-03-29T09:46:16.481235",
"result": {
"reviews": {
"company_name": "Elysia Laser Clinic",
"total_reviews": 127,
"average_rating": 4.6,
"reviews": [
{
"author": "Ramóna Törös",
"rating": 5,
"text": "Az orvosok empatikusak, alaposak és szakszerűek, az asszisztensek pedig szintúgy. Szívből ajánlom Harmati Imrich doktor urat és Horváth Beáta doktornőt mindenkinek. A rendelő igényes, a recepción dolgozók abszolút segítőkészek. Összességében maximálisan elégedett vagyok, számomra 5 csillagos ellátás.",
"date": null
},
{
"author": "Andrea Sipos",
"rating": 5,
"text": "Először jártam a rendelőben … nagyon igényes tiszta és gyönyörű . A recepciós lányok igazán kedvesen fogadtak , nyugodt volt a hangulat. Anyajegy szűrésre mentem, kifejezetten egy darabra voltam kiváncsi , viszont a doktornő alaposan átvizsgálta a létező összes anyajegyemet. Tanácsokkal látott el és minden kérdésemre kielégítő választ kaptam . Nyugodt szívvel ajánlom mindenkinek , aki egy igazán jó bőrgyógyászt keres. 🌸🧚",
"date": null
},
{
"author": "Éva Tóthné Wirth",
"rating": 5,
"text": "Nagyon segítőkészek, kedvesek. Kaptam aznap mikor telefonáltam időpontot. Dr Horváth Beáta és asszisztense is rettentő kedvesek és segítőkészek, doktornő nagyon jó, alapos, kedves orvos, csak ajánlani tudom! Profi , kedves és gyors ellátás! Köszönöm",
"date": null
},
{
"author": "Virág H-S",
"rating": 5,
"text": "Rendkívül kedves recepciós Hölgyek fogadtak minden alkalommal. Bőrgyógyászat szakrendelésen dr. Horváth Beáta nemcsak hozzáértő, de remek humánus szakember és nagyon kedves. Jó szívvel ajánlom a Doktornőt. Az Asszisztense rendkívül kedves, felkészült és ügyes.",
"date": null
},
{
"author": "Emília Szabó",
"rating": 5,
"text": "Kellemes környezet.Baràtsàgos,előzèkeny recepciós hölgyek.Közvetlen,alapos asszisztens.Horvàth Beàta doktornő nagyon jó orvos, ami valódi kedvessèggel ,empàtiával pàrosul.Nagyon megbìzom benne. Csak őt vàlasztom.",
"date": null
},
{
"author": "Renáta Schatz",
"rating": 5,
"text": "Teljes mértékben meg vagyok elégedve, a recepciós hölgyekkel és az asszisztens hölgyekel is minden nagyon jól sikerült amiért mentem .\nMég egyszer itt is köszönöm Haris Ákos Dr úr nagyon profi munkáját .Ajánlom mindenkinek. 😊",
"date": null
},
{
"author": "László Németh",
"rating": 5,
"text": "Profi, kedves és gyors ellátás. Máskor is szívesen megyek ha szükséges lesz. Fényévekre az állami ellátástól! Gratulálok és köszönöm!",
"date": null
},
{
"author": "Nikolett Molnár",
"rating": 5,
"text": "Teljesen megvagyok elégedve: a recepciós hölgyek kedvesek és segítőkészek, Harmati Doktor Úr pedig alapos, precíz munkát végzett!",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "9026",
"city": "Győr",
"street": "Dózsa György rkp. 29-31",
"phone": "06 20 275 0025"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T09:46:16.638791",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T09:46:16.711664",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 7b903fef-384e-44a7-a6fc-d2b339cb745e_*.log, CLI: pipeline_7b903fef_*.log).
data/logs/7b903fef-384e-44a7-a6fc-d2b339cb745e_20260329_094507.log
2026-03-29 09:45:07 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 7b903fef-384e-44a7-a6fc-d2b339cb745e for URL: https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 09:45:07 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 09:45:07 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://elysia.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 09:45:07 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 1 URLs in 0.2s (success=1, errors=0)
2026-03-29 09:45:07 | WARNING | src.stages.stage_1_metadata_alt | Failed to extract content from main URL: https://elysia.hu/
2026-03-29 09:45:07 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 09:45:07 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'elysia.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 09:45:20 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 09:45:20 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 09:45:20 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 3 results
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Result 1: Lézerkezelések — Elysia Laser Clinic - https://elysia.hu/szolgaltatasok/lezerkezelesek
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Result 2: Labor és dagnosztikai vizsgálatok — Elysia Laser Clinic - https://elysia.hu/szolgaltatasok/labor-es-diagnosztikai-vizsgalatok
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Result 3: Idegsebészet — Elysia Laser Clinic - https://elysia.hu/szolgaltatasok/idegsebeszet
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://elysia.hu/szolgaltatasok/lezerkezelesek
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 19 characters from contact page 1
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://elysia.hu/szolgaltatasok/labor-es-diagnosztikai-vizsgalatok
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 19 characters from contact page 2
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://elysia.hu/szolgaltatasok/idegsebeszet
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 19 characters from contact page 3
2026-03-29 09:45:31 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 09:45:39 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Elysia Laser Clinic
2026-03-29 09:45:39 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 09:45:39 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 09:45:39 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Elysia Laser Clinic, varos=N/A
2026-03-29 09:45:40 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmpuz7x0cz9
2026-03-29 09:45:40 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp1ivtdrp4
2026-03-29 09:45:40 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 09:46:16 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 09:46:16 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_094616_elysia_laser_clinic_url_input.txt
2026-03-29 09:46:16 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_094616_elysia_laser_clinic_url_output.json
2026-03-29 09:46:16 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 09:46:16 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 09:46:16 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).