A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-28 12:44:34 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-28 12:42:45 | 2026-03-28 12:44:34 | 1 min 48 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-28 12:42:45 | 2026-03-28 12:44:33 | 1 min 48 s | — |
| reviews | completed | 2026-03-28 12:43:35 | 2026-03-28 12:44:33 | 58 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-28 12:44:34 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "dd51e6c6-9ea0-4c47-8976-8595e2c26d48",
"input_url": "https://kabayrendelo.hu/",
"state_filename": "20260328_124230_kabayrendelo_hu.json",
"created_at": "2026-03-28T12:42:30.381297",
"updated_at": "2026-03-28T12:44:34.247422",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-28T12:42:45.414456",
"completed_at": "2026-03-28T12:44:33.809274",
"result": {
"metadata": {
"company_name": "Kabay Rendelő",
"description": "A Kabay Rendelő egy magánorvosi rendelő Szeged belvárosában, a Kabay Patika épületében (Tisza Lajos krt. 95.), amely exkluzív környezetben, rövid előjegyzési idővel nyújt ellátást. Szolgáltatásaik között szerepel a szülészet‑nőgyógyászat és nőgyógyászati endokrinológia, gyermekgyógyászat, bőrgyógyászat, urológia és gyógytorna. Csapatukat tapasztalt szakorvosok alkotják (pl. Dr. Bitó Tamás, Dr. Szűcs Márta, Prof. Bajory Zoltán, Dr. Vincze Márió) és diplomás gyógytornász (Manga Anikó) is dolgozik a rendelőben. A rendelő hangsúlyt fektet a korszerű diagnosztikára (szülészeti‑nőgyógyászati ultrahang), valamint a minimálisan invazív sebészeti megoldásokra. Online időpontfoglalási lehetőség elérhető a Medicall rendszerén keresztül, továbbá telefonos és e‑mailes ügyfélszolgálatot biztosítanak. A Kabay Rendelő a Frida Med szakrendeléseivel is együttműködik, kiegészítő specialistákat (pl. neurológia, idegsebészet, aneszteziológia) kínálva.",
"arlista_url": "https://kabayrendelo.hu/araink",
"varos": "Szeged",
"iranyitoszam": "6721",
"utca": "Tisza Lajos krt. 95",
"telefonszam": "+36 30 999 6376; +36 30 869 2881",
"email": "rendelo@kabayrendelo.hu",
"website": "https://kabayrendelo.hu/"
},
"llm_usage": {
"prompt_tokens": 18231,
"completion_tokens": 1948,
"total_tokens": 20179,
"cost": 0.00845375
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-28T12:42:45.593695",
"completed_at": "2026-03-28T12:44:34.030637",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-28T12:43:35.454113",
"completed_at": "2026-03-28T12:44:33.916483",
"result": {
"reviews": {
"company_name": "Kabay Rendelő",
"total_reviews": 8,
"average_rating": 4.6,
"reviews": [
{
"author": "Kitti Lakatos",
"rating": 2,
"text": "Tegnapra egyeztettem időpontot dr Fekete Zoltán nőgyógyászhoz 18:40re. Odaérkeztem erre közölték hogy kb 1.5 órát kell várni mert 15 fő várakozik a doktorúrra. Azonnal ott hagytam mert minek fizessem 15 ezret ha ugyanannyit kell várni mint egy állami rendelőben. Nevetséges. Így tegnap felhivtam a bérkert klinikát és mára már tudtam adni időpontot és pontosan akkor hívott be. Nagyon kedves türelmes doktorúr volt. 16.000be került. DR. SIKOVANYECZ JÁNOS PH.D.",
"date": null
},
{
"author": "zita horti",
"rating": 5,
"text": "Csak maximális pozitívum! Tündéri hölgyek a recepción, kényelmes légkondicionált váróterem. Dr. Sári Tamás nagyon kedves, türelmes és a legprofibb orvos.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "6722",
"city": "Szeged",
"street": "Tisza Lajos krt. 95",
"phone": "06 20 469 8139"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-28T12:44:34.137970",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-28T12:44:34.247408",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: dd51e6c6-9ea0-4c47-8976-8595e2c26d48_*.log, CLI: pipeline_dd51e6c6_*.log).
data/logs/dd51e6c6-9ea0-4c47-8976-8595e2c26d48_20260328_124245.log
2026-03-28 12:42:45 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution dd51e6c6-9ea0-4c47-8976-8595e2c26d48 for URL: https://kabayrendelo.hu/
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://kabayrendelo.hu/
2026-03-28 12:42:48 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://kabayrendelo.hu/
2026-03-28 12:42:48 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://kabayrendelo.hu/
2026-03-28 12:42:48 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://kabayrendelo.hu/ (max_depth=2, max_concurrent=10)
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 3120 characters from main URL
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-28 12:42:48 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'kabayrendelo.hu', 'limit': '3', 'lang': 'HU'}
2026-03-28 12:42:48 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://kabayrendelo.hu/
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/szakrendeles
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/dr-vincze-mario
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/szolgaltatasok/urologia
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/szolgaltatasok/fajdalom-ambulancia
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/dr-bajory-zoltan
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/dr-bito-tamas
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/manga-aniko
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/dr-szucs-marta
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/sziranyi-agi-betegkapcsolatok
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/blog
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/araink
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/munkatarsaink/makos-andrea
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/kapcsolat
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/rolunk
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/szolgaltatasok/gyogytorna
2026-03-28 12:42:49 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/gyakran-ismetelt-kerdesek
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://kabayrendelo.hu/adatkezelesi-tajekoztato
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/a-gyermekkori-asztma
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/miben-segit-a-terhestorna
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/alapertelmezett
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/gyogytorna
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/gyermekgyogyaszat
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/terhesseg-es-policisztas-ovarium-szindroma
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/gyermekgyogyaszat/csecsemogondozas
2026-03-28 12:42:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/nogyogyaszat
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/category/nogyogyaszat/nogyogyaszati-endokrinologia
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/asztma
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/endokrinologia
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/pco
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/nogyogyaszat
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/gyogytorna
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/gyermektudogyogyaszat
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/gyermekgyogyaszat
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/policisztas-ovarium-szindroma
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/ujszulott
2026-03-28 12:42:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/blog?paged=1
2026-03-28 12:42:52 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://kabayrendelo.hu/tag/terhestorna
2026-03-28 12:42:52 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 39 URLs in 4.0s (success=39, errors=0)
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 4 results
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Result 1: Kapcsolat | Kabay Rendelő | Szeged | Az ön egészsége a mi hivatásunk - https://kabayrendelo.hu/kapcsolat
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Result 2: Adatvédelmi irányelvek - https://kabayrendelo.hu/adatkezelesi-tajekoztato
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Result 3: Kabay Rendelő | Szeged | Az ön egészsége a mi hivatásunk - https://kabayrendelo.hu/
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://kabayrendelo.hu/kapcsolat
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 4219 characters from contact page 1
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://kabayrendelo.hu/adatkezelesi-tajekoztato
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 32126 characters from contact page 2
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://kabayrendelo.hu/
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 10065 characters from contact page 3
2026-03-28 12:43:17 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-28 12:43:21 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-28 12:43:21 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-28 12:43:21 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-28 12:43:35 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Kabay Rendelő
2026-03-28 12:43:35 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-28 12:43:35 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-28 12:43:35 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Kabay Rendelő, varos=Szeged
2026-03-28 12:43:35 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmps4p2pts_
2026-03-28 12:43:35 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp6k52fa7k
2026-03-28 12:43:35 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-28 12:44:33 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-28 12:44:33 | INFO | src.stages.stage_4_reviews | URL match found: kabayrendelo.hu
2026-03-28 12:44:33 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260328_124433_kabay_rendelő_url_input.txt
2026-03-28 12:44:33 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260328_124433_kabay_rendelő_url_output.json
2026-03-28 12:44:33 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 2 reviews
2026-03-28 12:44:33 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-28 12:44:33 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).