A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| discovery_fetch_validation | failed | 2026-03-29 14:01:16 | 2026-03-29 14:01:32 | 16 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 14:01:16 | 2026-03-29 14:01:59 | 43 s | — |
| reviews | running | 2026-03-29 14:02:03 | — | 32 nap 7 ó (eddig) | — |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "c04105ec-559a-4a93-8cb5-a3001027a90b",
"input_url": "https://edesszivkft.hu/",
"state_filename": "20260329_140115_edesszivkft_hu.json",
"created_at": "2026-03-29T14:01:15.413243",
"updated_at": "2026-03-31T06:55:40.592127",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T14:01:16.036354",
"completed_at": "2026-03-29T14:01:59.861041",
"result": {
"metadata": {
"company_name": "Édes Szívünk Egészségközpont Kft.",
"description": "Édes Szívünk Egészségközpont magán kardiológiai és diagnosztikai szolgáltatásokat nyújt páciensek részére. A központ elsősorban kardiológiai rendeléseket, EKG, terheléses EKG, Holter és ABPM vizsgálatokat kínál, valamint egyéb műszeres vizsgálatokat és szakrendeléseket. A rendelésre előzetes bejelentkezés szükséges, időpontkérés a megadott titkári telefonszámon történik. A rendelők és várók a Hunguest Hotel Apollóban találhatók, címe: 4200 Hajdúszoboszló, Mátyás király sétány 12–14. A honlap részletes információkat tartalmaz az orvosokról, rendelési időkről és 2026-os árakról.",
"arlista_url": "https://www.edesszivkft.hu/araink-2026",
"varos": "Hajdúszoboszló",
"iranyitoszam": "4200",
"utca": "Mátyás király sétány 12–14 (Hunguest Hotel Apolló)",
"telefonszam": "+36/30 9 38-17-38",
"email": "N/A",
"website": "https://edesszivkft.hu/"
},
"llm_usage": {
"prompt_tokens": 1544,
"completion_tokens": 1120,
"total_tokens": 2664,
"cost": 0.002626
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T14:01:16.217842",
"completed_at": "2026-03-29T14:01:32.479957",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "running",
"started_at": "2026-03-29T14:02:03.885275",
"completed_at": null,
"result": null,
"error": null,
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "reviews",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: c04105ec-559a-4a93-8cb5-a3001027a90b_*.log, CLI: pipeline_c04105ec_*.log).
data/logs/c04105ec-559a-4a93-8cb5-a3001027a90b_20260329_140115.log
2026-03-29 14:01:15 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution c04105ec-559a-4a93-8cb5-a3001027a90b for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:01:16 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 0.4s (success=1, errors=0)
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:01:16 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:01:31 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:01:31 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:01:31 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 2 results
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Result 1: Bejelentkezés - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Result 2: Képgaléria - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1051 characters from contact page 1
2026-03-29 14:01:42 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:43 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 671 characters from contact page 2
2026-03-29 14:01:43 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:01:57 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Édes Szívünk Egészségközpont Kft.
2026-03-29 14:01:57 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:02:03 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:02:03 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Édes Szívünk Egészségközpont Kft., varos=Hajdúszoboszló
2026-03-29 14:02:03 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmpugi7dbne
2026-03-29 14:02:03 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmpy4lmnt1z
2026-03-29 14:02:04 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:02:07 | INFO | src.stages.stage_4_reviews | google-maps-scraper completed successfully on attempt 1
2026-03-29 14:02:07 | WARNING | src.stages.stage_4_reviews | No URL match for foryoulife.hu, using best by review count: For Life Medical Center (521 reviews)
2026-03-29 14:02:07 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_140207_foryoulife_url_input.txt
2026-03-29 14:02:07 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_140207_foryoulife_url_output.json
2026-03-29 14:02:07 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 14:02:08 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 14:02:08 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:02:55 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution c5892ca1-0673-4f80-a969-0849e4027e3d for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 1.1s (success=1, errors=0)
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:03:05 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:03:05 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:03:05 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:03:28 | WARNING | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 14:03:28 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:03:39 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT
2026-03-29 14:03:39 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT, varos=N/A
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmp2iqtg5tt
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp9x2405uw
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:05:25 | WARNING | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:05:30 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)
2026-03-29 14:07:02 | WARNING | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:07:07 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)