A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| discovery_fetch_validation | failed | 2026-03-29 14:02:57 | 2026-03-29 14:03:15 | 18 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 14:02:56 | 2026-03-29 14:03:39 | 42 s | — |
| reviews | running | 2026-03-29 14:03:39 | — | 32 nap 7 ó (eddig) | — |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "c5892ca1-0673-4f80-a969-0849e4027e3d",
"input_url": "https://edesszivkft.hu/",
"state_filename": "20260329_140254_edesszivkft_hu.json",
"created_at": "2026-03-29T14:02:54.326776",
"updated_at": "2026-03-31T06:55:40.579578",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T14:02:56.605617",
"completed_at": "2026-03-29T14:03:39.569724",
"result": {
"metadata": {
"company_name": "ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT",
"description": "Az Édes Szívünk Egészségközpont komplex kardiológiai ellátást és kapcsolódó szakrendeléseket kínál. A honlap tájékoztatása szerint a központon belül orvosi rendelők, műszeres vizsgálatok és diagnosztikai szolgáltatások állnak rendelkezésre, továbbá részletes információk találhatók az orvosokról és a rendelési időkről. A weboldal külön szekciót szentel a bejelentkezésnek vizsgálatra, valamint 2026-ra vonatkozó árlistát is közöl. A képgaléria és a szakrendeléseink helye segíti a pácienseket a tájékozódásban, míg az adatvédelemre vonatkozó információk biztosítják a személyes adatok kezelésének átláthatóságát. Összességében a honlap a kardiológiai ellátás köré szervezett szolgáltatásokat, elérhetőségeket és gyakorlati tudnivalókat mutatja be professzionális módon.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "+36/30 9 38-17-38",
"email": "N/A",
"website": "https://edesszivkft.hu/"
},
"llm_usage": {
"prompt_tokens": 688,
"completion_tokens": 876,
"total_tokens": 1564,
"cost": 0.001924
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T14:02:57.256317",
"completed_at": "2026-03-29T14:03:15.270880",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "running",
"started_at": "2026-03-29T14:03:39.782012",
"completed_at": null,
"result": null,
"error": null,
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "reviews",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: c5892ca1-0673-4f80-a969-0849e4027e3d_*.log, CLI: pipeline_c5892ca1_*.log).
data/logs/c5892ca1-0673-4f80-a969-0849e4027e3d_20260329_140255.log
2026-03-29 14:02:55 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution c5892ca1-0673-4f80-a969-0849e4027e3d for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:02:57 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 1.1s (success=1, errors=0)
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:02:58 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:03:05 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:03:05 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:03:05 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:03:28 | WARNING | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 14:03:28 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:03:39 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT
2026-03-29 14:03:39 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT, varos=N/A
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmp2iqtg5tt
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp9x2405uw
2026-03-29 14:03:39 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:05:25 | WARNING | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:05:30 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)
2026-03-29 14:07:02 | WARNING | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:07:07 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)