A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | failed | — | 2026-03-29 13:22:14 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| discovery_fetch_validation | failed | 2026-03-29 13:20:57 | 2026-03-29 13:22:14 | 1 min 17 s | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
| metadata_alt | completed | 2026-03-29 13:20:56 | 2026-03-29 13:22:13 | 1 min 16 s | — |
| reviews | completed | 2026-03-29 13:21:39 | 2026-03-29 13:22:14 | 34 s | — |
| taxonomy_enrichment_alt | failed | — | 2026-03-29 13:22:14 | — | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s). |
A futtatás hibával zárult — részletek a stage táblázatban.
{
"execution_id": "fdfc834e-198d-42c0-a2cd-c329fdceef34",
"input_url": "https://szinapszispecs.hu/",
"state_filename": "20260329_132056_szinapszispecs_hu.json",
"created_at": "2026-03-29T13:20:56.206527",
"updated_at": "2026-03-29T13:22:14.621951",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T13:20:56.881060",
"completed_at": "2026-03-29T13:22:13.805528",
"result": {
"metadata": {
"company_name": "SZINAPSZIS magánrendelő (Szinapszis Pécs)",
"description": "A Szinapszis magánrendelő Pécsen működő egészségügyi intézmény, amely pszichiátriai, addiktológiai és neurológiai szakellátást, valamint klinikai szakpszichológiai, pszichoterápiás és pszichoszociális szolgáltatásokat nyújt. Külön figyelmet fordítanak a gyermek- és pedagógiai pszichológiára, gyógypedagógiára, dietetikára, pár- és családterápiára, valamint demenciák kivizsgálására. A rendelő hangsúlyozza a szakértelmet, diszkréciót és a komplex ellátást, és szükség szerint személyre szabott terápiás megoldásokat kínál. Online konzultációkat áthidaló megoldásként alkalmaznak, elsősorban a már megkezdett terápiás folyamatok keretében. A honlap és a rendelő adatkezelési tájékoztatóval rendelkezik, valamint közzéteszik a lemondási feltételeket (no‑show vagy 24 órán belüli lemondás esetén 50% díjfizetés).",
"arlista_url": "https://szinapszispecs.hu/wp-content/uploads/2026/02/Szinapszis_Arlista_2026.02.23.pdf",
"varos": "Pécs",
"iranyitoszam": "7623",
"utca": "Mártírok útja 34.",
"telefonszam": "+36 30 615 3155",
"email": "info@szinapszispecs.hu",
"website": "https://szinapszispecs.hu/"
},
"llm_usage": {
"prompt_tokens": 10185,
"completion_tokens": 908,
"total_tokens": 11093,
"cost": 0.00436225
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "failed",
"started_at": "2026-03-29T13:20:57.079561",
"completed_at": "2026-03-29T13:22:14.213935",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T13:21:39.311469",
"completed_at": "2026-03-29T13:22:14.007819",
"result": {
"reviews": {
"company_name": "SZINAPSZIS magánrendelő (Szinapszis Pécs)",
"total_reviews": 43,
"average_rating": 4.8,
"reviews": [
{
"author": "Melinda Mayer",
"rating": 5,
"text": "A doktornő nagyon kedves volt, segítőkész recepciós, egy héten belül kaptam időpontot, szívből ajánlom!",
"date": null
},
{
"author": "Fanni Sziebert",
"rating": 5,
"text": "Mindenki nagyon kedves és szakmailag tapasztalt. Csak ajánlani tudom. :)",
"date": null
},
{
"author": "Kristóf Faddi",
"rating": 5,
"text": "Kellemes atmoszféra, kedves, nyitott és professzionális szakemberekkel.",
"date": null
},
{
"author": "Ádám Harcos",
"rating": 5,
"text": "Képzett szakemberek.\nAranyos, kedves recepciós.",
"date": null
},
{
"author": "Judit Szűcsné dr. Péter",
"rating": 5,
"text": "Súlyos lelki állapotom miatt pszichiáter és pszichológus segítségét is igénybe vettem a Szinapszis rendelőben. Lelkiismeretes gyógyító munkájuknak köszönhetően sikeresen felépültem. Jó szívvel ajánlom a Szinapszis rendelő szolgáltatásait.",
"date": null
},
{
"author": "Judit szabó",
"rating": 1,
"text": "Csak ez a hellyet NE! 22.000 Forintot érek. Az orvost nem is érdekli mit tett. Megkapta a nyamvadt 22.000.- Forintot. Hiába mondtam neki, hogy nem jó a gyógyszer. 50 percen keresztül győzködtem. Felemelte a dózist több mint duplájára. Pontosan tudta hogy egy baleset miatt Tramadol tartalmú fájdalomcsillapítót szedek. Erre még tett egy emelt dózist. Éjszaka volt egy szép gyógyszertúladagolásom. Amire a Doktorúr annyit írt hogy vegyem vissza a gyógyszert és valakivel írassal fel altatót. Jah nagyon sajnálja hogy nem tudok aludni🤣🤣🤣. Ennyi esett le az elmúlt időböl? És tessék mondani ha maga a fizetett orvosom akkor péntek délután ki a fenével írassak fel altatót? Most keressék más orvost. És kezdjem az egészet előröl. De most iszonyú nagy a baj. De még sem kérdezi mi van velem. Megkapta a nyomorúlt 22.000 Forintot",
"date": "2024-6-24"
},
{
"author": "László Illés",
"rating": 5,
"text": "Nagyon jó szakemberek dolgoznak ebben a rendelőben, mindenkinek csak ajánlani tudom őket!",
"date": null
},
{
"author": "Angyal Anikó (Kozmina)",
"rating": 5,
"text": "Nem a pénzre mennek, Dr Miklósy Vikoria doktornőnél voltam, meg voltam elégedve,nyílt, és segítőkész.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "7623",
"city": "Pécs",
"street": "Mártírok útja 34",
"phone": "06 30 615 3155"
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T13:22:14.413673",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "failed",
"started_at": null,
"completed_at": "2026-03-29T13:22:14.621932",
"result": null,
"error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
"metadata": {}
}
},
"overall_status": "failed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": null
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: fdfc834e-198d-42c0-a2cd-c329fdceef34_*.log, CLI: pipeline_fdfc834e_*.log).
data/logs/fdfc834e-198d-42c0-a2cd-c329fdceef34_20260329_132056.log
2026-03-29 13:20:56 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution fdfc834e-198d-42c0-a2cd-c329fdceef34 for URL: https://szinapszispecs.hu/
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://szinapszispecs.hu/
2026-03-29 13:20:57 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://szinapszispecs.hu/
2026-03-29 13:20:57 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 13:20:57 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://szinapszispecs.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://szinapszispecs.hu/
2026-03-29 13:20:57 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://szinapszispecs.hu/
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 5158 characters from main URL
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 13:20:57 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'szinapszispecs.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/pszichiatria
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/addiktologia
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/pszichoterapia
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/szolgaltatasaink
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/fuggosegek-hozzatartozoknak
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/konzultaciospszichologia
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/fuggosegek-kezelesrol
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/pszichoszocialis-mentoralas
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/klinikai-szakpszichologia
2026-03-29 13:21:07 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/fuggosegek-informaciok
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 5 results
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Result 1: Kapcsolat - Szinapszis Pécs - https://szinapszispecs.hu/kapcsolat/
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Result 2: Adatvédelem - https://szinapszispecs.hu/adatvedelem/
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Result 3: klinikai - Szinapszis Pécs - https://szinapszispecs.hu/klinikai/
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://szinapszispecs.hu/kapcsolat/
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 4257 characters from contact page 1
2026-03-29 13:21:18 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://szinapszispecs.hu/adatvedelem/
2026-03-29 13:21:19 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 16604 characters from contact page 2
2026-03-29 13:21:19 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://szinapszispecs.hu/klinikai/
2026-03-29 13:21:23 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/neurologia
2026-03-29 13:21:23 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/parterapia
2026-03-29 13:21:23 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/gyogypedagogia
2026-03-29 13:21:23 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/gyermekespedagogiaipszichologia
2026-03-29 13:21:23 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/demencia
2026-03-29 13:21:24 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/dietetika
2026-03-29 13:21:24 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/csaladterapia
2026-03-29 13:21:24 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/araink
2026-03-29 13:21:24 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/kapcsolat
2026-03-29 13:21:24 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/munkatarsaink
2026-03-29 13:21:27 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1848 characters from contact page 3
2026-03-29 13:21:27 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 13:21:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://szinapszispecs.hu/adatvedelem
2026-03-29 13:21:27 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 22 URLs in 30.5s (success=22, errors=0)
2026-03-29 13:21:38 | INFO | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 13:21:38 | ERROR | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 13:21:38 | INFO | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 13:21:38 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: SZINAPSZIS magánrendelő (Szinapszis Pécs)
2026-03-29 13:21:38 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 13:21:39 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 13:21:39 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=SZINAPSZIS magánrendelő (Szinapszis Pécs), varos=Pécs
2026-03-29 13:21:39 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmplz7bwp99
2026-03-29 13:21:39 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmph93ft6h7
2026-03-29 13:21:39 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 13:22:13 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 13:22:13 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_132213_szinapszis_magánrendelő_(szinapszis_pécs)_url_input.txt
2026-03-29 13:22:13 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_132213_szinapszis_magánrendelő_(szinapszis_pécs)_url_output.json
2026-03-29 13:22:13 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 13:22:14 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 13:22:14 | ERROR | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).