A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-30 19:21:23 | 2026-03-30 19:24:47 | 3 min 24 s | — |
| discovery_fetch_validation | completed | 2026-03-30 19:21:00 | 2026-03-30 19:24:47 | 3 min 47 s | — |
| metadata_alt | completed | 2026-03-30 19:20:59 | 2026-03-30 19:24:47 | 3 min 47 s | — |
| reviews | completed | 2026-03-30 19:21:43 | 2026-03-30 19:24:47 | 3 min 3 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-30 19:21:26 | 2026-03-30 19:24:48 | 3 min 21 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Allergológiai szakorvosi vizsgálat – első alkalom | 28000 | Allergológia | Allergológia / 0.6583891363230248 |
| Kontrollvizsgálat | 20000 | Allergológia | Allergológia / 0.7297345359033999 |
| Bőrpróba (Prick-teszt) | 8000 | Allergológia | Allergológia / 0.7800997068322457 |
| Konzultáció eredményekről (online/telefonon) | 12000 | Allergológia | Allergológia / 0.6556066196644865 |
| Injekció beadása | 10000 | Allergológia | Allergológia / 0.669969867199019 |
| Vérvétel | 2500 | Allergológia | Allergológia / 0.7264817689751959 |
| Sürgősségi felár | 22000 | Allergológia | Allergológia / 0.6550010547187448 |
{
"execution_id": "bec36075-453c-4a13-8268-8b0e3f15fdd2",
"input_url": "https://allergiadoktor.hu/",
"state_filename": "20260330_192059_allergiadoktor_hu.json",
"created_at": "2026-03-30T19:20:59.032941",
"updated_at": "2026-03-30T19:24:48.473917",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-30T19:20:59.950742",
"completed_at": "2026-03-30T19:24:47.103098",
"result": {
"metadata": {
"company_name": "Allergiadoktor – Dr. Söjtöry Hajnalka, allergológus, klinikai immunológus",
"description": "Dr. Söjtöry Hajnalka magánrendelése légúti allergiákra, bőr- és ételallergiákra, valamint összetett, nehezen felismerhető allergiás tünetek kivizsgálására specializálódott. Több mint húsz éves szakmai tapasztalattal várja gyermekek és felnőttek ellátását nyugodt, személyre szabott rendelői környezetben. A rendelésen elérhetők allergia- és légzésfunkciós vizsgálatok, Prick-tesztek, vérvételes laboratóriumi vizsgálatok és korszerű diagnosztikai eszközök, valamint egyéni terápiás javaslatok, beleértve az immunterápiát. Külön figyelmet fordítanak a késleltetett típusú ételérzékenységek feltérképezésére és a multidiszciplináris együttműködésre (pl. gasztroenterológusokkal). Időpontfoglalás előzetesen, rugalmas időpontokkal, lehetőség online konzultációra és sürgősségi ellátásra felár ellenében.",
"arlista_url": "https://allergiadoktor.hu/home#arak",
"varos": "Balaton környéke és Budapest",
"iranyitoszam": "0000",
"utca": "N/A",
"telefonszam": "+36 30 400 4022",
"email": "doktorno@allergiadoktor.hu",
"website": "https://allergiadoktor.hu/"
},
"llm_usage": {
"prompt_tokens": 3262,
"completion_tokens": 1139,
"total_tokens": 4401,
"cost": 0.0030935
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-30T19:21:00.298949",
"completed_at": "2026-03-30T19:24:47.633510",
"result": {
"pages": [
{
"source_url": "https://allergiadoktor.hu/",
"discovered_url": "https://allergiadoktor.hu/",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://allergiadoktor.hu/",
"validation_passed": true,
"ft_count": 7,
"score": 0.999627947807312,
"attempts": 1
},
{
"source_url": "https://allergiadoktor.hu/home#arak",
"discovered_url": "https://allergiadoktor.hu/home#arak",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://allergiadoktor.hu/",
"validation_passed": true,
"ft_count": 7,
"score": 0.999627947807312,
"attempts": 2
}
],
"original_url": "https://allergiadoktor.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-30T19:21:23.158238",
"completed_at": "2026-03-30T19:24:47.940397",
"result": {
"number_of_price_items": 7,
"price_items": [
{
"s": "Allergológiai szakorvosi vizsgálat – első alkalom",
"p": 28000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.6583891363230248
},
{
"s": "Kontrollvizsgálat",
"p": 20000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.7297345359033999
},
{
"s": "Bőrpróba (Prick-teszt)",
"p": 8000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.7800997068322457
},
{
"s": "Konzultáció eredményekről (online/telefonon)",
"p": 12000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.6556066196644865
},
{
"s": "Injekció beadása",
"p": 10000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.669969867199019
},
{
"s": "Vérvétel",
"p": 2500,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.7264817689751959
},
{
"s": "Sürgősségi felár",
"p": 22000,
"c": "Allergológia",
"a": "Allergológia",
"v": 0.6550010547187448
}
],
"llm_usage": {
"prompt_tokens": 6920,
"completion_tokens": 470,
"total_tokens": 7390,
"cost": 0.00221388
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-30T19:21:26.612163",
"completed_at": "2026-03-30T19:24:48.201942",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 7,
"items_processed": 7,
"avg_best_similarity": 0.6964689556594451,
"min_best_similarity": 0.6550010547187448,
"max_best_similarity": 0.7800997068322457,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Allergológiai szakorvosi vizsgálat – első alkalom",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.6583891363230248
},
{
"idx": 1,
"s": "Kontrollvizsgálat",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.7297345359033999
},
{
"idx": 2,
"s": "Bőrpróba (Prick-teszt)",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.7800997068322457
},
{
"idx": 3,
"s": "Konzultáció eredményekről (online/telefonon)",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.6556066196644865
},
{
"idx": 4,
"s": "Injekció beadása",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.669969867199019
},
{
"idx": 5,
"s": "Vérvétel",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.7264817689751959
},
{
"idx": 6,
"s": "Sürgősségi felár",
"c": "Allergológia",
"best_a": "Allergológia",
"best_similarity": 0.6550010547187448
}
],
"llm_usage": {
"prompt_tokens": 111,
"completion_tokens": 0,
"total_tokens": 111,
"cost": 0.00001443
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-30T19:21:43.972662",
"completed_at": "2026-03-30T19:24:47.362981",
"result": {
"reviews": {
"company_name": "Allergiadoktor – Dr. Söjtöry Hajnalka, allergológus, klinikai immunológus",
"total_reviews": 0,
"average_rating": null,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "8623",
"city": "Balatonföldvár",
"street": "Camping u.",
"phone": "06 30 400 4022"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 10293,
"completion_tokens": 1609,
"total_tokens": 11902,
"cost": 0.005321810000000001
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: bec36075-453c-4a13-8268-8b0e3f15fdd2_*.log, CLI: pipeline_bec36075_*.log).
data/logs/bec36075-453c-4a13-8268-8b0e3f15fdd2_20260330_192059.log
2026-03-30 19:20:59 | INFO | prefect.pipeline.parallel.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Starting parallel pipeline execution bec36075-453c-4a13-8268-8b0e3f15fdd2 for URL: https://allergiadoktor.hu/
2026-03-30 19:21:00 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Starting alternative metadata extraction stage
2026-03-30 19:21:00 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Querying metadata for: https://allergiadoktor.hu/
2026-03-30 19:21:00 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Starting discovery-fetch-validation (async) for URL: https://allergiadoktor.hu/
2026-03-30 19:21:00 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-30 19:21:00 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Async crawl starting: https://allergiadoktor.hu/ (max_depth=2, max_concurrent=10, preserve_url_fragments=True)
2026-03-30 19:21:00 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Downloading main URL: https://allergiadoktor.hu/
2026-03-30 19:21:01 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Successfully extracted 6366 characters from main URL
2026-03-30 19:21:01 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Searching for contact pages using OpenSerp
2026-03-30 19:21:01 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'allergiadoktor.hu', 'limit': '3', 'lang': 'HU'}
2026-03-30 19:21:02 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 0): https://allergiadoktor.hu/
2026-03-30 19:21:03 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/cart
2026-03-30 19:21:03 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/home#arak
2026-03-30 19:21:03 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/bovebben
2026-03-30 19:21:03 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/vizit-menete
2026-03-30 19:21:03 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/idpontfoglals
2026-03-30 19:21:04 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/blog
2026-03-30 19:21:05 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/legal
2026-03-30 19:21:05 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 1): https://allergiadoktor.hu/gyik
2026-03-30 19:21:06 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/tudatos+t%C3%A1pl%C3%A1lkoz%C3%A1s
2026-03-30 19:21:08 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/allergia-s-tpllkozs
2026-03-30 19:21:08 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/az-allergia-s-nyarals
2026-03-30 19:21:10 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/poll%C3%A9n+%C3%A9s+gy%C3%BCm%C3%B6lcs
2026-03-30 19:21:10 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/poliallergia
2026-03-30 19:21:10 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/az-allergia-es-tudatossg
2026-03-30 19:21:11 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/mi-jelent-az-alallergia
2026-03-30 19:21:11 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/az-allergiarol-roviden
2026-03-30 19:21:12 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/gy%C3%BCm%C3%B6lcs+allergia
2026-03-30 19:21:14 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/DAO+allergia
2026-03-30 19:21:14 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/hisztamin+intolerancia
2026-03-30 19:21:14 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Prediction batch to http://docker-host:8000/predict/batch completed in 6585.2 ms (remaining_batches=1, texts=10)
2026-03-30 19:21:15 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/EIA
2026-03-30 19:21:16 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/allergia-sport
2026-03-30 19:21:20 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/csal%C3%A1nki%C3%BCt%C3%A9s
2026-03-30 19:21:20 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawled (depth 2): https://allergiadoktor.hu/blog/category/hisztamin+allergia
2026-03-30 19:21:20 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Crawl finished: 65 URLs in 19.9s (success=24, errors=0)
2026-03-30 19:21:20 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Prediction batch to http://docker-host:8000/predict/batch completed in 5550.7 ms (remaining_batches=1, texts=10)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Prediction batch to http://docker-host:8000/predict/batch completed in 1657.8 ms (remaining_batches=1, texts=4)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Pass 1 (httpx): 2 BERT candidates, html_cache 24 entries
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 1/2] Processing (BERT prob=1.00): https://allergiadoktor.hu/
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 1/2] Using cached HTML (1259104 chars)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 1/2] OK (BERT prob=1.00)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 2/2] Processing (BERT prob=1.00): https://allergiadoktor.hu/home#arak
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 2/2] Using cached HTML (296310 chars)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | [URL 2/2] OK (BERT prob=1.00)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Discovery (async) completed with 2 page(s)
2026-03-30 19:21:22 | INFO | src.stages.stage_2_discovery_async.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Detailed logs saved to: data/logs/bec36075-453c-4a13-8268-8b0e3f15fdd2_20260330_192059.log
2026-03-30 19:21:23 | INFO | src.stages.stage_3_data_extraction.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Data extraction: 2 page(s) to process
2026-03-30 19:21:23 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-30 19:21:23 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | OpenSerp returned 1 results
2026-03-30 19:21:23 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Result 1: New Page — Allergiadoktor.hu - Dr. Söjtöry Hajnalka Allergológus ... - https://www.allergiadoktor.hu/new-page
2026-03-30 19:21:23 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Trying to download contact page 1/3: https://www.allergiadoktor.hu/new-page
2026-03-30 19:21:25 | INFO | src.stages.stage_3_data_extraction.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Extracted 7 price items from page 2
2026-03-30 19:21:25 | INFO | src.stages.stage_3_data_extraction.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Extracted 7 price items from page 1
2026-03-30 19:21:25 | INFO | src.stages.stage_3_data_extraction.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Post-process price_items: 14 -> 7 (removed invalid/zero prices and duplicate services)
2026-03-30 19:21:25 | INFO | src.stages.stage_3_data_extraction.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Data extraction stage completed: 7 total price items from 2 page(s)
2026-03-30 19:21:26 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Successfully downloaded and converted 1293 characters from contact page 1
2026-03-30 19:21:26 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-30 19:21:26 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Starting taxonomy enrichment alt stage (embeddings)
2026-03-30 19:21:26 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-30 19:21:27 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | taxonomy_enrichment_alt summary: processed=7 avg=0.6965 min=0.6550 max=0.7801 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-30 19:21:27 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | taxonomy_enrichment_alt weakest_matches: [{'idx': 6, 's': 'Sürgősségi felár', 'c': 'Allergológia', 'best_a': 'Allergológia', 'best_similarity': 0.6550010547187448}, {'idx': 3, 's': 'Konzultáció eredményekről (online/telefonon)', 'c': 'Allergológia', 'best_a': 'Allergológia', 'best_similarity': 0.6556066196644865}, {'idx': 0, 's': 'Allergológiai szakorvosi vizsgálat – első alkalom', 'c': 'Allergológia', 'best_a': 'Allergológia', 'best_similarity': 0.6583891363230248}]
2026-03-30 19:21:27 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | taxonomy_enrichment_alt stage completed
2026-03-30 19:21:43 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Successfully extracted metadata for: Allergiadoktor – Dr. Söjtöry Hajnalka, allergológus, klinikai immunológus
2026-03-30 19:21:43 | INFO | src.stages.stage_1_metadata_alt.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Alternative metadata extraction stage completed
2026-03-30 19:21:43 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Starting reviews scraping stage
2026-03-30 19:21:43 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Found metadata directly: company_name=Allergiadoktor – Dr. Söjtöry Hajnalka, allergológus, klinikai immunológus, varos=Balaton környéke és Budapest
2026-03-30 19:21:43 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | input_path: /tmp/tmp495r063n
2026-03-30 19:21:43 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | output_path: /tmp/tmplxrswxa_
2026-03-30 19:21:43 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Running google-maps-scraper (attempt 1/3)
2026-03-30 19:24:46 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | google-maps-scraper completed successfully on attempt 1
2026-03-30 19:24:46 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | URL match found: allergiadoktor.hu
2026-03-30 19:24:46 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Input fájl mentve: data/review/20260330_192446_allergiadoktor_hu_url_input.txt
2026-03-30 19:24:46 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Output fájl mentve: data/review/20260330_192446_allergiadoktor_hu_url_output.json
2026-03-30 19:24:46 | INFO | src.stages.stage_4_reviews.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Reviews scraping completed. Found 0 reviews
2026-03-30 19:24:47 | INFO | prefect.pipeline.parallel.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-30 19:24:48 | INFO | prefect.pipeline.parallel.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-30 19:24:48 | INFO | prefect.pipeline.parallel.bec36075-453c-4a13-8268-8b0e3f15fdd2 | Pipeline execution bec36075-453c-4a13-8268-8b0e3f15fdd2 completed