A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-30 18:46:52 | 2026-03-30 18:48:16 | 1 min 23 s | — |
| discovery_fetch_validation | completed | 2026-03-30 18:46:41 | 2026-03-30 18:48:15 | 1 min 33 s | — |
| metadata_alt | completed | 2026-03-30 18:46:41 | 2026-03-30 18:48:14 | 1 min 33 s | — |
| reviews | completed | 2026-03-30 18:47:19 | 2026-03-30 18:48:15 | 55 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-30 18:46:58 | 2026-03-30 18:48:16 | 1 min 18 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Sebészeti vizsgálat, dermatoszkópos vizsgálat és vényírás | 30000 | Sebészeti kisműtétek | Bőrgyógyászat / 0.6593568382884781 |
| Anyajegyszűrés | 30000 | Sebészeti kisműtétek | Sebészet / 0.6421166490062815 |
| 1 db bőrelváltozás eltávolítása | 84000 | Sebészeti kisműtétek | Sebészet / 0.6809466935598446 |
| 2 vagy több bőrelváltozás eltávolítása | 110000 | Sebészeti kisműtétek | Sebészet / 0.6628406543940816 |
| Konzultáció azonnali műtéttel | 95000 | Sebészeti kisműtétek | Sebészet / 0.6837872603602071 |
| Állapotfelmérés és konzultáció, 1. alkalom | 30000 | Gyógytorna | Fizioterápia / 0.5805047991882547 |
| Manuális kezelés | 18000 | Gyógytorna | Fizioterápia / 0.7936249120812292 |
| Sportrehabilitáció | 18000 | Gyógytorna | Fizioterápia / 0.7171292280191687 |
| Sportrehabilitáció profi sportolóknak | 30000 | Gyógytorna | Fizioterápia / 0.6710928721430697 |
| Gyógytorna | 18000 | Gyógytorna | Fizioterápia / 0.6802880839427415 |
| Mozgásszervi állapotfelmérés, kiértékelés, javaslatok digitalizálva | 80000 | Sportfizioterápia | Sportorvoslás / 0.6376035715757007 |
| Lökéshullám terápia | 14000 | Fizikoterápia | Fizioterápia / 0.6627460881300364 |
| Mágnesterápia | 8000 | Fizikoterápia | Fizioterápia / 0.7083267582470429 |
| Lézerterápia | 6500 | Fizikoterápia | Fizioterápia / 0.7237529379831683 |
| Elektroterápia | 5500 | Fizikoterápia | Fizioterápia / 0.7585393084235813 |
| Mágneses indukciós terápia (SIS) | 14000 | Fizikoterápia | Fizioterápia / 0.6627754268254595 |
| Reflexológiás talpmasszázs | 12000 | Reflexológia | Alternatív gyógyászat / 0.6077937692575789 |
{
"execution_id": "9d67f0e4-2db3-44d4-aaec-c6f99655b9f6",
"input_url": "https://halmaimedical.hu/",
"state_filename": "20260330_184640_halmaimedical_hu.json",
"created_at": "2026-03-30T18:46:40.281812",
"updated_at": "2026-03-30T18:48:16.976652",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-30T18:46:41.281487",
"completed_at": "2026-03-30T18:48:14.561628",
"result": {
"metadata": {
"company_name": "N/A",
"description": "N/A",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "2000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://halmaimedical.hu/"
},
"llm_usage": {
"prompt_tokens": 666,
"completion_tokens": 443,
"total_tokens": 1109,
"cost": 0.0010525
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-30T18:46:41.570793",
"completed_at": "2026-03-30T18:48:15.542138",
"result": {
"pages": [
{
"source_url": "https://halmaimedical.hu/araink",
"discovered_url": "https://halmaimedical.hu/araink",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://halmaimedical.hu/",
"validation_passed": true,
"ft_count": 25,
"score": 0.9996820688247681,
"attempts": 1
},
{
"source_url": "https://halmaimedical.hu/anyajegy-eltavolitas",
"discovered_url": "https://halmaimedical.hu/anyajegy-eltavolitas",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://halmaimedical.hu/",
"validation_passed": true,
"ft_count": 5,
"score": 0.9994458556175232,
"attempts": 2
},
{
"source_url": "https://halmaimedical.hu/talpmasszazs",
"discovered_url": "https://halmaimedical.hu/talpmasszazs",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://halmaimedical.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.8410539031028748,
"attempts": 3
}
],
"original_url": "https://halmaimedical.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-30T18:46:52.343552",
"completed_at": "2026-03-30T18:48:16.034193",
"result": {
"number_of_price_items": 17,
"price_items": [
{
"s": "Sebészeti vizsgálat, dermatoszkópos vizsgálat és vényírás",
"p": 30000,
"c": "Sebészeti kisműtétek",
"a": "Bőrgyógyászat",
"v": 0.6593568382884781
},
{
"s": "Anyajegyszűrés",
"p": 30000,
"c": "Sebészeti kisműtétek",
"a": "Sebészet",
"v": 0.6421166490062815
},
{
"s": "1 db bőrelváltozás eltávolítása",
"p": 84000,
"c": "Sebészeti kisműtétek",
"a": "Sebészet",
"v": 0.6809466935598446
},
{
"s": "2 vagy több bőrelváltozás eltávolítása",
"p": 110000,
"c": "Sebészeti kisműtétek",
"a": "Sebészet",
"v": 0.6628406543940816
},
{
"s": "Konzultáció azonnali műtéttel",
"p": 95000,
"c": "Sebészeti kisműtétek",
"a": "Sebészet",
"v": 0.6837872603602071
},
{
"s": "Állapotfelmérés és konzultáció, 1. alkalom",
"p": 30000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.5805047991882547
},
{
"s": "Manuális kezelés",
"p": 18000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.7936249120812292
},
{
"s": "Sportrehabilitáció",
"p": 18000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.7171292280191687
},
{
"s": "Sportrehabilitáció profi sportolóknak",
"p": 30000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.6710928721430697
},
{
"s": "Gyógytorna",
"p": 18000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.6802880839427415
},
{
"s": "Mozgásszervi állapotfelmérés, kiértékelés, javaslatok digitalizálva",
"p": 80000,
"c": "Sportfizioterápia",
"a": "Sportorvoslás",
"v": 0.6376035715757007
},
{
"s": "Lökéshullám terápia",
"p": 14000,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.6627460881300364
},
{
"s": "Mágnesterápia",
"p": 8000,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.7083267582470429
},
{
"s": "Lézerterápia",
"p": 6500,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.7237529379831683
},
{
"s": "Elektroterápia",
"p": 5500,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.7585393084235813
},
{
"s": "Mágneses indukciós terápia (SIS)",
"p": 14000,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.6627754268254595
},
{
"s": "Reflexológiás talpmasszázs",
"p": 12000,
"c": "Reflexológia",
"a": "Alternatív gyógyászat",
"v": 0.6077937692575789
}
],
"llm_usage": {
"prompt_tokens": 7002,
"completion_tokens": 895,
"total_tokens": 7897,
"cost": 0.00276354
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-30T18:46:58.042664",
"completed_at": "2026-03-30T18:48:16.513947",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 17,
"items_processed": 17,
"avg_best_similarity": 0.6784250500838781,
"min_best_similarity": 0.5805047991882547,
"max_best_similarity": 0.7936249120812292,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Sebészeti vizsgálat, dermatoszkópos vizsgálat és vényírás",
"c": "Sebészeti kisműtétek",
"best_a": "Bőrgyógyászat",
"best_similarity": 0.6593568382884781
},
{
"idx": 1,
"s": "Anyajegyszűrés",
"c": "Sebészeti kisműtétek",
"best_a": "Sebészet",
"best_similarity": 0.6421166490062815
},
{
"idx": 2,
"s": "1 db bőrelváltozás eltávolítása",
"c": "Sebészeti kisműtétek",
"best_a": "Sebészet",
"best_similarity": 0.6809466935598446
},
{
"idx": 3,
"s": "2 vagy több bőrelváltozás eltávolítása",
"c": "Sebészeti kisműtétek",
"best_a": "Sebészet",
"best_similarity": 0.6628406543940816
},
{
"idx": 4,
"s": "Konzultáció azonnali műtéttel",
"c": "Sebészeti kisműtétek",
"best_a": "Sebészet",
"best_similarity": 0.6837872603602071
},
{
"idx": 5,
"s": "Állapotfelmérés és konzultáció, 1. alkalom",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.5805047991882547
},
{
"idx": 6,
"s": "Manuális kezelés",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.7936249120812292
},
{
"idx": 7,
"s": "Sportrehabilitáció",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.7171292280191687
},
{
"idx": 8,
"s": "Sportrehabilitáció profi sportolóknak",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.6710928721430697
},
{
"idx": 9,
"s": "Gyógytorna",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.6802880839427415
},
{
"idx": 10,
"s": "Mozgásszervi állapotfelmérés, kiértékelés, javaslatok digitalizálva",
"c": "Sportfizioterápia",
"best_a": "Sportorvoslás",
"best_similarity": 0.6376035715757007
},
{
"idx": 11,
"s": "Lökéshullám terápia",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.6627460881300364
},
{
"idx": 12,
"s": "Mágnesterápia",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.7083267582470429
},
{
"idx": 13,
"s": "Lézerterápia",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.7237529379831683
},
{
"idx": 14,
"s": "Elektroterápia",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.7585393084235813
},
{
"idx": 15,
"s": "Mágneses indukciós terápia (SIS)",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.6627754268254595
},
{
"idx": 16,
"s": "Reflexológiás talpmasszázs",
"c": "Reflexológia",
"best_a": "Alternatív gyógyászat",
"best_similarity": 0.6077937692575789
}
],
"llm_usage": {
"prompt_tokens": 358,
"completion_tokens": 0,
"total_tokens": 358,
"cost": 0.00004654
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-30T18:47:19.389253",
"completed_at": "2026-03-30T18:48:15.054196",
"result": {
"reviews": {
"company_name": "N/A",
"total_reviews": 6,
"average_rating": 5,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "2500",
"city": "Esztergom",
"street": "Táncsics Mihály u. 5-1. emelet",
"phone": "(06 33) 200 777"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 8026,
"completion_tokens": 1338,
"total_tokens": 9364,
"cost": 0.00386258
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 9d67f0e4-2db3-44d4-aaec-c6f99655b9f6_*.log, CLI: pipeline_9d67f0e4_*.log).
data/logs/9d67f0e4-2db3-44d4-aaec-c6f99655b9f6_20260330_184640.log
2026-03-30 18:46:40 | INFO | prefect.pipeline.parallel.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Starting parallel pipeline execution 9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 for URL: https://halmaimedical.hu/
2026-03-30 18:46:41 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Starting discovery-fetch-validation (async) for URL: https://halmaimedical.hu/
2026-03-30 18:46:41 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-30 18:46:41 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Async crawl starting: https://halmaimedical.hu/ (max_depth=2, max_concurrent=10, preserve_url_fragments=True)
2026-03-30 18:46:41 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Starting alternative metadata extraction stage
2026-03-30 18:46:41 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Querying metadata for: https://halmaimedical.hu/
2026-03-30 18:46:41 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Downloading main URL: https://halmaimedical.hu/
2026-03-30 18:46:42 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 0): https://halmaimedical.hu/
2026-03-30 18:46:42 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Successfully extracted 296 characters from main URL
2026-03-30 18:46:42 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Searching for contact pages using OpenSerp
2026-03-30 18:46:42 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'halmaimedical.hu', 'limit': '3', 'lang': 'HU'}
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/sebeszeti-kismutetek
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/manualis-kezelesek
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/fizioterapia
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/sportrehabilitacio
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/gyogytorna
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/rolunk
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/anyajegy-eltavolitas
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/talpvizsgalat
2026-03-30 18:46:43 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/talpmasszazs
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/munkatarsaink
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/halmai-tamas
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/pecskai-rita
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/gabala-zsombor
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/egeszsegpenztarak
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/partnereink
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/araink
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/hivatasos-labdarugoknak
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/dr-szollar-andras
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawled (depth 1): https://halmaimedical.hu/kapcsolat
2026-03-30 18:46:44 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Crawl finished: 43 URLs in 3.3s (success=20, errors=2)
2026-03-30 18:46:48 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Prediction batch to http://docker-host:8000/predict/batch completed in 4204.0 ms (remaining_batches=1, texts=10)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Prediction batch to http://docker-host:8000/predict/batch completed in 3412.2 ms (remaining_batches=1, texts=10)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Pass 1 (httpx): 3 BERT candidates, html_cache 20 entries
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 1/3] Processing (BERT prob=1.00): https://halmaimedical.hu/araink
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 1/3] Using cached HTML (72444 chars)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 1/3] OK (BERT prob=1.00)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 2/3] Processing (BERT prob=1.00): https://halmaimedical.hu/anyajegy-eltavolitas
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 2/3] Using cached HTML (68731 chars)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 2/3] OK (BERT prob=1.00)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 3/3] Processing (BERT prob=0.84): https://halmaimedical.hu/talpmasszazs
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 3/3] Using cached HTML (60544 chars)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | [URL 3/3] OK (BERT prob=0.84)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Discovery (async) completed with 3 page(s)
2026-03-30 18:46:51 | INFO | src.stages.stage_2_discovery_async.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Detailed logs saved to: data/logs/9d67f0e4-2db3-44d4-aaec-c6f99655b9f6_20260330_184640.log
2026-03-30 18:46:52 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Data extraction: 3 page(s) to process
2026-03-30 18:46:53 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Extracted 0 price items from page 3
2026-03-30 18:46:54 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Extracted 5 price items from page 2
2026-03-30 18:46:57 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Extracted 19 price items from page 1
2026-03-30 18:46:57 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Post-process price_items: 24 -> 17 (removed invalid/zero prices and duplicate services)
2026-03-30 18:46:57 | INFO | src.stages.stage_3_data_extraction.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Data extraction stage completed: 17 total price items from 3 page(s)
2026-03-30 18:46:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Starting taxonomy enrichment alt stage (embeddings)
2026-03-30 18:46:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-30 18:46:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | taxonomy_enrichment_alt summary: processed=17 avg=0.6784 min=0.5805 max=0.7936 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-30 18:46:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | taxonomy_enrichment_alt weakest_matches: [{'idx': 5, 's': 'Állapotfelmérés és konzultáció, 1. alkalom', 'c': 'Gyógytorna', 'best_a': 'Fizioterápia', 'best_similarity': 0.5805047991882547}, {'idx': 16, 's': 'Reflexológiás talpmasszázs', 'c': 'Reflexológia', 'best_a': 'Alternatív gyógyászat', 'best_similarity': 0.6077937692575789}, {'idx': 10, 's': 'Mozgásszervi állapotfelmérés, kiértékelés, javaslatok digitalizálva', 'c': 'Sportfizioterápia', 'best_a': 'Sportorvoslás', 'best_similarity': 0.6376035715757007}]
2026-03-30 18:46:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | taxonomy_enrichment_alt stage completed
2026-03-30 18:47:12 | WARNING | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-30 18:47:12 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-30 18:47:18 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Successfully extracted metadata for: N/A
2026-03-30 18:47:18 | INFO | src.stages.stage_1_metadata_alt.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Alternative metadata extraction stage completed
2026-03-30 18:47:19 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Starting reviews scraping stage
2026-03-30 18:47:19 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Found metadata directly: company_name=N/A, varos=N/A
2026-03-30 18:47:19 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | input_path: /tmp/tmp2nmuz0nr
2026-03-30 18:47:19 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | output_path: /tmp/tmpkze0pe2b
2026-03-30 18:47:19 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Running google-maps-scraper (attempt 1/3)
2026-03-30 18:48:13 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-30 18:48:13 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | URL match found: halmaimedical.hu
2026-03-30 18:48:13 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Input fájl mentve: data/review/20260330_184813_halmaimedical_hu_url_input.txt
2026-03-30 18:48:13 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Output fájl mentve: data/review/20260330_184813_halmaimedical_hu_url_output.json
2026-03-30 18:48:13 | INFO | src.stages.stage_4_reviews.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Reviews scraping completed. Found 0 reviews
2026-03-30 18:48:15 | INFO | prefect.pipeline.parallel.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-30 18:48:16 | INFO | prefect.pipeline.parallel.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-30 18:48:16 | INFO | prefect.pipeline.parallel.9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 | Pipeline execution 9d67f0e4-2db3-44d4-aaec-c6f99655b9f6 completed