A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-30 19:06:39 | 2026-03-30 19:06:46 | 6 s | — |
| discovery_fetch_validation | completed | 2026-03-30 19:04:42 | 2026-03-30 19:06:46 | 2 min 4 s | — |
| metadata_alt | completed | 2026-03-30 19:04:42 | 2026-03-30 19:06:04 | 1 min 22 s | — |
| reviews | completed | 2026-03-30 19:05:35 | 2026-03-30 19:06:04 | 28 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-30 19:06:45 | 2026-03-30 19:06:46 | 1.0 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Lágyrészek egyéb : végtagi-, hasfali-, lágyéktáji területek UH vizsgálata ( pl. tapintható elváltozások - kivétel emlő!, sérv, nyirokcsomók ) | 33000 | Radiológia | Radiológia / 0.6801079977352075 |
| Belgyógyászati szakorvosi vizsgálat (első vizsgálat) | 31900 | Belgyógyászat | Belgyógyászat / 0.7052468297855307 |
| Belgyógyászati szakorvosi kontroll vizsgálat | 26900 | Belgyógyászat | Belgyógyászat / 0.7421046777492092 |
| Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás nélkül) | 27000 | Csecsemő és gyermekgyógyászat | Újszülöttgyógyászat / 0.6311649750713384 |
| Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás beadásával) | 31000 | Csecsemő és gyermekgyógyászat | Újszülöttgyógyászat / 0.6372321511211385 |
| Csecsemő és gyermekgyógyászati kontroll vizsgálat (2 hónapon belül) | 23000 | Csecsemő és gyermekgyógyászat | Újszülöttgyógyászat / 0.6684623723686731 |
| Dietetikai első konzultáció | 19800 | Dietetika | Dietetika / 0.7290501446274037 |
| Dietetikai kontroll vizsgálat | 12000 | Dietetika | Dietetika / 0.6835510926748009 |
| „A” foglalkozás-egészségi osztály | 13000 | Foglalkozás-egészségügy, üzemorvos | Sportorvoslás / 0.48710086528613367 |
| „B” foglalkozás-egészségi osztály | 11500 | Foglalkozás-egészségügy, üzemorvos | Sportorvoslás / 0.5025170297989732 |
| „C” foglalkozás-egészségi osztály | 10000 | Foglalkozás-egészségügy, üzemorvos | Sportorvoslás / 0.503759915857204 |
| „D” foglalkozás-egészségi osztály | 7500 | Foglalkozás-egészségügy, üzemorvos | Ideggyógyászat / 0.501189556125272 |
| Fül-Orr-Gégészeti szakorvosi vizsgálatok (fül, orr, garat, gége) | 27000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.8155607825515298 |
| Fül-Orr-Gégészeti kontroll vizsgálatok (3 hónapon belül) | 21000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.721112264220456 |
| BPPV vizsgálat - szédüléses vizsgálat (szakvizsgálattal) | 30000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.750781335981587 |
| Gégerákszűrés tükrözéssel + szakorvosi vizsgálat | 34000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.7510321328923991 |
| Tenyésztés fülből, orrból, torokból | 9000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.6943339872939233 |
| Hallójárati gyulladáskezelés | 7000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.7374375028347007 |
| Orrvérzés ellátása | 14000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.6834309661606274 |
| Fül-Orr-Gégészeti receptírás | 3000 | Fül-Orr-Gégészet | Fül-orr-gégészet / 0.6805716993478453 |
| Neurológiai szakorvosi vizsgálat | 27000 | Neurológia | Ideggyógyászat / 0.6687206499266157 |
| Carotis ultrahang | 29000 | Neurológia | Ideggyógyászat / 0.6517061644542981 |
| Ortopédiai kontroll vizsgálat | 24000 | Ortopédia | Ortopédia / 0.6262843531617108 |
| Ortopédiai szakorvosi vizsgálat | 29000 | Ortopédia | Ortopédia / 0.6681245286723722 |
| Injekció beadása az izületbe (az injekció árát nem tartalmazza) | 11000 | Ortopédia | Ortopédia / 0.6325076983798318 |
| Hasi és kismedencei UH (szigorúan éhgyomorra, telt hólyaggal!) | 28000 | Radiológia | Radiológia / 0.6666888006291284 |
| Pajzsmirigy és nyaki lágyrészek UH vizsgálata | 33000 | Radiológia | Radiológia / 0.6259543883241319 |
| Nyaki nagyerek -carotis duplex UH vizsgálat | 29000 | Radiológia | Radiológia / 0.5913264051494984 |
| Alsó végtagi vénás UH-egyoldali | 28000 | Radiológia | Angiológia / 0.6266256405704944 |
| Tüdőgyógyászati kontroll (3 hónapon belül, légzésfunkcióval együtt) | 28000 | Tüdőgyógyászat | Pulmonológia / 0.6965130180689885 |
| Tüdőgyógyászati első vizsgálat (légzésfunkcióval együtt) | 31000 | Tüdőgyógyászat | Pulmonológia / 0.7351444374710118 |
| Vizsgálathoz kérhető allergia vizsgálat | 10000 | Tüdőgyógyászat | Allergológia / 0.7084045625514134 |
{
"execution_id": "44167a0f-df9d-4ec5-9441-1119b4ceb75f",
"input_url": "https://www.tata.elixirmedical.hu/",
"state_filename": "20260330_190441_tata_elixirmedical_hu.json",
"created_at": "2026-03-30T19:04:41.812577",
"updated_at": "2026-03-30T19:06:46.410277",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-30T19:04:42.019709",
"completed_at": "2026-03-30T19:06:04.046927",
"result": {
"metadata": {
"company_name": "Elixir Medical (Tata)",
"description": "Az Elixir Medical Tata magán egészségügyi központ 2025-ben nyílt meg Tatán, az Öreg-tó szomszédságában, a cég pedig 2024-ben nyitotta első központját Felsőzsolcán. Kiemelt hangsúlyt fektetünk a prevencióra és a betegségek korai stádiumban történő diagnosztizálására, továbbá magas színvonalú szakmai ellátást biztosítunk igényes, elegáns környezetben. A központ folyamatosan bővíti szakrendeléseit a páciensek igényei szerint, többek között gyermekgyógyászat, dietetika, fül-orr-gégészet, neurológia, ortopédia, radiológia és tüdőgyógyászat érhető el. Az oldal impresszuma szerint a szolgáltatást a PRESI-DENT 2006 Kft. üzemelteti, a rendelő pedig a páciensek kényelmét és biztonságát helyezi előtérbe. Tájékoztatjuk pácienseinket az időpontfoglalás és előlegfizetés feltételeiről is, valamint egészségpénztári szerződésekre is lehetőség van.",
"arlista_url": "https://www.tata.elixirmedical.hu/szakrendeles-arak/",
"varos": "Tata",
"iranyitoszam": "2890",
"utca": "Ady Endre u. 29.",
"telefonszam": "+36 30 178 9342",
"email": "drverebzsuzsanna@gmail.com",
"website": "https://www.tata.elixirmedical.hu/"
},
"llm_usage": {
"prompt_tokens": 4110,
"completion_tokens": 1108,
"total_tokens": 5218,
"cost": 0.0032435
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-30T19:04:42.067029",
"completed_at": "2026-03-30T19:06:46.267357",
"result": {
"pages": [
{
"source_url": "https://www.tata.elixirmedical.hu/szakrendeles-arak",
"discovered_url": "https://www.tata.elixirmedical.hu/szakrendeles-arak",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert_lambda,curl,html",
"original_url": "https://www.tata.elixirmedical.hu/",
"validation_passed": true,
"ft_count": 33,
"score": 0.9995914101600647,
"attempts": 1
},
{
"source_url": "https://www.tata.elixirmedical.hu/szakrendeles-arak#content",
"discovered_url": "https://www.tata.elixirmedical.hu/szakrendeles-arak#content",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert_lambda,curl,html",
"original_url": "https://www.tata.elixirmedical.hu/",
"validation_passed": true,
"ft_count": 33,
"score": 0.9995914101600647,
"attempts": 2
},
{
"source_url": "https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/also-vegtagi-venas-uh",
"discovered_url": "https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/also-vegtagi-venas-uh",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert_lambda,curl,html",
"original_url": "https://www.tata.elixirmedical.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.7888146042823792,
"attempts": 3
}
],
"original_url": "https://www.tata.elixirmedical.hu/",
"strategy": "async_crawl_bert_lambda,curl,html"
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-30T19:05:35.840513",
"completed_at": "2026-03-30T19:06:04.092579",
"result": {
"reviews": {
"company_name": "Elixir Medical (Tata)",
"total_reviews": 0,
"average_rating": null,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "2890",
"city": "Tata",
"street": "Ady Endre u. 29",
"phone": ""
}
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-30T19:06:39.668152",
"completed_at": "2026-03-30T19:06:46.315578",
"result": {
"number_of_price_items": 32,
"price_items": [
{
"s": "Lágyrészek egyéb : végtagi-, hasfali-, lágyéktáji területek UH vizsgálata ( pl. tapintható elváltozások - kivétel emlő!, sérv, nyirokcsomók )",
"p": 33000,
"c": "Radiológia",
"a": "Radiológia",
"v": 0.6801079977352075
},
{
"s": "Belgyógyászati szakorvosi vizsgálat (első vizsgálat)",
"p": 31900,
"c": "Belgyógyászat",
"a": "Belgyógyászat",
"v": 0.7052468297855307
},
{
"s": "Belgyógyászati szakorvosi kontroll vizsgálat",
"p": 26900,
"c": "Belgyógyászat",
"a": "Belgyógyászat",
"v": 0.7421046777492092
},
{
"s": "Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás nélkül)",
"p": 27000,
"c": "Csecsemő és gyermekgyógyászat",
"a": "Újszülöttgyógyászat",
"v": 0.6311649750713384
},
{
"s": "Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás beadásával)",
"p": 31000,
"c": "Csecsemő és gyermekgyógyászat",
"a": "Újszülöttgyógyászat",
"v": 0.6372321511211385
},
{
"s": "Csecsemő és gyermekgyógyászati kontroll vizsgálat (2 hónapon belül)",
"p": 23000,
"c": "Csecsemő és gyermekgyógyászat",
"a": "Újszülöttgyógyászat",
"v": 0.6684623723686731
},
{
"s": "Dietetikai első konzultáció",
"p": 19800,
"c": "Dietetika",
"a": "Dietetika",
"v": 0.7290501446274037
},
{
"s": "Dietetikai kontroll vizsgálat",
"p": 12000,
"c": "Dietetika",
"a": "Dietetika",
"v": 0.6835510926748009
},
{
"s": "„A” foglalkozás-egészségi osztály",
"p": 13000,
"c": "Foglalkozás-egészségügy, üzemorvos",
"a": "Sportorvoslás",
"v": 0.48710086528613367
},
{
"s": "„B” foglalkozás-egészségi osztály",
"p": 11500,
"c": "Foglalkozás-egészségügy, üzemorvos",
"a": "Sportorvoslás",
"v": 0.5025170297989732
},
{
"s": "„C” foglalkozás-egészségi osztály",
"p": 10000,
"c": "Foglalkozás-egészségügy, üzemorvos",
"a": "Sportorvoslás",
"v": 0.503759915857204
},
{
"s": "„D” foglalkozás-egészségi osztály",
"p": 7500,
"c": "Foglalkozás-egészségügy, üzemorvos",
"a": "Ideggyógyászat",
"v": 0.501189556125272
},
{
"s": "Fül-Orr-Gégészeti szakorvosi vizsgálatok (fül, orr, garat, gége)",
"p": 27000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.8155607825515298
},
{
"s": "Fül-Orr-Gégészeti kontroll vizsgálatok (3 hónapon belül)",
"p": 21000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.721112264220456
},
{
"s": "BPPV vizsgálat - szédüléses vizsgálat (szakvizsgálattal)",
"p": 30000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.750781335981587
},
{
"s": "Gégerákszűrés tükrözéssel + szakorvosi vizsgálat",
"p": 34000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.7510321328923991
},
{
"s": "Tenyésztés fülből, orrból, torokból",
"p": 9000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.6943339872939233
},
{
"s": "Hallójárati gyulladáskezelés",
"p": 7000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.7374375028347007
},
{
"s": "Orrvérzés ellátása",
"p": 14000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.6834309661606274
},
{
"s": "Fül-Orr-Gégészeti receptírás",
"p": 3000,
"c": "Fül-Orr-Gégészet",
"a": "Fül-orr-gégészet",
"v": 0.6805716993478453
},
{
"s": "Neurológiai szakorvosi vizsgálat",
"p": 27000,
"c": "Neurológia",
"a": "Ideggyógyászat",
"v": 0.6687206499266157
},
{
"s": "Carotis ultrahang",
"p": 29000,
"c": "Neurológia",
"a": "Ideggyógyászat",
"v": 0.6517061644542981
},
{
"s": "Ortopédiai kontroll vizsgálat",
"p": 24000,
"c": "Ortopédia",
"a": "Ortopédia",
"v": 0.6262843531617108
},
{
"s": "Ortopédiai szakorvosi vizsgálat",
"p": 29000,
"c": "Ortopédia",
"a": "Ortopédia",
"v": 0.6681245286723722
},
{
"s": "Injekció beadása az izületbe (az injekció árát nem tartalmazza)",
"p": 11000,
"c": "Ortopédia",
"a": "Ortopédia",
"v": 0.6325076983798318
},
{
"s": "Hasi és kismedencei UH (szigorúan éhgyomorra, telt hólyaggal!)",
"p": 28000,
"c": "Radiológia",
"a": "Radiológia",
"v": 0.6666888006291284
},
{
"s": "Pajzsmirigy és nyaki lágyrészek UH vizsgálata",
"p": 33000,
"c": "Radiológia",
"a": "Radiológia",
"v": 0.6259543883241319
},
{
"s": "Nyaki nagyerek -carotis duplex UH vizsgálat",
"p": 29000,
"c": "Radiológia",
"a": "Radiológia",
"v": 0.5913264051494984
},
{
"s": "Alsó végtagi vénás UH-egyoldali",
"p": 28000,
"c": "Radiológia",
"a": "Angiológia",
"v": 0.6266256405704944
},
{
"s": "Tüdőgyógyászati kontroll (3 hónapon belül, légzésfunkcióval együtt)",
"p": 28000,
"c": "Tüdőgyógyászat",
"a": "Pulmonológia",
"v": 0.6965130180689885
},
{
"s": "Tüdőgyógyászati első vizsgálat (légzésfunkcióval együtt)",
"p": 31000,
"c": "Tüdőgyógyászat",
"a": "Pulmonológia",
"v": 0.7351444374710118
},
{
"s": "Vizsgálathoz kérhető allergia vizsgálat",
"p": 10000,
"c": "Tüdőgyógyászat",
"a": "Allergológia",
"v": 0.7084045625514134
}
],
"llm_usage": {
"prompt_tokens": 9941,
"completion_tokens": 2891,
"total_tokens": 12832,
"cost": 0.005299079999999999
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-30T19:06:45.401425",
"completed_at": "2026-03-30T19:06:46.362930",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 32,
"items_processed": 32,
"avg_best_similarity": 0.6626171539638578,
"min_best_similarity": 0.48710086528613367,
"max_best_similarity": 0.8155607825515298,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Lágyrészek egyéb : végtagi-, hasfali-, lágyéktáji területek UH vizsgálata ( pl. tapintható elváltozások - kivétel emlő!, sérv, nyirokcsomók )",
"c": "Radiológia",
"best_a": "Radiológia",
"best_similarity": 0.6801079977352075
},
{
"idx": 1,
"s": "Belgyógyászati szakorvosi vizsgálat (első vizsgálat)",
"c": "Belgyógyászat",
"best_a": "Belgyógyászat",
"best_similarity": 0.7052468297855307
},
{
"idx": 2,
"s": "Belgyógyászati szakorvosi kontroll vizsgálat",
"c": "Belgyógyászat",
"best_a": "Belgyógyászat",
"best_similarity": 0.7421046777492092
},
{
"idx": 3,
"s": "Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás nélkül)",
"c": "Csecsemő és gyermekgyógyászat",
"best_a": "Újszülöttgyógyászat",
"best_similarity": 0.6311649750713384
},
{
"idx": 4,
"s": "Csecsemő és gyermekgyógyászati szakorvosi vizsgálat (oltás beadásával)",
"c": "Csecsemő és gyermekgyógyászat",
"best_a": "Újszülöttgyógyászat",
"best_similarity": 0.6372321511211385
},
{
"idx": 5,
"s": "Csecsemő és gyermekgyógyászati kontroll vizsgálat (2 hónapon belül)",
"c": "Csecsemő és gyermekgyógyászat",
"best_a": "Újszülöttgyógyászat",
"best_similarity": 0.6684623723686731
},
{
"idx": 6,
"s": "Dietetikai első konzultáció",
"c": "Dietetika",
"best_a": "Dietetika",
"best_similarity": 0.7290501446274037
},
{
"idx": 7,
"s": "Dietetikai kontroll vizsgálat",
"c": "Dietetika",
"best_a": "Dietetika",
"best_similarity": 0.6835510926748009
},
{
"idx": 8,
"s": "„A” foglalkozás-egészségi osztály",
"c": "Foglalkozás-egészségügy, üzemorvos",
"best_a": "Sportorvoslás",
"best_similarity": 0.48710086528613367
},
{
"idx": 9,
"s": "„B” foglalkozás-egészségi osztály",
"c": "Foglalkozás-egészségügy, üzemorvos",
"best_a": "Sportorvoslás",
"best_similarity": 0.5025170297989732
},
{
"idx": 10,
"s": "„C” foglalkozás-egészségi osztály",
"c": "Foglalkozás-egészségügy, üzemorvos",
"best_a": "Sportorvoslás",
"best_similarity": 0.503759915857204
},
{
"idx": 11,
"s": "„D” foglalkozás-egészségi osztály",
"c": "Foglalkozás-egészségügy, üzemorvos",
"best_a": "Ideggyógyászat",
"best_similarity": 0.501189556125272
},
{
"idx": 12,
"s": "Fül-Orr-Gégészeti szakorvosi vizsgálatok (fül, orr, garat, gége)",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.8155607825515298
},
{
"idx": 13,
"s": "Fül-Orr-Gégészeti kontroll vizsgálatok (3 hónapon belül)",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.721112264220456
},
{
"idx": 14,
"s": "BPPV vizsgálat - szédüléses vizsgálat (szakvizsgálattal)",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.750781335981587
},
{
"idx": 15,
"s": "Gégerákszűrés tükrözéssel + szakorvosi vizsgálat",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.7510321328923991
},
{
"idx": 16,
"s": "Tenyésztés fülből, orrból, torokból",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.6943339872939233
},
{
"idx": 17,
"s": "Hallójárati gyulladáskezelés",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.7374375028347007
},
{
"idx": 18,
"s": "Orrvérzés ellátása",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.6834309661606274
},
{
"idx": 19,
"s": "Fül-Orr-Gégészeti receptírás",
"c": "Fül-Orr-Gégészet",
"best_a": "Fül-orr-gégészet",
"best_similarity": 0.6805716993478453
},
{
"idx": 20,
"s": "Neurológiai szakorvosi vizsgálat",
"c": "Neurológia",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6687206499266157
},
{
"idx": 21,
"s": "Carotis ultrahang",
"c": "Neurológia",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6517061644542981
},
{
"idx": 22,
"s": "Ortopédiai kontroll vizsgálat",
"c": "Ortopédia",
"best_a": "Ortopédia",
"best_similarity": 0.6262843531617108
},
{
"idx": 23,
"s": "Ortopédiai szakorvosi vizsgálat",
"c": "Ortopédia",
"best_a": "Ortopédia",
"best_similarity": 0.6681245286723722
},
{
"idx": 24,
"s": "Injekció beadása az izületbe (az injekció árát nem tartalmazza)",
"c": "Ortopédia",
"best_a": "Ortopédia",
"best_similarity": 0.6325076983798318
},
{
"idx": 25,
"s": "Hasi és kismedencei UH (szigorúan éhgyomorra, telt hólyaggal!)",
"c": "Radiológia",
"best_a": "Radiológia",
"best_similarity": 0.6666888006291284
},
{
"idx": 26,
"s": "Pajzsmirigy és nyaki lágyrészek UH vizsgálata",
"c": "Radiológia",
"best_a": "Radiológia",
"best_similarity": 0.6259543883241319
},
{
"idx": 27,
"s": "Nyaki nagyerek -carotis duplex UH vizsgálat",
"c": "Radiológia",
"best_a": "Radiológia",
"best_similarity": 0.5913264051494984
},
{
"idx": 28,
"s": "Alsó végtagi vénás UH-egyoldali",
"c": "Radiológia",
"best_a": "Angiológia",
"best_similarity": 0.6266256405704944
},
{
"idx": 29,
"s": "Tüdőgyógyászati kontroll (3 hónapon belül, légzésfunkcióval együtt)",
"c": "Tüdőgyógyászat",
"best_a": "Pulmonológia",
"best_similarity": 0.6965130180689885
},
{
"idx": 30,
"s": "Tüdőgyógyászati első vizsgálat (légzésfunkcióval együtt)",
"c": "Tüdőgyógyászat",
"best_a": "Pulmonológia",
"best_similarity": 0.7351444374710118
},
{
"idx": 31,
"s": "Vizsgálathoz kérhető allergia vizsgálat",
"c": "Tüdőgyógyászat",
"best_a": "Allergológia",
"best_similarity": 0.7084045625514134
}
],
"llm_usage": {
"prompt_tokens": 970,
"completion_tokens": 0,
"total_tokens": 970,
"cost": 0.0001261
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 15021,
"completion_tokens": 3999,
"total_tokens": 19020,
"cost": 0.00866868
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 44167a0f-df9d-4ec5-9441-1119b4ceb75f_*.log, CLI: pipeline_44167a0f_*.log).
data/logs/44167a0f-df9d-4ec5-9441-1119b4ceb75f_20260330_190441.log
2026-03-30 19:04:41 | INFO | prefect.pipeline.parallel.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Starting parallel pipeline execution 44167a0f-df9d-4ec5-9441-1119b4ceb75f for URL: https://www.tata.elixirmedical.hu/
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Starting alternative metadata extraction stage
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Querying metadata for: https://www.tata.elixirmedical.hu/
2026-03-30 19:04:42 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Starting discovery-fetch-validation (async) for URL: https://www.tata.elixirmedical.hu/
2026-03-30 19:04:42 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-30 19:04:42 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Async crawl starting: https://www.tata.elixirmedical.hu/ (max_depth=2, max_concurrent=10, preserve_url_fragments=True)
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Downloading main URL: https://www.tata.elixirmedical.hu/
2026-03-30 19:04:42 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 0): https://www.tata.elixirmedical.hu/
2026-03-30 19:04:42 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 1): https://www.tata.elixirmedical.hu/#content
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Successfully extracted 1066 characters from main URL
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Searching for contact pages using OpenSerp
2026-03-30 19:04:42 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'tata.elixirmedical.hu', 'limit': '3', 'lang': 'HU'}
2026-03-30 19:04:54 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/ful-orr-gegeszet
2026-03-30 19:04:54 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/radiologia
2026-03-30 19:05:03 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-30 19:05:03 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | OpenSerp returned 2 results
2026-03-30 19:05:03 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Result 1: Impresszum - Elixir Medical - https://www.tata.elixirmedical.hu/impresszum/
2026-03-30 19:05:03 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Result 2: Időpontfoglalás orvosi vizsgálatra - https://www.tata.elixirmedical.hu/idopontfoglalas-orvosi-vizsgalatra?_post_id=228
2026-03-30 19:05:03 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Trying to download contact page 1/3: https://www.tata.elixirmedical.hu/impresszum/
2026-03-30 19:05:04 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Successfully downloaded and converted 3930 characters from contact page 1
2026-03-30 19:05:04 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Trying to download contact page 2/3: https://www.tata.elixirmedical.hu/idopontfoglalas-orvosi-vizsgalatra?_post_id=228
2026-03-30 19:05:15 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ketoldali-also-vegtagi-venas-uh
2026-03-30 19:05:15 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ket-regio-pl-lagyreszek-es-pajzsmirigy
2026-03-30 19:05:15 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/egy-regio-pl-nyaki-lagyreszek-vagy-pajzsmirigy-stb
2026-03-30 19:05:15 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawl finished: 33 URLs in 33.7s (success=7, errors=21)
2026-03-30 19:05:18 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Successfully downloaded and converted 4481 characters from contact page 2
2026-03-30 19:05:18 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-30 19:05:18 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 2379.6 ms (remaining_batches=1, texts=7)
2026-03-30 19:05:18 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Pass 1 (httpx): 0 BERT candidates, html_cache 7 entries
2026-03-30 19:05:18 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Pass 1 yielded 0 valid pages. Retrying full crawl with Playwright Lambda (max_concurrent=5): https://bxsklyrivxk6xkvbkrkmte3ayy0nnevr.lambda-url.eu-central-1.on.aws/
2026-03-30 19:05:18 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Async crawl starting: https://www.tata.elixirmedical.hu/ (max_depth=2, max_concurrent=5, preserve_url_fragments=True)
2026-03-30 19:05:24 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 0): https://www.tata.elixirmedical.hu/
2026-03-30 19:05:27 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/#content
2026-03-30 19:05:32 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/neurologia
2026-03-30 19:05:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/dietetika
2026-03-30 19:05:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/csecsemo-es-gyermekgyogyaszat
2026-03-30 19:05:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendelesek
2026-03-30 19:05:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/ful-orr-gegeszet
2026-03-30 19:05:35 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/ortopedia
2026-03-30 19:05:35 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Successfully extracted metadata for: Elixir Medical (Tata)
2026-03-30 19:05:35 | INFO | src.stages.stage_1_metadata_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Alternative metadata extraction stage completed
2026-03-30 19:05:35 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Starting reviews scraping stage
2026-03-30 19:05:35 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Found metadata directly: company_name=Elixir Medical (Tata), varos=Tata
2026-03-30 19:05:35 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | input_path: /tmp/tmpmf89a4i6
2026-03-30 19:05:35 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | output_path: /tmp/tmp5xwo50zy
2026-03-30 19:05:35 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Running google-maps-scraper (attempt 1/3)
2026-03-30 19:05:38 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/radiologia
2026-03-30 19:05:38 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/galeria
2026-03-30 19:05:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles-arak
2026-03-30 19:05:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/szakrendeles/tudogyogyaszat
2026-03-30 19:05:40 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/wp-content/uploads/2025/12/P1190696.webp
2026-03-30 19:05:40 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/kapcsolat
2026-03-30 19:05:41 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/wp-content/uploads/2025/12/P1190760.webp
2026-03-30 19:05:41 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/wp-content/uploads/2025/12/P1190774.webp
2026-03-30 19:05:41 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/wp-content/uploads/2025/12/P1190789.webp
2026-03-30 19:05:41 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/wp-content/uploads/2025/12/P1190679.webp
2026-03-30 19:05:43 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 3817.1 ms (remaining_batches=1, texts=10)
2026-03-30 19:05:43 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/impresszum
2026-03-30 19:05:45 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/adatkezelesi-tajekoztato
2026-03-30 19:05:46 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/altalanos-szerzodesi-feltetelek
2026-03-30 19:05:46 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 1): https://www.tata.elixirmedical.hu/mediamegjeleneseink
2026-03-30 19:05:47 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/neurologia#content
2026-03-30 19:05:47 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/neurologiai-szakorvosi-vizsgalat
2026-03-30 19:05:49 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/carotis-ultrahang
2026-03-30 19:05:50 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 4238.4 ms (remaining_batches=1, texts=10)
2026-03-30 19:05:52 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/dietetika#content
2026-03-30 19:05:52 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/dietetikai-elso-konzultacio
2026-03-30 19:05:53 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/dietetikai-kontrollvizsgalat
2026-03-30 19:05:53 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/csecsemo-es-gyermekgyogyaszat#content
2026-03-30 19:05:53 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/csecsemo-es-gyermekgyogyaszati-szakorvosi-vizsgalat-oltas-nelkul
2026-03-30 19:05:56 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/csecsemo-es-gyermekgyogyaszati-szakorvosi-vizsgalat-oltassal
2026-03-30 19:05:58 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/csecsemo-es-gyermekgyogyaszati-kontroll
2026-03-30 19:05:59 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 5737.6 ms (remaining_batches=1, texts=10)
2026-03-30 19:05:59 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/ful-orr-gegeszet#content
2026-03-30 19:06:00 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ful-orr-gegeszeti-szakorvosi-vizsgalat
2026-03-30 19:06:02 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ful-orr-gegeszeti-kontroll-vizsgalat
2026-03-30 19:06:03 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | google-maps-scraper completed successfully on attempt 1
2026-03-30 19:06:03 | WARNING | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | No URL match for tata.elixirmedical.hu, using best by review count: ELIXIR MEDICAL TATA (0 reviews)
2026-03-30 19:06:03 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Input fájl mentve: data/review/20260330_190603_tata_elixirmedical_hu_url_input.txt
2026-03-30 19:06:03 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Output fájl mentve: data/review/20260330_190603_tata_elixirmedical_hu_url_output.json
2026-03-30 19:06:03 | INFO | src.stages.stage_4_reviews.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Reviews scraping completed. Found 0 reviews
2026-03-30 19:06:04 | INFO | prefect.pipeline.parallel.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-30 19:06:05 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/bppv-vizsgalat-szakvizsgalattal
2026-03-30 19:06:07 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/gegerakszures-tukrozessel-szakorvosi-vizsgalat
2026-03-30 19:06:07 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendelesek#content
2026-03-30 19:06:07 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/ortopedia#content
2026-03-30 19:06:08 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ortopediai-kontroll-vizsgalat
2026-03-30 19:06:08 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ortopediai-szakorvosi-vizsgalat
2026-03-30 19:06:10 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/radiologia#content
2026-03-30 19:06:11 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 2692.8 ms (remaining_batches=1, texts=10)
2026-03-30 19:06:11 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/hasi-es-kismedencei-ultrahang-szigoruan-ehgyomorra-telt-holyaggal
2026-03-30 19:06:12 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ketoldali-also-vegtagi-venas-uh
2026-03-30 19:06:13 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/also-vegtagi-venas-uh
2026-03-30 19:06:13 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/ket-regio-pl-lagyreszek-es-pajzsmirigy
2026-03-30 19:06:13 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/egy-regio-pl-nyaki-lagyreszek-vagy-pajzsmirigy-stb
2026-03-30 19:06:15 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/galeria#content
2026-03-30 19:06:16 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles-arak#content
2026-03-30 19:06:18 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/belgyogyaszat
2026-03-30 19:06:19 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/foglalkozas-egeszsegugy-uzemorvos
2026-03-30 19:06:19 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/kardiologia
2026-03-30 19:06:21 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/kezsebeszet
2026-03-30 19:06:21 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/logopedia
2026-03-30 19:06:22 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 3194.2 ms (remaining_batches=1, texts=10)
2026-03-30 19:06:24 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/nogyogyaszat
2026-03-30 19:06:25 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/proktologia
2026-03-30 19:06:25 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/pszichiatria
2026-03-30 19:06:26 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/sebeszet
2026-03-30 19:06:26 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/urologia
2026-03-30 19:06:27 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/szakrendeles/tudogyogyaszat#content
2026-03-30 19:06:28 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/tudogyogyaszati-kontroll
2026-03-30 19:06:29 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/tudogyogyaszati-elso-vizsgalat
2026-03-30 19:06:30 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 2240.3 ms (remaining_batches=1, texts=10)
2026-03-30 19:06:30 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/kapcsolat#content
2026-03-30 19:06:31 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/impresszum#content
2026-03-30 19:06:32 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/adatkezelesi-tajekoztato#content
2026-03-30 19:06:32 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/altalanos-szerzodesi-feltetelek#content
2026-03-30 19:06:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawled via Lambda (depth 2): https://www.tata.elixirmedical.hu/mediamegjeleneseink#content
2026-03-30 19:06:33 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Crawl finished: 67 URLs in 74.6s (success=67, errors=0)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Prediction batch to http://docker-host:8000/predict/batch completed in 5933.8 ms (remaining_batches=1, texts=7)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Pass 2 (Lambda): 3 BERT candidates, html_cache 67 entries
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 1/3] Processing (BERT prob=1.00): https://www.tata.elixirmedical.hu/szakrendeles-arak
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 1/3] Using cached HTML (516519 chars)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 1/3] OK (BERT prob=1.00)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 2/3] Processing (BERT prob=1.00): https://www.tata.elixirmedical.hu/szakrendeles-arak#content
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 2/3] Using cached HTML (516519 chars)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 2/3] OK (BERT prob=1.00)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 3/3] Processing (BERT prob=0.79): https://www.tata.elixirmedical.hu/vizsgalat-kategoriak/also-vegtagi-venas-uh
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 3/3] Using cached HTML (292735 chars)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | [URL 3/3] OK (BERT prob=0.79)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Discovery (Lambda retry) completed with 3 page(s)
2026-03-30 19:06:39 | INFO | src.stages.stage_2_discovery_async.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Detailed logs saved to: data/logs/44167a0f-df9d-4ec5-9441-1119b4ceb75f_20260330_190441.log
2026-03-30 19:06:39 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Data extraction: 3 page(s) to process
2026-03-30 19:06:40 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Extracted 1 price items from page 3
2026-03-30 19:06:45 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Extracted 32 price items from page 2
2026-03-30 19:06:45 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Extracted 32 price items from page 1
2026-03-30 19:06:45 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Post-process price_items: 65 -> 32 (removed invalid/zero prices and duplicate services)
2026-03-30 19:06:45 | INFO | src.stages.stage_3_data_extraction.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Data extraction stage completed: 32 total price items from 3 page(s)
2026-03-30 19:06:45 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Starting taxonomy enrichment alt stage (embeddings)
2026-03-30 19:06:45 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-30 19:06:46 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | taxonomy_enrichment_alt summary: processed=32 avg=0.6626 min=0.4871 max=0.8156 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-30 19:06:46 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | taxonomy_enrichment_alt weakest_matches: [{'idx': 8, 's': '„A” foglalkozás-egészségi osztály', 'c': 'Foglalkozás-egészségügy, üzemorvos', 'best_a': 'Sportorvoslás', 'best_similarity': 0.48710086528613367}, {'idx': 11, 's': '„D” foglalkozás-egészségi osztály', 'c': 'Foglalkozás-egészségügy, üzemorvos', 'best_a': 'Ideggyógyászat', 'best_similarity': 0.501189556125272}, {'idx': 9, 's': '„B” foglalkozás-egészségi osztály', 'c': 'Foglalkozás-egészségügy, üzemorvos', 'best_a': 'Sportorvoslás', 'best_similarity': 0.5025170297989732}]
2026-03-30 19:06:46 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.44167a0f-df9d-4ec5-9441-1119b4ceb75f | taxonomy_enrichment_alt stage completed
2026-03-30 19:06:46 | INFO | prefect.pipeline.parallel.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-30 19:06:46 | INFO | prefect.pipeline.parallel.44167a0f-df9d-4ec5-9441-1119b4ceb75f | Pipeline execution 44167a0f-df9d-4ec5-9441-1119b4ceb75f completed