A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-29 10:59:01 | 2026-03-29 11:00:02 | 1 min 1 s | — |
| discovery_fetch_validation | completed | 2026-03-29 10:58:39 | 2026-03-29 11:00:02 | 1 min 23 s | — |
| metadata_alt | completed | 2026-03-29 10:58:39 | 2026-03-29 11:00:02 | 1 min 22 s | — |
| reviews | completed | 2026-03-29 10:59:28 | 2026-03-29 11:00:02 | 34 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-29 10:59:06 | 2026-03-29 11:00:03 | 56 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Első szakorvosi vizsgálat | 27000 | Belgyógyászat - Diabetológia vizsgálatok | Belgyógyászat / 0.6246773276314326 |
| Utánkövető vizsgálat 3 hónapon belül | 20000 | Belgyógyászat - Diabetológia vizsgálatok | Diabetológia / 0.6002872859207753 |
| Neuropathia | 7000 | Belgyógyászat - Diabetológia vizsgálatok | Diabetológia / 0.6539623920460309 |
| Szakorvosi javaslat írás | 5000 | Belgyógyászat - Diabetológia vizsgálatok | Diabetológia / 0.612707901410176 |
| Receptírás (rendelésen kívül) | 3000 | Belgyógyászat - Diabetológia vizsgálatok | Diabetológia / 0.6388492225273176 |
| Idegsebészeti szakorvosi vizsgálat | 27000 | Idegsebészeti vizsgálatok | Ideggyógyászat / 0.6604803937620646 |
| Idegsebészeti utánkövető vizsgálat 3 hónapon belül | 20000 | Idegsebészeti vizsgálatok | Ideggyógyászat / 0.5956589971536979 |
| Paravertebralis infiltráció | 13000 | Idegsebészeti vizsgálatok | Gerincgyógyászat / 0.5870548317285941 |
| Receptírás | 3000 | Idegsebészeti vizsgálatok | Ideggyógyászat / 0.6268549589023409 |
| Alapcsomag | 40000 | Kardiológiai vizsgálatok | Kardiológia / 0.6649816323581288 |
| Érrendszeri csomag | 60000 | Kardiológiai vizsgálatok | Kardiológia / 0.6700477586480779 |
| Ritmuszavar csomag | 60000 | Kardiológiai vizsgálatok | Kardiológia / 0.6629528040985203 |
| Szakorvosi javaslat | 5000 | Kardiológiai vizsgálatok | Kardiológia / 0.6525371126222431 |
| Kardiológiai kontroll vizsgálat 3 hónapon belül | 15000 | Kardiológiai vizsgálatok | Kardiológia / 0.5918333652008176 |
| Kardiológiai szívultrahang vizsgálat 3 hónapon belül | 20000 | Kardiológiai vizsgálatok | Kardiológia / 0.6465180747478896 |
| Kardiológiai kontroll vizsgálat szívultrahanggal 3 hónapon belül | 30000 | Kardiológiai vizsgálatok | Kardiológia / 0.6192628632065403 |
| ABPM (24 órás vérnyomásmérés) szakorvosi kiértékeléssel | 15000 | Kardiológiai vizsgálatok | Kardiológia / 0.6467612342047101 |
| 24 órás Holter EKG vizsgálat szakorvosi kiértékeléssel | 20000 | Kardiológiai vizsgálatok | Kardiológia / 0.6948988467632881 |
| 48 órás Holter EKG vizsgálat szakorvosi kiértékeléssel | 30000 | Kardiológiai vizsgálatok | Kardiológia / 0.7109494504258785 |
| Terheléses EKG vizsgálat szakorvosi kiértékeléssel | 20000 | Kardiológiai vizsgálatok | Kardiológia / 0.6819523599170217 |
| Alsó-felső vénás doppler – mindkét oldal | 27000 | Ultrahang Diagnosztika | Angiológia / 0.6074790401456837 |
| Alsó-felső végtagi – egy oldal | 19000 | Ultrahang Diagnosztika | Angiológia / 0.5869679952497282 |
| Ízületi ultrahang | 20000 | Ultrahang Diagnosztika | Radiológia / 0.6492759731847061 |
| Carotis Color doppler | 22000 | Ultrahang Diagnosztika | Angiológia / 0.5705012013526656 |
| Has- és kismedence ultrahang | 22000 | Ultrahang Diagnosztika | Szülészet és Nőgyógyászat / 0.6175934518142147 |
| Pajzsmirigy ultrahang | 18000 | Ultrahang Diagnosztika | Radiológia / 0.6169841729540287 |
| Izom ultrahang | 15000 | Ultrahang Diagnosztika | Radiológia / 0.6120648994336334 |
| Emlő ultrahang | 25000 | Ultrahang Diagnosztika | Radiológia / 0.6428914778506833 |
| Lágyrész ultrahang | 15000 | Ultrahang Diagnosztika | Radiológia / 0.6348967135405046 |
| Csípőszűrés Gyerek ultrahang | 15000 | Ultrahang Diagnosztika | Újszülöttgyógyászat / 0.6263262222491237 |
{
"execution_id": "9fd2e8db-59fa-447c-9e76-77b444ec0355",
"input_url": "https://helixmed.hu/",
"state_filename": "20260329_105839_helixmed_hu.json",
"created_at": "2026-03-29T10:58:39.018794",
"updated_at": "2026-03-29T11:00:03.161030",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T10:58:39.543142",
"completed_at": "2026-03-29T11:00:02.439861",
"result": {
"metadata": {
"company_name": "HelixMed (Helixmed-Balaton Egészségügyi és Szolgáltató Kft.)",
"description": "HelixMed Siófokon, a Balaton partján működő modern magánegészségügyi rendelő, amely decemberi nyitással magas színvonalú és széleskörű szolgáltatásokat kínál. Rendelésükön elérhetők hasi és pajzsmirigy ultrahangok, érvizsgálatok, valamint kardiológiai vizsgálatok (szívultrahang, terheléses EKG) és idegsebészeti konzultációk gerinc- és derékproblémákra, porckorongsérvre. A weboldalon részletes orvos- és szolgáltatásbemutató, időpontfoglalási lehetőség, adatvédelmi tájékoztató és árlista található. A cél a személyre szabott diagnosztika és kezelés biztosítása helyi lakosok és a környékre látogatók számára. Az oldal tartalma alapján könnyen elérhetőek az elérhetőségek és a foglalási információk.",
"arlista_url": "https://helixmed.hu/arak/",
"varos": "Siófok",
"iranyitoszam": "8600",
"utca": "Szűcs utca 2. Fsz. 9. ajtó",
"telefonszam": "+36-30-758-4747",
"email": "helixmed@gmail.hu",
"website": "https://helixmed.hu/"
},
"llm_usage": {
"prompt_tokens": 5582,
"completion_tokens": 1540,
"total_tokens": 7122,
"cost": 0.0044755
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-29T10:58:39.687611",
"completed_at": "2026-03-29T11:00:02.717172",
"result": {
"pages": [
{
"source_url": "https://helixmed.hu/arak",
"discovered_url": "https://helixmed.hu/arak",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://helixmed.hu/",
"validation_passed": true,
"ft_count": 41,
"score": 0.9998226761817932,
"attempts": 1
}
],
"original_url": "https://helixmed.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-29T10:59:01.766649",
"completed_at": "2026-03-29T11:00:02.862118",
"result": {
"number_of_price_items": 30,
"price_items": [
{
"s": "Első szakorvosi vizsgálat",
"p": 27000,
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"a": "Belgyógyászat",
"v": 0.6246773276314326
},
{
"s": "Utánkövető vizsgálat 3 hónapon belül",
"p": 20000,
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"a": "Diabetológia",
"v": 0.6002872859207753
},
{
"s": "Neuropathia",
"p": 7000,
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"a": "Diabetológia",
"v": 0.6539623920460309
},
{
"s": "Szakorvosi javaslat írás",
"p": 5000,
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"a": "Diabetológia",
"v": 0.612707901410176
},
{
"s": "Receptírás (rendelésen kívül)",
"p": 3000,
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"a": "Diabetológia",
"v": 0.6388492225273176
},
{
"s": "Idegsebészeti szakorvosi vizsgálat",
"p": 27000,
"c": "Idegsebészeti vizsgálatok",
"a": "Ideggyógyászat",
"v": 0.6604803937620646
},
{
"s": "Idegsebészeti utánkövető vizsgálat 3 hónapon belül",
"p": 20000,
"c": "Idegsebészeti vizsgálatok",
"a": "Ideggyógyászat",
"v": 0.5956589971536979
},
{
"s": "Paravertebralis infiltráció",
"p": 13000,
"c": "Idegsebészeti vizsgálatok",
"a": "Gerincgyógyászat",
"v": 0.5870548317285941
},
{
"s": "Receptírás",
"p": 3000,
"c": "Idegsebészeti vizsgálatok",
"a": "Ideggyógyászat",
"v": 0.6268549589023409
},
{
"s": "Alapcsomag",
"p": 40000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6649816323581288
},
{
"s": "Érrendszeri csomag",
"p": 60000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6700477586480779
},
{
"s": "Ritmuszavar csomag",
"p": 60000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6629528040985203
},
{
"s": "Szakorvosi javaslat",
"p": 5000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6525371126222431
},
{
"s": "Kardiológiai kontroll vizsgálat 3 hónapon belül",
"p": 15000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.5918333652008176
},
{
"s": "Kardiológiai szívultrahang vizsgálat 3 hónapon belül",
"p": 20000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6465180747478896
},
{
"s": "Kardiológiai kontroll vizsgálat szívultrahanggal 3 hónapon belül",
"p": 30000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6192628632065403
},
{
"s": "ABPM (24 órás vérnyomásmérés) szakorvosi kiértékeléssel",
"p": 15000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6467612342047101
},
{
"s": "24 órás Holter EKG vizsgálat szakorvosi kiértékeléssel",
"p": 20000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6948988467632881
},
{
"s": "48 órás Holter EKG vizsgálat szakorvosi kiértékeléssel",
"p": 30000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.7109494504258785
},
{
"s": "Terheléses EKG vizsgálat szakorvosi kiértékeléssel",
"p": 20000,
"c": "Kardiológiai vizsgálatok",
"a": "Kardiológia",
"v": 0.6819523599170217
},
{
"s": "Alsó-felső vénás doppler – mindkét oldal",
"p": 27000,
"c": "Ultrahang Diagnosztika",
"a": "Angiológia",
"v": 0.6074790401456837
},
{
"s": "Alsó-felső végtagi – egy oldal",
"p": 19000,
"c": "Ultrahang Diagnosztika",
"a": "Angiológia",
"v": 0.5869679952497282
},
{
"s": "Ízületi ultrahang",
"p": 20000,
"c": "Ultrahang Diagnosztika",
"a": "Radiológia",
"v": 0.6492759731847061
},
{
"s": "Carotis Color doppler",
"p": 22000,
"c": "Ultrahang Diagnosztika",
"a": "Angiológia",
"v": 0.5705012013526656
},
{
"s": "Has- és kismedence ultrahang",
"p": 22000,
"c": "Ultrahang Diagnosztika",
"a": "Szülészet és Nőgyógyászat",
"v": 0.6175934518142147
},
{
"s": "Pajzsmirigy ultrahang",
"p": 18000,
"c": "Ultrahang Diagnosztika",
"a": "Radiológia",
"v": 0.6169841729540287
},
{
"s": "Izom ultrahang",
"p": 15000,
"c": "Ultrahang Diagnosztika",
"a": "Radiológia",
"v": 0.6120648994336334
},
{
"s": "Emlő ultrahang",
"p": 25000,
"c": "Ultrahang Diagnosztika",
"a": "Radiológia",
"v": 0.6428914778506833
},
{
"s": "Lágyrész ultrahang",
"p": 15000,
"c": "Ultrahang Diagnosztika",
"a": "Radiológia",
"v": 0.6348967135405046
},
{
"s": "Csípőszűrés Gyerek ultrahang",
"p": 15000,
"c": "Ultrahang Diagnosztika",
"a": "Újszülöttgyógyászat",
"v": 0.6263262222491237
}
],
"llm_usage": {
"prompt_tokens": 3267,
"completion_tokens": 1202,
"total_tokens": 4469,
"cost": 0.00191934
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-29T10:59:06.509934",
"completed_at": "2026-03-29T11:00:03.016217",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 30,
"items_processed": 30,
"avg_best_similarity": 0.6336069987016839,
"min_best_similarity": 0.5705012013526656,
"max_best_similarity": 0.7109494504258785,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Első szakorvosi vizsgálat",
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"best_a": "Belgyógyászat",
"best_similarity": 0.6246773276314326
},
{
"idx": 1,
"s": "Utánkövető vizsgálat 3 hónapon belül",
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"best_a": "Diabetológia",
"best_similarity": 0.6002872859207753
},
{
"idx": 2,
"s": "Neuropathia",
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"best_a": "Diabetológia",
"best_similarity": 0.6539623920460309
},
{
"idx": 3,
"s": "Szakorvosi javaslat írás",
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"best_a": "Diabetológia",
"best_similarity": 0.612707901410176
},
{
"idx": 4,
"s": "Receptírás (rendelésen kívül)",
"c": "Belgyógyászat - Diabetológia vizsgálatok",
"best_a": "Diabetológia",
"best_similarity": 0.6388492225273176
},
{
"idx": 5,
"s": "Idegsebészeti szakorvosi vizsgálat",
"c": "Idegsebészeti vizsgálatok",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6604803937620646
},
{
"idx": 6,
"s": "Idegsebészeti utánkövető vizsgálat 3 hónapon belül",
"c": "Idegsebészeti vizsgálatok",
"best_a": "Ideggyógyászat",
"best_similarity": 0.5956589971536979
},
{
"idx": 7,
"s": "Paravertebralis infiltráció",
"c": "Idegsebészeti vizsgálatok",
"best_a": "Gerincgyógyászat",
"best_similarity": 0.5870548317285941
},
{
"idx": 8,
"s": "Receptírás",
"c": "Idegsebészeti vizsgálatok",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6268549589023409
},
{
"idx": 9,
"s": "Alapcsomag",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6649816323581288
},
{
"idx": 10,
"s": "Érrendszeri csomag",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6700477586480779
},
{
"idx": 11,
"s": "Ritmuszavar csomag",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6629528040985203
},
{
"idx": 12,
"s": "Szakorvosi javaslat",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6525371126222431
},
{
"idx": 13,
"s": "Kardiológiai kontroll vizsgálat 3 hónapon belül",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.5918333652008176
},
{
"idx": 14,
"s": "Kardiológiai szívultrahang vizsgálat 3 hónapon belül",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6465180747478896
},
{
"idx": 15,
"s": "Kardiológiai kontroll vizsgálat szívultrahanggal 3 hónapon belül",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6192628632065403
},
{
"idx": 16,
"s": "ABPM (24 órás vérnyomásmérés) szakorvosi kiértékeléssel",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6467612342047101
},
{
"idx": 17,
"s": "24 órás Holter EKG vizsgálat szakorvosi kiértékeléssel",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6948988467632881
},
{
"idx": 18,
"s": "48 órás Holter EKG vizsgálat szakorvosi kiértékeléssel",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.7109494504258785
},
{
"idx": 19,
"s": "Terheléses EKG vizsgálat szakorvosi kiértékeléssel",
"c": "Kardiológiai vizsgálatok",
"best_a": "Kardiológia",
"best_similarity": 0.6819523599170217
},
{
"idx": 20,
"s": "Alsó-felső vénás doppler – mindkét oldal",
"c": "Ultrahang Diagnosztika",
"best_a": "Angiológia",
"best_similarity": 0.6074790401456837
},
{
"idx": 21,
"s": "Alsó-felső végtagi – egy oldal",
"c": "Ultrahang Diagnosztika",
"best_a": "Angiológia",
"best_similarity": 0.5869679952497282
},
{
"idx": 22,
"s": "Ízületi ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6492759731847061
},
{
"idx": 23,
"s": "Carotis Color doppler",
"c": "Ultrahang Diagnosztika",
"best_a": "Angiológia",
"best_similarity": 0.5705012013526656
},
{
"idx": 24,
"s": "Has- és kismedence ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Szülészet és Nőgyógyászat",
"best_similarity": 0.6175934518142147
},
{
"idx": 25,
"s": "Pajzsmirigy ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6169841729540287
},
{
"idx": 26,
"s": "Izom ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6120648994336334
},
{
"idx": 27,
"s": "Emlő ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6428914778506833
},
{
"idx": 28,
"s": "Lágyrész ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6348967135405046
},
{
"idx": 29,
"s": "Csípőszűrés Gyerek ultrahang",
"c": "Ultrahang Diagnosztika",
"best_a": "Újszülöttgyógyászat",
"best_similarity": 0.6263262222491237
}
],
"llm_usage": {
"prompt_tokens": 762,
"completion_tokens": 0,
"total_tokens": 762,
"cost": 0.00009906
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T10:59:28.093113",
"completed_at": "2026-03-29T11:00:02.576001",
"result": {
"reviews": {
"company_name": "HelixMed (Helixmed-Balaton Egészségügyi és Szolgáltató Kft.)",
"total_reviews": 14,
"average_rating": 5,
"reviews": [
{
"author": "Andrea Varga Papp",
"rating": 5,
"text": "Ultrahang vizsgálaton voltam Dr.Navazandeh Vahid-nál.A doktor úr nagyon kedves, közvetlen és alapos. Minden kérdésemre türelmesen válaszolt. Külön köszönöm Ildikónak a recepción, hogy kedvességével oldotta a kezdeti izgalmamat.",
"date": null
},
{
"author": "B PM",
"rating": 5,
"text": "EKG vizsgálaton voltam.\nMinden rendben volt. Nagyon kedves, figyelmes és segítőkész mindenki.\nKöszönöm szépen mégegyszer.",
"date": null
},
{
"author": "ali naghi fani",
"rating": 5,
"text": "Perfect",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8600",
"city": "Siófok",
"street": "Szücs u. 2.fsz.9",
"phone": "06 30 758 4747"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 9611,
"completion_tokens": 2742,
"total_tokens": 12353,
"cost": 0.0064939
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 9fd2e8db-59fa-447c-9e76-77b444ec0355_*.log, CLI: pipeline_9fd2e8db_*.log).
data/logs/9fd2e8db-59fa-447c-9e76-77b444ec0355_20260329_105839.log
2026-03-29 10:58:39 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 9fd2e8db-59fa-447c-9e76-77b444ec0355 for URL: https://helixmed.hu/
2026-03-29 10:58:39 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:58:39 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://helixmed.hu/
2026-03-29 10:58:39 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://helixmed.hu/
2026-03-29 10:58:39 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:58:39 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://helixmed.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:58:39 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://helixmed.hu/
2026-03-29 10:58:41 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://helixmed.hu/
2026-03-29 10:58:41 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 1007 characters from main URL
2026-03-29 10:58:41 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:58:41 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'helixmed.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:58:45 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok
2026-03-29 10:58:46 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok
2026-03-29 10:58:46 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-amirinejad-meyssam-idegsebesz
2026-03-29 10:58:46 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/elerhetoseg
2026-03-29 10:58:46 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-varga-gabriella-belgyogyasz
2026-03-29 10:58:47 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus
2026-03-29 10:58:47 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/idopontfoglalas
2026-03-29 10:58:47 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-alipour-shahpour-kardiologus
2026-03-29 10:58:47 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/kremer-klaudia-gyogymasszor
2026-03-29 10:58:47 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-navazandeh-vahid-ultrahang-diagnosztika
2026-03-29 10:58:50 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/arak
2026-03-29 10:58:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/rolunk
2026-03-29 10:58:51 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/idegsebeszet
2026-03-29 10:58:52 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/kardiologia
2026-03-29 10:58:52 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/ultrahang-diagnosztika
2026-03-29 10:58:53 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/gyogymasszazs
2026-03-29 10:58:54 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/adatvedelmi-iranyelvek
2026-03-29 10:58:54 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/impresszum
2026-03-29 10:58:54 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 25 URLs in 14.8s (success=19, errors=1)
2026-03-29 10:59:00 | INFO | src.stages.stage_2_discovery_async | Crawl produced 1 URLs from BERT (threshold and above), fetching all
2026-03-29 10:59:00 | INFO | src.stages.stage_2_discovery_async | [URL 1/1] Fetching (BERT prob=1.00): https://helixmed.hu/arak
2026-03-29 10:59:01 | INFO | src.stages.stage_2_discovery_async | [URL 1/1] OK (BERT prob=1.00)
2026-03-29 10:59:01 | INFO | src.stages.stage_2_discovery_async | Discovery (async) completed with 1 page(s)
2026-03-29 10:59:01 | INFO | src.stages.stage_2_discovery_async | Detailed logs saved to: data/logs/9fd2e8db-59fa-447c-9e76-77b444ec0355_20260329_105839.log
2026-03-29 10:59:01 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:59:01 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 2 results
2026-03-29 10:59:01 | INFO | src.stages.stage_1_metadata_alt | Result 1: Adatvédelmi irányelvek - https://helixmed.hu/adatvedelmi-iranyelvek/
2026-03-29 10:59:01 | INFO | src.stages.stage_1_metadata_alt | Result 2: Császár Bernadett - Dietetikus - HelixMed - https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus/
2026-03-29 10:59:01 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://helixmed.hu/adatvedelmi-iranyelvek/
2026-03-29 10:59:01 | INFO | src.stages.stage_3_data_extraction | Data extraction: 1 page(s) to process
2026-03-29 10:59:02 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 7051 characters from contact page 1
2026-03-29 10:59:02 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus/
2026-03-29 10:59:02 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 5631 characters from contact page 2
2026-03-29 10:59:02 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:59:06 | INFO | src.stages.stage_3_data_extraction | Extracted 31 price items from page 1
2026-03-29 10:59:06 | INFO | src.stages.stage_3_data_extraction | Post-process price_items: 31 -> 30 (removed invalid/zero prices and duplicate services)
2026-03-29 10:59:06 | INFO | src.stages.stage_3_data_extraction | Data extraction stage completed: 30 total price items from 1 page(s)
2026-03-29 10:59:06 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | Starting taxonomy enrichment alt stage (embeddings)
2026-03-29 10:59:06 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-29 10:59:07 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt summary: processed=30 avg=0.6336 min=0.5705 max=0.7109 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-29 10:59:07 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt weakest_matches: [{'idx': 23, 's': 'Carotis Color doppler', 'c': 'Ultrahang Diagnosztika', 'best_a': 'Angiológia', 'best_similarity': 0.5705012013526656}, {'idx': 21, 's': 'Alsó-felső végtagi – egy oldal', 'c': 'Ultrahang Diagnosztika', 'best_a': 'Angiológia', 'best_similarity': 0.5869679952497282}, {'idx': 7, 's': 'Paravertebralis infiltráció', 'c': 'Idegsebészeti vizsgálatok', 'best_a': 'Gerincgyógyászat', 'best_similarity': 0.5870548317285941}]
2026-03-29 10:59:07 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt stage completed
2026-03-29 10:59:27 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: HelixMed (Helixmed-Balaton Egészségügyi és Szolgáltató Kft.)
2026-03-29 10:59:27 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:59:28 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:59:28 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=HelixMed (Helixmed-Balaton Egészségügyi és Szolgáltató Kft.), varos=Siófok
2026-03-29 10:59:28 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmpr09_2hnm
2026-03-29 10:59:28 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmphvivtnlv
2026-03-29 10:59:28 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 11:00:02 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 11:00:02 | INFO | src.stages.stage_4_reviews | URL match found: helixmed.hu
2026-03-29 11:00:02 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_110002_helixmed_(helixmed-balaton_egészségügyi_és_szolgáltató_kft.)_url_input.txt
2026-03-29 11:00:02 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_110002_helixmed_(helixmed-balaton_egészségügyi_és_szolgáltató_kft.)_url_output.json
2026-03-29 11:00:02 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 3 reviews
2026-03-29 11:00:02 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 11:00:03 | INFO | prefect.pipeline.parallel | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-29 11:00:03 | INFO | prefect.pipeline.parallel | Pipeline execution 9fd2e8db-59fa-447c-9e76-77b444ec0355 completed