A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-30 18:52:43 | 2026-03-30 18:58:58 | 6 min 14 s | — |
| discovery_fetch_validation | completed | 2026-03-30 18:52:34 | 2026-03-30 18:58:58 | 6 min 24 s | — |
| metadata_alt | completed | 2026-03-30 18:52:34 | 2026-03-30 18:53:51 | 1 min 17 s | — |
| reviews | completed | 2026-03-30 18:53:31 | 2026-03-30 18:53:52 | 20 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-30 18:58:57 | 2026-03-30 18:58:59 | 1 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Gyógytorna | 6500 | Gyógytorna | Fizioterápia / 0.6802924542473467 |
| Betegvizsgálat | 15000 | Gyógytorna | Sportorvoslás / 0.6520024084502362 |
| Gyógymasszázs | 2500 | Gyógymasszázs | Fizioterápia / 0.6601108844740757 |
| Nyiroködéma KOMPLEX | 11000 | Gyógymasszázs | Fizioterápia / 0.5977832032873441 |
| Nyiroködéma masszázs | 9000 | Gyógymasszázs | Fizioterápia / 0.6077025200565959 |
| Gépi masszázskezelés | 4500 | Gyógymasszázs | Fizioterápia / 0.6831411151397657 |
| Fizikoterápia - 1 | 2000 | Fizikoterápia | Fizioterápia / 0.6934494251540085 |
| Fizikoterápia - 2 | 3500 | Fizikoterápia | Fizioterápia / 0.7154292591767903 |
| Fizikoterápia - 3 | 5000 | Fizikoterápia | Fizioterápia / 0.6985516178673284 |
| Lökéshullám-terápia | 8000 | Lökéshullám-terápia | Fizioterápia / 0.5671610557789022 |
| Ortopédiai vizsgálat | 30000 | Ortopédiai szakrendelés | Ortopédia / 0.6800331563815053 |
| Ortopédiai kontroll vizsgálat | 20000 | Ortopédiai szakrendelés | Ortopédia / 0.6586037444073685 |
| Szakorvosi javaslat | 10000 | Ortopédiai szakrendelés | Ortopédia / 0.6637543109430731 |
| Injekció | 10000 | Ortopédiai szakrendelés | Ortopédia / 0.7001932944366956 |
| Receptírás | 4000 | Ortopédiai szakrendelés | Ortopédia / 0.6637900644677184 |
| Belgyógyászati vizsgálat | 30000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.722656517155954 |
| Belgyógyászati kontroll vizsgálat | 20000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.7330303240949364 |
| EKG vizsgálat | 10000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.7216932141435997 |
| ABPM vizsgálat | 20000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.691378011564353 |
| ABPM kontroll vizsgálattal | 33000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.7135400685361359 |
| Gyógyszerfelírás | 6000 | Belgyógyászati szakrendelés | Belgyógyászat / 0.6501508838154781 |
| Neurológiai vizsgálat | 30000 | Neurológiai szakrendelés | Ideggyógyászat / 0.6906557966736296 |
| Neurológiai kontroll vizsgálat | 20000 | Neurológiai szakrendelés | Ideggyógyászat / 0.6568882525341614 |
| Szakorvosi javaslat korábban kivizsgált betegeknek | 10000 | Neurológiai szakrendelés | Ideggyógyászat / 0.6161608552626752 |
| Gyermekneurológiai vizsgálat | 30000 | Gyermekneurológiai szakrendelés | Ideggyógyászat / 0.635906918857065 |
{
"execution_id": "9b78af24-217e-40c9-98fe-cbd6c397c2a5",
"input_url": "https://www.rochlitzgyogytorna.hu/",
"state_filename": "20260330_185233_rochlitzgyogytorna_hu.json",
"created_at": "2026-03-30T18:52:33.352405",
"updated_at": "2026-03-30T18:58:59.303694",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-30T18:52:34.000310",
"completed_at": "2026-03-30T18:53:51.930159",
"result": {
"metadata": {
"company_name": "Rochlitz Gyógytornász Bt. (Rochlitz Gyógytorna)",
"description": "Több mint 30 éve működő magán gyógytorna rendelő Tatán, amely járóbeteg-gyógytornát, gyógymasszázst, fizikoterápiát, lökéshullám terápiát és nyiroködéma kezelést kínál. Rendelőik Tatán és Tatabányán találhatók, több szakemberrel (kb. 20 alkalmazott) biztosítják a magas szakmai színvonalú rehabilitációt. Szolgáltatásaik között szerepelnak egyéni és csoportos terápiák, otthoni és online gyógytorna lehetőségek, valamint komplex kezelési csomagok és bérletek. Kiemelten foglalkoznak posztoperatív rehabilitációval, sérülések utáni ellátással és gyermekgyógytornával (bizonyos gyermekellátás társadalombiztosítási szerződés keretében). Ajándékutalványok igényelhetők nyomtatott vagy digitális formában, és a rendelő weboldalán elérhető a „Szolgáltatások, Árak” menüpont a részletes árlista és csomagajánlatok megtekintéséhez.",
"arlista_url": "Szolgáltatások, Árak (menüpont a weboldalon)",
"varos": "Tata (rendelői telephely: Tatabánya is)",
"iranyitoszam": "0000",
"utca": "Almási utca 8.",
"telefonszam": "+36 34 481 671 / +36 34 301 995",
"email": "gyogytornatata@gmail.com",
"website": "https://www.rochlitzgyogytorna.hu/"
},
"llm_usage": {
"prompt_tokens": 3439,
"completion_tokens": 1691,
"total_tokens": 5130,
"cost": 0.00424175
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-30T18:52:34.190896",
"completed_at": "2026-03-30T18:58:58.713451",
"result": {
"pages": [
{
"source_url": "https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak",
"discovered_url": "https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.rochlitzgyogytorna.hu/",
"validation_passed": true,
"ft_count": 61,
"score": 0.9997038245201111,
"attempts": 1
},
{
"source_url": "https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak#content",
"discovered_url": "https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak#content",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.rochlitzgyogytorna.hu/",
"validation_passed": true,
"ft_count": 61,
"score": 0.9997038245201111,
"attempts": 2
},
{
"source_url": "https://www.rochlitzgyogytorna.hu/",
"discovered_url": "https://www.rochlitzgyogytorna.hu/",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.rochlitzgyogytorna.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.9975290894508362,
"attempts": 3
},
{
"source_url": "https://www.rochlitzgyogytorna.hu/#content",
"discovered_url": "https://www.rochlitzgyogytorna.hu/#content",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.rochlitzgyogytorna.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.9975290894508362,
"attempts": 4
},
{
"source_url": "https://www.rochlitzgyogytorna.hu/#gyik",
"discovered_url": "https://www.rochlitzgyogytorna.hu/#gyik",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.rochlitzgyogytorna.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.9975290894508362,
"attempts": 5
}
],
"original_url": "https://www.rochlitzgyogytorna.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-30T18:52:43.986305",
"completed_at": "2026-03-30T18:58:58.916886",
"result": {
"number_of_price_items": 25,
"price_items": [
{
"s": "Gyógytorna",
"p": 6500,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.6802924542473467
},
{
"s": "Betegvizsgálat",
"p": 15000,
"c": "Gyógytorna",
"a": "Sportorvoslás",
"v": 0.6520024084502362
},
{
"s": "Gyógymasszázs",
"p": 2500,
"c": "Gyógymasszázs",
"a": "Fizioterápia",
"v": 0.6601108844740757
},
{
"s": "Nyiroködéma KOMPLEX",
"p": 11000,
"c": "Gyógymasszázs",
"a": "Fizioterápia",
"v": 0.5977832032873441
},
{
"s": "Nyiroködéma masszázs",
"p": 9000,
"c": "Gyógymasszázs",
"a": "Fizioterápia",
"v": 0.6077025200565959
},
{
"s": "Gépi masszázskezelés",
"p": 4500,
"c": "Gyógymasszázs",
"a": "Fizioterápia",
"v": 0.6831411151397657
},
{
"s": "Fizikoterápia - 1",
"p": 2000,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.6934494251540085
},
{
"s": "Fizikoterápia - 2",
"p": 3500,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.7154292591767903
},
{
"s": "Fizikoterápia - 3",
"p": 5000,
"c": "Fizikoterápia",
"a": "Fizioterápia",
"v": 0.6985516178673284
},
{
"s": "Lökéshullám-terápia",
"p": 8000,
"c": "Lökéshullám-terápia",
"a": "Fizioterápia",
"v": 0.5671610557789022
},
{
"s": "Ortopédiai vizsgálat",
"p": 30000,
"c": "Ortopédiai szakrendelés",
"a": "Ortopédia",
"v": 0.6800331563815053
},
{
"s": "Ortopédiai kontroll vizsgálat",
"p": 20000,
"c": "Ortopédiai szakrendelés",
"a": "Ortopédia",
"v": 0.6586037444073685
},
{
"s": "Szakorvosi javaslat",
"p": 10000,
"c": "Ortopédiai szakrendelés",
"a": "Ortopédia",
"v": 0.6637543109430731
},
{
"s": "Injekció",
"p": 10000,
"c": "Ortopédiai szakrendelés",
"a": "Ortopédia",
"v": 0.7001932944366956
},
{
"s": "Receptírás",
"p": 4000,
"c": "Ortopédiai szakrendelés",
"a": "Ortopédia",
"v": 0.6637900644677184
},
{
"s": "Belgyógyászati vizsgálat",
"p": 30000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.722656517155954
},
{
"s": "Belgyógyászati kontroll vizsgálat",
"p": 20000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.7330303240949364
},
{
"s": "EKG vizsgálat",
"p": 10000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.7216932141435997
},
{
"s": "ABPM vizsgálat",
"p": 20000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.691378011564353
},
{
"s": "ABPM kontroll vizsgálattal",
"p": 33000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.7135400685361359
},
{
"s": "Gyógyszerfelírás",
"p": 6000,
"c": "Belgyógyászati szakrendelés",
"a": "Belgyógyászat",
"v": 0.6501508838154781
},
{
"s": "Neurológiai vizsgálat",
"p": 30000,
"c": "Neurológiai szakrendelés",
"a": "Ideggyógyászat",
"v": 0.6906557966736296
},
{
"s": "Neurológiai kontroll vizsgálat",
"p": 20000,
"c": "Neurológiai szakrendelés",
"a": "Ideggyógyászat",
"v": 0.6568882525341614
},
{
"s": "Szakorvosi javaslat korábban kivizsgált betegeknek",
"p": 10000,
"c": "Neurológiai szakrendelés",
"a": "Ideggyógyászat",
"v": 0.6161608552626752
},
{
"s": "Gyermekneurológiai vizsgálat",
"p": 30000,
"c": "Gyermekneurológiai szakrendelés",
"a": "Ideggyógyászat",
"v": 0.635906918857065
}
],
"llm_usage": {
"prompt_tokens": 17529,
"completion_tokens": 1189,
"total_tokens": 18718,
"cost": 0.006186239999999999
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-30T18:53:31.482131",
"completed_at": "2026-03-30T18:53:52.209028",
"result": {
"reviews": {
"company_name": "Rochlitz Gyógytornász Bt. (Rochlitz Gyógytorna)",
"total_reviews": 37,
"average_rating": 4.9,
"reviews": [
{
"author": "Hajnalka Szepesi",
"rating": 5,
"text": "Mindenkinek ajánlani tudom🙏Barna Évihez járok 8 éve,műtétem után ő kezel és hál istennek a legjobb szaktudása és kezei neki van szerintem❤️🙏😇 Régen is voltam tornán és massziron náluk jó volt minden köszönőm🙏😇 mindenkinek további jó munkát szép egészséges napokat kívánok🍀❤️🙏😇sziasztok😘",
"date": null
},
{
"author": "Attila MIKLÓS",
"rating": 5,
"text": "Először voltam, de csak jót tudok mondani róluk! Profi szakértelemmel rendelkeznek és rendkívül segítőkészek, kedvesek!",
"date": null
},
{
"author": "Bernadett Simon",
"rating": 5,
"text": "Nem igazán tudtam elképzelni, hogy fog működni egy online gyógytorna, csípőprotézis műtét után.\nMondhatom, hogy tökéletesen! Most már 8 hónapja, rég túl a kötelező időn, de annyira bevált és olyan jól működik minden, hogy jövőre is folytatjuk!\nKöszönöm neked Benda Orsolya!❤️",
"date": null
},
{
"author": "Pál Erzsébet (Llsa)",
"rating": 5,
"text": "Nem tudok semmi rosszat mondani! Köszönöm Bárdos Tamás Főorvos Úrnak a becsületes , tisztességes,türelmes hozzáállását a vizsgálatomhoz és műtétemhez! Az asszisztens hölgy barátságos,kedves segítőkész viselkedését!",
"date": null
},
{
"author": "Anikó Mede",
"rating": 5,
"text": "Kedves és hozzáértő gyógytornász és fizikoterapeuta, aki mindent megtesz a gyógyulásért!",
"date": null
},
{
"author": "Ágnes Piskóthy",
"rating": 5,
"text": "Mind a szakmai felkészültség, empátia mind az időpont betartása maximális pontot jelent számunkra.",
"date": null
},
{
"author": "Andrea Fodor",
"rating": 3,
"text": "A terapeuták nagyon jók,de elstomoríto,hogy a felszereltség kb a 70-és évek szintjén ragadt.az,higy sztrókosként,bénulan kell felszenvedni magam a magas ágyra egy dolog,de hogy a saját dolgozóik egészségével nem törődik a tulajdonos az már nonszensz,azt nézve,hogy egy terapeuta bárhol kaphat állást emberibb körülmények között.még egyszer,ez az üzenet a tulajdonosnak szól,aki esetleg nem ert az üzlethez,a bevételből néha vissza is kell forgatni.",
"date": null
},
{
"author": "Évi Kalmár",
"rating": 5,
"text": "Sarkantyú miatt kerestem fel a Rochlitz-Med Kft-t. Lökéshullám terápiát kaptam kezelésként. Már az első kezelés után is érezhető javulást eredményezett. Családias légkör, nagyon kedves és jó szakemberek dolgoznak, segítenek ott. Mindenképpen ajánlani tudom csak!\"",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "2800",
"city": "Tatabánya",
"street": "Bánhidai ltp. 103-105",
"phone": "(06 34) 301 995"
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-30T18:58:57.215838",
"completed_at": "2026-03-30T18:58:59.119057",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 25,
"items_processed": 25,
"avg_best_similarity": 0.6701623742762696,
"min_best_similarity": 0.5671610557789022,
"max_best_similarity": 0.7330303240949364,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Gyógytorna",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.6802924542473467
},
{
"idx": 1,
"s": "Betegvizsgálat",
"c": "Gyógytorna",
"best_a": "Sportorvoslás",
"best_similarity": 0.6520024084502362
},
{
"idx": 2,
"s": "Gyógymasszázs",
"c": "Gyógymasszázs",
"best_a": "Fizioterápia",
"best_similarity": 0.6601108844740757
},
{
"idx": 3,
"s": "Nyiroködéma KOMPLEX",
"c": "Gyógymasszázs",
"best_a": "Fizioterápia",
"best_similarity": 0.5977832032873441
},
{
"idx": 4,
"s": "Nyiroködéma masszázs",
"c": "Gyógymasszázs",
"best_a": "Fizioterápia",
"best_similarity": 0.6077025200565959
},
{
"idx": 5,
"s": "Gépi masszázskezelés",
"c": "Gyógymasszázs",
"best_a": "Fizioterápia",
"best_similarity": 0.6831411151397657
},
{
"idx": 6,
"s": "Fizikoterápia - 1",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.6934494251540085
},
{
"idx": 7,
"s": "Fizikoterápia - 2",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.7154292591767903
},
{
"idx": 8,
"s": "Fizikoterápia - 3",
"c": "Fizikoterápia",
"best_a": "Fizioterápia",
"best_similarity": 0.6985516178673284
},
{
"idx": 9,
"s": "Lökéshullám-terápia",
"c": "Lökéshullám-terápia",
"best_a": "Fizioterápia",
"best_similarity": 0.5671610557789022
},
{
"idx": 10,
"s": "Ortopédiai vizsgálat",
"c": "Ortopédiai szakrendelés",
"best_a": "Ortopédia",
"best_similarity": 0.6800331563815053
},
{
"idx": 11,
"s": "Ortopédiai kontroll vizsgálat",
"c": "Ortopédiai szakrendelés",
"best_a": "Ortopédia",
"best_similarity": 0.6586037444073685
},
{
"idx": 12,
"s": "Szakorvosi javaslat",
"c": "Ortopédiai szakrendelés",
"best_a": "Ortopédia",
"best_similarity": 0.6637543109430731
},
{
"idx": 13,
"s": "Injekció",
"c": "Ortopédiai szakrendelés",
"best_a": "Ortopédia",
"best_similarity": 0.7001932944366956
},
{
"idx": 14,
"s": "Receptírás",
"c": "Ortopédiai szakrendelés",
"best_a": "Ortopédia",
"best_similarity": 0.6637900644677184
},
{
"idx": 15,
"s": "Belgyógyászati vizsgálat",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.722656517155954
},
{
"idx": 16,
"s": "Belgyógyászati kontroll vizsgálat",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.7330303240949364
},
{
"idx": 17,
"s": "EKG vizsgálat",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.7216932141435997
},
{
"idx": 18,
"s": "ABPM vizsgálat",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.691378011564353
},
{
"idx": 19,
"s": "ABPM kontroll vizsgálattal",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.7135400685361359
},
{
"idx": 20,
"s": "Gyógyszerfelírás",
"c": "Belgyógyászati szakrendelés",
"best_a": "Belgyógyászat",
"best_similarity": 0.6501508838154781
},
{
"idx": 21,
"s": "Neurológiai vizsgálat",
"c": "Neurológiai szakrendelés",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6906557966736296
},
{
"idx": 22,
"s": "Neurológiai kontroll vizsgálat",
"c": "Neurológiai szakrendelés",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6568882525341614
},
{
"idx": 23,
"s": "Szakorvosi javaslat korábban kivizsgált betegeknek",
"c": "Neurológiai szakrendelés",
"best_a": "Ideggyógyászat",
"best_similarity": 0.6161608552626752
},
{
"idx": 24,
"s": "Gyermekneurológiai vizsgálat",
"c": "Gyermekneurológiai szakrendelés",
"best_a": "Ideggyógyászat",
"best_similarity": 0.635906918857065
}
],
"llm_usage": {
"prompt_tokens": 496,
"completion_tokens": 0,
"total_tokens": 496,
"cost": 0.00006448
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 21464,
"completion_tokens": 2880,
"total_tokens": 24344,
"cost": 0.010492469999999999
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 9b78af24-217e-40c9-98fe-cbd6c397c2a5_*.log, CLI: pipeline_9b78af24_*.log).
data/logs/9b78af24-217e-40c9-98fe-cbd6c397c2a5_20260330_185233.log
2026-03-30 18:52:33 | INFO | prefect.pipeline.parallel.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Starting parallel pipeline execution 9b78af24-217e-40c9-98fe-cbd6c397c2a5 for URL: https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Starting alternative metadata extraction stage
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Starting discovery-fetch-validation (async) for URL: https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Querying metadata for: https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Async crawl starting: https://www.rochlitzgyogytorna.hu/ (max_depth=2, max_concurrent=10, preserve_url_fragments=True)
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Downloading main URL: https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 0): https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 1): https://www.rochlitzgyogytorna.hu/#content
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Successfully extracted 8267 characters from main URL
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Searching for contact pages using OpenSerp
2026-03-30 18:52:34 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'rochlitzgyogytorna.hu', 'limit': '3', 'lang': 'HU'}
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 1): https://www.rochlitzgyogytorna.hu/#gyik
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 1): https://www.rochlitzgyogytorna.hu/kapcsolat
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 1): https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 1): https://www.rochlitzgyogytorna.hu/rolunk
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 2): https://www.rochlitzgyogytorna.hu/kapcsolat#content
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 2): https://www.rochlitzgyogytorna.hu/rolunk#content
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawled (depth 2): https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak#content
2026-03-30 18:52:34 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Crawl finished: 9 URLs in 0.6s (success=9, errors=0)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Prediction batch to http://docker-host:8000/predict/batch completed in 7981.0 ms (remaining_batches=1, texts=9)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Pass 1 (httpx): 5 BERT candidates, html_cache 9 entries
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 1/5] Processing (BERT prob=1.00): https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 1/5] Using cached HTML (251007 chars)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 1/5] OK (BERT prob=1.00)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 2/5] Processing (BERT prob=1.00): https://www.rochlitzgyogytorna.hu/szolgaltatasok-arak#content
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 2/5] Using cached HTML (251007 chars)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 2/5] OK (BERT prob=1.00)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 3/5] Processing (BERT prob=1.00): https://www.rochlitzgyogytorna.hu/
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 3/5] Using cached HTML (174763 chars)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 3/5] OK (BERT prob=1.00)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 4/5] Processing (BERT prob=1.00): https://www.rochlitzgyogytorna.hu/#content
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 4/5] Using cached HTML (174763 chars)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 4/5] OK (BERT prob=1.00)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 5/5] Processing (BERT prob=1.00): https://www.rochlitzgyogytorna.hu/#gyik
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 5/5] Using cached HTML (174763 chars)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | [URL 5/5] OK (BERT prob=1.00)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Discovery (async) completed with 5 page(s)
2026-03-30 18:52:43 | INFO | src.stages.stage_2_discovery_async.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Detailed logs saved to: data/logs/9b78af24-217e-40c9-98fe-cbd6c397c2a5_20260330_185233.log
2026-03-30 18:52:44 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Data extraction: 5 page(s) to process
2026-03-30 18:52:45 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Extracted 0 price items from page 5
2026-03-30 18:52:45 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Extracted 0 price items from page 3
2026-03-30 18:52:48 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Extracted 0 price items from page 4
2026-03-30 18:52:52 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Extracted 34 price items from page 2
2026-03-30 18:53:04 | WARNING | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-30 18:53:04 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-30 18:53:31 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Successfully extracted metadata for: Rochlitz Gyógytornász Bt. (Rochlitz Gyógytorna)
2026-03-30 18:53:31 | INFO | src.stages.stage_1_metadata_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Alternative metadata extraction stage completed
2026-03-30 18:53:31 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Starting reviews scraping stage
2026-03-30 18:53:31 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Found metadata directly: company_name=Rochlitz Gyógytornász Bt. (Rochlitz Gyógytorna), varos=Tata (rendelői telephely: Tatabánya is)
2026-03-30 18:53:31 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | input_path: /tmp/tmpgulig6c3
2026-03-30 18:53:31 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | output_path: /tmp/tmp8ryfrblv
2026-03-30 18:53:31 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Running google-maps-scraper (attempt 1/3)
2026-03-30 18:53:51 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-30 18:53:51 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Input fájl mentve: data/review/20260330_185351_rochlitzgyogytorna_hu_url_input.txt
2026-03-30 18:53:51 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Output fájl mentve: data/review/20260330_185351_rochlitzgyogytorna_hu_url_output.json
2026-03-30 18:53:51 | INFO | src.stages.stage_4_reviews.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Reviews scraping completed. Found 8 reviews
2026-03-30 18:53:52 | INFO | prefect.pipeline.parallel.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-30 18:58:56 | WARNING | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Extraction failed for page 1: Unterminated string starting at: line 1 column 114424 (char 114423)
2026-03-30 18:58:56 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Post-process price_items: 34 -> 25 (removed invalid/zero prices and duplicate services)
2026-03-30 18:58:56 | INFO | src.stages.stage_3_data_extraction.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Data extraction stage completed: 25 total price items from 5 page(s)
2026-03-30 18:58:57 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Starting taxonomy enrichment alt stage (embeddings)
2026-03-30 18:58:57 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-30 18:58:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | taxonomy_enrichment_alt summary: processed=25 avg=0.6702 min=0.5672 max=0.7330 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-30 18:58:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | taxonomy_enrichment_alt weakest_matches: [{'idx': 9, 's': 'Lökéshullám-terápia', 'c': 'Lökéshullám-terápia', 'best_a': 'Fizioterápia', 'best_similarity': 0.5671610557789022}, {'idx': 3, 's': 'Nyiroködéma KOMPLEX', 'c': 'Gyógymasszázs', 'best_a': 'Fizioterápia', 'best_similarity': 0.5977832032873441}, {'idx': 4, 's': 'Nyiroködéma masszázs', 'c': 'Gyógymasszázs', 'best_a': 'Fizioterápia', 'best_similarity': 0.6077025200565959}]
2026-03-30 18:58:58 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | taxonomy_enrichment_alt stage completed
2026-03-30 18:58:59 | INFO | prefect.pipeline.parallel.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-30 18:58:59 | INFO | prefect.pipeline.parallel.9b78af24-217e-40c9-98fe-cbd6c397c2a5 | Pipeline execution 9b78af24-217e-40c9-98fe-cbd6c397c2a5 completed