A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-30 18:07:16 | 2026-03-30 18:10:11 | 2 min 54 s | — |
| discovery_fetch_validation | completed | 2026-03-30 18:07:03 | 2026-03-30 18:10:11 | 3 min 7 s | — |
| metadata_alt | completed | 2026-03-30 18:07:03 | 2026-03-30 18:10:10 | 3 min 7 s | — |
| reviews | completed | 2026-03-30 18:08:04 | 2026-03-30 18:10:11 | 2 min 6 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-30 18:07:22 | 2026-03-30 18:10:11 | 2 min 49 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Konzultáció, tanácsadás | 12000 | Fogászat | Fogászat / 0.7273447509143253 |
| Fogkőeltávolítás, depurálás, sópolírozás | 25000 | fogászat | Fogászat / 0.745914761178855 |
| Röntgen felvétel/elvitelre | 6000 | fogászat | Fogászat / 0.6968783975502529 |
| Panoráma röntgen felvétel/elvitelre | 10000 | fogászat | Fogászat / 0.7223691231082199 |
| Kompozit tömés (fehér) | 18000 | fogászat | Fogászat / 0.6927170676030289 |
| Barázdazárás | 15000 | fogászat | Fogászat / 0.682115562075723 |
| Tejfog tömése | 20000 | Fogászat | Fogászat / 0.6937541046313395 |
| Trepanálás | 17000 | Fogászat | Fogászat / 0.6305915085615426 |
| Gyökércsatorna gyógyszeres zárása | 12000 | fogászat | Fogászat / 0.6203636451320339 |
| Gyökértömés csatornaszámtól függően | 23000 | fogászat | Fogászat / 0.6523293316340997 |
| Gépi gyökércsatorna megmunkálás | 7000 | Fogászat | Fogászat / 0.6842291355336068 |
| Ideiglenes tömés | 2500 | Fogászat | Fogászat / 0.6770034096327829 |
| Gyógyszeres alábélelés | 3000 | Fogászat | Fogászat / 0.6451249706788972 |
| Öntött csap (fém/cirkon) | 35000 | fogászat | Fogászat / 0.6357273845002686 |
| Fémkerámia korona, hídtag | 77000 | fogászat | Fogászat / 0.705333070262109 |
| Fémkerámia szólókorona | 85000 | Fogászat | Fogászat / 0.6732244395137902 |
| Fémkerámia korona porcelánvállal | 85000 | Fogászat | Fogászat / 0.6808925527602069 |
| Zirkon korona | 92000 | Fogászat | Fogászat / 0.703802631939185 |
| Inlay, Onlay, Overlay | 95000 | Fogászat | Fogászat / 0.661251067824424 |
| Préskerámia héj, korona | 95000 | Fogászat | Fogászat / 0.6920815253733353 |
| Fémmentes (Belle-Glass) korona, betét, hídtag | 90000 | Fogászat | Fogászat / 0.6517810276706403 |
| Fémmentes (Cerec, Adoro) korona, betét | 95000 | Fogászat | Fogászat / 0.6827132969890687 |
| Kapocstartó korona frézelt vállal | 85000 | Fogászat | Fogászat / 0.6431026345291322 |
| Teljes fogsor | 230000 | fogászat | Fogászat / 0.6945287309995968 |
| Részleges fogsor | 220000 | fogászat | Fogászat / 0.6796138101068644 |
| Fémlemezes fogsor | 240000 | fogászat | Fogászat / 0.6844029152238733 |
| Törhetetlen fogsor (Valplast) | 300000 | Fogászat | Fogászat / 0.6309914993987825 |
| Fogeltávolítás | 19000 | fogászat | Fogászat / 0.7553626162920423 |
| Rejtett elhorgonyzás | 40000 | fogászat | Fogászat / 0.6346193942325619 |
| Varrat | 5000 | Fogászat | Fogászat / 0.6421979485961177 |
| Gyökér, fog műtéti eltávolítása | 20000 | fogászat | Fogászat / 0.7126717291879846 |
| Cysta eltávolítása, resectió | 30000 | fogászat | Fogászat / 0.6615082558630582 |
| Implantátum | 120000 | Fogászat | Fogászat / 0.7403139816406633 |
| Fogfehérítés állcsontonként | 40000 | Fogászat | Fogászat / 0.6999507522390824 |
{
"execution_id": "5e89610d-3262-45cd-a7a0-c9b5e28cb1b8",
"input_url": "https://www.torokbalintifog.hu/",
"state_filename": "20260330_180702_torokbalintifog_hu.json",
"created_at": "2026-03-30T18:07:02.757596",
"updated_at": "2026-03-30T18:10:11.605769",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-30T18:07:03.220590",
"completed_at": "2026-03-30T18:10:10.934760",
"result": {
"metadata": {
"company_name": "N/A",
"description": "Törökbálinti rendelőnk 2009 őszén nyílt meg Törökbálint központjában, miután 8 évig működtünk Érden. Célunk team alapú, komplex fogászati ellátás biztosítása, amely magában foglalja a konzerváló fogászati, szájsebészeti, fogszabályzó, parodontológiai és protetikai kezeléseket. Minden ellátási területre külön szakvizsgával rendelkező szakorvos áll rendelkezésre, így a páciensek átfogó, szakszerű ellátást kapnak. Elkötelezettek vagyunk a minőségi betegellátás mellett, folyamatosan bevezetjük az újításokat, miközben törekszünk megfizethető szolgáltatást nyújtani. Kiemelt hangsúlyt fektetünk a páciensek tájékoztatására és az egyszerű időpontfoglalásra — kérik, hogy időpontfoglaláskor jelezze a recepción, ha Törökbálintra szeretne időpontot foglalni. Hitvallásunk: \"Mert a fogon egy ember lóg.\"",
"arlista_url": "N/A",
"varos": "Törökbálint",
"iranyitoszam": "3000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://www.torokbalintifog.hu/"
},
"llm_usage": {
"prompt_tokens": 870,
"completion_tokens": 1662,
"total_tokens": 2532,
"cost": 0.0035415
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-30T18:07:03.353002",
"completed_at": "2026-03-30T18:10:11.202521",
"result": {
"pages": [
{
"source_url": "https://www.torokbalintifog.hu/araink",
"discovered_url": "https://www.torokbalintifog.hu/araink",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.torokbalintifog.hu/",
"validation_passed": true,
"ft_count": 0,
"score": 0.990827739238739,
"attempts": 1
},
{
"source_url": "https://www.torokbalintifog.hu/araink#main",
"discovered_url": "https://www.torokbalintifog.hu/araink#main",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://www.torokbalintifog.hu/",
"validation_passed": true,
"ft_count": 0,
"score": 0.990827739238739,
"attempts": 2
}
],
"original_url": "https://www.torokbalintifog.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-30T18:07:16.558399",
"completed_at": "2026-03-30T18:10:11.338998",
"result": {
"number_of_price_items": 34,
"price_items": [
{
"s": "Konzultáció, tanácsadás",
"p": 12000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.7273447509143253
},
{
"s": "Fogkőeltávolítás, depurálás, sópolírozás",
"p": 25000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.745914761178855
},
{
"s": "Röntgen felvétel/elvitelre",
"p": 6000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6968783975502529
},
{
"s": "Panoráma röntgen felvétel/elvitelre",
"p": 10000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.7223691231082199
},
{
"s": "Kompozit tömés (fehér)",
"p": 18000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6927170676030289
},
{
"s": "Barázdazárás",
"p": 15000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.682115562075723
},
{
"s": "Tejfog tömése",
"p": 20000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6937541046313395
},
{
"s": "Trepanálás",
"p": 17000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6305915085615426
},
{
"s": "Gyökércsatorna gyógyszeres zárása",
"p": 12000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6203636451320339
},
{
"s": "Gyökértömés csatornaszámtól függően",
"p": 23000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6523293316340997
},
{
"s": "Gépi gyökércsatorna megmunkálás",
"p": 7000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6842291355336068
},
{
"s": "Ideiglenes tömés",
"p": 2500,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6770034096327829
},
{
"s": "Gyógyszeres alábélelés",
"p": 3000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6451249706788972
},
{
"s": "Öntött csap (fém/cirkon)",
"p": 35000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6357273845002686
},
{
"s": "Fémkerámia korona, hídtag",
"p": 77000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.705333070262109
},
{
"s": "Fémkerámia szólókorona",
"p": 85000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6732244395137902
},
{
"s": "Fémkerámia korona porcelánvállal",
"p": 85000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6808925527602069
},
{
"s": "Zirkon korona",
"p": 92000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.703802631939185
},
{
"s": "Inlay, Onlay, Overlay",
"p": 95000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.661251067824424
},
{
"s": "Préskerámia héj, korona",
"p": 95000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6920815253733353
},
{
"s": "Fémmentes (Belle-Glass) korona, betét, hídtag",
"p": 90000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6517810276706403
},
{
"s": "Fémmentes (Cerec, Adoro) korona, betét",
"p": 95000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6827132969890687
},
{
"s": "Kapocstartó korona frézelt vállal",
"p": 85000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6431026345291322
},
{
"s": "Teljes fogsor",
"p": 230000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6945287309995968
},
{
"s": "Részleges fogsor",
"p": 220000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6796138101068644
},
{
"s": "Fémlemezes fogsor",
"p": 240000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6844029152238733
},
{
"s": "Törhetetlen fogsor (Valplast)",
"p": 300000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6309914993987825
},
{
"s": "Fogeltávolítás",
"p": 19000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.7553626162920423
},
{
"s": "Rejtett elhorgonyzás",
"p": 40000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6346193942325619
},
{
"s": "Varrat",
"p": 5000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6421979485961177
},
{
"s": "Gyökér, fog műtéti eltávolítása",
"p": 20000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.7126717291879846
},
{
"s": "Cysta eltávolítása, resectió",
"p": 30000,
"c": "fogászat",
"a": "Fogászat",
"v": 0.6615082558630582
},
{
"s": "Implantátum",
"p": 120000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.7403139816406633
},
{
"s": "Fogfehérítés állcsontonként",
"p": 40000,
"c": "Fogászat",
"a": "Fogászat",
"v": 0.6999507522390824
}
],
"llm_usage": {
"prompt_tokens": 4172,
"completion_tokens": 2811,
"total_tokens": 6983,
"cost": 0.0036389400000000002
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-30T18:07:22.435116",
"completed_at": "2026-03-30T18:10:11.469900",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 34,
"items_processed": 34,
"avg_best_similarity": 0.6804943245111028,
"min_best_similarity": 0.6203636451320339,
"max_best_similarity": 0.7553626162920423,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Konzultáció, tanácsadás",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.7273447509143253
},
{
"idx": 1,
"s": "Fogkőeltávolítás, depurálás, sópolírozás",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.745914761178855
},
{
"idx": 2,
"s": "Röntgen felvétel/elvitelre",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6968783975502529
},
{
"idx": 3,
"s": "Panoráma röntgen felvétel/elvitelre",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.7223691231082199
},
{
"idx": 4,
"s": "Kompozit tömés (fehér)",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6927170676030289
},
{
"idx": 5,
"s": "Barázdazárás",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.682115562075723
},
{
"idx": 6,
"s": "Tejfog tömése",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6937541046313395
},
{
"idx": 7,
"s": "Trepanálás",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6305915085615426
},
{
"idx": 8,
"s": "Gyökércsatorna gyógyszeres zárása",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6203636451320339
},
{
"idx": 9,
"s": "Gyökértömés csatornaszámtól függően",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6523293316340997
},
{
"idx": 10,
"s": "Gépi gyökércsatorna megmunkálás",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6842291355336068
},
{
"idx": 11,
"s": "Ideiglenes tömés",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6770034096327829
},
{
"idx": 12,
"s": "Gyógyszeres alábélelés",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6451249706788972
},
{
"idx": 13,
"s": "Öntött csap (fém/cirkon)",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6357273845002686
},
{
"idx": 14,
"s": "Fémkerámia korona, hídtag",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.705333070262109
},
{
"idx": 15,
"s": "Fémkerámia szólókorona",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6732244395137902
},
{
"idx": 16,
"s": "Fémkerámia korona porcelánvállal",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6808925527602069
},
{
"idx": 17,
"s": "Zirkon korona",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.703802631939185
},
{
"idx": 18,
"s": "Inlay, Onlay, Overlay",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.661251067824424
},
{
"idx": 19,
"s": "Préskerámia héj, korona",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6920815253733353
},
{
"idx": 20,
"s": "Fémmentes (Belle-Glass) korona, betét, hídtag",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6517810276706403
},
{
"idx": 21,
"s": "Fémmentes (Cerec, Adoro) korona, betét",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6827132969890687
},
{
"idx": 22,
"s": "Kapocstartó korona frézelt vállal",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6431026345291322
},
{
"idx": 23,
"s": "Teljes fogsor",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6945287309995968
},
{
"idx": 24,
"s": "Részleges fogsor",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6796138101068644
},
{
"idx": 25,
"s": "Fémlemezes fogsor",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6844029152238733
},
{
"idx": 26,
"s": "Törhetetlen fogsor (Valplast)",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6309914993987825
},
{
"idx": 27,
"s": "Fogeltávolítás",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.7553626162920423
},
{
"idx": 28,
"s": "Rejtett elhorgonyzás",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6346193942325619
},
{
"idx": 29,
"s": "Varrat",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6421979485961177
},
{
"idx": 30,
"s": "Gyökér, fog műtéti eltávolítása",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.7126717291879846
},
{
"idx": 31,
"s": "Cysta eltávolítása, resectió",
"c": "fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6615082558630582
},
{
"idx": 32,
"s": "Implantátum",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.7403139816406633
},
{
"idx": 33,
"s": "Fogfehérítés állcsontonként",
"c": "Fogászat",
"best_a": "Fogászat",
"best_similarity": 0.6999507522390824
}
],
"llm_usage": {
"prompt_tokens": 566,
"completion_tokens": 0,
"total_tokens": 566,
"cost": 0.00007358
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-30T18:08:04.236047",
"completed_at": "2026-03-30T18:10:11.068354",
"result": {
"reviews": {
"company_name": "N/A",
"total_reviews": 15,
"average_rating": 4.3,
"reviews": [
{
"author": "Gergely K",
"rating": 5,
"text": "Maximálisan elégedett vagyok mind szakmai mind emberi tényezőket alapul véve!\nKimagasló emberségességgel és hozzáértéssel bánik a doktornő és asszisztense tökéletes összhangban. Jó hangulatban!\nAz árak számomra kedvezőek nem túlzóak.\nSzemély szerint Dr. András Beáta és Jánkyné Halász Sarolta.\nAki nem hiszi tapasztalja meg ;)\nKöszönöm",
"date": null
},
{
"author": "Enikő Varga",
"rating": 5,
"text": "Mindenkinek csak ajánlani tudom!\nÉvek oda ide járok és maximálisan meg vagyok elégedve. Precíz, alapos szolgáltatást kaptam, nagyon kedves az orvos és a szájhigiénikus hölgy. Rengeteg jó tanácsot és megfelelő tájékoztatást kaptam fogápolás terén. Köszönöm !",
"date": null
},
{
"author": "Török Ádám",
"rating": 1,
"text": "Csak szeretném üzenni annak a \"kedves\" itt dolgozó hölgynek, akit 09.12-én reggel 8.20 körül zavart a gyereksírás, hogy esetleg keressen magának másik munkahelyet, ahol nem közös a váróterem a gyerekorvossal!",
"date": null
},
{
"author": "Nándi Székely",
"rating": 5,
"text": "Ajánlom Dr. András Beátát. Kedves, precíz, folyamatosan tájékoztat róla hogy mi fog történni, minden kérdésre kedvesen, türelmesen válaszol.",
"date": null
},
{
"author": "zoltán buzás",
"rating": 5,
"text": "Szuper kedves,korrekt csaladias,roppant nagy hozzáertes.",
"date": null
},
{
"author": "sanyisz21",
"rating": 5,
"text": "Kimagasló szolgáltatások, rendkíívül kedves kiszolgálás",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "",
"city": "",
"street": "",
"phone": ""
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 5608,
"completion_tokens": 4473,
"total_tokens": 10081,
"cost": 0.00725402
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 5e89610d-3262-45cd-a7a0-c9b5e28cb1b8_*.log, CLI: pipeline_5e89610d_*.log).
data/logs/5e89610d-3262-45cd-a7a0-c9b5e28cb1b8_20260330_180703.log
2026-03-30 18:07:03 | INFO | prefect.pipeline.parallel.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Starting parallel pipeline execution 5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 for URL: https://www.torokbalintifog.hu/
2026-03-30 18:07:03 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Starting alternative metadata extraction stage
2026-03-30 18:07:03 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Querying metadata for: https://www.torokbalintifog.hu/
2026-03-30 18:07:03 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Starting discovery-fetch-validation (async) for URL: https://www.torokbalintifog.hu/
2026-03-30 18:07:03 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-30 18:07:03 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Async crawl starting: https://www.torokbalintifog.hu/ (max_depth=2, max_concurrent=10, preserve_url_fragments=True)
2026-03-30 18:07:03 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Downloading main URL: https://www.torokbalintifog.hu/
2026-03-30 18:07:11 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 0): https://www.torokbalintifog.hu/
2026-03-30 18:07:11 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Successfully extracted 821 characters from main URL
2026-03-30 18:07:11 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Searching for contact pages using OpenSerp
2026-03-30 18:07:11 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'torokbalintifog.hu', 'limit': '3', 'lang': 'HU'}
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/araink
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/garancia
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/szolgaltatasok
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/egeszsegpenztar
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 1): https://www.torokbalintifog.hu/elerhetoseg
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 2): https://www.torokbalintifog.hu/garancia#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 2): https://www.torokbalintifog.hu/araink#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 2): https://www.torokbalintifog.hu/egeszsegpenztar#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 2): https://www.torokbalintifog.hu/szolgaltatasok#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawled (depth 2): https://www.torokbalintifog.hu/elerhetoseg#main
2026-03-30 18:07:12 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Crawl finished: 12 URLs in 9.4s (success=12, errors=0)
2026-03-30 18:07:15 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Prediction batch to http://docker-host:8000/predict/batch completed in 2679.1 ms (remaining_batches=1, texts=10)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Prediction batch to http://docker-host:8000/predict/batch completed in 655.4 ms (remaining_batches=1, texts=2)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Pass 1 (httpx): 2 BERT candidates, html_cache 12 entries
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 1/2] Processing (BERT prob=0.99): https://www.torokbalintifog.hu/araink
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 1/2] Using cached HTML (59679 chars)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 1/2] OK (BERT prob=0.99)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 2/2] Processing (BERT prob=0.99): https://www.torokbalintifog.hu/araink#main
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 2/2] Using cached HTML (59679 chars)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | [URL 2/2] OK (BERT prob=0.99)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Discovery (async) completed with 2 page(s)
2026-03-30 18:07:16 | INFO | src.stages.stage_2_discovery_async.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Detailed logs saved to: data/logs/5e89610d-3262-45cd-a7a0-c9b5e28cb1b8_20260330_180703.log
2026-03-30 18:07:16 | INFO | src.stages.stage_3_data_extraction.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Data extraction: 2 page(s) to process
2026-03-30 18:07:20 | INFO | src.stages.stage_3_data_extraction.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Extracted 34 price items from page 2
2026-03-30 18:07:22 | INFO | src.stages.stage_3_data_extraction.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Extracted 51 price items from page 1
2026-03-30 18:07:22 | INFO | src.stages.stage_3_data_extraction.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Post-process price_items: 85 -> 34 (removed invalid/zero prices and duplicate services)
2026-03-30 18:07:22 | INFO | src.stages.stage_3_data_extraction.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Data extraction stage completed: 34 total price items from 2 page(s)
2026-03-30 18:07:22 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Starting taxonomy enrichment alt stage (embeddings)
2026-03-30 18:07:22 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-30 18:07:23 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | taxonomy_enrichment_alt summary: processed=34 avg=0.6805 min=0.6204 max=0.7554 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-30 18:07:23 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | taxonomy_enrichment_alt weakest_matches: [{'idx': 8, 's': 'Gyökércsatorna gyógyszeres zárása', 'c': 'fogászat', 'best_a': 'Fogászat', 'best_similarity': 0.6203636451320339}, {'idx': 7, 's': 'Trepanálás', 'c': 'Fogászat', 'best_a': 'Fogászat', 'best_similarity': 0.6305915085615426}, {'idx': 26, 's': 'Törhetetlen fogsor (Valplast)', 'c': 'Fogászat', 'best_a': 'Fogászat', 'best_similarity': 0.6309914993987825}]
2026-03-30 18:07:23 | INFO | src.stages.stage_5_taxonomy_enrichment_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | taxonomy_enrichment_alt stage completed
2026-03-30 18:07:41 | WARNING | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-30 18:07:41 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-30 18:08:03 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Successfully extracted metadata for: N/A
2026-03-30 18:08:03 | INFO | src.stages.stage_1_metadata_alt.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Alternative metadata extraction stage completed
2026-03-30 18:08:04 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Starting reviews scraping stage
2026-03-30 18:08:04 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Found metadata directly: company_name=N/A, varos=Törökbálint
2026-03-30 18:08:04 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | input_path: /tmp/tmptqlj592z
2026-03-30 18:08:04 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | output_path: /tmp/tmp0nertxay
2026-03-30 18:08:04 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Running google-maps-scraper (attempt 1/3)
2026-03-30 18:10:10 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-30 18:10:10 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | URL match found: torokbalintifog.hu
2026-03-30 18:10:10 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Input fájl mentve: data/review/20260330_181010_torokbalintifog_hu_url_input.txt
2026-03-30 18:10:10 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Output fájl mentve: data/review/20260330_181010_torokbalintifog_hu_url_output.json
2026-03-30 18:10:10 | INFO | src.stages.stage_4_reviews.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Reviews scraping completed. Found 6 reviews
2026-03-30 18:10:11 | INFO | prefect.pipeline.parallel.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-30 18:10:11 | INFO | prefect.pipeline.parallel.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-30 18:10:11 | INFO | prefect.pipeline.parallel.5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 | Pipeline execution 5e89610d-3262-45cd-a7a0-c9b5e28cb1b8 completed