A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-29 10:36:36 | 2026-03-29 10:37:49 | 1 min 13 s | — |
| discovery_fetch_validation | completed | 2026-03-29 10:36:28 | 2026-03-29 10:37:49 | 1 min 21 s | — |
| metadata_alt | completed | 2026-03-29 10:36:28 | 2026-03-29 10:37:49 | 1 min 21 s | — |
| reviews | completed | 2026-03-29 10:37:15 | 2026-03-29 10:37:49 | 34 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-29 10:36:39 | 2026-03-29 10:37:49 | 1 min 9 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| belgyógyászati szakvizsgálat, első vizsgálat | 20000 | belgyógyászat | Belgyógyászat / 0.6392722763696509 |
| belgyógyászati szakvizsgálat, kontrollvizsgálat | 10000 | belgyógyászat | Belgyógyászat / 0.6834174750100024 |
| prothrombin meghatározás | 3000 | labor | Laborvizsgálatok / 0.5287441677734976 |
| hasi ultrahangvizsgálat | 20000 | ultrahangdiagnosztika | Radiológia / 0.6464571795413561 |
| pajzsmirigy ultrahangvizsgálat | 18000 | ultrahangdiagnosztika | Endokrinológia / 0.6010451851137452 |
| emlő ultrahangvizsgálat | 18000 | ultrahangdiagnosztika | Radiológia / 0.6297175023625637 |
| végtag color doppler ultrahangvizsgálat | 20000 | ultrahangdiagnosztika | Angiológia / 0.643565608596982 |
| nyaki erek color doppler ultrahangvizsgálata | 18000 | ultrahangdiagnosztika | Angiológia / 0.5843326817634512 |
| ízületek ultrahangvizsgálata | 18000 | ultrahangdiagnosztika | Radiológia / 0.6143371151538334 |
| Internistische Erstuntersuchung | 20000 | Internisztika | Belgyógyászat / 0.49024394048216235 |
| Internistische Kontrolluntersuchung | 10000 | Internisztika | Belgyógyászat / 0.49595298573904756 |
| Prothrombin (INR) Bestimmung/Gerinnungstest | 3000 | Labor | Laborvizsgálatok / 0.3845498973292768 |
| Oberbauch/Unterbauch-Sonografie | 20000 | Ultraschall-Diagnostik | Radiológia / 0.42408154140334126 |
| Schilddrüsen-Sonografie | 18000 | Ultraschall-Diagnostik | Radiológia / 0.4196924904699106 |
| Brust-Sonografie | 18000 | Ultraschall-Diagnostik | Radiológia / 0.4436477087131716 |
| Farbcodierte Doppler-Sonografie der Gefäße | 20000 | Ultraschall-Diagnostik | Angiológia / 0.46448164396383906 |
| Farbcodierte Doppler-Sonografie der Halsgefäße | 18000 | Ultraschall-Diagnostik | Angiológia / 0.4342185707894187 |
| Sonografie der Gelenke | 18000 | Ultraschall-Diagnostik | Radiológia / 0.41892029848612305 |
{
"execution_id": "91da0d49-7549-4738-b172-ca2ec901e8ee",
"input_url": "https://csillag-praxis.hu/",
"state_filename": "20260329_103620_csillag-praxis_hu.json",
"created_at": "2026-03-29T10:36:20.552094",
"updated_at": "2026-03-29T10:37:49.580455",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T10:36:28.052787",
"completed_at": "2026-03-29T10:37:49.459527",
"result": {
"metadata": {
"company_name": "Csillag-praxis",
"description": "Csillag-praxis egy családias magánorvosi rendelő Keszthelyen, ahol tapasztalt szakorvosok nyújtanak háziorvosi, belgyógyászati és ultrahang-diagnosztikai ellátást. Fontos számukra a rövid várakozási idő és a betegközpontú, személyes ellátás, amely bizalmas orvos–beteg kapcsolatot eredményez. A praxis korszerű ultrahangkészülékkel (Samsung Medison Sono Ace R7) dolgozik, így részletes, sugárterhelés nélküli vizsgálatokat kínál minden belső szervre, erekre és lágyrészekre. Belgyógyászati és ultrahangvizsgálatok előjegyzés alapján történnek; háziorvosi ellátás regisztrált betegek számára térítésmentes. A rendelő hangsúlyt fektet a megelőzésre és szűrővizsgálatokra, különösen az 50 év felettiek számára.",
"arlista_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
"varos": "Keszthely",
"iranyitoszam": "8360",
"utca": "Pál utca 36/b",
"telefonszam": "+36 83 315 257; +36 30 5250 100",
"email": "dr.csillag.peter@t-online.hu; spenglerellen@gmail.com",
"website": "https://csillag-praxis.hu/"
},
"llm_usage": {
"prompt_tokens": 4493,
"completion_tokens": 1429,
"total_tokens": 5922,
"cost": 0.00398125
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-29T10:36:28.075515",
"completed_at": "2026-03-29T10:37:49.507908",
"result": {
"pages": [
{
"source_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
"discovered_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://csillag-praxis.hu/",
"validation_passed": true,
"ft_count": 9,
"score": 0.9997789263725281,
"attempts": 1
},
{
"source_url": "https://csillag-praxis.hu/leistungen.htm",
"discovered_url": "https://csillag-praxis.hu/leistungen.htm",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://csillag-praxis.hu/",
"validation_passed": true,
"ft_count": 9,
"score": 0.9994964599609375,
"attempts": 2
}
],
"original_url": "https://csillag-praxis.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-29T10:36:36.335684",
"completed_at": "2026-03-29T10:37:49.532003",
"result": {
"number_of_price_items": 18,
"price_items": [
{
"s": "belgyógyászati szakvizsgálat, első vizsgálat",
"p": 20000,
"c": "belgyógyászat",
"a": "Belgyógyászat",
"v": 0.6392722763696509
},
{
"s": "belgyógyászati szakvizsgálat, kontrollvizsgálat",
"p": 10000,
"c": "belgyógyászat",
"a": "Belgyógyászat",
"v": 0.6834174750100024
},
{
"s": "prothrombin meghatározás",
"p": 3000,
"c": "labor",
"a": "Laborvizsgálatok",
"v": 0.5287441677734976
},
{
"s": "hasi ultrahangvizsgálat",
"p": 20000,
"c": "ultrahangdiagnosztika",
"a": "Radiológia",
"v": 0.6464571795413561
},
{
"s": "pajzsmirigy ultrahangvizsgálat",
"p": 18000,
"c": "ultrahangdiagnosztika",
"a": "Endokrinológia",
"v": 0.6010451851137452
},
{
"s": "emlő ultrahangvizsgálat",
"p": 18000,
"c": "ultrahangdiagnosztika",
"a": "Radiológia",
"v": 0.6297175023625637
},
{
"s": "végtag color doppler ultrahangvizsgálat",
"p": 20000,
"c": "ultrahangdiagnosztika",
"a": "Angiológia",
"v": 0.643565608596982
},
{
"s": "nyaki erek color doppler ultrahangvizsgálata",
"p": 18000,
"c": "ultrahangdiagnosztika",
"a": "Angiológia",
"v": 0.5843326817634512
},
{
"s": "ízületek ultrahangvizsgálata",
"p": 18000,
"c": "ultrahangdiagnosztika",
"a": "Radiológia",
"v": 0.6143371151538334
},
{
"s": "Internistische Erstuntersuchung",
"p": 20000,
"c": "Internisztika",
"a": "Belgyógyászat",
"v": 0.49024394048216235
},
{
"s": "Internistische Kontrolluntersuchung",
"p": 10000,
"c": "Internisztika",
"a": "Belgyógyászat",
"v": 0.49595298573904756
},
{
"s": "Prothrombin (INR) Bestimmung/Gerinnungstest",
"p": 3000,
"c": "Labor",
"a": "Laborvizsgálatok",
"v": 0.3845498973292768
},
{
"s": "Oberbauch/Unterbauch-Sonografie",
"p": 20000,
"c": "Ultraschall-Diagnostik",
"a": "Radiológia",
"v": 0.42408154140334126
},
{
"s": "Schilddrüsen-Sonografie",
"p": 18000,
"c": "Ultraschall-Diagnostik",
"a": "Radiológia",
"v": 0.4196924904699106
},
{
"s": "Brust-Sonografie",
"p": 18000,
"c": "Ultraschall-Diagnostik",
"a": "Radiológia",
"v": 0.4436477087131716
},
{
"s": "Farbcodierte Doppler-Sonografie der Gefäße",
"p": 20000,
"c": "Ultraschall-Diagnostik",
"a": "Angiológia",
"v": 0.46448164396383906
},
{
"s": "Farbcodierte Doppler-Sonografie der Halsgefäße",
"p": 18000,
"c": "Ultraschall-Diagnostik",
"a": "Angiológia",
"v": 0.4342185707894187
},
{
"s": "Sonografie der Gelenke",
"p": 18000,
"c": "Ultraschall-Diagnostik",
"a": "Radiológia",
"v": 0.41892029848612305
}
],
"llm_usage": {
"prompt_tokens": 4584,
"completion_tokens": 671,
"total_tokens": 5255,
"cost": 0.0016939799999999999
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-29T10:36:39.839250",
"completed_at": "2026-03-29T10:37:49.554201",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 18,
"items_processed": 18,
"avg_best_similarity": 0.530371014947854,
"min_best_similarity": 0.3845498973292768,
"max_best_similarity": 0.6834174750100024,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "belgyógyászati szakvizsgálat, első vizsgálat",
"c": "belgyógyászat",
"best_a": "Belgyógyászat",
"best_similarity": 0.6392722763696509
},
{
"idx": 1,
"s": "belgyógyászati szakvizsgálat, kontrollvizsgálat",
"c": "belgyógyászat",
"best_a": "Belgyógyászat",
"best_similarity": 0.6834174750100024
},
{
"idx": 2,
"s": "prothrombin meghatározás",
"c": "labor",
"best_a": "Laborvizsgálatok",
"best_similarity": 0.5287441677734976
},
{
"idx": 3,
"s": "hasi ultrahangvizsgálat",
"c": "ultrahangdiagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6464571795413561
},
{
"idx": 4,
"s": "pajzsmirigy ultrahangvizsgálat",
"c": "ultrahangdiagnosztika",
"best_a": "Endokrinológia",
"best_similarity": 0.6010451851137452
},
{
"idx": 5,
"s": "emlő ultrahangvizsgálat",
"c": "ultrahangdiagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6297175023625637
},
{
"idx": 6,
"s": "végtag color doppler ultrahangvizsgálat",
"c": "ultrahangdiagnosztika",
"best_a": "Angiológia",
"best_similarity": 0.643565608596982
},
{
"idx": 7,
"s": "nyaki erek color doppler ultrahangvizsgálata",
"c": "ultrahangdiagnosztika",
"best_a": "Angiológia",
"best_similarity": 0.5843326817634512
},
{
"idx": 8,
"s": "ízületek ultrahangvizsgálata",
"c": "ultrahangdiagnosztika",
"best_a": "Radiológia",
"best_similarity": 0.6143371151538334
},
{
"idx": 9,
"s": "Internistische Erstuntersuchung",
"c": "Internisztika",
"best_a": "Belgyógyászat",
"best_similarity": 0.49024394048216235
},
{
"idx": 10,
"s": "Internistische Kontrolluntersuchung",
"c": "Internisztika",
"best_a": "Belgyógyászat",
"best_similarity": 0.49595298573904756
},
{
"idx": 11,
"s": "Prothrombin (INR) Bestimmung/Gerinnungstest",
"c": "Labor",
"best_a": "Laborvizsgálatok",
"best_similarity": 0.3845498973292768
},
{
"idx": 12,
"s": "Oberbauch/Unterbauch-Sonografie",
"c": "Ultraschall-Diagnostik",
"best_a": "Radiológia",
"best_similarity": 0.42408154140334126
},
{
"idx": 13,
"s": "Schilddrüsen-Sonografie",
"c": "Ultraschall-Diagnostik",
"best_a": "Radiológia",
"best_similarity": 0.4196924904699106
},
{
"idx": 14,
"s": "Brust-Sonografie",
"c": "Ultraschall-Diagnostik",
"best_a": "Radiológia",
"best_similarity": 0.4436477087131716
},
{
"idx": 15,
"s": "Farbcodierte Doppler-Sonografie der Gefäße",
"c": "Ultraschall-Diagnostik",
"best_a": "Angiológia",
"best_similarity": 0.46448164396383906
},
{
"idx": 16,
"s": "Farbcodierte Doppler-Sonografie der Halsgefäße",
"c": "Ultraschall-Diagnostik",
"best_a": "Angiológia",
"best_similarity": 0.4342185707894187
},
{
"idx": 17,
"s": "Sonografie der Gelenke",
"c": "Ultraschall-Diagnostik",
"best_a": "Radiológia",
"best_similarity": 0.41892029848612305
}
],
"llm_usage": {
"prompt_tokens": 366,
"completion_tokens": 0,
"total_tokens": 366,
"cost": 0.00004758
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T10:37:15.337579",
"completed_at": "2026-03-29T10:37:49.482358",
"result": {
"reviews": {
"company_name": "Csillag-praxis",
"total_reviews": 55,
"average_rating": 4.5,
"reviews": [
{
"author": "Hermina Zsók",
"rating": 5,
"text": "Precíz ellátás,empátia,kedvesség,tiszta szép környezet,online időpont foglalás.Évek óta járok vissza UH-ra a doktornőhöz!Maximálisan elégedett vagyok!Kiváló szakember!\nNagyon hálás vagyok az Ő munkájáért!\nSzívből ajánlom mindenkinek!",
"date": null
},
{
"author": "Diána Egervölgyi",
"rating": 5,
"text": "Nagyon kedves és alapos orvos, mindent részletesen elmagyarázott. Nem kellett sokat várni, emberileg és szakmailag is maximálisan elégedett vagyok. Szívből ajánlom!",
"date": null
},
{
"author": "beatrix stampfel",
"rating": 5,
"text": "Nagyon kedves a főorvos asszony,már többször jártam nála,mindig pontos időben,nagyon kedvesen és segítőkészen fogadott,legközelebb is csak Őt választom,mindenkinek tiszta szívből csak ajánlani tudom!",
"date": null
},
{
"author": "Krisztina Dénesné Rosta",
"rating": 5,
"text": "Csak jót mondhatok a doktornőről! Évek óta hozzá járok! Megbízható, kedves, megnyugtató a vele való kommunikáció! Ajánlom mindenkinek!😊",
"date": null
},
{
"author": "Lajos Fuksz",
"rating": 5,
"text": "A feleségem nagyon megelégedett, és feldobobódott hangulatban érkezett haza a vizsgálat után, mert a főorvosnő kedvessége és szaktudása rabul ejtette. Ajánljuk mindenkinek!",
"date": null
},
{
"author": "Tamás Salamon",
"rating": 5,
"text": "Hosszú ideje ide járok! Doktornő alapos,megbízható,kedves. Modern diagnosztikai eszközzel magas szintű tudás párosul! Csak ajánlani tudom!",
"date": null
},
{
"author": "Gabriella Bázsa",
"rating": 5,
"text": "Doktornő kiváló szakember, hálás vagyok a precíz diagnózisért és az empátiáért. Ajánlom mindenkinek! Köszönöm szépen! ★★★★★",
"date": null
},
{
"author": "Mark Nemeth",
"rating": 5,
"text": "Csakis ide! Kedves alapos gyors! Egy beteg nem is kívánhatna jobbat👍🤩",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "8360",
"city": "Keszthely",
"street": "Pál u. 36/b",
"phone": "(06 83) 315 257"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 9443,
"completion_tokens": 2100,
"total_tokens": 11543,
"cost": 0.00572281
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 91da0d49-7549-4738-b172-ca2ec901e8ee_*.log, CLI: pipeline_91da0d49_*.log).
data/logs/91da0d49-7549-4738-b172-ca2ec901e8ee_20260329_103628.log
2026-03-29 10:36:28 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 91da0d49-7549-4738-b172-ca2ec901e8ee for URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:36:29 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://csillag-praxis.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 573 characters from main URL
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:36:29 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'csillag-praxis.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:36:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index_d.html
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/orvosok.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/elerhetoeseg.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/megkoezelites.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index.html
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/praxis.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/impressum.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/leistungen.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/aerzte.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/praxis_d.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:30 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/weg.htm
2026-03-29 10:36:31 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/idopont
2026-03-29 10:36:31 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 16 URLs in 1.5s (success=16, errors=0)
2026-03-29 10:36:35 | INFO | src.stages.stage_2_discovery_async | Crawl produced 2 URLs from BERT (threshold and above), fetching all
2026-03-29 10:36:35 | INFO | src.stages.stage_2_discovery_async | [URL 1/2] Fetching (BERT prob=1.00): https://csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:36 | INFO | src.stages.stage_2_discovery_async | [URL 1/2] OK (BERT prob=1.00)
2026-03-29 10:36:36 | INFO | src.stages.stage_2_discovery_async | [URL 2/2] Fetching (BERT prob=1.00): https://csillag-praxis.hu/leistungen.htm
2026-03-29 10:36:36 | INFO | src.stages.stage_2_discovery_async | [URL 2/2] OK (BERT prob=1.00)
2026-03-29 10:36:36 | INFO | src.stages.stage_2_discovery_async | Discovery (async) completed with 2 page(s)
2026-03-29 10:36:36 | INFO | src.stages.stage_2_discovery_async | Detailed logs saved to: data/logs/91da0d49-7549-4738-b172-ca2ec901e8ee_20260329_103628.log
2026-03-29 10:36:36 | INFO | src.stages.stage_3_data_extraction | Data extraction: 2 page(s) to process
2026-03-29 10:36:39 | INFO | src.stages.stage_3_data_extraction | Extracted 9 price items from page 1
2026-03-29 10:36:39 | INFO | src.stages.stage_3_data_extraction | Extracted 9 price items from page 2
2026-03-29 10:36:39 | INFO | src.stages.stage_3_data_extraction | Data extraction stage completed: 18 total price items from 2 page(s)
2026-03-29 10:36:39 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | Starting taxonomy enrichment alt stage (embeddings)
2026-03-29 10:36:39 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-29 10:36:40 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt summary: processed=18 avg=0.5304 min=0.3845 max=0.6834 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-29 10:36:40 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt weakest_matches: [{'idx': 11, 's': 'Prothrombin (INR) Bestimmung/Gerinnungstest', 'c': 'Labor', 'best_a': 'Laborvizsgálatok', 'best_similarity': 0.3845498973292768}, {'idx': 17, 's': 'Sonografie der Gelenke', 'c': 'Ultraschall-Diagnostik', 'best_a': 'Radiológia', 'best_similarity': 0.41892029848612305}, {'idx': 13, 's': 'Schilddrüsen-Sonografie', 'c': 'Ultraschall-Diagnostik', 'best_a': 'Radiológia', 'best_similarity': 0.4196924904699106}]
2026-03-29 10:36:40 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt stage completed
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 4 results
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Result 1: Csillag-praxis Keszthely Balaton - Kontakt - https://www.csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Result 2: Csillag-praxis Keszthely Balaton - Szólgáltatásaink - http://www.csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Result 3: ARZTPRAXIS CSILLAG - Kontakt - http://www.csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1970 characters from contact page 1
2026-03-29 10:36:51 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: http://www.csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:52 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 4158 characters from contact page 2
2026-03-29 10:36:52 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: http://www.csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:52 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 2221 characters from contact page 3
2026-03-29 10:36:52 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:37:15 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Csillag-praxis
2026-03-29 10:37:15 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:37:15 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:37:15 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Csillag-praxis, varos=Keszthely
2026-03-29 10:37:15 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmp8ej8awtp
2026-03-29 10:37:15 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmpib1jug2h
2026-03-29 10:37:15 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:37:49 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:37:49 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_103749_csillag-praxis_url_input.txt
2026-03-29 10:37:49 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_103749_csillag-praxis_url_output.json
2026-03-29 10:37:49 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 10:37:49 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:37:49 | INFO | prefect.pipeline.parallel | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-29 10:37:49 | INFO | prefect.pipeline.parallel | Pipeline execution 91da0d49-7549-4738-b172-ca2ec901e8ee completed