← Vissza a listához

Futtatás részletei

https://csillag-praxis.hu/

Azonosítók

Státusz
completed
Task ID
91da0d49-7549-4738-b172-ca2ec901e8ee
State fájl
20260329_103620_csillag-praxis_hu.json
Aktuális stage
taxonomy_enrichment_alt
Létrehozva
2026-03-29 10:36:20
Frissítve
2026-03-29 10:37:49
Futás időtartama
1 min 21 s

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
data_extraction completed 2026-03-29 10:36:36 2026-03-29 10:37:49 1 min 13 s
discovery_fetch_validation completed 2026-03-29 10:36:28 2026-03-29 10:37:49 1 min 21 s
metadata_alt completed 2026-03-29 10:36:28 2026-03-29 10:37:49 1 min 21 s
reviews completed 2026-03-29 10:37:15 2026-03-29 10:37:49 34 s
taxonomy_enrichment_alt completed 2026-03-29 10:36:39 2026-03-29 10:37:49 1 min 9 s

Eredmény (összegzés)

Cég
Csillag-praxis
Leírás
Csillag-praxis egy családias magánorvosi rendelő Keszthelyen, ahol tapasztalt szakorvosok nyújtanak háziorvosi, belgyógyászati és ultrahang-diagnosztikai ellátást. Fontos számukra a rövid várakozási idő és a betegközpontú, személyes ellátás, amely bizalmas orvos–beteg kapcsolatot eredményez. A praxis korszerű ultrahangkészülékkel (Samsung Medison Sono Ace R7) dolgozik, így részletes, sugárterhelés nélküli vizsgálatokat kínál minden belső szervre, erekre és lágyrészekre. Belgyógyászati és ultraha…
Cím
8360 Keszthely Pál u. 36/b
Email / telefon
dr.csillag.peter@t-online.hu; spenglerellen@gmail.com · (06 83) 315 257
Értékelés
4.5 (55 vélemény)
LLM költség (USD)
$0.0057

Ár tételek

Szolgáltatás Ár Kategória a / v
belgyógyászati szakvizsgálat, első vizsgálat 20000 belgyógyászat Belgyógyászat / 0.6392722763696509
belgyógyászati szakvizsgálat, kontrollvizsgálat 10000 belgyógyászat Belgyógyászat / 0.6834174750100024
prothrombin meghatározás 3000 labor Laborvizsgálatok / 0.5287441677734976
hasi ultrahangvizsgálat 20000 ultrahangdiagnosztika Radiológia / 0.6464571795413561
pajzsmirigy ultrahangvizsgálat 18000 ultrahangdiagnosztika Endokrinológia / 0.6010451851137452
emlő ultrahangvizsgálat 18000 ultrahangdiagnosztika Radiológia / 0.6297175023625637
végtag color doppler ultrahangvizsgálat 20000 ultrahangdiagnosztika Angiológia / 0.643565608596982
nyaki erek color doppler ultrahangvizsgálata 18000 ultrahangdiagnosztika Angiológia / 0.5843326817634512
ízületek ultrahangvizsgálata 18000 ultrahangdiagnosztika Radiológia / 0.6143371151538334
Internistische Erstuntersuchung 20000 Internisztika Belgyógyászat / 0.49024394048216235
Internistische Kontrolluntersuchung 10000 Internisztika Belgyógyászat / 0.49595298573904756
Prothrombin (INR) Bestimmung/Gerinnungstest 3000 Labor Laborvizsgálatok / 0.3845498973292768
Oberbauch/Unterbauch-Sonografie 20000 Ultraschall-Diagnostik Radiológia / 0.42408154140334126
Schilddrüsen-Sonografie 18000 Ultraschall-Diagnostik Radiológia / 0.4196924904699106
Brust-Sonografie 18000 Ultraschall-Diagnostik Radiológia / 0.4436477087131716
Farbcodierte Doppler-Sonografie der Gefäße 20000 Ultraschall-Diagnostik Angiológia / 0.46448164396383906
Farbcodierte Doppler-Sonografie der Halsgefäße 18000 Ultraschall-Diagnostik Angiológia / 0.4342185707894187
Sonografie der Gelenke 18000 Ultraschall-Diagnostik Radiológia / 0.41892029848612305
Nyers state (JSON)
{
  "execution_id": "91da0d49-7549-4738-b172-ca2ec901e8ee",
  "input_url": "https://csillag-praxis.hu/",
  "state_filename": "20260329_103620_csillag-praxis_hu.json",
  "created_at": "2026-03-29T10:36:20.552094",
  "updated_at": "2026-03-29T10:37:49.580455",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T10:36:28.052787",
      "completed_at": "2026-03-29T10:37:49.459527",
      "result": {
        "metadata": {
          "company_name": "Csillag-praxis",
          "description": "Csillag-praxis egy családias magánorvosi rendelő Keszthelyen, ahol tapasztalt szakorvosok nyújtanak háziorvosi, belgyógyászati és ultrahang-diagnosztikai ellátást. Fontos számukra a rövid várakozási idő és a betegközpontú, személyes ellátás, amely bizalmas orvos–beteg kapcsolatot eredményez. A praxis korszerű ultrahangkészülékkel (Samsung Medison Sono Ace R7) dolgozik, így részletes, sugárterhelés nélküli vizsgálatokat kínál minden belső szervre, erekre és lágyrészekre. Belgyógyászati és ultrahangvizsgálatok előjegyzés alapján történnek; háziorvosi ellátás regisztrált betegek számára térítésmentes. A rendelő hangsúlyt fektet a megelőzésre és szűrővizsgálatokra, különösen az 50 év felettiek számára.",
          "arlista_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
          "varos": "Keszthely",
          "iranyitoszam": "8360",
          "utca": "Pál utca 36/b",
          "telefonszam": "+36 83 315 257; +36 30 5250 100",
          "email": "dr.csillag.peter@t-online.hu; spenglerellen@gmail.com",
          "website": "https://csillag-praxis.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 4493,
          "completion_tokens": 1429,
          "total_tokens": 5922,
          "cost": 0.00398125
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "completed",
      "started_at": "2026-03-29T10:36:28.075515",
      "completed_at": "2026-03-29T10:37:49.507908",
      "result": {
        "pages": [
          {
            "source_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
            "discovered_url": "https://csillag-praxis.hu/szolgaltatasok.htm",
            "input_strategy": "async_crawl_bert",
            "fetch_strategy": "curl",
            "output_strategy": "html",
            "strategy": "async_crawl_bert,curl,html",
            "original_url": "https://csillag-praxis.hu/",
            "validation_passed": true,
            "ft_count": 9,
            "score": 0.9997789263725281,
            "attempts": 1
          },
          {
            "source_url": "https://csillag-praxis.hu/leistungen.htm",
            "discovered_url": "https://csillag-praxis.hu/leistungen.htm",
            "input_strategy": "async_crawl_bert",
            "fetch_strategy": "curl",
            "output_strategy": "html",
            "strategy": "async_crawl_bert,curl,html",
            "original_url": "https://csillag-praxis.hu/",
            "validation_passed": true,
            "ft_count": 9,
            "score": 0.9994964599609375,
            "attempts": 2
          }
        ],
        "original_url": "https://csillag-praxis.hu/",
        "strategy": "async_crawl_bert,curl,html"
      },
      "error": null,
      "metadata": {}
    },
    "data_extraction": {
      "stage_name": "data_extraction",
      "status": "completed",
      "started_at": "2026-03-29T10:36:36.335684",
      "completed_at": "2026-03-29T10:37:49.532003",
      "result": {
        "number_of_price_items": 18,
        "price_items": [
          {
            "s": "belgyógyászati szakvizsgálat, első vizsgálat",
            "p": 20000,
            "c": "belgyógyászat",
            "a": "Belgyógyászat",
            "v": 0.6392722763696509
          },
          {
            "s": "belgyógyászati szakvizsgálat, kontrollvizsgálat",
            "p": 10000,
            "c": "belgyógyászat",
            "a": "Belgyógyászat",
            "v": 0.6834174750100024
          },
          {
            "s": "prothrombin meghatározás",
            "p": 3000,
            "c": "labor",
            "a": "Laborvizsgálatok",
            "v": 0.5287441677734976
          },
          {
            "s": "hasi ultrahangvizsgálat",
            "p": 20000,
            "c": "ultrahangdiagnosztika",
            "a": "Radiológia",
            "v": 0.6464571795413561
          },
          {
            "s": "pajzsmirigy ultrahangvizsgálat",
            "p": 18000,
            "c": "ultrahangdiagnosztika",
            "a": "Endokrinológia",
            "v": 0.6010451851137452
          },
          {
            "s": "emlő ultrahangvizsgálat",
            "p": 18000,
            "c": "ultrahangdiagnosztika",
            "a": "Radiológia",
            "v": 0.6297175023625637
          },
          {
            "s": "végtag color doppler ultrahangvizsgálat",
            "p": 20000,
            "c": "ultrahangdiagnosztika",
            "a": "Angiológia",
            "v": 0.643565608596982
          },
          {
            "s": "nyaki erek color doppler ultrahangvizsgálata",
            "p": 18000,
            "c": "ultrahangdiagnosztika",
            "a": "Angiológia",
            "v": 0.5843326817634512
          },
          {
            "s": "ízületek ultrahangvizsgálata",
            "p": 18000,
            "c": "ultrahangdiagnosztika",
            "a": "Radiológia",
            "v": 0.6143371151538334
          },
          {
            "s": "Internistische Erstuntersuchung",
            "p": 20000,
            "c": "Internisztika",
            "a": "Belgyógyászat",
            "v": 0.49024394048216235
          },
          {
            "s": "Internistische Kontrolluntersuchung",
            "p": 10000,
            "c": "Internisztika",
            "a": "Belgyógyászat",
            "v": 0.49595298573904756
          },
          {
            "s": "Prothrombin (INR) Bestimmung/Gerinnungstest",
            "p": 3000,
            "c": "Labor",
            "a": "Laborvizsgálatok",
            "v": 0.3845498973292768
          },
          {
            "s": "Oberbauch/Unterbauch-Sonografie",
            "p": 20000,
            "c": "Ultraschall-Diagnostik",
            "a": "Radiológia",
            "v": 0.42408154140334126
          },
          {
            "s": "Schilddrüsen-Sonografie",
            "p": 18000,
            "c": "Ultraschall-Diagnostik",
            "a": "Radiológia",
            "v": 0.4196924904699106
          },
          {
            "s": "Brust-Sonografie",
            "p": 18000,
            "c": "Ultraschall-Diagnostik",
            "a": "Radiológia",
            "v": 0.4436477087131716
          },
          {
            "s": "Farbcodierte Doppler-Sonografie der Gefäße",
            "p": 20000,
            "c": "Ultraschall-Diagnostik",
            "a": "Angiológia",
            "v": 0.46448164396383906
          },
          {
            "s": "Farbcodierte Doppler-Sonografie der Halsgefäße",
            "p": 18000,
            "c": "Ultraschall-Diagnostik",
            "a": "Angiológia",
            "v": 0.4342185707894187
          },
          {
            "s": "Sonografie der Gelenke",
            "p": 18000,
            "c": "Ultraschall-Diagnostik",
            "a": "Radiológia",
            "v": 0.41892029848612305
          }
        ],
        "llm_usage": {
          "prompt_tokens": 4584,
          "completion_tokens": 671,
          "total_tokens": 5255,
          "cost": 0.0016939799999999999
        }
      },
      "error": null,
      "metadata": {}
    },
    "taxonomy_enrichment_alt": {
      "stage_name": "taxonomy_enrichment_alt",
      "status": "completed",
      "started_at": "2026-03-29T10:36:39.839250",
      "completed_at": "2026-03-29T10:37:49.554201",
      "result": {
        "summary": {
          "provider": "openrouter",
          "embedding_model": "openai/text-embedding-3-large",
          "items_total": 18,
          "items_processed": 18,
          "avg_best_similarity": 0.530371014947854,
          "min_best_similarity": 0.3845498973292768,
          "max_best_similarity": 0.6834174750100024,
          "cache_hit": true,
          "cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
        },
        "predictions": [
          {
            "idx": 0,
            "s": "belgyógyászati szakvizsgálat, első vizsgálat",
            "c": "belgyógyászat",
            "best_a": "Belgyógyászat",
            "best_similarity": 0.6392722763696509
          },
          {
            "idx": 1,
            "s": "belgyógyászati szakvizsgálat, kontrollvizsgálat",
            "c": "belgyógyászat",
            "best_a": "Belgyógyászat",
            "best_similarity": 0.6834174750100024
          },
          {
            "idx": 2,
            "s": "prothrombin meghatározás",
            "c": "labor",
            "best_a": "Laborvizsgálatok",
            "best_similarity": 0.5287441677734976
          },
          {
            "idx": 3,
            "s": "hasi ultrahangvizsgálat",
            "c": "ultrahangdiagnosztika",
            "best_a": "Radiológia",
            "best_similarity": 0.6464571795413561
          },
          {
            "idx": 4,
            "s": "pajzsmirigy ultrahangvizsgálat",
            "c": "ultrahangdiagnosztika",
            "best_a": "Endokrinológia",
            "best_similarity": 0.6010451851137452
          },
          {
            "idx": 5,
            "s": "emlő ultrahangvizsgálat",
            "c": "ultrahangdiagnosztika",
            "best_a": "Radiológia",
            "best_similarity": 0.6297175023625637
          },
          {
            "idx": 6,
            "s": "végtag color doppler ultrahangvizsgálat",
            "c": "ultrahangdiagnosztika",
            "best_a": "Angiológia",
            "best_similarity": 0.643565608596982
          },
          {
            "idx": 7,
            "s": "nyaki erek color doppler ultrahangvizsgálata",
            "c": "ultrahangdiagnosztika",
            "best_a": "Angiológia",
            "best_similarity": 0.5843326817634512
          },
          {
            "idx": 8,
            "s": "ízületek ultrahangvizsgálata",
            "c": "ultrahangdiagnosztika",
            "best_a": "Radiológia",
            "best_similarity": 0.6143371151538334
          },
          {
            "idx": 9,
            "s": "Internistische Erstuntersuchung",
            "c": "Internisztika",
            "best_a": "Belgyógyászat",
            "best_similarity": 0.49024394048216235
          },
          {
            "idx": 10,
            "s": "Internistische Kontrolluntersuchung",
            "c": "Internisztika",
            "best_a": "Belgyógyászat",
            "best_similarity": 0.49595298573904756
          },
          {
            "idx": 11,
            "s": "Prothrombin (INR) Bestimmung/Gerinnungstest",
            "c": "Labor",
            "best_a": "Laborvizsgálatok",
            "best_similarity": 0.3845498973292768
          },
          {
            "idx": 12,
            "s": "Oberbauch/Unterbauch-Sonografie",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Radiológia",
            "best_similarity": 0.42408154140334126
          },
          {
            "idx": 13,
            "s": "Schilddrüsen-Sonografie",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Radiológia",
            "best_similarity": 0.4196924904699106
          },
          {
            "idx": 14,
            "s": "Brust-Sonografie",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Radiológia",
            "best_similarity": 0.4436477087131716
          },
          {
            "idx": 15,
            "s": "Farbcodierte Doppler-Sonografie der Gefäße",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Angiológia",
            "best_similarity": 0.46448164396383906
          },
          {
            "idx": 16,
            "s": "Farbcodierte Doppler-Sonografie der Halsgefäße",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Angiológia",
            "best_similarity": 0.4342185707894187
          },
          {
            "idx": 17,
            "s": "Sonografie der Gelenke",
            "c": "Ultraschall-Diagnostik",
            "best_a": "Radiológia",
            "best_similarity": 0.41892029848612305
          }
        ],
        "llm_usage": {
          "prompt_tokens": 366,
          "completion_tokens": 0,
          "total_tokens": 366,
          "cost": 0.00004758
        }
      },
      "error": null,
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "completed",
      "started_at": "2026-03-29T10:37:15.337579",
      "completed_at": "2026-03-29T10:37:49.482358",
      "result": {
        "reviews": {
          "company_name": "Csillag-praxis",
          "total_reviews": 55,
          "average_rating": 4.5,
          "reviews": [
            {
              "author": "Hermina Zsók",
              "rating": 5,
              "text": "Precíz ellátás,empátia,kedvesség,tiszta szép környezet,online időpont foglalás.Évek óta járok vissza UH-ra a doktornőhöz!Maximálisan elégedett vagyok!Kiváló szakember!\nNagyon hálás vagyok az Ő munkájáért!\nSzívből ajánlom mindenkinek!",
              "date": null
            },
            {
              "author": "Diána Egervölgyi",
              "rating": 5,
              "text": "Nagyon kedves és alapos orvos, mindent részletesen elmagyarázott. Nem kellett sokat várni, emberileg és szakmailag is maximálisan elégedett vagyok. Szívből ajánlom!",
              "date": null
            },
            {
              "author": "beatrix stampfel",
              "rating": 5,
              "text": "Nagyon kedves a főorvos asszony,már többször jártam nála,mindig pontos időben,nagyon kedvesen és segítőkészen fogadott,legközelebb is csak Őt választom,mindenkinek tiszta szívből csak ajánlani tudom!",
              "date": null
            },
            {
              "author": "Krisztina Dénesné Rosta",
              "rating": 5,
              "text": "Csak jót mondhatok a doktornőről! Évek óta hozzá járok! Megbízható, kedves, megnyugtató a vele való kommunikáció! Ajánlom mindenkinek!😊",
              "date": null
            },
            {
              "author": "Lajos Fuksz",
              "rating": 5,
              "text": "A feleségem nagyon megelégedett, és feldobobódott hangulatban érkezett haza a vizsgálat után, mert a főorvosnő kedvessége és szaktudása rabul ejtette. Ajánljuk mindenkinek!",
              "date": null
            },
            {
              "author": "Tamás Salamon",
              "rating": 5,
              "text": "Hosszú ideje ide járok! Doktornő alapos,megbízható,kedves. Modern diagnosztikai eszközzel magas szintű tudás párosul! Csak ajánlani tudom!",
              "date": null
            },
            {
              "author": "Gabriella Bázsa",
              "rating": 5,
              "text": "Doktornő kiváló szakember, hálás vagyok a precíz diagnózisért és az empátiáért. Ajánlom mindenkinek! Köszönöm szépen! ★★★★★",
              "date": null
            },
            {
              "author": "Mark Nemeth",
              "rating": 5,
              "text": "Csakis ide! Kedves alapos gyors! Egy beteg nem is kívánhatna jobbat👍🤩",
              "date": null
            }
          ],
          "source": "google-maps-scraper",
          "postal_code": "8360",
          "city": "Keszthely",
          "street": "Pál u. 36/b",
          "phone": "(06 83) 315 257"
        }
      },
      "error": null,
      "metadata": {}
    }
  },
  "overall_status": "completed",
  "current_stage": "taxonomy_enrichment_alt",
  "resume_from_stage": null,
  "llm_usage_summary": {
    "prompt_tokens": 9443,
    "completion_tokens": 2100,
    "total_tokens": 11543,
    "cost": 0.00572281
  }
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 91da0d49-7549-4738-b172-ca2ec901e8ee_*.log, CLI: pipeline_91da0d49_*.log).

91da0d49-7549-4738-b172-ca2ec901e8ee_20260329_103628.log

data/logs/91da0d49-7549-4738-b172-ca2ec901e8ee_20260329_103628.log

2026-03-29 10:36:28 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution 91da0d49-7549-4738-b172-ca2ec901e8ee for URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:36:29 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://csillag-praxis.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://csillag-praxis.hu/
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 573 characters from main URL
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:36:29 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'csillag-praxis.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:36:29 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index_d.html
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/orvosok.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/elerhetoeseg.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/megkoezelites.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index.html
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/praxis.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/impressum.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/leistungen.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/aerzte.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/praxis_d.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:30 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/weg.htm
2026-03-29 10:36:31 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/idopont
2026-03-29 10:36:31 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 16 URLs in 1.5s (success=16, errors=0)
2026-03-29 10:36:35 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 2 URLs from BERT (threshold and above), fetching all
2026-03-29 10:36:35 | INFO     | src.stages.stage_2_discovery_async |   [URL 1/2] Fetching (BERT prob=1.00): https://csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:36 | INFO     | src.stages.stage_2_discovery_async |   [URL 1/2] OK (BERT prob=1.00)
2026-03-29 10:36:36 | INFO     | src.stages.stage_2_discovery_async |   [URL 2/2] Fetching (BERT prob=1.00): https://csillag-praxis.hu/leistungen.htm
2026-03-29 10:36:36 | INFO     | src.stages.stage_2_discovery_async |   [URL 2/2] OK (BERT prob=1.00)
2026-03-29 10:36:36 | INFO     | src.stages.stage_2_discovery_async | Discovery (async) completed with 2 page(s)
2026-03-29 10:36:36 | INFO     | src.stages.stage_2_discovery_async | Detailed logs saved to: data/logs/91da0d49-7549-4738-b172-ca2ec901e8ee_20260329_103628.log
2026-03-29 10:36:36 | INFO     | src.stages.stage_3_data_extraction | Data extraction: 2 page(s) to process
2026-03-29 10:36:39 | INFO     | src.stages.stage_3_data_extraction | Extracted 9 price items from page 1
2026-03-29 10:36:39 | INFO     | src.stages.stage_3_data_extraction | Extracted 9 price items from page 2
2026-03-29 10:36:39 | INFO     | src.stages.stage_3_data_extraction | Data extraction stage completed: 18 total price items from 2 page(s)
2026-03-29 10:36:39 | INFO     | src.stages.stage_5_taxonomy_enrichment_alt | Starting taxonomy enrichment alt stage (embeddings)
2026-03-29 10:36:39 | INFO     | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-29 10:36:40 | INFO     | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt summary: processed=18 avg=0.5304 min=0.3845 max=0.6834 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-29 10:36:40 | INFO     | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt weakest_matches: [{'idx': 11, 's': 'Prothrombin (INR) Bestimmung/Gerinnungstest', 'c': 'Labor', 'best_a': 'Laborvizsgálatok', 'best_similarity': 0.3845498973292768}, {'idx': 17, 's': 'Sonografie der Gelenke', 'c': 'Ultraschall-Diagnostik', 'best_a': 'Radiológia', 'best_similarity': 0.41892029848612305}, {'idx': 13, 's': 'Schilddrüsen-Sonografie', 'c': 'Ultraschall-Diagnostik', 'best_a': 'Radiológia', 'best_similarity': 0.4196924904699106}]
2026-03-29 10:36:40 | INFO     | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt stage completed
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 4 results
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Csillag-praxis Keszthely Balaton - Kontakt - https://www.csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Csillag-praxis Keszthely Balaton - Szólgáltatásaink - http://www.csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Result 3: ARZTPRAXIS CSILLAG - Kontakt - http://www.csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.csillag-praxis.hu/impresszum.htm
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1970 characters from contact page 1
2026-03-29 10:36:51 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: http://www.csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:36:52 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 4158 characters from contact page 2
2026-03-29 10:36:52 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: http://www.csillag-praxis.hu/kontakt.htm
2026-03-29 10:36:52 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 2221 characters from contact page 3
2026-03-29 10:36:52 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:37:15 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Csillag-praxis
2026-03-29 10:37:15 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:37:15 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:37:15 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Csillag-praxis, varos=Keszthely
2026-03-29 10:37:15 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmp8ej8awtp
2026-03-29 10:37:15 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmpib1jug2h
2026-03-29 10:37:15 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:37:49 | INFO     | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:37:49 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_103749_csillag-praxis_url_input.txt
2026-03-29 10:37:49 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_103749_csillag-praxis_url_output.json
2026-03-29 10:37:49 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 10:37:49 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:37:49 | INFO     | prefect.pipeline.parallel | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-29 10:37:49 | INFO     | prefect.pipeline.parallel | Pipeline execution 91da0d49-7549-4738-b172-ca2ec901e8ee completed