← Vissza a listához

Futtatás részletei

https://www.allergiacentrum.hu/

Azonosítók

Státusz
failed
Task ID
e6409764-2add-42f8-b9d5-20e321f53b18
State fájl
20260329_102930_allergiacentrum_hu.json
Aktuális stage
taxonomy_enrichment_alt
Létrehozva
2026-03-29 10:29:30
Frissítve
2026-03-29 10:30:43
Futás időtartama
1 min 13 s

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
data_extraction failed 2026-03-29 10:30:43 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
discovery_fetch_validation failed 2026-03-29 10:29:30 2026-03-29 10:30:43 1 min 12 s Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
metadata_alt completed 2026-03-29 10:29:30 2026-03-29 10:30:43 1 min 12 s
reviews completed 2026-03-29 10:30:11 2026-03-29 10:30:43 32 s
taxonomy_enrichment_alt failed 2026-03-29 10:30:43 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "e6409764-2add-42f8-b9d5-20e321f53b18",
  "input_url": "https://www.allergiacentrum.hu/",
  "state_filename": "20260329_102930_allergiacentrum_hu.json",
  "created_at": "2026-03-29T10:29:30.328066",
  "updated_at": "2026-03-29T10:30:43.539369",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T10:29:30.497506",
      "completed_at": "2026-03-29T10:30:43.344206",
      "result": {
        "metadata": {
          "company_name": "Allergia Centrum Szombathely",
          "description": "Allergia Centrum Szombathely járóbeteg-ellátást nyújt allergológiai, tüdőgyógyászati és gyermekgyógyászati területen. Széles körű vizsgálatokat és kezeléseket kínálnak: légúti és élelmiszer-allergiák, rovarcsípés-allergia, gyógyszer- és kontaktallergiák, immunterápia, intolerancia-vizsgálatok, provokációs tesztek és teljeskörű vérvizsgálatok. A centrum COVID-19 teszteket (OGYÉI/FDA engedéllyel említve a honlapon) és sugárterhelés nélküli orvosi hőkamerás állapotfelmérést is végez. Az időpontfoglalás online rendszerrel történik, és a honlap szerint gyakorlatilag várakozás nélkül fogadják a betegeket. A weboldalon található információk alapján igazolásokat (pl. családi pótlék, adóvisszatérítés) is kiállítanak, valamint részletes tájékoztatást adnak a vizsgálati területekről.",
          "arlista_url": "N/A",
          "varos": "Szombathely",
          "iranyitoszam": "9700",
          "utca": "Kossuth L. u. 10 I/3.",
          "telefonszam": "+36 30 901 7007",
          "email": "petzzsuzsa@allergiacentrum.hu",
          "website": "https://www.allergiacentrum.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 3397,
          "completion_tokens": 927,
          "total_tokens": 4324,
          "cost": 0.00270325
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "failed",
      "started_at": "2026-03-29T10:29:30.517583",
      "completed_at": "2026-03-29T10:30:43.457413",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "completed",
      "started_at": "2026-03-29T10:30:11.109502",
      "completed_at": "2026-03-29T10:30:43.386963",
      "result": {
        "reviews": {
          "company_name": "Allergia Centrum Szombathely",
          "total_reviews": 43,
          "average_rating": 4,
          "reviews": [
            {
              "author": "Borka Páli",
              "rating": 1,
              "text": "Kontakt és ételallergia vizsgálatra kértem időpontot. Az ételallergiánál mogyorót állapítottak meg, bár a bőrömön semmi extra reakció nem lászódott a többivel összehasonlítva sem, és ahogy a többi tapasztalatot olvasom, nem feltétlenül bízhatok ebben a megállapításban. A kontakt allergia teszt anyagait felragasztotta a hátamra a doktornő, majd utamra engedett. Egy képet kellett visszaküldenem 48 órával később, tehát nem személyesen állapította meg, és a diagnózis is teljesen orvosi nyelven lett továbbítva nekem. Semmilyen leírás nem szerepelt arról, hogy mely anyagokat kerüljek pontosan, mit ajánl. Csak a latin nevek, egy kód, és hogy kerüljem ezeket. Miután felhívtam a doktornőt, hogy legyen szíves akkor elmondani, hogy mégis mit jelentenek ezek, mire figyeljek oda, a chatgpt-t és google-t ajánlotta. Sajnálom, hogy ezért  a \"szolgáltatásért\" cserébe 56000ft-tal lettem szegényebb, és mehetek további vizsgálatokra. Aki teheti, keressen másik helyet ilyen jellegű problémákkal.",
              "date": null
            },
            {
              "author": "Rudolf Krály",
              "rating": 1,
              "text": "Nagy humbuk az egész. Tej,tojás,liszt allergiát állapították meg nálam, hozzáteszem a kezemen semmi nem látszódott a vizsgálat során. 55 ezer ft ért .Majd elmentem vérvételes allergia vizsgálatra és minden negativ! Hogy is van ez? ÁTVERÉS!!!",
              "date": null
            },
            {
              "author": "Dorottya Váczi",
              "rating": 1,
              "text": "Visszaigazolták az időpontunkat a férjemmel, mégis mikor odaértünk, senki sem volt ott! Hívtuk őket telefonon… kiderült, hogy szabadságon vannak… akkor hogyan lehet időpontot foglalni aznapra ? Amit még vissza is igazolnak? Nevetséges , úgyhogy nem nálam ilyen orvos nem játszik!!!!",
              "date": null
            },
            {
              "author": "Patrìcia Dèri",
              "rating": 5,
              "text": "Mi évek óta ide járunk fiam asztmás. Kiváló orvosok és segítőkészek.",
              "date": null
            },
            {
              "author": "Regina Kerlang",
              "rating": 5,
              "text": "Évekkel ezelőtt találtam rá a dokira. A 2 kislányom asztmásan született. A kórház hetek múlva adott volna csak időpontot. Elkeseredésembe a neten kerestem orvost. Szeretek utána nézni annak az embernek akihez viszem őket. A szép önéletrajz nem a véletlen műve. Rengeteg tudás van mögötte! Úgy kerestem fel a centrumot, ha ők nem tudnak segíteni akkor senki. A dr.úr kedves felesége is egy alkalommal át jött és jó tanácsokkal látott el.A 2 kislányom minőségibb életet tudott él. Csak ajánlani tudom!",
              "date": null
            },
            {
              "author": "Tóth Csaba",
              "rating": 2,
              "text": "Sajnos csalódást okozott messze nem az a szolgáltatást kaptam ami ennyi pénzért elvárható. Futószalagon törénő \"betegvizsgálat\" nem is azt a gyógyszert kaptam amit szerettem volna. Szakmai hírnév úgyan jó de úgy néz ki ez megkopott, nem a beteg érdekein alapuló kezelés a lényeg.",
              "date": null
            },
            {
              "author": "Gábor Laczkó",
              "rating": 5,
              "text": "Nagyon kedvesek voltak velem és sok hasonló hely látogatása után, a megfelelő kezelést írták fel, aminek hála, hónapok után panaszmentes vagyok! Ajánlani tudom mindenkinek!",
              "date": null
            },
            {
              "author": "Peter Nagy",
              "rating": 5,
              "text": "A kislanyommal voltunk ott es az egyik legkiemelkedobb szolgaltatast kaptuk. A doktorno nagyon kedves es segitokesz volt, valoban profi! Evek ota szenvedunk, de a kezeles amit felirtak egy het alatt csodat tett! Igazan ajanlom barkinek, akit allergia gyotor!",
              "date": null
            }
          ],
          "source": "google-maps-scraper",
          "postal_code": "9700",
          "city": "Szombathely",
          "street": "Kossuth Lajos u. 10",
          "phone": "06 30 901 7007"
        }
      },
      "error": null,
      "metadata": {}
    },
    "data_extraction": {
      "stage_name": "data_extraction",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:30:43.499544",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "taxonomy_enrichment_alt": {
      "stage_name": "taxonomy_enrichment_alt",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:30:43.539339",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "taxonomy_enrichment_alt",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: e6409764-2add-42f8-b9d5-20e321f53b18_*.log, CLI: pipeline_e6409764_*.log).

e6409764-2add-42f8-b9d5-20e321f53b18_20260329_102930.log

data/logs/e6409764-2add-42f8-b9d5-20e321f53b18_20260329_102930.log

2026-03-29 10:29:30 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution e6409764-2add-42f8-b9d5-20e321f53b18 for URL: https://www.allergiacentrum.hu/
2026-03-29 10:29:30 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://www.allergiacentrum.hu/
2026-03-29 10:29:30 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:29:30 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://www.allergiacentrum.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:29:30 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:29:30 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://www.allergiacentrum.hu/
2026-03-29 10:29:30 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://www.allergiacentrum.hu/
2026-03-29 10:29:31 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://www.allergiacentrum.hu/
2026-03-29 10:29:31 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 672 characters from main URL
2026-03-29 10:29:31 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:29:31 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'allergiacentrum.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hu/orvosi-hokamera
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hirek/fontos
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hu/idopont-kerese
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hirek/az-allergiarol
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/dieta
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/kivizsgalasi_teruletek
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/a_hiany_tunetei
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hirek
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hirek/covid-19
2026-03-29 10:29:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/hirek/jarvanyhelyzet
2026-03-29 10:29:33 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/anafilaxia
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/asztma
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/szenanatha
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/coliakia
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/natha
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/liszterzekenyseg
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/allergia
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/vizsgalatok
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://www.allergiacentrum.hu/tag/szezonalis_allergia
2026-03-29 10:29:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/a-liszterzekeny-betegek-dietaja
2026-03-29 10:29:35 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/az-allergia-kialakulasanak-feltetelezett-okai
2026-03-29 10:29:35 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/hogyan-kell-idopontot-foglalni
2026-03-29 10:29:35 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/asztma-ellen-tbc
2026-03-29 10:29:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/kivizsgalasi-es-kezelesi-gondozasi-teruletek
2026-03-29 10:29:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/a-natha
2026-03-29 10:29:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/a-legsulyosabb-allergias-reakcio-az-anafilaxia
2026-03-29 10:29:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://www.allergiacentrum.hu/hirek/az-asztmarol
2026-03-29 10:29:36 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 29 URLs in 5.8s (success=28, errors=0)
2026-03-29 10:29:44 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 10:29:44 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 10:29:44 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 4 results
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Időpont kérése - https://www.allergiacentrum.hu/hu/idopont-kerese
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Hogyan kell időpontot kérni - Allergia Centrum - https://www.allergiacentrum.hu/hogyan-kell-idopontot-kerni
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | Result 3: Címlap - Allergia Centrum - https://www.allergiacentrum.hu/
2026-03-29 10:30:00 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.allergiacentrum.hu/hu/idopont-kerese
2026-03-29 10:30:01 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1983 characters from contact page 1
2026-03-29 10:30:01 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.allergiacentrum.hu/hogyan-kell-idopontot-kerni
2026-03-29 10:30:02 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1302 characters from contact page 2
2026-03-29 10:30:02 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://www.allergiacentrum.hu/
2026-03-29 10:30:03 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 3192 characters from contact page 3
2026-03-29 10:30:03 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:30:11 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Allergia Centrum Szombathely
2026-03-29 10:30:11 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:30:11 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:30:11 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Allergia Centrum Szombathely, varos=Szombathely
2026-03-29 10:30:11 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmpkftyjfae
2026-03-29 10:30:11 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmp6f58mohp
2026-03-29 10:30:11 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:30:43 | INFO     | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:30:43 | INFO     | src.stages.stage_4_reviews | URL match found: allergiacentrum.hu
2026-03-29 10:30:43 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_103043_allergia_centrum_szombathely_url_input.txt
2026-03-29 10:30:43 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_103043_allergia_centrum_szombathely_url_output.json
2026-03-29 10:30:43 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 10:30:43 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:30:43 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).