← Vissza a listához

Futtatás részletei

https://ivanmedical.hu/

Azonosítók

Státusz
failed
Task ID
6b62ba25-dafe-4170-9ba9-421c6827823c
State fájl
20260329_104207_ivanmedical_hu.json
Aktuális stage
taxonomy_enrichment_alt
Létrehozva
2026-03-29 10:42:07
Frissítve
2026-03-29 10:43:21
Futás időtartama
1 min 13 s

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
data_extraction failed 2026-03-29 10:43:21 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
discovery_fetch_validation failed 2026-03-29 10:42:08 2026-03-29 10:43:20 1 min 12 s Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
metadata_alt completed 2026-03-29 10:42:08 2026-03-29 10:43:20 1 min 12 s
reviews completed 2026-03-29 10:42:43 2026-03-29 10:43:20 36 s
taxonomy_enrichment_alt failed 2026-03-29 10:43:21 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "6b62ba25-dafe-4170-9ba9-421c6827823c",
  "input_url": "https://ivanmedical.hu/",
  "state_filename": "20260329_104207_ivanmedical_hu.json",
  "created_at": "2026-03-29T10:42:07.413982",
  "updated_at": "2026-03-29T10:43:21.435681",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T10:42:08.011745",
      "completed_at": "2026-03-29T10:43:20.428114",
      "result": {
        "metadata": {
          "company_name": "Iván Medical",
          "description": "Iván Medical (Iván Medical Center) egy zalaegerszegi magánrendelő, amely elsősorban implantológiai és fogászati ellátást nyújt, valamint általános orvosi és rehabilitációs szolgáltatásokat is kínál. Honlapjuk szerint „Intézményünkben az egészség nem csupán cél, hanem alapérték”, és személyre szabott figyelemmel, szakértelemmel és gondoskodással dolgoznak pácienseikért. A rendelőt Dr. Iván Gyula implantológus vezeti, aki a honlapon 25 éves tapasztalattal szerepel, és komplex implantológiai eseteket vállal, akár azonnali fogpótlással csontpótlás nélkül. A rendelő hangsúlyozza a nyugodt, modern környezetet és az online időpontfoglalás lehetőségét. A weboldalon megtalálhatók a kapcsolati adatok, nyitvatartás (munkanapokon 08:00–20:00) és páciensvéleményekre utaló tartalmak.",
          "arlista_url": "N/A",
          "varos": "Zalaegerszeg",
          "iranyitoszam": "8900",
          "utca": "Göcseji út 12.",
          "telefonszam": "+36 30 985 4366",
          "email": "info@ivanmedical.hu",
          "website": "https://ivanmedical.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 3098,
          "completion_tokens": 889,
          "total_tokens": 3987,
          "cost": 0.0025525
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "failed",
      "started_at": "2026-03-29T10:42:08.177527",
      "completed_at": "2026-03-29T10:43:20.992763",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "completed",
      "started_at": "2026-03-29T10:42:43.788765",
      "completed_at": "2026-03-29T10:43:20.723384",
      "result": {
        "reviews": {
          "company_name": "Iván Medical",
          "total_reviews": 4,
          "average_rating": 5,
          "reviews": [
            {
              "author": "G Ivan",
              "rating": 5,
              "text": "Ivan Medical\nFogorvosi és Magánorvosi centrum\n\nA modern külsőt és belsőt a legújabb orvosi eljárásokkal ötvözi az egészség centrum , miközben középpontba helyezi az embert. Az itt nyújtott ellátás nemcsak korszerű és hatékony, hanem páciensbarát is: a legmodernebb technológia a személyes törődéssel és gondoskodással együtt biztosítja a biztonságot, a kényelmet és a bizalmat.",
              "date": "2025-9-8"
            },
            {
              "author": "Réka Kovács",
              "rating": 5,
              "text": "Invisalign fogszabalyozot hasznalok, amit Veszelovszky Rita doktorno keszitett. Nagyon modern technikaval szkenneltek be a fogam, es elkeszitettek a 20 hetes tervemet, amivel egy applikacio segitsegevel mar elore latom, milyen szep lesz a fogam a kezeles vegen.\nKorabban ket alkalommal is volt hagyomanyos fogszabalyozom, de ezt sokkal jobban szeretem. Nagyon kenyelmes, konnyu tisztitani, es rendkivul praktikus. Nem kell gyakran visszajarni allitasra, mert tobb hetre elore megkapom a sineket, megis nagyon szepen es hatekonyan szabalyozza a fogam. Mindenkinek szivbol ajanlom. Az uj rendelojuk pedig gyonyoru.",
              "date": null
            },
            {
              "author": "Katalin Bagladi",
              "rating": 5,
              "text": "Hosszú és nem egyszerű kezelésen vagyok túl, de a Professzor Úr és a csapata végig rendkívül türelmesek, kedvesek és profik voltak. Az implantáció eredménye tökéletes lett, minden várakozásomat felülmúlta. Csak ajánlani tudom őket – hálás köszönet!",
              "date": null
            }
          ],
          "source": "google-maps-scraper",
          "postal_code": "8900",
          "city": "Zalaegerszeg",
          "street": "Göcseji út 12",
          "phone": "06 30 985 4366"
        }
      },
      "error": null,
      "metadata": {}
    },
    "data_extraction": {
      "stage_name": "data_extraction",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:43:21.208582",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "taxonomy_enrichment_alt": {
      "stage_name": "taxonomy_enrichment_alt",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:43:21.435664",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "taxonomy_enrichment_alt",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 6b62ba25-dafe-4170-9ba9-421c6827823c_*.log, CLI: pipeline_6b62ba25_*.log).

6b62ba25-dafe-4170-9ba9-421c6827823c_20260329_104207.log

data/logs/6b62ba25-dafe-4170-9ba9-421c6827823c_20260329_104207.log

2026-03-29 10:42:07 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution 6b62ba25-dafe-4170-9ba9-421c6827823c for URL: https://ivanmedical.hu/
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://ivanmedical.hu/
2026-03-29 10:42:08 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://ivanmedical.hu/
2026-03-29 10:42:08 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:42:08 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://ivanmedical.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://ivanmedical.hu/
2026-03-29 10:42:08 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://ivanmedical.hu/
2026-03-29 10:42:08 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 0.7s (success=1, errors=0)
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 1026 characters from main URL
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:42:08 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'ivanmedical.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:42:10 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 10:42:10 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 10:42:10 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 5 results
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Időpontfoglalás / Iván Medical Center - https://www.ivanmedical.hu/fogaszat/informaciok/idopontfoglalas
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Kapcsolat / Iván Medical Center - https://www.ivanmedical.hu/fogaszat/informaciok/kapcsolat
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | Result 3: Rendelőnk / Iván Medical Center - https://www.ivanmedical.hu/rolunk/rendelo
2026-03-29 10:42:30 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.ivanmedical.hu/fogaszat/informaciok/idopontfoglalas
2026-03-29 10:42:31 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1902 characters from contact page 1
2026-03-29 10:42:31 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.ivanmedical.hu/fogaszat/informaciok/kapcsolat
2026-03-29 10:42:31 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1969 characters from contact page 2
2026-03-29 10:42:31 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://www.ivanmedical.hu/rolunk/rendelo
2026-03-29 10:42:32 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1808 characters from contact page 3
2026-03-29 10:42:32 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:42:43 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Iván Medical
2026-03-29 10:42:43 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:42:43 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:42:43 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Iván Medical, varos=Zalaegerszeg
2026-03-29 10:42:43 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmp0viz2myl
2026-03-29 10:42:43 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmptfj2vkkc
2026-03-29 10:42:43 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:43:19 | INFO     | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:43:19 | INFO     | src.stages.stage_4_reviews | URL match found: ivanmedical.hu
2026-03-29 10:43:19 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_104319_iván_medical_url_input.txt
2026-03-29 10:43:19 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_104319_iván_medical_url_output.json
2026-03-29 10:43:19 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 3 reviews
2026-03-29 10:43:20 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:43:20 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).