← Vissza a listához

Futtatás részletei

https://helixmed.hu/

Azonosítók

Státusz
failed
Task ID
1ea51bd4-93e8-499d-86c3-c481a43aa80f
State fájl
20260329_105713_helixmed_hu.json
Aktuális stage
taxonomy_enrichment_alt
Létrehozva
2026-03-29 10:57:13
Frissítve
2026-03-29 10:58:32
Futás időtartama
1 min 18 s

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
data_extraction failed 2026-03-29 10:58:32 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
discovery_fetch_validation failed 2026-03-29 10:57:14 2026-03-29 10:58:32 1 min 18 s Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
metadata_alt completed 2026-03-29 10:57:14 2026-03-29 10:58:32 1 min 18 s
reviews completed 2026-03-29 10:57:57 2026-03-29 10:58:32 34 s
taxonomy_enrichment_alt failed 2026-03-29 10:58:32 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "1ea51bd4-93e8-499d-86c3-c481a43aa80f",
  "input_url": "https://helixmed.hu/",
  "state_filename": "20260329_105713_helixmed_hu.json",
  "created_at": "2026-03-29T10:57:13.835928",
  "updated_at": "2026-03-29T10:58:32.344407",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T10:57:14.045642",
      "completed_at": "2026-03-29T10:58:32.131475",
      "result": {
        "metadata": {
          "company_name": "Helixmed-Balaton Egészségügyi és Szolgáltató Korlátolt Felelősségű Társaság (HelixMed)",
          "description": "A HelixMed egy Siófokon működő, modern orvosi rendelő, amely széleskörű járóbeteg-szakellátást kínál a helyi lakosok és a környékre látogatók számára. Rendelőjük ultrahang diagnosztikát (hasi, pajzsmirigy, érvizsgálatok), kardiológiai szakrendelést (szív ultrahang, terheléses EKG) és idegsebészeti konzultációkat nyújt, valamint dietetikai és egyéb kiegészítő szolgáltatásokat. A csapat hangsúlyt helyez a pontos diagnosztikára, személyre szabott kezelési tervek elkészítésére és a legmodernebb eszközök alkalmazására. A weboldalon egyszerű időpontfoglalási lehetőség és kapcsolattartási információk érhetők el. A szolgáltatásokkal és áraikkal kapcsolatos részletek és a rendelő elérhetőségei az oldalon találhatók.",
          "arlista_url": "https://helixmed.hu/arak/",
          "varos": "Siófok",
          "iranyitoszam": "8600",
          "utca": "Szűcs utca 2. Fsz. 9. ajtó",
          "telefonszam": "+36-30-758-4747",
          "email": "helixmed@gmail.hu",
          "website": "https://helixmed.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 5582,
          "completion_tokens": 948,
          "total_tokens": 6530,
          "cost": 0.0032915
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "failed",
      "started_at": "2026-03-29T10:57:14.098229",
      "completed_at": "2026-03-29T10:58:32.238961",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "completed",
      "started_at": "2026-03-29T10:57:57.912173",
      "completed_at": "2026-03-29T10:58:32.182180",
      "result": {
        "reviews": {
          "company_name": "Helixmed-Balaton Egészségügyi és Szolgáltató Korlátolt Felelősségű Társaság (HelixMed)",
          "total_reviews": 14,
          "average_rating": 5,
          "reviews": [
            {
              "author": "Andrea Varga Papp",
              "rating": 5,
              "text": "Ultrahang vizsgálaton voltam Dr.Navazandeh Vahid-nál.A doktor úr nagyon kedves, közvetlen és alapos. Minden kérdésemre türelmesen válaszolt. Külön köszönöm Ildikónak a recepción, hogy kedvességével oldotta a kezdeti izgalmamat.",
              "date": null
            },
            {
              "author": "B PM",
              "rating": 5,
              "text": "EKG vizsgálaton voltam.\nMinden rendben volt. Nagyon kedves, figyelmes és segítőkész mindenki.\nKöszönöm szépen mégegyszer.",
              "date": null
            },
            {
              "author": "ali naghi fani",
              "rating": 5,
              "text": "Perfect",
              "date": null
            }
          ],
          "source": "google-maps-scraper",
          "postal_code": "8600",
          "city": "Siófok",
          "street": "Szücs u. 2.fsz.9",
          "phone": "06 30 758 4747"
        }
      },
      "error": null,
      "metadata": {}
    },
    "data_extraction": {
      "stage_name": "data_extraction",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:58:32.292556",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "taxonomy_enrichment_alt": {
      "stage_name": "taxonomy_enrichment_alt",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T10:58:32.344391",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "taxonomy_enrichment_alt",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 1ea51bd4-93e8-499d-86c3-c481a43aa80f_*.log, CLI: pipeline_1ea51bd4_*.log).

1ea51bd4-93e8-499d-86c3-c481a43aa80f_20260329_105713.log

data/logs/1ea51bd4-93e8-499d-86c3-c481a43aa80f_20260329_105713.log

2026-03-29 10:57:13 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution 1ea51bd4-93e8-499d-86c3-c481a43aa80f for URL: https://helixmed.hu/
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://helixmed.hu/
2026-03-29 10:57:14 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://helixmed.hu/
2026-03-29 10:57:14 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:57:14 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://helixmed.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://helixmed.hu/
2026-03-29 10:57:14 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://helixmed.hu/
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 1007 characters from main URL
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:57:14 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'helixmed.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:57:20 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-alipour-shahpour-kardiologus
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/idopontfoglalas
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-varga-gabriella-belgyogyasz
2026-03-29 10:57:22 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-amirinejad-meyssam-idegsebesz
2026-03-29 10:57:23 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/elerhetoseg
2026-03-29 10:57:24 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/kremer-klaudia-gyogymasszor
2026-03-29 10:57:24 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/orvosok/dr-navazandeh-vahid-ultrahang-diagnosztika
2026-03-29 10:57:34 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/rolunk
2026-03-29 10:57:35 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/ultrahang-diagnosztika
2026-03-29 10:57:35 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 10:57:35 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 2 results
2026-03-29 10:57:35 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Császár Bernadett - Dietetikus - HelixMed - https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus/
2026-03-29 10:57:35 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Adatvédelmi irányelvek - https://helixmed.hu/adatvedelmi-iranyelvek/
2026-03-29 10:57:35 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://helixmed.hu/orvosok/csaszar-bernadett-dietetikus/
2026-03-29 10:57:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/kardiologia
2026-03-29 10:57:36 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/szolgaltatasok/idegsebeszet
2026-03-29 10:57:39 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/adatvedelmi-iranyelvek
2026-03-29 10:57:39 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 5631 characters from contact page 1
2026-03-29 10:57:39 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://helixmed.hu/adatvedelmi-iranyelvek/
2026-03-29 10:57:41 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://helixmed.hu/impresszum
2026-03-29 10:57:41 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 25 URLs in 27.2s (success=17, errors=3)
2026-03-29 10:57:41 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 7051 characters from contact page 2
2026-03-29 10:57:41 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:57:45 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 10:57:45 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 10:57:45 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 10:57:57 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Helixmed-Balaton Egészségügyi és Szolgáltató Korlátolt Felelősségű Társaság (HelixMed)
2026-03-29 10:57:57 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:57:57 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 10:57:57 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Helixmed-Balaton Egészségügyi és Szolgáltató Korlátolt Felelősségű Társaság (HelixMed), varos=Siófok
2026-03-29 10:57:57 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmpk9yixabq
2026-03-29 10:57:57 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmp590kze6q
2026-03-29 10:57:57 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 10:58:31 | INFO     | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 10:58:31 | INFO     | src.stages.stage_4_reviews | URL match found: helixmed.hu
2026-03-29 10:58:31 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_105831_helixmed-balaton_egészségügyi_és_szolgáltató_korlátolt_felelősségű_társaság_(helixmed)_url_input.txt
2026-03-29 10:58:31 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_105831_helixmed-balaton_egészségügyi_és_szolgáltató_korlátolt_felelősségű_társaság_(helixmed)_url_output.json
2026-03-29 10:58:31 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 3 reviews
2026-03-29 10:58:32 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 10:58:32 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).