← Vissza a listához

Futtatás részletei

https://foryoulife.hu/

Azonosítók

Státusz
failed
Task ID
5e483e68-3cf0-45f7-92b7-ccd315218fa9
State fájl
20260329_135813_foryoulife_hu.json
Aktuális stage
taxonomy_enrichment_alt
Létrehozva
2026-03-29 13:58:13
Frissítve
2026-03-29 14:02:09
Futás időtartama
3 min 55 s

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
data_extraction failed 2026-03-29 14:02:08 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
discovery_fetch_validation failed 2026-03-29 13:58:13 2026-03-29 14:02:08 3 min 54 s Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
metadata_alt completed 2026-03-29 13:58:13 2026-03-29 14:02:07 3 min 54 s
reviews completed 2026-03-29 13:58:54 2026-03-29 14:02:08 3 min 13 s
taxonomy_enrichment_alt failed 2026-03-29 14:02:09 Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "5e483e68-3cf0-45f7-92b7-ccd315218fa9",
  "input_url": "https://foryoulife.hu/",
  "state_filename": "20260329_135813_foryoulife_hu.json",
  "created_at": "2026-03-29T13:58:13.283114",
  "updated_at": "2026-03-29T14:02:09.187376",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T13:58:13.734441",
      "completed_at": "2026-03-29T14:02:07.855778",
      "result": {
        "metadata": {
          "company_name": "ForYouLife",
          "description": "A ForYouLife egy komplex magánegészségügyi intézményrendszer, amelyet három fő pillér határoz meg: a ForYouLife Medical Center, a ForYouLife Med Hotel és az ápolási osztály. Több mint húsz szakterületet foglal magában gyermek- és felnőtt szakrendelésekkel, korszerű diagnosztikai háttérrel és személyre szabott ellátással. A Med Hotel két modern műtővel és 24 betegággyal biztosít magas színvonalú fekvőbeteg- és egynapos sebészeti beavatkozásokat, míg az ápolási osztály 16 betegággyal nyújt hosszabb távú, kényelmes ellátást. Intézményük hangsúlyt fektet a szakmai kiválóságra, a modern szemléletre és a páciensek iránti kiemelt figyelemre — mottójuk: „Az egészségügy új dimenziója”. Szolgáltatásaik között megtalálhatók a gyermekgyógyászat, neurológiai diagnosztika és terápia, szexuális medicina, inkontinencia- és merevedési zavarok kezelése, valamint fejlett diagnosztika és sebészeti beavatkozások. Pácienseiknek diszkrét, empatikus és méltóságteljes ellátást ígérnek, és online vagy telefonos időpontfoglalást kínálnak.",
          "arlista_url": "N/A",
          "varos": "N/A",
          "iranyitoszam": "0000",
          "utca": "N/A",
          "telefonszam": "N/A",
          "email": "N/A",
          "website": "https://foryoulife.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 1261,
          "completion_tokens": 1126,
          "total_tokens": 2387,
          "cost": 0.00256725
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "failed",
      "started_at": "2026-03-29T13:58:13.849217",
      "completed_at": "2026-03-29T14:02:08.338182",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "completed",
      "started_at": "2026-03-29T13:58:54.599974",
      "completed_at": "2026-03-29T14:02:08.077433",
      "result": {
        "reviews": {
          "company_name": "ForYouLife",
          "total_reviews": 521,
          "average_rating": 4.6,
          "reviews": [
            {
              "author": "Attila Biró",
              "rating": 5,
              "text": "Babaelsősegélyen voltunk Horváth Erzsébetnél, rendkívül informatív és hasznos volt! A legjobb döntés volt hogy őt választottuk, nagyon ajánlom mindenkinek egyrészt a kedvessége és profizmusa miatt, másrészt szerintem tényleg elengedhetetlen egy ilyen tanfolyam.\nKöszönjük a tanfolyamot!",
              "date": null
            },
            {
              "author": "Tünde Hernàdi",
              "rating": 2,
              "text": "Èveken át jártam ide egy tünemènyes doktornő miatt.Elment szülni,azóta sajnos csak egy napot rendel,de sajnos is többször le lett mondva.\nPest megyèből járok fel hozzájuk,ez ilyenkor baby sitter...,szervezéssel jár.Múltkor úton voltam hozzàjuk,akkor is jön a telefon ,hogy balesete volt egy doktornőnek,tudok menni máshoz,de csak este 8ra.Haza potyára kifizettem a babysittert,és este vissza,zéró kompenzàció.\nOdamemtem ,ès mint az utóbbi 2 èvben MINDIG ,most is plusz egy óràs vàrakozàsi idő!!!!\nLegutóbb Nifty tesztre mentem,szervezés stb...odaèrek,leveszik a vért,harmadjàra sikerült(jól be is lilult a karom,pedig sose szokott)!Utána a kérdés,szúrok vèrhigìtót,mert ha igen,ugye nem szúrtam 24 óràja?De,reggel!Nem mondtàk telón,hogy nem szabad?NEM!Nekem meg honnan kène tudnom?Ès ezt utána kell megkèrdezni? Akkor meg kell ismètelni!Innen már sìrva mentem ki az èpületből!Nagy hóba feljöttem ,taxi  a 11.ker-től a  belvárosig oda vissza ,plusz a b.sitter...\nJöjjek vissza pènteken!\nBárkinek mesèltem felhàborodás,biztos kapok kedvezmènyt!Mondtam nekik,ez nem az a hely!\nAztàn pènteken kiderült,elszólta magàt az asszisztens,hogy sokszor gond van ebből ,hogy telefonon ezt elfelejtik mondani!\nSzuper!Akkor küldjenek ilyenkor egy előre megìrt tàjèkoztatót emailben!\nMegfogadtam,ide soha többet,nekem sok anyagi kàrom volt ezekből a dolgokból,és a fix 1 órás csúszás is,hogy minden alkalommal ez van,nagyon dühìtő egy magànrendelőben!Pedig szerettem ide járni!",
              "date": null
            },
            {
              "author": "Fazekas Dóra",
              "rating": 5,
              "text": "nagyon szép, rendezett, modern rendelő. A doktornők (Forró Tímea, és Zakariás Anita) rendkívül kedvesek, precízek és segítőkészek, mindig mindent nagyon alaposan és készségesen elmagyaráznak. Legjobb rendelő, csakis javasolni tudom!",
              "date": null
            },
            {
              "author": "Henrietta Királyfi",
              "rating": 5,
              "text": "A vizsgálat barátságos, igényes környezetben történik. Dr Burja Edina személyisége, számomra kedves és bizalmat ébresztő. Vele biztonságban van mindenki, lehet kérdezni, mindenben segít. És mosolyával oldja a hangulatot. Köszönöm.🥰",
              "date": null
            },
            {
              "author": "Anna Borsódy",
              "rating": 5,
              "text": "Nagyon kedves és alapos ellátást kaptam az éves mell ultrahang keretein belül. A szakorvos minden kórelőzményt rögzített, végig mosolygós és informatív volt. A rendelő könnyen elérhető, tiszta és modern, az asszisztensek és a recepció is nagyon segítőkész, mosolygós. 🙂",
              "date": null
            },
            {
              "author": "Viktória Kreisz",
              "rating": 5,
              "text": "Kellemes környezet, gyors és rugalmas időpontfoglalás.\nDr. Zakariás Anita doktornőt csak ajánlani tudom, kedves, lelkiismeretes. Első találkozás után tudtam, hogy én már csak hozzá szeretnék járni, olyan bizalmat kelt az emberben.",
              "date": null
            },
            {
              "author": "Katalin Czári",
              "rating": 5,
              "text": "Dr. Zakariás Anita rendkívül kedves, szakmai tudása és embersége példaértékű. Empatikusan meghallgatott, mindent részletesen elmagyarázott, és  segítőkészen állt hozzám. Nagyon hálás vagyok neki, szívből ajánlom mindenkinek!",
              "date": null
            },
            {
              "author": "Bence Péter Balás",
              "rating": 5,
              "text": "Csomagot vittem nekik, előtte pár címmel véletlen beletűztem az ujjbegyembe a tűzőkapcsot és megkérdeztem, hogy ez mennyire lehet veszélyes és nem csak választ kaptam hanem nagyon kedvesen le is fertőtlenítették nekem :):)",
              "date": null
            }
          ],
          "source": "google-maps-scraper",
          "postal_code": "1088",
          "city": "Budapest",
          "street": "Budapest Bródy Sándor utca 28 1. lépcsőház, fszt. 2",
          "phone": "06 70 677 4813"
        }
      },
      "error": null,
      "metadata": {}
    },
    "data_extraction": {
      "stage_name": "data_extraction",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T14:02:08.706974",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "taxonomy_enrichment_alt": {
      "stage_name": "taxonomy_enrichment_alt",
      "status": "failed",
      "started_at": null,
      "completed_at": "2026-03-29T14:02:09.187340",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "taxonomy_enrichment_alt",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 5e483e68-3cf0-45f7-92b7-ccd315218fa9_*.log, CLI: pipeline_5e483e68_*.log).

5e483e68-3cf0-45f7-92b7-ccd315218fa9_20260329_135813.log

data/logs/5e483e68-3cf0-45f7-92b7-ccd315218fa9_20260329_135813.log

2026-03-29 13:58:13 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution 5e483e68-3cf0-45f7-92b7-ccd315218fa9 for URL: https://foryoulife.hu/
2026-03-29 13:58:13 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 13:58:13 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://foryoulife.hu/
2026-03-29 13:58:13 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://foryoulife.hu/
2026-03-29 13:58:13 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 13:58:13 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://foryoulife.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 13:58:13 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://foryoulife.hu/
2026-03-29 13:58:14 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://foryoulife.hu/
2026-03-29 13:58:14 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 2116 characters from main URL
2026-03-29 13:58:14 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 13:58:14 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'foryoulife.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 13:58:14 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 4 URLs in 0.5s (success=1, errors=2)
2026-03-29 13:58:22 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 13:58:22 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 13:58:22 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 13:58:44 | WARNING  | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 13:58:44 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 13:58:54 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: ForYouLife
2026-03-29 13:58:54 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 13:58:54 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 13:58:54 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=ForYouLife, varos=N/A
2026-03-29 13:58:54 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmpxabtzwfo
2026-03-29 13:58:54 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmpibvj4lzo
2026-03-29 13:58:54 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:01:03 | INFO     | src.stages.stage_4_reviews | google-maps-scraper completed successfully on attempt 1
2026-03-29 14:01:03 | WARNING  | src.stages.stage_4_reviews | No URL match for foryoulife.hu, using best by review count: For Life Medical Center (521 reviews)
2026-03-29 14:01:04 | ERROR    | src.stages.stage_4_reviews | Hiba történt a review fájlok mentése során: [Errno 2] No such file or directory: 'data/review/20260329_140103_foryoulife_medical_center_/_foryoulife_med_hotel_url_input.txt'
Traceback (most recent call last):
  File "/app/src/scrapers/google_reviews.py", line 339, in _save_review_files
    shutil.copy2(input_path, input_dest)
  File "/usr/local/lib/python3.11/shutil.py", line 448, in copy2
    copyfile(src, dst, follow_symlinks=follow_symlinks)
  File "/usr/local/lib/python3.11/shutil.py", line 258, in copyfile
    with open(dst, 'wb') as fdst:
         ^^^^^^^^^^^^^^^
FileNotFoundError: [Errno 2] No such file or directory: 'data/review/20260329_140103_foryoulife_medical_center_/_foryoulife_med_hotel_url_input.txt'
2026-03-29 14:01:04 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 14:01:04 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 14:01:04 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:01:15 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution c04105ec-559a-4a93-8cb5-a3001027a90b for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 0.4s (success=1, errors=0)
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:01:31 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:01:31 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:01:31 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 2 results
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Bejelentkezés - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Képgaléria - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1051 characters from contact page 1
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:43 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 671 characters from contact page 2
2026-03-29 14:01:43 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:01:57 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Édes Szívünk Egészségközpont Kft.
2026-03-29 14:01:57 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Édes Szívünk Egészségközpont Kft., varos=Hajdúszoboszló
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmpugi7dbne
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmpy4lmnt1z
2026-03-29 14:02:04 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | google-maps-scraper completed successfully on attempt 1
2026-03-29 14:02:07 | WARNING  | src.stages.stage_4_reviews | No URL match for foryoulife.hu, using best by review count: For Life Medical Center (521 reviews)
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_140207_foryoulife_url_input.txt
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_140207_foryoulife_url_output.json
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 14:02:08 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 14:02:08 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).