← Vissza a listához

Futtatás részletei

https://edesszivkft.hu/

Azonosítók

Státusz
failed
Task ID
c04105ec-559a-4a93-8cb5-a3001027a90b
State fájl
20260329_140115_edesszivkft_hu.json
Aktuális stage
reviews
Létrehozva
2026-03-29 14:01:15
Frissítve
2026-03-31 06:55:40
Futás időtartama
32 nap 7 ó (eddig)

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
discovery_fetch_validation failed 2026-03-29 14:01:16 2026-03-29 14:01:32 16 s Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
metadata_alt completed 2026-03-29 14:01:16 2026-03-29 14:01:59 43 s
reviews running 2026-03-29 14:02:03 32 nap 7 ó (eddig)

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "c04105ec-559a-4a93-8cb5-a3001027a90b",
  "input_url": "https://edesszivkft.hu/",
  "state_filename": "20260329_140115_edesszivkft_hu.json",
  "created_at": "2026-03-29T14:01:15.413243",
  "updated_at": "2026-03-31T06:55:40.592127",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "completed",
      "started_at": "2026-03-29T14:01:16.036354",
      "completed_at": "2026-03-29T14:01:59.861041",
      "result": {
        "metadata": {
          "company_name": "Édes Szívünk Egészségközpont Kft.",
          "description": "Édes Szívünk Egészségközpont magán kardiológiai és diagnosztikai szolgáltatásokat nyújt páciensek részére. A központ elsősorban kardiológiai rendeléseket, EKG, terheléses EKG, Holter és ABPM vizsgálatokat kínál, valamint egyéb műszeres vizsgálatokat és szakrendeléseket. A rendelésre előzetes bejelentkezés szükséges, időpontkérés a megadott titkári telefonszámon történik. A rendelők és várók a Hunguest Hotel Apollóban találhatók, címe: 4200 Hajdúszoboszló, Mátyás király sétány 12–14. A honlap részletes információkat tartalmaz az orvosokról, rendelési időkről és 2026-os árakról.",
          "arlista_url": "https://www.edesszivkft.hu/araink-2026",
          "varos": "Hajdúszoboszló",
          "iranyitoszam": "4200",
          "utca": "Mátyás király sétány 12–14 (Hunguest Hotel Apolló)",
          "telefonszam": "+36/30 9 38-17-38",
          "email": "N/A",
          "website": "https://edesszivkft.hu/"
        },
        "llm_usage": {
          "prompt_tokens": 1544,
          "completion_tokens": 1120,
          "total_tokens": 2664,
          "cost": 0.002626
        }
      },
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "failed",
      "started_at": "2026-03-29T14:01:16.217842",
      "completed_at": "2026-03-29T14:01:32.479957",
      "result": null,
      "error": "Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).",
      "metadata": {}
    },
    "reviews": {
      "stage_name": "reviews",
      "status": "running",
      "started_at": "2026-03-29T14:02:03.885275",
      "completed_at": null,
      "result": null,
      "error": null,
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "reviews",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: c04105ec-559a-4a93-8cb5-a3001027a90b_*.log, CLI: pipeline_c04105ec_*.log).

c04105ec-559a-4a93-8cb5-a3001027a90b_20260329_140115.log

data/logs/c04105ec-559a-4a93-8cb5-a3001027a90b_20260329_140115.log

2026-03-29 14:01:15 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution c04105ec-559a-4a93-8cb5-a3001027a90b for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:01:16 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 0.4s (success=1, errors=0)
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:01:16 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:01:31 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:01:31 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:01:31 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | OpenSerp returned 2 results
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Result 1: Bejelentkezés - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Result 2: Képgaléria - ÉDES SZÍVÜNK KFT. - https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://www.edesszivkft.hu/bejelentkezes-vizsgalatra
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 1051 characters from contact page 1
2026-03-29 14:01:42 | INFO     | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://www.edesszivkft.hu/kepgaleria
2026-03-29 14:01:43 | INFO     | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 671 characters from contact page 2
2026-03-29 14:01:43 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:01:57 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Édes Szívünk Egészségközpont Kft.
2026-03-29 14:01:57 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=Édes Szívünk Egészségközpont Kft., varos=Hajdúszoboszló
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmpugi7dbne
2026-03-29 14:02:03 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmpy4lmnt1z
2026-03-29 14:02:04 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | google-maps-scraper completed successfully on attempt 1
2026-03-29 14:02:07 | WARNING  | src.stages.stage_4_reviews | No URL match for foryoulife.hu, using best by review count: For Life Medical Center (521 reviews)
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_140207_foryoulife_url_input.txt
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_140207_foryoulife_url_output.json
2026-03-29 14:02:07 | INFO     | src.stages.stage_4_reviews | Reviews scraping completed. Found 8 reviews
2026-03-29 14:02:08 | INFO     | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 14:02:08 | ERROR    | prefect.pipeline.parallel | Branch 2 failed: Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:02:55 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution c5892ca1-0673-4f80-a969-0849e4027e3d for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 14:02:57 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://edesszivkft.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 14:02:57 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 14:02:57 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://edesszivkft.hu/
2026-03-29 14:02:57 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://edesszivkft.hu/
2026-03-29 14:02:58 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 2 URLs in 1.1s (success=1, errors=0)
2026-03-29 14:02:58 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 215 characters from main URL
2026-03-29 14:02:58 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 14:02:58 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'edesszivkft.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 14:03:05 | INFO     | src.stages.stage_2_discovery_async | Crawl produced 0 URLs from BERT (threshold and above), fetching all
2026-03-29 14:03:05 | ERROR    | src.stages.stage_2_discovery_async | Async discovery: no BERT candidate URL produced valid content. Tried 0 URL(s).
2026-03-29 14:03:05 | INFO     | src.stages.stage_2_discovery_async | Attempting fallback: original URL with trafilatura+markdown
2026-03-29 14:03:28 | WARNING  | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 14:03:28 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 14:03:39 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT
2026-03-29 14:03:39 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 14:03:39 | INFO     | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 14:03:39 | INFO     | src.stages.stage_4_reviews | Found metadata directly: company_name=ÉDES SZÍVÜNK EGÉSZSÉGKÖZPONT, varos=N/A
2026-03-29 14:03:39 | INFO     | src.stages.stage_4_reviews | input_path: /tmp/tmp2iqtg5tt
2026-03-29 14:03:39 | INFO     | src.stages.stage_4_reviews | output_path: /tmp/tmp9x2405uw
2026-03-29 14:03:39 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 14:05:25 | WARNING  | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:05:30 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)
2026-03-29 14:07:02 | WARNING  | src.stages.stage_4_reviews | google-maps-scraper timed out after 200s (attempt 1/3). Retrying in 5 seconds...
2026-03-29 14:07:07 | INFO     | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 2/3)