← Vissza a listához

Futtatás részletei

https://csillag-praxis.hu/

Azonosítók

Státusz
failed
Task ID
3ccb2d09-5025-48ce-9f7c-f2d0358b3a36
State fájl
20260329_103124_csillag-praxis_hu.json
Aktuális stage
discovery_fetch_validation
Létrehozva
2026-03-29 10:31:24
Frissítve
2026-03-31 06:55:40
Futás időtartama
32 nap 11 ó (eddig)

Stage-ek

A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).

Stage Státusz Indult Befejezve Időtartam Hiba
discovery_fetch_validation running 2026-03-29 10:31:36 32 nap 11 ó (eddig)
metadata_alt running 2026-03-29 10:31:33 32 nap 11 ó (eddig)

A futtatás hibával zárult — részletek a stage táblázatban.

Nyers state (JSON)
{
  "execution_id": "3ccb2d09-5025-48ce-9f7c-f2d0358b3a36",
  "input_url": "https://csillag-praxis.hu/",
  "state_filename": "20260329_103124_csillag-praxis_hu.json",
  "created_at": "2026-03-29T10:31:24.219738",
  "updated_at": "2026-03-31T06:55:40.585578",
  "stages": {
    "metadata_alt": {
      "stage_name": "metadata_alt",
      "status": "running",
      "started_at": "2026-03-29T10:31:33.349709",
      "completed_at": null,
      "result": null,
      "error": null,
      "metadata": {}
    },
    "discovery_fetch_validation": {
      "stage_name": "discovery_fetch_validation",
      "status": "running",
      "started_at": "2026-03-29T10:31:36.049088",
      "completed_at": null,
      "result": null,
      "error": null,
      "metadata": {}
    }
  },
  "overall_status": "failed",
  "current_stage": "discovery_fetch_validation",
  "resume_from_stage": null,
  "llm_usage_summary": null
}

Futtatás naplók

Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 3ccb2d09-5025-48ce-9f7c-f2d0358b3a36_*.log, CLI: pipeline_3ccb2d09_*.log).

3ccb2d09-5025-48ce-9f7c-f2d0358b3a36_20260329_103131.log

data/logs/3ccb2d09-5025-48ce-9f7c-f2d0358b3a36_20260329_103131.log

2026-03-29 10:31:31 | INFO     | prefect.pipeline.parallel | Starting parallel pipeline execution 3ccb2d09-5025-48ce-9f7c-f2d0358b3a36 for URL: https://csillag-praxis.hu/
2026-03-29 10:31:36 | INFO     | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 10:31:36 | INFO     | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://csillag-praxis.hu/
2026-03-29 10:31:36 | INFO     | src.stages.stage_1_metadata_alt | Querying metadata for: https://csillag-praxis.hu/
2026-03-29 10:31:36 | INFO     | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 10:31:37 | INFO     | src.stages.stage_2_discovery_async | Async crawl starting: https://csillag-praxis.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 10:31:38 | INFO     | src.stages.stage_1_metadata_alt | Downloading main URL: https://csillag-praxis.hu/
2026-03-29 10:31:41 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 0): https://csillag-praxis.hu/
2026-03-29 10:31:42 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted 573 characters from main URL
2026-03-29 10:31:42 | INFO     | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 10:31:42 | INFO     | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'csillag-praxis.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 10:31:42 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index_d.html
2026-03-29 10:31:44 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/szolgaltatasok.htm
2026-03-29 10:31:54 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/impresszum.htm
2026-03-29 10:31:55 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/index.html
2026-03-29 10:31:57 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/impressum.htm
2026-03-29 10:31:58 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/praxis.htm
2026-03-29 10:31:59 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/elerhetoeseg.htm
2026-03-29 10:32:01 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/orvosok.htm
2026-03-29 10:32:03 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/aerzte.htm
2026-03-29 10:32:05 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/megkoezelites.htm
2026-03-29 10:32:10 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/leistungen.htm
2026-03-29 10:32:13 | WARNING  | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 10:32:13 | INFO     | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 10:32:26 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/weg.htm
2026-03-29 10:32:29 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/praxis_d.htm
2026-03-29 10:32:30 | INFO     | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Csillag Praxis
2026-03-29 10:32:30 | INFO     | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 10:32:31 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 2): https://csillag-praxis.hu/kontakt.htm
2026-03-29 10:32:32 | INFO     | src.stages.stage_2_discovery_async | Crawled (depth 1): https://csillag-praxis.hu/idopont
2026-03-29 10:32:33 | INFO     | src.stages.stage_2_discovery_async | Crawl finished: 16 URLs in 55.4s (success=16, errors=0)