A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-28 20:29:35 | 2026-03-28 20:33:09 | 3 min 33 s | — |
| discovery_fetch_validation | completed | 2026-03-28 20:29:27 | 2026-03-28 20:33:08 | 3 min 40 s | — |
| metadata_alt | completed | 2026-03-28 20:29:27 | 2026-03-28 20:33:08 | 3 min 40 s | — |
| reviews | completed | 2026-03-28 20:30:05 | 2026-03-28 20:33:08 | 3 min 3 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-28 20:29:37 | 2026-03-28 20:33:09 | 3 min 31 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Szemészeti szakorvosi vizsgálat | 20000 | Szemészet | Szemészet / 0.7463745095429977 |
| Szemészeti kontroll | 15000 | Szemészet | Szemészet / 0.685136898401486 |
| Receptfelírás | 3000 | Szemészet | Szemészet / 0.6171448442898573 |
| OCT vizsgálat | 5000 | Szemészet | Szemészet / 0.777374872794002 |
{
"execution_id": "8e21e4f4-fb9f-49b1-8b41-ccadc0a44753",
"input_url": "https://starlens.hu/",
"state_filename": "20260328_202926_starlens_hu.json",
"created_at": "2026-03-28T20:29:26.816728",
"updated_at": "2026-03-28T20:33:09.533324",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-28T20:29:27.660937",
"completed_at": "2026-03-28T20:33:08.239684",
"result": {
"metadata": {
"company_name": "Star-Lens Kft. (Starlens magán szemészeti rendelő)",
"description": "A Star-Lens szemészeti szakrendelő 2024-ben alakult azzal a céllal, hogy korszerű és személyre szabott szemészeti ellátást nyújtson pácienseinek. Rendelőnk modern műszerekkel és fejlett technológiával dolgozik a pontos diagnózisok és hatékony kezelések érdekében. Szakterületünkön tapasztalt szakorvosok — többek között Dr. Tinka Tímea Réka és Dr. Böcskei Zsolt — biztosítják a magas színvonalú szakmai ellátást. Kiemelt célunk a páciensek legjobb látásélményének és életminőségének elősegítése. Rendelőnkben teljeskörű szemészeti vizsgálatok, szemfenék- és szűrővizsgálatok, valamint gyermek- és színlátás-vizsgálatok is elérhetők.",
"arlista_url": "https://starlens.hu/szemeszeti-vizsgalatok-dija",
"varos": "Nagykőrös",
"iranyitoszam": "2750",
"utca": "Biczó Géza u. 2.",
"telefonszam": "+36 70 537 1310",
"email": "N/A",
"website": "https://starlens.hu/"
},
"llm_usage": {
"prompt_tokens": 8778,
"completion_tokens": 1163,
"total_tokens": 9941,
"cost": 0.0045205
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-28T20:29:27.905645",
"completed_at": "2026-03-28T20:33:08.747430",
"result": {
"pages": [
{
"source_url": "https://starlens.hu/szemeszeti-vizsgalatok-dija",
"discovered_url": "https://starlens.hu/szemeszeti-vizsgalatok-dija",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://starlens.hu/",
"validation_passed": true,
"ft_count": 4,
"score": 0.9993219375610352,
"attempts": 1
}
],
"original_url": "https://starlens.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-28T20:29:35.838076",
"completed_at": "2026-03-28T20:33:09.019347",
"result": {
"number_of_price_items": 4,
"price_items": [
{
"s": "Szemészeti szakorvosi vizsgálat",
"p": 20000,
"c": "Szemészet",
"a": "Szemészet",
"v": 0.7463745095429977
},
{
"s": "Szemészeti kontroll",
"p": 15000,
"c": "Szemészet",
"a": "Szemészet",
"v": 0.685136898401486
},
{
"s": "Receptfelírás",
"p": 3000,
"c": "Szemészet",
"a": "Szemészet",
"v": 0.6171448442898573
},
{
"s": "OCT vizsgálat",
"p": 5000,
"c": "Szemészet",
"a": "Szemészet",
"v": 0.777374872794002
}
],
"llm_usage": {
"prompt_tokens": 1338,
"completion_tokens": 122,
"total_tokens": 1460,
"cost": 0.0005112
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-28T20:29:37.512553",
"completed_at": "2026-03-28T20:33:09.276048",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 4,
"items_processed": 4,
"avg_best_similarity": 0.7065077812570857,
"min_best_similarity": 0.6171448442898573,
"max_best_similarity": 0.777374872794002,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Szemészeti szakorvosi vizsgálat",
"c": "Szemészet",
"best_a": "Szemészet",
"best_similarity": 0.7463745095429977
},
{
"idx": 1,
"s": "Szemészeti kontroll",
"c": "Szemészet",
"best_a": "Szemészet",
"best_similarity": 0.685136898401486
},
{
"idx": 2,
"s": "Receptfelírás",
"c": "Szemészet",
"best_a": "Szemészet",
"best_similarity": 0.6171448442898573
},
{
"idx": 3,
"s": "OCT vizsgálat",
"c": "Szemészet",
"best_a": "Szemészet",
"best_similarity": 0.777374872794002
}
],
"llm_usage": {
"prompt_tokens": 50,
"completion_tokens": 0,
"total_tokens": 50,
"cost": 6.5e-6
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-28T20:30:05.465306",
"completed_at": "2026-03-28T20:33:08.486386",
"result": {
"reviews": {
"company_name": "Star-Lens Kft. (Starlens magán szemészeti rendelő)",
"total_reviews": 0,
"average_rating": null,
"reviews": [],
"source": "google-maps-scraper",
"postal_code": "1056",
"city": "Budapest",
"street": "Irányi u. 1",
"phone": "(06 1) 318 2418"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 10166,
"completion_tokens": 1285,
"total_tokens": 11451,
"cost": 0.0050382000000000005
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 8e21e4f4-fb9f-49b1-8b41-ccadc0a44753_*.log, CLI: pipeline_8e21e4f4_*.log).
data/logs/8e21e4f4-fb9f-49b1-8b41-ccadc0a44753_20260328_202927.log
2026-03-28 20:29:27 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution 8e21e4f4-fb9f-49b1-8b41-ccadc0a44753 for URL: https://starlens.hu/
2026-03-28 20:29:27 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://starlens.hu/
2026-03-28 20:29:27 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-28 20:29:27 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://starlens.hu/ (max_depth=2, max_concurrent=10)
2026-03-28 20:29:27 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-28 20:29:27 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://starlens.hu/
2026-03-28 20:29:27 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://starlens.hu/
2026-03-28 20:29:28 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://starlens.hu/
2026-03-28 20:29:28 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 692 characters from main URL
2026-03-28 20:29:28 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-28 20:29:28 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'starlens.hu', 'limit': '3', 'lang': 'HU'}
2026-03-28 20:29:28 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://starlens.hu/sutiszabalyzat
2026-03-28 20:29:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://starlens.hu/adatvedelem
2026-03-28 20:29:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://starlens.hu/szemeszeti-vizsgalatok-dija
2026-03-28 20:29:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://starlens.hu/megkozelites
2026-03-28 20:29:29 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://starlens.hu/szemeszeti-vizsgalatok
2026-03-28 20:29:31 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 21 URLs in 3.5s (success=6, errors=2)
2026-03-28 20:29:35 | INFO | src.stages.stage_2_discovery_async | Crawl produced 1 URLs from BERT (threshold and above), fetching all
2026-03-28 20:29:35 | INFO | src.stages.stage_2_discovery_async | [URL 1/1] Fetching (BERT prob=1.00): https://starlens.hu/szemeszeti-vizsgalatok-dija
2026-03-28 20:29:35 | INFO | src.stages.stage_2_discovery_async | [URL 1/1] OK (BERT prob=1.00)
2026-03-28 20:29:35 | INFO | src.stages.stage_2_discovery_async | Discovery (async) completed with 1 page(s)
2026-03-28 20:29:35 | INFO | src.stages.stage_2_discovery_async | Detailed logs saved to: data/logs/8e21e4f4-fb9f-49b1-8b41-ccadc0a44753_20260328_202927.log
2026-03-28 20:29:35 | INFO | src.stages.stage_3_data_extraction | Data extraction: 1 page(s) to process
2026-03-28 20:29:36 | INFO | src.stages.stage_3_data_extraction | Extracted 4 price items from page 1
2026-03-28 20:29:36 | INFO | src.stages.stage_3_data_extraction | Data extraction stage completed: 4 total price items from 1 page(s)
2026-03-28 20:29:37 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | Starting taxonomy enrichment alt stage (embeddings)
2026-03-28 20:29:37 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-28 20:29:38 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt summary: processed=4 avg=0.7065 min=0.6171 max=0.7774 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-28 20:29:38 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt weakest_matches: [{'idx': 2, 's': 'Receptfelírás', 'c': 'Szemészet', 'best_a': 'Szemészet', 'best_similarity': 0.6171448442898573}, {'idx': 1, 's': 'Szemészeti kontroll', 'c': 'Szemészet', 'best_a': 'Szemészet', 'best_similarity': 0.685136898401486}, {'idx': 0, 's': 'Szemészeti szakorvosi vizsgálat', 'c': 'Szemészet', 'best_a': 'Szemészet', 'best_similarity': 0.7463745095429977}]
2026-03-28 20:29:38 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt stage completed
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Successfully connected to OpenSerp at http://openserp:7000/mega/search
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | OpenSerp returned 3 results
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Result 1: Starlens magán szemészeti rendelő Nagykőrös - https://starlens.hu/
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Result 2: Szemészeti vizsgálatok - starlens.hu - https://starlens.hu/szemeszeti-vizsgalatok
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Result 3: Adatvédelem - Starlens magán szemészeti rendelő Nagykőrös - https://starlens.hu/adatvedelem
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 1/3: https://starlens.hu/
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 2439 characters from contact page 1
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 2/3: https://starlens.hu/szemeszeti-vizsgalatok
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 2956 characters from contact page 2
2026-03-28 20:29:49 | INFO | src.stages.stage_1_metadata_alt | Trying to download contact page 3/3: https://starlens.hu/adatvedelem
2026-03-28 20:29:50 | INFO | src.stages.stage_1_metadata_alt | Successfully downloaded and converted 17195 characters from contact page 3
2026-03-28 20:29:50 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-28 20:30:04 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: Star-Lens Kft. (Starlens magán szemészeti rendelő)
2026-03-28 20:30:04 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-28 20:30:05 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-28 20:30:05 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=Star-Lens Kft. (Starlens magán szemészeti rendelő), varos=Nagykőrös
2026-03-28 20:30:05 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmpxznz3oei
2026-03-28 20:30:05 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp9_bzu8w6
2026-03-28 20:30:05 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-28 20:33:07 | INFO | src.stages.stage_4_reviews | google-maps-scraper completed successfully on attempt 1
2026-03-28 20:33:07 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260328_203307_star-lens_kft._(starlens_magán_szemészeti_rendelő)_url_input.txt
2026-03-28 20:33:07 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260328_203307_star-lens_kft._(starlens_magán_szemészeti_rendelő)_url_output.json
2026-03-28 20:33:07 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 0 reviews
2026-03-28 20:33:08 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-28 20:33:09 | INFO | prefect.pipeline.parallel | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-28 20:33:09 | INFO | prefect.pipeline.parallel | Pipeline execution 8e21e4f4-fb9f-49b1-8b41-ccadc0a44753 completed