A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-29 13:06:34 | 2026-03-29 13:07:40 | 1 min 6 s | — |
| discovery_fetch_validation | completed | 2026-03-29 13:06:26 | 2026-03-29 13:07:40 | 1 min 13 s | — |
| metadata_alt | completed | 2026-03-29 13:06:26 | 2026-03-29 13:07:39 | 1 min 13 s | — |
| reviews | completed | 2026-03-29 13:07:19 | 2026-03-29 13:07:39 | 20 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-29 13:06:36 | 2026-03-29 13:07:40 | 1 min 4 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Gyógytorna | 4000 | Gyógytorna | Fizioterápia / 0.6802745173935665 |
| Pfaffenrot módszer | 5000 | Pfaffenrot módszer | Pszichológia / 0.4109187366642951 |
| Lymphoedema kezelés | 5000 | Lymphoedema kezelés | Fizioterápia / 0.5329657293498316 |
| Kismama torna | 1500 | Kismama torna | Szülészet és Nőgyógyászat / 0.4782481038251658 |
| Gyermek komplex program | 6000 | Gyermek komplex program | Gyógypedagógia / 0.5288360516227895 |
| Kinesio tape felhelyezés | 1000 | Kinesio tape felhelyezés | Fizioterápia / 0.4775083743819628 |
| Gyógytorna a beteg otthonában | 4000 | Gyógytorna a beteg otthonában | Fizioterápia / 0.6083282787625462 |
| Masszázs | 3000 | Masszázs | Fizioterápia / 0.5842977277925673 |
{
"execution_id": "f0e036a0-60a0-48fb-8a59-83ff40445a6f",
"input_url": "https://fiziokozpont.hu/",
"state_filename": "20260329_130625_fiziokozpont_hu.json",
"created_at": "2026-03-29T13:06:25.348414",
"updated_at": "2026-03-29T13:07:41.050049",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-29T13:06:26.022370",
"completed_at": "2026-03-29T13:07:39.768080",
"result": {
"metadata": {
"company_name": "FizioKözpont",
"description": "Magánrendelésünk 2009 óta működik Tolna megyében, Szekszárdon; 2018-ban új helyen, kibővülve folytattuk munkánkat FizioKözpontként. Célunk egy olyan Terápiás Központ létrehozása, ahol több, különböző szakterületen jártas terapeuta együttműködésével mindenki megtalálja a számára legmegfelelőbb terápiát. Csapatunkban a terapeuták közösen dolgoznak azon, hogy a hozzánk fordulóknak személyre szabott és hatékony kezelési technikákat ajánljunk. Fontosnak tartjuk az evidenciákon alapuló gyógyítást, ezért kizárólag nemzetközileg elismert módszereket alkalmazunk. A folyamatos tanulás és továbbképzés elengedhetetlen számunkra; tudásunkat postgraduális képzéseken és rendszeres konferenciákon való részvétellel bővítjük. A csapatban MSc és BSc végzettségű gyógytornászok, valamint gyógy- és sportmasszőrök dolgoznak.",
"arlista_url": "N/A",
"varos": "Szekszárd",
"iranyitoszam": "7100",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "https://fiziokozpont.hu/"
},
"llm_usage": {
"prompt_tokens": 863,
"completion_tokens": 1095,
"total_tokens": 1958,
"cost": 0.00240575
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-29T13:06:26.218357",
"completed_at": "2026-03-29T13:07:40.193248",
"result": {
"pages": [
{
"source_url": "https://fiziokozpont.hu/araink",
"discovered_url": "https://fiziokozpont.hu/araink",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://fiziokozpont.hu/",
"validation_passed": true,
"ft_count": 11,
"score": 0.9998125433921814,
"attempts": 1
},
{
"source_url": "https://fiziokozpont.hu/",
"discovered_url": "https://fiziokozpont.hu/",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "https://fiziokozpont.hu/",
"validation_passed": true,
"ft_count": 11,
"score": 0.9996523857116699,
"attempts": 2
}
],
"original_url": "https://fiziokozpont.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-29T13:06:34.071462",
"completed_at": "2026-03-29T13:07:40.451240",
"result": {
"number_of_price_items": 8,
"price_items": [
{
"s": "Gyógytorna",
"p": 4000,
"c": "Gyógytorna",
"a": "Fizioterápia",
"v": 0.6802745173935665
},
{
"s": "Pfaffenrot módszer",
"p": 5000,
"c": "Pfaffenrot módszer",
"a": "Pszichológia",
"v": 0.4109187366642951
},
{
"s": "Lymphoedema kezelés",
"p": 5000,
"c": "Lymphoedema kezelés",
"a": "Fizioterápia",
"v": 0.5329657293498316
},
{
"s": "Kismama torna",
"p": 1500,
"c": "Kismama torna",
"a": "Szülészet és Nőgyógyászat",
"v": 0.4782481038251658
},
{
"s": "Gyermek komplex program",
"p": 6000,
"c": "Gyermek komplex program",
"a": "Gyógypedagógia",
"v": 0.5288360516227895
},
{
"s": "Kinesio tape felhelyezés",
"p": 1000,
"c": "Kinesio tape felhelyezés",
"a": "Fizioterápia",
"v": 0.4775083743819628
},
{
"s": "Gyógytorna a beteg otthonában",
"p": 4000,
"c": "Gyógytorna a beteg otthonában",
"a": "Fizioterápia",
"v": 0.6083282787625462
},
{
"s": "Masszázs",
"p": 3000,
"c": "Masszázs",
"a": "Fizioterápia",
"v": 0.5842977277925673
}
],
"llm_usage": {
"prompt_tokens": 3863,
"completion_tokens": 353,
"total_tokens": 4216,
"cost": 0.0014766
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-29T13:06:36.424115",
"completed_at": "2026-03-29T13:07:40.728769",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 8,
"items_processed": 8,
"avg_best_similarity": 0.5376721899740906,
"min_best_similarity": 0.4109187366642951,
"max_best_similarity": 0.6802745173935665,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Gyógytorna",
"c": "Gyógytorna",
"best_a": "Fizioterápia",
"best_similarity": 0.6802745173935665
},
{
"idx": 1,
"s": "Pfaffenrot módszer",
"c": "Pfaffenrot módszer",
"best_a": "Pszichológia",
"best_similarity": 0.4109187366642951
},
{
"idx": 2,
"s": "Lymphoedema kezelés",
"c": "Lymphoedema kezelés",
"best_a": "Fizioterápia",
"best_similarity": 0.5329657293498316
},
{
"idx": 3,
"s": "Kismama torna",
"c": "Kismama torna",
"best_a": "Szülészet és Nőgyógyászat",
"best_similarity": 0.4782481038251658
},
{
"idx": 4,
"s": "Gyermek komplex program",
"c": "Gyermek komplex program",
"best_a": "Gyógypedagógia",
"best_similarity": 0.5288360516227895
},
{
"idx": 5,
"s": "Kinesio tape felhelyezés",
"c": "Kinesio tape felhelyezés",
"best_a": "Fizioterápia",
"best_similarity": 0.4775083743819628
},
{
"idx": 6,
"s": "Gyógytorna a beteg otthonában",
"c": "Gyógytorna a beteg otthonában",
"best_a": "Fizioterápia",
"best_similarity": 0.6083282787625462
},
{
"idx": 7,
"s": "Masszázs",
"c": "Masszázs",
"best_a": "Fizioterápia",
"best_similarity": 0.5842977277925673
}
],
"llm_usage": {
"prompt_tokens": 120,
"completion_tokens": 0,
"total_tokens": 120,
"cost": 0.0000156
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-29T13:07:19.309031",
"completed_at": "2026-03-29T13:07:39.968401",
"result": {
"reviews": {
"company_name": "FizioKözpont",
"total_reviews": 3,
"average_rating": 5,
"reviews": [
{
"author": "Evelin Sárosi",
"rating": 5,
"text": "Tökéletesen felszerelt gyógytorna rendelő!\nKorai fejlesztésben, gyermek mozgásszervi rehabilitációban és intenzív terápiában a legjobb! Nóri szakértelme és a kisbeteghez való hozzáállása páratlan!",
"date": null
},
{
"author": "Rita Szentiványi",
"rating": 5,
"text": "Gyógytornászként és szülőként őszintén ajánlom Nóri rendelőjét!\nTherasuit és gyermek intenzív terápiás mozgásszervi kezelések nála a legjobbak az országban! Aki egyszer már járt nála az tudja!",
"date": null
},
{
"author": "Balázs Bozzay",
"rating": 5,
"text": "Felkészült, kedves szakemberek, hozzáértő kezelések.",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "7100",
"city": "Szekszárd",
"street": "Dienes Valéria utca",
"phone": "06 20 936 7871"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 4846,
"completion_tokens": 1448,
"total_tokens": 6294,
"cost": 0.00389795
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: f0e036a0-60a0-48fb-8a59-83ff40445a6f_*.log, CLI: pipeline_f0e036a0_*.log).
data/logs/f0e036a0-60a0-48fb-8a59-83ff40445a6f_20260329_130625.log
2026-03-29 13:06:25 | INFO | prefect.pipeline.parallel | Starting parallel pipeline execution f0e036a0-60a0-48fb-8a59-83ff40445a6f for URL: https://fiziokozpont.hu/
2026-03-29 13:06:26 | INFO | src.stages.stage_1_metadata_alt | Starting alternative metadata extraction stage
2026-03-29 13:06:26 | INFO | src.stages.stage_1_metadata_alt | Querying metadata for: https://fiziokozpont.hu/
2026-03-29 13:06:26 | INFO | src.stages.stage_2_discovery_async | Starting discovery-fetch-validation (async) for URL: https://fiziokozpont.hu/
2026-03-29 13:06:26 | INFO | src.stages.stage_2_discovery_async | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict
2026-03-29 13:06:26 | INFO | src.stages.stage_2_discovery_async | Async crawl starting: https://fiziokozpont.hu/ (max_depth=2, max_concurrent=10)
2026-03-29 13:06:26 | INFO | src.stages.stage_1_metadata_alt | Downloading main URL: https://fiziokozpont.hu/
2026-03-29 13:06:26 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 0): https://fiziokozpont.hu/
2026-03-29 13:06:26 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/rolunk
2026-03-29 13:06:27 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted 869 characters from main URL
2026-03-29 13:06:27 | INFO | src.stages.stage_1_metadata_alt | Searching for contact pages using OpenSerp
2026-03-29 13:06:27 | INFO | src.stages.stage_1_metadata_alt | Trying OpenSerp API: http://openserp:7000/mega/search with params: {'text': 'cím kapcsolat telefonszám', 'site': 'fiziokozpont.hu', 'limit': '3', 'lang': 'HU'}
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/terapeutak
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/kapcsolat
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/araink
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/terapiak
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 1): https://fiziokozpont.hu/galeria
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapeutak/kozma-zsofia
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/pfaffenrot-manualis-terapia
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapeutak/tanacs-gulyas-nora
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapeutak/lindauer-lea
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/schroth-modszer
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/kinesio-tape
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/kismama-torna
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/mckenzie-modszer
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/lymphoedema-kezeles
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/katona-modszer
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/baba-mama-torna
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/sportrehabilitacio
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/masszazs
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawled (depth 2): https://fiziokozpont.hu/terapiak/korai-fejlesztes
2026-03-29 13:06:27 | INFO | src.stages.stage_2_discovery_async | Crawl finished: 21 URLs in 1.4s (success=21, errors=0)
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | Crawl produced 2 URLs from BERT (threshold and above), fetching all
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | [URL 1/2] Fetching (BERT prob=1.00): https://fiziokozpont.hu/araink
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | [URL 1/2] OK (BERT prob=1.00)
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | [URL 2/2] Fetching (BERT prob=1.00): https://fiziokozpont.hu/
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | [URL 2/2] OK (BERT prob=1.00)
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | Discovery (async) completed with 2 page(s)
2026-03-29 13:06:33 | INFO | src.stages.stage_2_discovery_async | Detailed logs saved to: data/logs/f0e036a0-60a0-48fb-8a59-83ff40445a6f_20260329_130625.log
2026-03-29 13:06:34 | INFO | src.stages.stage_3_data_extraction | Data extraction: 2 page(s) to process
2026-03-29 13:06:34 | INFO | src.stages.stage_3_data_extraction | Extracted 0 price items from page 1
2026-03-29 13:06:35 | INFO | src.stages.stage_3_data_extraction | Extracted 11 price items from page 2
2026-03-29 13:06:35 | INFO | src.stages.stage_3_data_extraction | Post-process price_items: 11 -> 8 (removed invalid/zero prices and duplicate services)
2026-03-29 13:06:35 | INFO | src.stages.stage_3_data_extraction | Data extraction stage completed: 8 total price items from 2 page(s)
2026-03-29 13:06:36 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | Starting taxonomy enrichment alt stage (embeddings)
2026-03-29 13:06:36 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt: loaded cached label embeddings from data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json
2026-03-29 13:06:36 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt summary: processed=8 avg=0.5377 min=0.4109 max=0.6803 cache_hit=True model=openai/text-embedding-3-large provider=openrouter
2026-03-29 13:06:36 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt weakest_matches: [{'idx': 1, 's': 'Pfaffenrot módszer', 'c': 'Pfaffenrot módszer', 'best_a': 'Pszichológia', 'best_similarity': 0.4109187366642951}, {'idx': 5, 's': 'Kinesio tape felhelyezés', 'c': 'Kinesio tape felhelyezés', 'best_a': 'Fizioterápia', 'best_similarity': 0.4775083743819628}, {'idx': 3, 's': 'Kismama torna', 'c': 'Kismama torna', 'best_a': 'Szülészet és Nőgyógyászat', 'best_similarity': 0.4782481038251658}]
2026-03-29 13:06:36 | INFO | src.stages.stage_5_taxonomy_enrichment_alt | taxonomy_enrichment_alt stage completed
2026-03-29 13:06:57 | WARNING | src.stages.stage_1_metadata_alt | Error using OpenSerp or extracting contact pages: Could not connect to OpenSerp API
2026-03-29 13:06:57 | INFO | src.stages.stage_1_metadata_alt | Calling OpenRouter for metadata extraction (model=openai/gpt-5-mini)
2026-03-29 13:07:18 | INFO | src.stages.stage_1_metadata_alt | Successfully extracted metadata for: FizioKözpont
2026-03-29 13:07:18 | INFO | src.stages.stage_1_metadata_alt | Alternative metadata extraction stage completed
2026-03-29 13:07:19 | INFO | src.stages.stage_4_reviews | Starting reviews scraping stage
2026-03-29 13:07:19 | INFO | src.stages.stage_4_reviews | Found metadata directly: company_name=FizioKözpont, varos=Szekszárd
2026-03-29 13:07:19 | INFO | src.stages.stage_4_reviews | input_path: /tmp/tmprsvuc2a3
2026-03-29 13:07:19 | INFO | src.stages.stage_4_reviews | output_path: /tmp/tmp1s7hm8m9
2026-03-29 13:07:19 | INFO | src.stages.stage_4_reviews | Running google-maps-scraper (attempt 1/3)
2026-03-29 13:07:39 | INFO | src.stages.stage_4_reviews | google-maps-scraper: early exit (reviews found in output for URL) on attempt 1
2026-03-29 13:07:39 | INFO | src.stages.stage_4_reviews | Input fájl mentve: data/review/20260329_130739_fizioközpont_url_input.txt
2026-03-29 13:07:39 | INFO | src.stages.stage_4_reviews | Output fájl mentve: data/review/20260329_130739_fizioközpont_url_output.json
2026-03-29 13:07:39 | INFO | src.stages.stage_4_reviews | Reviews scraping completed. Found 3 reviews
2026-03-29 13:07:39 | INFO | prefect.pipeline.parallel | Branch 1 (metadata_alt -> reviews) completed successfully
2026-03-29 13:07:40 | INFO | prefect.pipeline.parallel | Branch 2 (discovery -> data_extraction -> taxonomy_enrichment_alt) completed successfully
2026-03-29 13:07:41 | INFO | prefect.pipeline.parallel | Pipeline execution f0e036a0-60a0-48fb-8a59-83ff40445a6f completed