A séma az aktuális config alapján rajzolódik; egy régebbi futtatás más orchestrátorral készülhetett. BPMN-szerű jelölés: zöld kör = kezdőesemény, kék + rombusz = párhuzamos fork/join, lekerekített téglalap = task (szín = státusz), dupla piros kör = befejezés. Egér a task fölött: részletek (státusz, időpontok, hiba).
| Stage | Státusz | Indult | Befejezve | Időtartam | Hiba |
|---|---|---|---|---|---|
| data_extraction | completed | 2026-03-23 15:48:41 | 2026-03-23 15:50:19 | 1 min 38 s | — |
| discovery_fetch_validation | completed | 2026-03-23 15:48:24 | 2026-03-23 15:50:19 | 1 min 54 s | — |
| metadata_alt | completed | 2026-03-23 15:48:24 | 2026-03-23 15:50:19 | 1 min 54 s | — |
| reviews | completed | 2026-03-23 15:49:17 | 2026-03-23 15:50:19 | 1 min 2 s | — |
| taxonomy_enrichment_alt | completed | 2026-03-23 15:48:42 | 2026-03-23 15:50:19 | 1 min 37 s | — |
| Szolgáltatás | Ár | Kategória | a / v |
|---|---|---|---|
| Komplett hasi és kismedencei UH vizsgálat | 21000 | Diagnosztika | Diagnosztika / 0.6166692158429364 |
| nyaki erek | 23000 | Érrendszer ultrahang vizsgálata | Angiológia / 0.6296680542451253 |
| hasi erek | 23000 | Érrendszer ultrahang vizsgálata | Angiológia / 0.608825128055505 |
| vétagi erek | 24000 | Érrendszer ultrahang vizsgálata | Angiológia / 0.6521017814429292 |
| erek komplex áttekintő vizsgálata | 70000 | Érrendszer ultrahang vizsgálata | Angiológia / 0.5989139235378181 |
{
"execution_id": "9688c8da-b5df-43a6-b48c-0c5542d8dcba",
"input_url": "http://4dultrahanggyor.hu/",
"state_filename": "20260323_154824_4dultrahanggyor_hu.json",
"created_at": "2026-03-23T15:48:24.440685",
"updated_at": "2026-03-23T15:50:19.551831",
"stages": {
"metadata_alt": {
"stage_name": "metadata_alt",
"status": "completed",
"started_at": "2026-03-23T15:48:24.640969",
"completed_at": "2026-03-23T15:50:19.276308",
"result": {
"metadata": {
"company_name": "N/A",
"description": "A honlap bemutatja az ultrahangvizsgálatok jelentőségét és egy olyan rendelőt, amely korszerű, 4 dimenziós, nagyfelbontású monitorral rendelkező ultrahanggépet telepített. Ismerteti az ultrahang elvét: a különböző szövetszerkezetekről visszaverődő hangok számítógépes képpé alakítását, és hangsúlyozza, hogy az ultrahang rutinszerű, gyors és kevésbé kockázatos diagnosztikai módszer. A szöveg kiemeli, hogy a rendelő nemzetközi hírű szaktekintélyeket is megnyert a berendezéshez, és szükség szerint szakorvosi javaslatokat ad a további teendőkre. Különös figyelmet fordítanak a megelőzésre: az 35-40 év feletti lakosság rendszeres, évenkénti szűrésének fontosságát hangsúlyozzák a korai felismerés és a túlélési esélyek javítása érdekében. A bemutató célja felhívni a figyelmet arra, hogy egy korai ultrahangvizsgálat költséghatékonyabb és rövidebb ideig tartó beavatkozásokhoz vezethet, mint a késői diagnózis miatti kezelések.",
"arlista_url": "N/A",
"varos": "N/A",
"iranyitoszam": "2000",
"utca": "N/A",
"telefonszam": "N/A",
"email": "N/A",
"website": "http://4dultrahanggyor.hu/"
},
"llm_usage": {
"prompt_tokens": 1176,
"completion_tokens": 1270,
"total_tokens": 2446,
"cost": 0.002834
}
},
"error": null,
"metadata": {}
},
"discovery_fetch_validation": {
"stage_name": "discovery_fetch_validation",
"status": "completed",
"started_at": "2026-03-23T15:48:24.696454",
"completed_at": "2026-03-23T15:50:19.393557",
"result": {
"pages": [
{
"source_url": "http://4dultrahanggyor.hu/errendszer.html",
"discovered_url": "http://4dultrahanggyor.hu/errendszer.html",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "http://4dultrahanggyor.hu/",
"validation_passed": true,
"ft_count": 5,
"score": 0.9991495609283447,
"attempts": 1
},
{
"source_url": "http://4dultrahanggyor.hu/hasieskismedencei.html",
"discovered_url": "http://4dultrahanggyor.hu/hasieskismedencei.html",
"input_strategy": "async_crawl_bert",
"fetch_strategy": "curl",
"output_strategy": "html",
"strategy": "async_crawl_bert,curl,html",
"original_url": "http://4dultrahanggyor.hu/",
"validation_passed": true,
"ft_count": 1,
"score": 0.9989902377128601,
"attempts": 2
}
],
"original_url": "http://4dultrahanggyor.hu/",
"strategy": "async_crawl_bert,curl,html"
},
"error": null,
"metadata": {}
},
"data_extraction": {
"stage_name": "data_extraction",
"status": "completed",
"started_at": "2026-03-23T15:48:41.293531",
"completed_at": "2026-03-23T15:50:19.444620",
"result": {
"number_of_price_items": 5,
"price_items": [
{
"s": "Komplett hasi és kismedencei UH vizsgálat",
"p": 21000,
"c": "Diagnosztika",
"a": "Diagnosztika",
"v": 0.6166692158429364
},
{
"s": "nyaki erek",
"p": 23000,
"c": "Érrendszer ultrahang vizsgálata",
"a": "Angiológia",
"v": 0.6296680542451253
},
{
"s": "hasi erek",
"p": 23000,
"c": "Érrendszer ultrahang vizsgálata",
"a": "Angiológia",
"v": 0.608825128055505
},
{
"s": "vétagi erek",
"p": 24000,
"c": "Érrendszer ultrahang vizsgálata",
"a": "Angiológia",
"v": 0.6521017814429292
},
{
"s": "erek komplex áttekintő vizsgálata",
"p": 70000,
"c": "Érrendszer ultrahang vizsgálata",
"a": "Angiológia",
"v": 0.5989139235378181
}
],
"llm_usage": {
"prompt_tokens": 4223,
"completion_tokens": 191,
"total_tokens": 4414,
"cost": 0.00129624
}
},
"error": null,
"metadata": {}
},
"taxonomy_enrichment_alt": {
"stage_name": "taxonomy_enrichment_alt",
"status": "completed",
"started_at": "2026-03-23T15:48:42.453161",
"completed_at": "2026-03-23T15:50:19.494145",
"result": {
"summary": {
"provider": "openrouter",
"embedding_model": "openai/text-embedding-3-large",
"items_total": 5,
"items_processed": 5,
"avg_best_similarity": 0.6212356206248628,
"min_best_similarity": 0.5989139235378181,
"max_best_similarity": 0.6521017814429292,
"cache_hit": true,
"cache_file": "data/taxonomy_embeddings/openrouter_openai_text_embedding_3_large.json"
},
"predictions": [
{
"idx": 0,
"s": "Komplett hasi és kismedencei UH vizsgálat",
"c": "Diagnosztika",
"best_a": "Diagnosztika",
"best_similarity": 0.6166692158429364
},
{
"idx": 1,
"s": "nyaki erek",
"c": "Érrendszer ultrahang vizsgálata",
"best_a": "Angiológia",
"best_similarity": 0.6296680542451253
},
{
"idx": 2,
"s": "hasi erek",
"c": "Érrendszer ultrahang vizsgálata",
"best_a": "Angiológia",
"best_similarity": 0.608825128055505
},
{
"idx": 3,
"s": "vétagi erek",
"c": "Érrendszer ultrahang vizsgálata",
"best_a": "Angiológia",
"best_similarity": 0.6521017814429292
},
{
"idx": 4,
"s": "erek komplex áttekintő vizsgálata",
"c": "Érrendszer ultrahang vizsgálata",
"best_a": "Angiológia",
"best_similarity": 0.5989139235378181
}
],
"llm_usage": {
"prompt_tokens": 97,
"completion_tokens": 0,
"total_tokens": 97,
"cost": 0.00001261
}
},
"error": null,
"metadata": {}
},
"reviews": {
"stage_name": "reviews",
"status": "completed",
"started_at": "2026-03-23T15:49:17.024590",
"completed_at": "2026-03-23T15:50:19.332914",
"result": {
"reviews": {
"company_name": "N/A",
"total_reviews": 13,
"average_rating": 4.4,
"reviews": [
{
"author": "Attila Kukel",
"rating": 1,
"text": "Sajnos abszolút csalódás a hely. A vizsgálatot végző hölgy még csak be sem mutatkozott. A baba elbújt és még aludt is, ami természetesen nem a hölgy vagy a helyszín hibája. A vállvonogatás és a némileg flegma hangvételű \"nem tudok vele mit kezdeni\" már annál inkább. Szerintem ezt normálisan is el lehet mondani. Pár dolgot elmondott a babánkról, de abból én semmit nem hallottam, olyan halk volt. Ez nem is feltétlenül zavarta. Lőtt pár használhatatlan képet, mert azért a pénzénél akart lenni, majd kedvesen felajánlotta, hogy válasszunk. Csalódás a hely.\n\nSajnos nem tudok közvetlenül válaszolni, így itt írom lesz az észrevételeim:\nNagyon jókat hallottunk mi is a helyről, ezért is választottuk Önöket. Az ingyenes visszahívás lehetőségét sajnos csak az eset után olvastam, a vizsgálatot végző hölgy nem említette. Ahogy jeleztem, a baba nem megfelelő helyzete nem az Önök hibája, ezt nem is rónám fel senkinek. A helyzet nem jött ki jól és végül nem úgy távoztunk, ahogy eredetileg gondoltuk volna, ezért is írtam le a véleményem.\nSzerencsére a kismama jó egészségnek örvend, a baba pedig szépen cseperedik. Minden jót kívánok Önöknek!",
"date": null
},
{
"author": "RIVERS SOUL",
"rating": 5,
"text": "Győr-Moson-Sopron megyében a legjobbak! Kedves személyzet, jól felszerelt rendelő. Csak ajánlani tudom!",
"date": null
},
{
"author": "Kitti Bardos",
"rating": 5,
"text": "Mindennel teljesen meg voltunk elégedve. 😊 Csak ajánlani tudom, szerintem Győrben a legjobb, és a hölgy is nagyon barátságos volt! 😊",
"date": null
},
{
"author": "Krisztina Atkáry",
"rating": 5,
"text": "Nagyon aranyos a hölgy vidám és szimpatikus! Mindenkinek merem ajánlani!",
"date": null
},
{
"author": "róbert sárközi",
"rating": 5,
"text": "2 alkalommal voltam itt nagyon rendesek!",
"date": null
},
{
"author": "Imre Ábrahám",
"rating": 5,
"text": "Nagyon kedvesek és segítőkészek! Csak ajánlani tudom!",
"date": null
}
],
"source": "google-maps-scraper",
"postal_code": "9024",
"city": "Győr",
"street": "Bem tér 14/B",
"phone": "06 20 219 0555"
}
},
"error": null,
"metadata": {}
}
},
"overall_status": "completed",
"current_stage": "taxonomy_enrichment_alt",
"resume_from_stage": null,
"llm_usage_summary": {
"prompt_tokens": 5496,
"completion_tokens": 1461,
"total_tokens": 6957,
"cost": 0.00414285
}
}
Forrás: data/logs — név szerint illeszkedő .log fájlok (API/orchestrator: 9688c8da-b5df-43a6-b48c-0c5542d8dcba_*.log, CLI: pipeline_9688c8da_*.log).
data/logs/9688c8da-b5df-43a6-b48c-0c5542d8dcba_20260323_154824.log
2026-03-23 15:48:24 | INFO | Starting discovery-fetch-validation (async) for URL: http://4dultrahanggyor.hu/ 2026-03-23 15:48:24 | INFO | Async discovery config: fetch=curl, output=html, prediction=http://docker-host:8000/predict 2026-03-23 15:48:24 | INFO | Async crawl starting: http://4dultrahanggyor.hu/ (max_depth=2, max_concurrent=10) 2026-03-23 15:48:24 | INFO | Crawled (depth 0): http://4dultrahanggyor.hu/ 2026-03-23 15:48:24 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/index.html 2026-03-23 15:48:24 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/elerhetosegeink.html 2026-03-23 15:48:24 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/munkatarsaink.html 2026-03-23 15:48:24 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/vizsgalatainkaraink.html 2026-03-23 15:48:24 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/galeria.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/terkep.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/4dultrahangbabamozi.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/gyakorikerdesek.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/ossejtbank.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/partnereink.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/mikormenjunkvizsgalatra.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/hogyankeszuljunk.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/azultrahangelonyei.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/vendegkonyv.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/lagyreszek.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/errendszer.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/pajzsmirigy.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/hasieskismedencei.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/kismedencei.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/emlok.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/izuletek.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/babamozi.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/gyermekhasi.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/herezacsko.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/terhessegiesemenynaplo.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/ketvizsgalat.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/idokalkulator.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/babamozi2.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/babafejlodese.html 2026-03-23 15:48:25 | INFO | Crawled (depth 1): http://4dultrahanggyor.hu/30nap.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/vanepeteeres.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/ababaneme.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/javasoltuhidopontok.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/tervezettbabavaras.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/magzatianatomia.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/leletmagyarazat.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/utonevjegyzek.html 2026-03-23 15:48:25 | INFO | Crawled (depth 2): http://4dultrahanggyor.hu/karosdolgok.html 2026-03-23 15:48:25 | INFO | Crawl finished: 39 URLs in 1.0s (success=39, errors=0) 2026-03-23 15:48:41 | INFO | Crawl produced 2 URLs from BERT (threshold and above), fetching all 2026-03-23 15:48:41 | INFO | [URL 1/2] Fetching (BERT prob=1.00): http://4dultrahanggyor.hu/errendszer.html 2026-03-23 15:48:41 | INFO | [URL 1/2] OK (BERT prob=1.00) 2026-03-23 15:48:41 | INFO | [URL 2/2] Fetching (BERT prob=1.00): http://4dultrahanggyor.hu/hasieskismedencei.html 2026-03-23 15:48:41 | INFO | [URL 2/2] OK (BERT prob=1.00) 2026-03-23 15:48:41 | INFO | Discovery (async) completed with 2 page(s) 2026-03-23 15:48:41 | INFO | Detailed logs saved to: data/logs/9688c8da-b5df-43a6-b48c-0c5542d8dcba_20260323_154824.log