okoun píše:takže dle vás xml neexituje? škoda mě se s tím xml celkem dobře dělalo (parsovalo)
auby: jo ... jenže když máš celý okres i s kusem vedlejšího, tak je to na***. Ty CSV jsou asi nakonec lepší.
okoun píše:takže dle vás xml neexituje? škoda mě se s tím xml celkem dobře dělalo (parsovalo)
ludvik píše:Že jsem se na to nevykašlal.
V záznamech mám samozřejmě jen údaje Ulice, čp, psč a město. Jak to dokážete párovat na RÚIAN? Ono to totiž není jednoznačné.
Např. mám obec Církvice. V číselníku jsou dvě. Kódy 599476 a 533998. První obsahuje jen jednu Část obce s názvem Církvice a druhá také jen jednu s názvem Jakub. Přitom je to jedna obec. Evidovaná jako dvě obce. A v tu ránu jsem pěkně v čudu, protože jsem nikdy neměl potřebu někam zapisovat části obcí ... O nich ani nevím, zda je podmínka jednoznačnosti v rámci státu. Když prokazatelně není ani v názvech obcí (např. Popůvky).
Přitom je podmínka, že ulice jednoznačné v rámci obce jsou ... ale dát si do kupy obec-část-ulice je v podstatě nad mé síly. Místo elegantního SQL abych vymýšlel AI.
ludvik píše:Že jsem se na to nevykašlal.
V záznamech mám samozřejmě jen údaje Ulice, čp, psč a město. Jak to dokážete párovat na RÚIAN? Ono to totiž není jednoznačné.
Např. mám obec Církvice. V číselníku jsou dvě. Kódy 599476 a 533998. První obsahuje jen jednu Část obce s názvem Církvice a druhá také jen jednu s názvem Jakub. Přitom je to jedna obec. Evidovaná jako dvě obce. A v tu ránu jsem pěkně v čudu, protože jsem nikdy neměl potřebu někam zapisovat části obcí ... O nich ani nevím, zda je podmínka jednoznačnosti v rámci státu. Když prokazatelně není ani v názvech obcí (např. Popůvky).
Přitom je podmínka, že ulice jednoznačné v rámci obce jsou ... ale dát si do kupy obec-část-ulice je v podstatě nad mé síly. Místo elegantního SQL abych vymýšlel AI.
Edit: beru zpět. Jsou to dvě různé obce. Ale na složitosti zpracování to zase tolik nemění.
svestka píše:
Osobně si počkám s čím přijde ISPA v Přerově. Pevně doufám, že to bude nějaké API napojené na DB, kde se mi podaří automaticky to spárovat třeba v 90% případů, to co zbude jako nejednoznačné holt bude ruční práce.
kraljan píše:Téměř vždy stačí PSČ, Obec, Ulice a číslo popisné.
ludvik píše:kraljan píše:Téměř vždy stačí PSČ, Obec, Ulice a číslo popisné.
Jenže PSČ je v té validaci další proměnná, která je ve spoustě případů špatně. Zvlášť u menších obcí, kde lidi uvádí (a ono to i funguje) třeba několik různých PSČ, v závislosti na historických událostech, datu narození a možná i postavení planet v době křtu.
To je fuk. Prostě se to musí přežít a validovat při pořizování. Je to sice víc práce (napsat to je rychlejší, než výběr z číselníků), ale ta správnost za to možná nakonec stojí.
kraljan píše: ... Proto i moje poznámka že očekávání 10% chyb je hodně optimistické. Můj odhad je, že plné automatické spárování bude tak maximálně do 50% a když někdo bez předchozí validace tuto hodnotu přesáhne, tak bude moct být jedině rád.