Název:
Information analysis of census data by using statistical models
Překlad názvu:
Informační analýza dat ze sčítání lidu pomocí statistických modelů
Autoři:
Grim, Jiří ; Hora, J. ; Boček, Pavel ; Somol, Petr ; Pudil, P. Typ dokumentu: Příspěvky z konference Konference/Akce: Statistics - Investment in the Future, Prague (CZ), 2004-09-06 / 2004-09-07
Rok:
2004
Jazyk:
eng
Abstrakt: [eng][cze] We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných
Klíčová slova:
information analysis; statistical databases; statistical models Číslo projektu: CEZ:AV0Z1075907 (CEP), 507752, GA402/02/1271 (CEP) Poskytovatel projektu: GA ČR Zdrojový dokument: Proceedings of the International Conference on Statistics - Investment in the Future
Instituce: Ústav teorie informace a automatizace AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0013496