Original title:
Information analysis of census data by using statistical models
Translated title:
Informační analýza dat ze sčítání lidu pomocí statistických modelů
Authors:
Grim, Jiří ; Hora, J. ; Boček, Pavel ; Somol, Petr ; Pudil, P. Document type: Papers Conference/Event: Statistics - Investment in the Future, Prague (CZ), 2004-09-06 / 2004-09-07
Year:
2004
Language:
eng Abstract:
[eng][cze] We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných
Keywords:
information analysis; statistical databases; statistical models Project no.: CEZ:AV0Z1075907 (CEP), 507752, GA402/02/1271 (CEP) Funding provider: GA ČR Host item entry: Proceedings of the International Conference on Statistics - Investment in the Future
Institution: Institute of Information Theory and Automation AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0013496