Original title:
Classifier Based on Inverted Indexes of Neighbors
Translated title:
Klasifikátor založený na inverzních hodnotách indexů
Authors:
Jiřina, Marcel ; Jiřina jr., M. Document type: Research reports
Year:
2008
Language:
eng Series:
Technical Report, volume: V-1034 Abstract:
[eng][cze] A new method for the classification of data into classes is presented. The method is based on the sum of reciprocals of neighbors' indexes. We show that neighbors' indexes are in close relation to the polynomial transform of the neighbors' distances. The sum of the reciprocals of indexes for all neighbors forms truncated harmonic series due to a finite number of its elements. For the neighbors of one class there is a sum of the selected elements of this truncated series. It is proved that the ratio of these sums gives just the probability that the point to be classified -- the query point -- is of that class. The classification ability is demonstrated on real-life data from the Machine Learning Repository and the results are compared with published results obtained through other methods.Je prezentována teorie nové metody pro klasifikaci dat do tříd. Metoda je založena na součtech reciprokých hodnot indexů sousedů. Ukazuje se, že indexy sousedů jsou v úzkém vztahu k přibližné polynomiální aproximaci transformace vzdáleností sousedů. Součet těchto převrácených hodnot tvoří useknutou harmonickou řadu v důsledku konečného počtu pvků. Pro sousedy jedné třídy se vytváří součet vybraných prvků této řady. Dokazuje se, že poměr těchto součtů dává právě odhad pravděpodobnosti, že dotazový bod patří do právě té třídy. Schopnosti klasifikace jsou ukázány na praktických datech z UCI MLR a výsledky jsou porovnány s publikovanými výsledky jiných metod.
Keywords:
classification; correlation dimension; correlation integral; decomposition; harmonic series; multivariate data; probability density estimation Project no.: CEZ:AV0Z10300504 (CEP), 1M0567 (CEP) Funding provider: GA MŠk
Rights: This work is protected under the Copyright Act No. 121/2000 Coll.