|
Velká data - extrakce klíčových informací pomocí metod matematické statistiky a strojového učení
Masák, Tomáš ; Antoch, Jaromír (vedoucí práce)
Tato práce se zabývá metodami zpracování dat, zejména analýzou hlav- ních komponent a její øídkou modi kací (AØHK), která je NP-tì¾kou úlohou. Úlohu AØHK lze pøepsat do regresního kontextu, ve kterém je øídkost typicky vynucována pomocí ℓ1-penalizace regresních koe cientù. V této práci navrhujeme pou¾ít iterativní pøeva¾ování ℓ2-penalizace namísto zmínìného ℓ1-pøístupu. Vý- sledný algoritmus porovnáváme s nìkolika známými algoritmy pro AØHK pomocí simulaèní studie a také zajímavého praktického pøíkladu, ve kterém analyzujeme data o hlasování poslancù v Parlamentu Èeské republiky. Experimentálnì uka- zujeme, ¾e námi navr¾ený algoritmus produkuje lep¹í výsledky ne¾ ostatní uva- ¾ované algoritmy. Pro navr¾ený algoritmus uvádíme té¾ dùkaz konvergence spolu s dùkazem konvergence pùvodního regresního pøístupu k AØHK. v
|
|
Velká data - extrakce klíčových informací pomocí metod matematické statistiky a strojového učení
Masák, Tomáš ; Antoch, Jaromír (vedoucí práce)
Tato práce se zabývá metodami zpracování dat, zejména analýzou hlav- ních komponent a její øídkou modi kací (AØHK), která je NP-tì¾kou úlohou. Úlohu AØHK lze pøepsat do regresního kontextu, ve kterém je øídkost typicky vynucována pomocí ℓ1-penalizace regresních koe cientù. V této práci navrhujeme pou¾ít iterativní pøeva¾ování ℓ2-penalizace namísto zmínìného ℓ1-pøístupu. Vý- sledný algoritmus porovnáváme s nìkolika známými algoritmy pro AØHK pomocí simulaèní studie a také zajímavého praktického pøíkladu, ve kterém analyzujeme data o hlasování poslancù v Parlamentu Èeské republiky. Experimentálnì uka- zujeme, ¾e námi navr¾ený algoritmus produkuje lep¹í výsledky ne¾ ostatní uva- ¾ované algoritmy. Pro navr¾ený algoritmus uvádíme té¾ dùkaz konvergence spolu s dùkazem konvergence pùvodního regresního pøístupu k AØHK. v
|
|
Velká data - extrakce klíčových informací pomocí metod matematické statistiky a strojového učení
Masák, Tomáš ; Antoch, Jaromír (vedoucí práce) ; Maciak, Matúš (oponent)
Tato práce se zabývá metodami zpracování dat, zejména analýzou hlav- ních komponent a její øídkou modi kací (AØHK), která je NP-tì¾kou úlohou. Úlohu AØHK lze pøepsat do regresního kontextu, ve kterém je øídkost typicky vynucována pomocí ℓ1-penalizace regresních koe cientù. V této práci navrhujeme pou¾ít iterativní pøeva¾ování ℓ2-penalizace namísto zmínìného ℓ1-pøístupu. Vý- sledný algoritmus porovnáváme s nìkolika známými algoritmy pro AØHK pomocí simulaèní studie a také zajímavého praktického pøíkladu, ve kterém analyzujeme data o hlasování poslancù v Parlamentu Èeské republiky. Experimentálnì uka- zujeme, ¾e námi navr¾ený algoritmus produkuje lep¹í výsledky ne¾ ostatní uva- ¾ované algoritmy. Pro navr¾ený algoritmus uvádíme té¾ dùkaz konvergence spolu s dùkazem konvergence pùvodního regresního pøístupu k AØHK. v
|