|
Vytěžování textu z fotografií
Kindermann, Hubert ; Blažek, Jan (vedoucí práce) ; Kolomazník, Jan (oponent)
Představujeme postup řešení jednotlivých kroků potřebných k binarizaci a segmentaci řádků textu obsažených ve fotografiích stránek tištěného textu. Uvádíme způsob normalizace neuniformního osvětlení fotografie. Navrhujeme algoritmus pro binarizaci vstupní bitmapy založený na dvou- dimenzionálním pravděpodobnostním modelu pixelu, který bere v úvahu i jeho okolí. Pokračujeme popisem robustního detektoru orientace řádků textu založeného na optimalizaci účelové funkce vycházející z prvních derivací obrazové funkce. Nakonec se zabýváme detekcí jednotlivých řádků textu a jejich následnou segmentací. Tvary výsledných řádků textu na závěr optimalizujeme pomocí grafového algoritmu. Powered by TCPDF (www.tcpdf.org)
|
|
Vytěžování textu ze strojově psaných dokumentů
Kindermann, Hubert ; Blažek, Jan (vedoucí práce) ; Kolomazník, Jan (oponent)
V předložené práci řešíme problém extrakce a rozpoznání znaků z tištěných dokumentů digitalizovaných skenerem nebo fotoaparátem. Uvádíme způsob normalizace osvětlení dokumentů rezistentní vůči šumu. Pokračujeme extrakcí jednotlivých znaků z dokumentu a následně jejich rozpoznáním pomocí systému vícevrstvých neurálních sítí s dopředným šířením. Okrajově se zabýváme zpracováním výsledné množiny rozpoznaných symbolů, které je nezbytné pro další práci s vytěženým textem. Posledním krokem je korekce výstupu založená na okolích jednotlivých znaků. Podařilo se nám implementovat automatický systém obsahující všechny zmíněné komponenty.
|
|
Vytěžování textu z fotografií
Kindermann, Hubert ; Blažek, Jan (vedoucí práce) ; Kolomazník, Jan (oponent)
Představujeme postup řešení jednotlivých kroků potřebných k binarizaci a segmentaci řádků textu obsažených ve fotografiích stránek tištěného textu. Uvádíme způsob normalizace neuniformního osvětlení fotografie. Navrhujeme algoritmus pro binarizaci vstupní bitmapy založený na dvou- dimenzionálním pravděpodobnostním modelu pixelu, který bere v úvahu i jeho okolí. Pokračujeme popisem robustního detektoru orientace řádků textu založeného na optimalizaci účelové funkce vycházející z prvních derivací obrazové funkce. Nakonec se zabýváme detekcí jednotlivých řádků textu a jejich následnou segmentací. Tvary výsledných řádků textu na závěr optimalizujeme pomocí grafového algoritmu. Powered by TCPDF (www.tcpdf.org)
|
|
Vytěžování textu ze strojově psaných dokumentů
Kindermann, Hubert ; Blažek, Jan (vedoucí práce) ; Kolomazník, Jan (oponent)
V předložené práci řešíme problém extrakce a rozpoznání znaků z tištěných dokumentů digitalizovaných skenerem nebo fotoaparátem. Uvádíme způsob normalizace osvětlení dokumentů rezistentní vůči šumu. Pokračujeme extrakcí jednotlivých znaků z dokumentu a následně jejich rozpoznáním pomocí systému vícevrstvých neurálních sítí s dopředným šířením. Okrajově se zabýváme zpracováním výsledné množiny rozpoznaných symbolů, které je nezbytné pro další práci s vytěženým textem. Posledním krokem je korekce výstupu založená na okolích jednotlivých znaků. Podařilo se nám implementovat automatický systém obsahující všechny zmíněné komponenty.
|