Název:
Hledání odpovědi v odpovědích
Překlad názvu:
Finding the answer in the answers
Autoři:
Záhumenský, Jakub ; Vidová Hladká, Barbora (vedoucí práce) ; Bojar, Ondřej (oponent) Typ dokumentu: Bakalářské práce
Rok:
2011
Jazyk:
slo
Abstrakt: [eng][cze] Title : Searching for the answer in answers Author : Jakub Záhumenský Contact : zahumensky.jakub@gmail.com Department : Institute of Formal and Applied Linguistics Supervisor : Mgr. Barbora Vidová Hladká, Ph.D. Contact on supervisor : hladka@ufal.mff.cuni.cz Abstract : We design a question-answering system Interviewer that enables users to fictionally (virtually) interview this person by asking questions as similar as possible to questions that journalists have already asked. The interviews with a given person posted on the web are being collected as a corpus of (question, answer) pairs. The user asks his/her question and the Interviewer system searches questions in the corpus to provide the answer that belongs to the most similar question. Matching questions is based on the frequency analysis and on the applications coming from natural language processing, namely tagging and parsing. We work with the interviews with Vaclav Havel posted on his personal page.Názov práce : Hľadanie odpovedí v odpovediach Autor : Jakub Záhumenský Kontakt : zahumensky.jakub@gmail.com Katedra : Ústav formalní a aplikované lingvistiky Vedúca práce : Mgr. Barbora Vidová Hladká, Ph.D. Kontakt : hladka@ufal.mff.cuni.cz Abstrakt : Témou tejto práce je navrhnúť a implementovať dialógový systém, ktorý bude simulovať rozhovor uživateľa s reálnou osobnosťou. Využívať budeme korpus reálnych rozhovorov zozbieraných z webových stránok. V implementácii budeme používať prístup vyhľadávania najpodobnejšej otázky v korpuse s otázkou uživateľa. Odpoveďou na uživateľovu otázku bude následne odpoveď na nájdenú najpodobnejšiu otázku z korpusu. V práci budeme využívať morfologickú a syntaktickú rovinu jazyka, rovnako ako frekvenčnú analýzu pomocou tf-idf váh, na určenie najpodobnejšej otázky. Otázky budú zozbierané v korpuse, ktorého vytvorenie je súčasťou tejto práce. Konkrétne v tejto práci budeme zbierať rozhovory s významnou českou osobnosťou, Václavom Havlom. Aplikácia bude pracovať s textami v českom jazyku.
Klíčová slova:
dialógový systém; frekvenčná analýza; korpus; morfologická analýza; syntaktická analýza; tf x idf váhy; tool_chain; Václav Havel; corpus; dialogue system; frequency analysis; morphological analysis; syntactical analysis; tf x idf weights; tool_chain; Václav Havel