Název: Vylepšení metod tokenizace pro vícejazyčné modely
Překlad názvu: Improving Subword Tokenization Methods for Multilingual Models
Autoři: Balhar, Jiří ; Limisiewicz, Tomasz (vedoucí práce) ; Popel, Martin (oponent)
Typ dokumentu: Diplomové práce
Rok: 2023
Jazyk: eng
Abstrakt: [eng] [cze]

Klíčová slova: natural language processing|multilingual language models|subword tokenization|NLP; natural language processing|multilingual language models|subword tokenization|NLP

Instituce: Fakulty UK (VŠKP) (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři UK.
Původní záznam: http://hdl.handle.net/20.500.11956/184045

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-534582


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Univerzita Karlova > Fakulty UK (VŠKP)
Vysokoškolské kvalifikační práce > Diplomové práce
 Záznam vytvořen dne 2023-10-01, naposledy upraven 2024-01-26.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet