Original title:
Testy ekvivalence
Translated title:
Equivalence testing
Authors:
Krejčová, Kateřina ; Hlávka, Zdeněk (advisor) ; Antoch, Jaromír (referee) Document type: Bachelor's theses
Year:
2024
Language:
cze Abstract:
[cze][eng] V této bakalářské práci se zabýváme testy ekvivalence využívanými v případech, kdy potřebujeme dokázat platnost tvrzení, které standardně dáváme do nulové hypotézy. Uve- deme postup řešení těchto testů nazvaný princip inkluze intervalu spolehlivosti. Poté se budeme věnovat dvěma vybraným testům ekvivalence pro párová data a ukážeme využití těchto testů na porovnání kvality nově vyvíjených algoritmů založených na umělé inteli- genci se současně používanými metodami. Prvním testem ekvivalence je modifikace páro- vého t-testu, druhým pak modifikovaný asymptotický McNemarův test. Součástí práce je u obou testů ekvivalence odvození plánování rozsahu výběru. Jejich použití poté demon- strujeme na reálných případech testování kvality algoritmů umělé inteligence používaných ve zdravotnictví. 1In this thesis, we focus on equivalence tests used in situation where we need to prove the validity of statements usually framed as null hypothesis. We present a procedure used for solving these tests called the confidence interval inclusion principle. We then discuss two selected equivalence tests for paired data. Using these tests, we demonstrate the comparison of quality of newly developed artificial intelligence-based algorithms with currently used methods. The first equivalence test is a modification of the paired t-test, and the second is a modified asymptotic McNemar test. For both tests, we present sample size calculation. Afterwards we show usage of these tests in quality testing of algorithms based on artificial intelligence which are applied in healthcare. 1
Keywords:
hypothesis|test statistic|equivalence; hypotéza|testová statistika|ekvivalence
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/191836