T-test on võimalus otsustada, kas andmekogumite vahel on statistiliselt olulisi erinevusi, kasutades Studenti t-jaotust. Exceli T-test on kahe valimiga T-test, mis võrdleb kahe valimi keskmisi. See artikkel selgitab, mida tähendab statistiline olulisus, ja näitab, kuidas Excelis T-testi teha.
Selles artiklis olevad juhised kehtivad Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365 ja Excel Online jaoks.
Mis on statistiline olulisus?
Kujutage ette, et soovite teada, milline kahest täringust annab parema tulemuse. Viskad esimest täringut ja saad 2; viskad teist täringut ja saad 6. Kas see ütleb teile, et teine täring annab tavaliselt kõrgemaid punkte? Kui vastasite "Muidugi mitte", siis on teil statistilisest olulisusest juba teatav arusaam. Saate aru, et erinevus tulenes skoori juhuslikust muutumisest iga kord, kui täringut visatakse. Kuna valim oli väga väike (ainult üks rull), ei näidanud see midagi olulist.
Kujutage nüüd ette, et viskate iga täringut 6 korda:
- Esimene täring viskab 3, 6, 6, 4, 3, 3; Keskmine=4,17
- Teine täring viskab 5, 6, 2, 5, 2, 4; Keskmine=4,00
Kas see tõestab nüüd, et esimene täring annab kõrgema hinde kui teine? Ilmselt mitte. Väike valim, mille keskmiste erinevus on suhteliselt väike, muudab tõenäoliseks, et erinevus tuleneb ikkagi juhuslikest variatsioonidest. Täringuviskamiste arvu suurendades muutub mõistusevastane vastus küsimusele raskeks anda – kas skooride erinevus tuleneb juhuslikust varieerumisest või annab üks tõenäolisem alt kõrgemaid punkte kui teine?
Olulisus on tõenäosus, et vaadeldav erinevus proovide vahel on tingitud juhuslikest variatsioonidest. Olulisust nimetatakse sageli alfatasemeks või lihts alt α-ks. Usaldusväärsuse tase või lihts alt 'c' on tõenäosus, et valimite erinevus ei ole tingitud juhuslikust variatsioonist; teisisõnu, et aluspopulatsioonide vahel on erinevus. Seetõttu: c=1 – α
Saame seada α mis tahes tasemele, et olla kindlad, et oleme tõestanud oma tähtsust. Väga sageli kasutatakse α=5% (95% usaldus), kuid kui tahame olla tõesti kindlad, et erinevused ei ole põhjustatud juhuslikust variatsioonist, võime rakendada kõrgemat usaldustaset, kasutades α=1% või isegi α=0,1 %.
Erinevates olukordades olulisuse arvutamiseks kasutatakse erinevaid statistilisi teste. T-teste kasutatakse selleks, et teha kindlaks, kas kahe populatsiooni keskmised on erinevad, ja F-teste, et teha kindlaks, kas dispersioonid on erinevad.
Miks testida statistilist olulisust?
Erinevate asjade võrdlemisel peame kasutama olulisuse testimist, et teha kindlaks, kas üks on teisest parem. See kehtib paljude väljade kohta, näiteks:
- Ettevõtluses peavad inimesed võrdlema erinevaid tooteid ja turundusmeetodeid.
- Spordis peavad inimesed võrdlema erinevaid seadmeid, tehnikaid ja konkurente.
- Inseneritöös peavad inimesed võrdlema erinevaid disainilahendusi ja parameetrite seadistusi.
Kui soovite testida, kas miski toimib mis tahes valdkonnas paremini kui miski muu, peate testima statistilist olulisust.
Mis on üliõpilaste T-jaotus?
A Studenti t-jaotus on sarnane normaaljaotusele (või Gaussi jaotusele). Need mõlemad on kellakujulised jaotused, mille enamik tulemusi on keskmisele lähedased, kuid mõned haruldased sündmused on mõlemas suunas keskmisest üsna kaugel, mida nimetatakse jaotuse sabadeks.
Studentide t-jaotuse täpne kuju sõltub valimi suurusest. Rohkem kui 30 proovi puhul on see väga sarnane normaaljaotusega. Valimi suuruse vähendamisel muutuvad sabad suuremaks, mis näitab suurenenud ebakindlust, mis tuleneb väikese valimi põhjal järelduste tegemisest.
Kuidas Excelis T-testi teha
Enne kui saate rakendada T-testi, et teha kindlaks, kas kahe valimi keskmiste vahel on statistiliselt oluline erinevus, peate esm alt sooritama F-testi. Selle põhjuseks on asjaolu, et T-testi jaoks tehakse erinevaid arvutusi sõltuv alt sellest, kas dispersioonide vahel on oluline erinevus.
Selle analüüsi tegemiseks on vaja Analysis Toolpaki lisandmoodulit.
Analüüsi tööriistapaki lisandmooduli kontrollimine ja laadimine
Analüüsi tööriistakomplekti kontrollimiseks ja aktiveerimiseks järgige neid samme:
- Valige vahekaart FILE >valige Valikud.
- Valige dialoogiboksis Valikud vasakpoolsetelt vahekaartidelt Lisandmoodulid.
-
Valige akna allosas rippmenüü Halda ja seejärel Exceli lisandmoodulid. Valige Mine.
-
Veenduge, et märkeruut Analysis Toolpak on märgitud, seejärel valige OK.
- Analüüsi tööriistapakett on nüüd aktiivne ja olete valmis F-teste ja T-teste rakendama.
F-testi ja T-testi sooritamine Excelis
-
Sisestage arvutustabelisse kaks andmekogumit. Sel juhul kaalume kahe toote müüki nädala jooksul. Arvutatakse ka iga toote keskmine päevane müügiväärtus koos selle standardhälbega.
-
Valige vahekaart Data > Andmete analüüs
-
Valige loendist F-Test Two-Sample for Variances, seejärel valige OK.
F-test on ebanormaalsuse suhtes väga tundlik. Seetõttu võib Welchi testi kasutamine olla ohutum, kuid Excelis on see keerulisem.
-
Valige muutuja 1 vahemik ja muutuja 2 vahemik; määra Alfa (0,05 annab 95% kindlustunde); valige väljundi vasakpoolses ülanurgas lahter, arvestades, et see täidab 3 veergu ja 10 rida. Valige OK.
Muutuja 1 vahemiku jaoks tuleb valida suurima standardhälbega (või dispersiooniga) valim.
-
Vaadake F-testi tulemusi, et teha kindlaks, kas dispersioonide vahel on oluline erinevus. Tulemused annavad kolm olulist väärtust:
- F: dispersioonide suhe.
- P(F<=f) one-tail: tõenäosus, et muutujal 1 ei ole tegelikult suurem dispersioon kui muutujal 2. Kui see on suurem kui alfa, mis on üldiselt 0,05, siis pole erinevuste vahel olulist erinevust.
- F Kriitiline ühe sabaga: F väärtus, mida oleks vaja, et P(F<=f)=α. Kui see väärtus on suurem kui F, näitab see ka seda, et erinevuste vahel pole olulist erinevust.
P(F<=f) saab arvutada ka funktsiooni FDIST abil, mille sisenditeks on F ja iga valimi vabadusastmed. Vabadusastmed on lihts alt vaatluste arv valimis miinus üks.
-
Nüüd, kui teate, kas dispersioonide vahel on erinevusi, saate valida sobiva T-testi. Valige vahekaart Data > Data Analysis, seejärel valige kas t-Test: Two-Sample Assuming Equal Variancesvõi t-test: kahe valimiga, eeldades ebavõrdseid hälbeid
-
Sõltumata sellest, millise valiku te eelmises etapis valisite, kuvatakse teile analüüsi üksikasjade sisestamiseks sama dialoogiboks. Alustuseks valige vahemikud, mis sisaldavad näidiseid Muutuja 1 Vahemik ja Muutuja 2 Vahemik.
- Eeldades, et soovite testida, kas keskmiste vahel pole erinevusi, määrake Hüpoteesitud keskmine erinevus nullile.
- Määrake olulisuse tase Alfa (0,05 annab 95% usaldusväärsuse) ja valige väljundi vasakpoolses ülanurgas lahter, arvestades, et see täidab 3 veergu ja 14 rida. Valige OK.
-
Vaadake tulemused üle, et otsustada, kas vahendite vahel on märkimisväärne erinevus.
Täpselt nagu F-testi puhul, kui p-väärtus, antud juhul P(T<=t), on suurem kui alfa, siis pole olulist erinevust. Kuid sel juhul on antud kaks p-väärtust, üks ühe saba testi jaoks ja teine kahe saba testi jaoks. Sel juhul kasutage kahe saba väärtust, kuna kumbki muutuja, millel on suurem keskmine, oleks märkimisväärne erinevus.