Kā veikt T testu programmā Excel

Satura rādītājs:

Kā veikt T testu programmā Excel
Kā veikt T testu programmā Excel
Anonim

T-tests ir veids, kā noteikt, vai starp datu kopām pastāv statistiski nozīmīgas atšķirības, izmantojot Stjudenta t sadalījumu. T-tests programmā Excel ir divu paraugu T-tests, kas salīdzina divu paraugu vidējos rādītājus. Šajā rakstā ir paskaidrots, ko nozīmē statistiskais nozīmīgums, un parādīts, kā programmā Excel veikt T-testu.

Šajā rakstā sniegtie norādījumi attiecas uz Excel 2019, 2016, 2013, 2010, 2007; Excel darbam ar Microsoft 365 un Excel Online.

Image
Image

Kas ir statistiskā nozīme?

Iedomājieties, ka vēlaties uzzināt, kurš no diviem kauliņiem sniegs labāku rezultātu. Jūs metat pirmo kauliņu un saņemat 2; tu met otro kauliņu un saņem 6. Vai tas norāda, ka otrais kauliņš parasti dod augstākus punktus? Ja jūs atbildējāt: “Protams, nē”, tad jums jau ir zināma izpratne par statistisko nozīmīgumu. Jūs saprotat, ka atšķirība radās nejaušas rezultāta maiņas dēļ, katru reizi, kad tiek mests kauliņš. Tā kā izlase bija ļoti maza (tikai viens rullītis), tas neuzrādīja neko nozīmīgu.

Tagad iedomājieties, ka metāt katru kauliņu 6 reizes:

  • Pirmais kauliņš met 3, 6, 6, 4, 3, 3; Vidējais=4,17
  • Otrais kauliņš met 5, 6, 2, 5, 2, 4; Vidējais=4,00

Vai tas tagad pierāda, ka pirmais kauliņš dod augstākus punktus nekā otrais? Visticamāk ne. Neliels paraugs ar relatīvi nelielu atšķirību starp vidējiem liek domāt, ka atšķirība joprojām ir nejaušu variāciju dēļ. Palielinoties metamo kauliņu skaitam, kļūst grūti sniegt veselā saprāta atbildi uz jautājumu – vai rezultātu starpība ir nejaušas variācijas rezultāts, vai arī viens, visticamāk, dos augstākus punktus nekā otrs?

Nozīmīgums ir iespējamība, ka novērotā atšķirība starp paraugiem ir saistīta ar nejaušām variācijām. Nozīmīgumu bieži sauc par alfa līmeni vai vienkārši “α”. Ticamības līmenis jeb vienkārši 'c' ir varbūtība, ka atšķirība starp paraugiem nav nejaušas variācijas dēļ; citiem vārdiem sakot, ka pastāv atšķirība starp pamata populācijām. Tāpēc: c=1 – α

Mēs varam iestatīt “α” jebkurā vēlamajā līmenī, lai justos pārliecināti, ka esam pierādījuši savu nozīmi. Ļoti bieži tiek izmantots α=5% (95% ticamība), bet, ja vēlamies būt patiesi pārliecināti, ka atšķirības nav radušās nejaušas variācijas dēļ, mēs varētu piemērot augstāku ticamības līmeni, izmantojot α=1% vai pat α=0,1. %.

Lai aprēķinātu nozīmīgumu dažādās situācijās, tiek izmantoti dažādi statistikas testi. T-testus izmanto, lai noteiktu, vai divu populāciju vidējie rādītāji ir atšķirīgi, un F-testus izmanto, lai noteiktu, vai atšķirības ir atšķirīgas.

Kāpēc pārbaudīt statistisko nozīmīgumu?

Salīdzinot dažādas lietas, mums ir jāizmanto nozīmīguma pārbaude, lai noteiktu, vai viena ir labāka par otru. Tas attiecas uz daudziem laukiem, piemēram:

  • Uzņēmējdarbībā cilvēkiem ir jāsalīdzina dažādi produkti un mārketinga metodes.
  • Sportā cilvēkiem ir jāsalīdzina dažāds aprīkojums, tehnika un konkurenti.
  • Inženierzinātnēs cilvēkiem ir jāsalīdzina dažādi dizaini un parametru iestatījumi.

Ja vēlaties pārbaudīt, vai kaut kas darbojas labāk nekā kaut kas cits, jebkurā jomā, jums ir jāpārbauda statistiskais nozīmīgums.

Kas ir studentu T-izplatījums?

A Stjudenta t sadalījums ir līdzīgs parastajam (vai Gausa) sadalījumam. Šie abi ir zvanveida sadalījumi, un vairums rezultātu ir tuvu vidējam, taču daži reti notikumi ir diezgan tālu no vidējā abos virzienos, ko dēvē par sadalījuma astes.

Precīza Studenta t sadalījuma forma ir atkarīga no izlases lieluma. Ja paraugi ir vairāk nekā 30, tas ir ļoti līdzīgs normālajam sadalījumam. Tā kā izlases lielums tiek samazināts, astes kļūst lielākas, kas liecina par palielinātu nenoteiktību, kas rodas, veicot secinājumus, pamatojoties uz nelielu paraugu.

Kā veikt T-testu programmā Excel

Pirms varat izmantot T-testu, lai noteiktu, vai pastāv statistiski nozīmīga atšķirība starp divu paraugu vidējiem rādītājiem, vispirms jāveic F-tests. Tas ir tāpēc, ka T-testam tiek veikti dažādi aprēķini atkarībā no tā, vai pastāv būtiska atšķirība starp novirzēm.

Lai veiktu šo analīzi, jums būs jāiespējo Analysis Toolpak pievienojumprogramma.

Analīzes rīkpaka pievienojumprogrammas pārbaude un ielāde

Lai pārbaudītu un aktivizētu analīzes rīku komplektu, veiciet šīs darbības:

  1. Atlasiet cilni FILE >atlasiet Opcijas.
  2. Opciju dialoglodziņā atlasiet Add-Ins no kreisās puses cilnēm.
  3. Loga apakšdaļā atlasiet nolaižamo izvēlni Pārvaldīt, pēc tam atlasiet Excel pievienojumprogrammas. Atlasiet Go.

    Image
    Image
  4. Pārliecinieties, ka ir atzīmēta izvēles rūtiņa blakus Analysis Toolpak, pēc tam atlasiet OK.

  5. Analīzes rīkpaka tagad ir aktīva, un jūs esat gatavs lietot F-testus un T-testus.

F-testa un T-testa veikšana programmā Excel

  1. Ievadiet divas datu kopas izklājlapā. Šajā gadījumā mēs apsveram divu produktu izpārdošanu nedēļas laikā. Tiek aprēķināta arī katra produkta vidējā dienas pārdošanas vērtība kopā ar tās standarta novirzi.

    Image
    Image
  2. Atlasiet cilni Data > Datu analīze

    Image
    Image
  3. Sarakstā atlasiet F-Test Two-Sample for Variances, pēc tam atlasiet OK.

    Image
    Image

    F-tests ir ļoti jutīgs pret nenormālību. Tāpēc var būt drošāk izmantot Welch testu, taču programmā Excel tas ir grūtāk.

  4. Atlasiet mainīgā 1 diapazonu un mainīgā 2 diapazonu; iestatīt Alfa (0,05 nodrošina 95% pārliecību); atlasiet šūnu izvades augšējā kreisajā stūrī, ņemot vērā, ka tas aizpildīs 3 kolonnas un 10 rindas. Atlasiet OK.

    Image
    Image

    Attiecībā uz mainīgo 1 diapazonu ir jāizvēlas paraugs ar lielāko standarta novirzi (vai dispersiju).

  5. Skatiet F-testa rezultātus, lai noteiktu, vai starp dispersijām ir būtiska atšķirība. Rezultāti sniedz trīs svarīgas vērtības:

    • F: attiecība starp novirzēm.
    • P(F<=f) one-tail: varbūtība, ka mainīgajam 1 faktiski nav lielāka dispersija nekā mainīgajam 2. Ja tas ir lielāks par alfa, kas parasti ir 0,05, tad starp novirzēm nav būtiskas atšķirības.
    • F Kritiskā viena aste: F vērtība, kas būtu nepieciešama, lai P(F<=f)=α. Ja šī vērtība ir lielāka par F, tas arī norāda, ka starp novirzēm nav būtiskas atšķirības.

    P(F<=f) var arī aprēķināt, izmantojot funkciju FDIST ar F un brīvības pakāpi katram paraugam kā ievadi. Brīvības pakāpes ir vienkārši novērojumu skaits paraugā mīnus viens.

  6. Tagad, kad zināt, vai pastāv atšķirības starp novirzēm, varat atlasīt atbilstošo T-testu. Atlasiet cilni Data > Datu analīze, pēc tam atlasiet vai nu t-Test: Two-Sample Assuming Equal Variancesvai t-tests: divu paraugu pieņemšana, ka ir nevienlīdzīgas novirzes

    Image
    Image
  7. Neatkarīgi no tā, kuru opciju izvēlējāties iepriekšējā darbībā, jums tiks parādīts tas pats dialoglodziņš, lai ievadītu analīzes datus. Lai sāktu, atlasiet diapazonus, kas satur paraugus Variable 1 Range un Variable 2 Range..

    Image
    Image
  8. Pieņemot, ka vēlaties pārbaudīt, vai nav atšķirības starp vidējiem, iestatiet vērtību Hypothesized Mean Difference uz nulli.
  9. Iestatiet nozīmīguma līmeni Alfa (0,05 nodrošina 95% ticamību) un atlasiet šūnu izvades augšējā kreisajā stūrī, ņemot vērā, ka tas aizpildīs 3 kolonnas un 14 rindas. Atlasiet OK.
  10. Pārskatiet rezultātus, lai izlemtu, vai pastāv būtiska atšķirība starp līdzekļiem.

    Tāpat kā ar F-testu, ja p vērtība, šajā gadījumā P(T<=t), ir lielāka par alfa, tad nav būtiskas atšķirības. Tomēr šajā gadījumā ir dotas divas p vērtības, viena vienas astes pārbaudei un otra divu astes pārbaudei. Šajā gadījumā izmantojiet divu astes vērtību, jo jebkuram mainīgajam ar lielāku vidējo vērtību būtu būtiska atšķirība.

Ieteicams: