Kā palaist regresiju programmā Excel

Satura rādītājs:

Kā palaist regresiju programmā Excel
Kā palaist regresiju programmā Excel
Anonim

Regresija programmā Excel ir veids, kā automatizēt statistisko procesu vairāku informācijas kopu salīdzināšanai, lai noskaidrotu, kā neatkarīgo mainīgo izmaiņas ietekmē atkarīgo mainīgo izmaiņas. Ja kādreiz esat vēlējies atrast korelāciju starp divām lietām, regresijas analīzes izmantošana programmā Excel ir viens no labākajiem veidiem, kā to izdarīt.

Šajā rakstā sniegtie norādījumi attiecas uz programmām Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Kāda ir regresijas nozīme?

Regresija ir statistiskās modelēšanas pieeja, ko analītiķi izmanto, lai noteiktu attiecības starp vairākiem mainīgajiem.

Regresijas analīze sākas ar vienu mainīgo, ko mēģināt analizēt, un neatkarīgiem mainīgajiem, ko pārbaudāt, lai noskaidrotu, vai tie ietekmē šo vienu mainīgo. Analīzē tiek aplūkotas izmaiņas neatkarīgajos mainīgajos un mēģināts saistīt šīs izmaiņas ar izmaiņām vienā (atkarīgajā) mainīgajā.

Tas var izklausīties pēc uzlabotas statistikas, taču programma Excel padara šo sarežģīto analīzi pieejamu ikvienam.

Lineārās regresijas veikšana programmā Excel

Vienkāršākā regresijas analīzes forma ir lineārā regresija. Vienkāršā lineārā regresija aplūko attiecības tikai starp diviem mainīgajiem.

Piemēram, šajā izklājlapā ir parādīti dati, kas satur kaloriju skaitu, ko cilvēks ēda katru dienu, un viņa svaru šajā dienā.

Image
Image

Tā kā šajā izklājlapā ir divas datu kolonnas un viens mainīgais var ietekmēt otru, varat veikt šo datu regresijas analīzi, izmantojot programmu Excel.

Analysis ToolPak pievienojumprogrammas iespējošana

Lai varētu izmantot Excel regresijas analīzes līdzekli, Excel opciju ekrānā ir jāiespējo Analysis ToolPak papildinājums.

  1. Programmā Excel atlasiet izvēlni File un izvēlieties Options.

    Image
    Image
  2. Kreisajā navigācijas izvēlnē atlasiet Add-ins. Pēc tam pārliecinieties, vai laukā Manage ir atlasīts Excel pievienojumprogrammas.

    Image
    Image
  3. Visbeidzot atlasiet pogu Go.

    Image
    Image
  4. Uznirstošajā logā Add-ins. Iespējojiet Analysis ToolPack, noklikšķinot uz lodziņa tās priekšā, lai pievienotu atzīmi, un atlasiet OK.

    Image
    Image

Tagad, kad Analysis ToolPak ir iespējots, varat sākt veikt regresijas analīzi programmā Excel.

Kā veikt vienkāršu lineāro regresiju programmā Excel

Izmantojot svara un kaloriju izklājlapu kā piemēru, varat veikt lineārās regresijas analīzi programmā Excel šādi.

  1. Atlasiet izvēlni Data. Pēc tam grupā Analysis atlasiet Data Analysis..

    Image
    Image
  2. Logā Data Analysis sarakstā atlasiet Regression un noklikšķiniet uz OK.

    Image
    Image
  3. Ievades Y diapazons ir šūnu diapazons, kas satur atkarīgo mainīgo. Šajā piemērā tas ir svars. Ievades X diapazons ir šūnu diapazons, kas satur neatkarīgo mainīgo. Šajā piemērā tā ir kaloriju sleja.

    Image
    Image
  4. Galvenes šūnām atlasiet Labels un pēc tam atlasiet New Worksheet, lai nosūtītu rezultātus uz jaunu darblapu. Atlasiet OK, lai programma Excel palaistu analīzi un nosūtītu rezultātus jaunā lapā.

    Image
    Image
  5. Pārbaudiet jauno darblapu. Analīzes izvadei ir vairākas vērtības, kas jums jāsaprot, lai interpretētu rezultātus.

    Image
    Image

    Katram no šiem cipariem ir šāda nozīme:

    • Vairāki R: korelācijas koeficients. 1 norāda uz spēcīgu korelāciju starp diviem mainīgajiem, savukārt -1 nozīmē, ka pastāv spēcīga negatīva saikne. 0 nozīmē, ka nav korelācijas.
    • R Kvadrāts: Determinācijas koeficients, kas parāda, cik punktu starp diviem mainīgajiem atrodas uz regresijas taisnes. Statistiski šī ir noviržu kvadrātā summa no vidējās vērtības.
    • Pielāgots R kvadrāts: statistikas vērtība, ko sauc par R kvadrātu, kas ir pielāgota jūsu izvēlēto neatkarīgo mainīgo skaitam.
    • Standarta kļūda: cik precīzi ir regresijas analīzes rezultāti. Ja šī kļūda ir maza, jūsu regresijas rezultāti ir precīzāki.
    • Novērojumi: novērojumu skaits jūsu regresijas modelī.

    Pārējās vērtības regresijas izvadē sniedz sīkāku informāciju par mazākiem komponentiem regresijas analīzē.

    • df: statistiskā vērtība, kas pazīstama kā brīvības pakāpes saistībā ar dispersijas avotiem.
    • SS: kvadrātu summa. Kvadrātu atlikušās summas attiecībai pret kopējo SS jābūt mazākai, ja lielākā daļa datu atbilst regresijas līnijai.
    • MS: regresijas datu vidējais kvadrāts.
    • F: F statistika (F-tests) nulles hipotēzei. Tas nodrošina regresijas modeļa nozīmi.
    • Nozīmīgums F: statistiskā vērtība, kas pazīstama kā F P vērtība.

    Ja neizprotat statistiku un regresijas modeļu aprēķināšanu, kopsavilkuma apakšdaļā esošajām vērtībām nebūs lielas nozīmes. Tomēr vairāki R un R kvadrāti ir divi vissvarīgākie.

Kā redzat, šajā piemērā kalorijām ir cieša korelācija ar kopējo svaru.

Vairāku lineārās regresijas analīze programmā Excel

Lai veiktu to pašu lineāro regresiju, bet ar vairākiem neatkarīgiem mainīgajiem, atlasiet visu diapazonu (vairākas kolonnas un rindas) Ievades X diapazonam.

Image
Image

Atlasot vairākus neatkarīgus mainīgos, ir mazāka iespēja, ka jūs atradīsit tikpat spēcīgu korelāciju, jo ir tik daudz mainīgo.

Tomēr regresijas analīze programmā Excel var palīdzēt atrast korelācijas ar vienu vai vairākiem mainīgajiem, kuru esamību jūs, iespējams, nenojaušat, tikai pārskatot datus manuāli.

Ieteicams: