Sådan udføres grundlæggende dataanalyse i Excel

Sådan udføres grundlæggende dataanalyse i Excel

Det meste af tiden, når du kører statistik, vil du bruge statistisk software. Disse værktøjer er bygget til at foretage beregninger som t -test, chi-square test, korrelationer og så videre. Excel er ikke beregnet til dataanalyse. Men det betyder ikke, at du ikke kan gøre det.





Desværre er Excel's statistiske funktioner ikke altid intuitive. Og de giver dig normalt esoteriske resultater. Så i stedet for at bruge statistikfunktioner, vil vi bruge tilføjelsen til Excel-statistik: the Dataanalyse Værktøjspakke.





Toolpak, på trods af sin ret uheldige stavemåde, indeholder en bred vifte af nyttige statistiske funktioner. Lad os se, hvad vi kan gøre med Excel -statistik.





Tilføjelse af Excel Data Analysis Toolpak

Mens du kan lave statistik uden Data Analysis Toolpak, det er meget lettere med det. For at installere Toolpak i Excel 2016 skal du gå til Fil> Indstillinger> Tilføjelser .

Klik på ud for 'Administrer: Excel-tilføjelsesprogrammer'.



I det resulterende vindue skal du markere feltet ud for Analyse Toolpak og klik derefter på Okay .

Hvis du korrekt tilføjede Data Analysis Toolpak til Excel, får du vist en Dataanalyse knappen i Data fane, grupperet i Analyse afsnit:





Hvis du vil have endnu mere strøm, skal du tjekke Excels andre tilføjelser.

Beskrivende statistik i Excel

Uanset hvilken statistisk test du kører, vil du sandsynligvis først få Excel's beskrivende statistik. Dette vil give dig information om midler, medianer, varians, standardafvigelse og fejl, kurtosis, skævhed og en række andre tal.





Det er let at køre beskrivende statistik i Excel. Klik på Dataanalyse i fanen Data, vælg Beskrivende statistik, og vælg dit inputområde. Klik på pilen ud for feltet inputområde, klik og træk for at vælge dine data, og tryk på Gå ind (eller klik på den tilsvarende pil ned), som i GIF'en herunder.

Derefter skal du sørge for at fortælle Excel, om dine data har etiketter, om du vil have output i et nyt ark eller på det samme, og hvis du vil have oversigtsstatistik og andre muligheder.

Efter det skal du slå Okay , og du får din beskrivende statistik:

Elevens t-test i Excel

Det t -test er en af ​​de mest grundlæggende statistiske test, og det er let at beregne i Excel med Toolpak. Klik på Dataanalyse og rul ned, indtil du ser t -test muligheder.

Du har tre valg:

  • t-Test: Parret to prøver til midler skal bruges, når dine målinger eller observationer blev parret. Brug dette, når du tog to målinger af de samme emner, f.eks. Måling af blodtryk før og efter en intervention.
  • t-Test: To-Prøve, der antager lige store variationer skal bruges, når dine målinger er uafhængige (hvilket normalt betyder, at de blev udført på to forskellige faggrupper). Vi vil diskutere delen 'lige afvigelser' om et øjeblik.
  • t-test: to-prøve antagelse af ulige variationer er også til uafhængige målinger, men bruges når dine afvigelser er ulige.

For at teste, om variationerne i dine to prøver er ens, skal du køre en F-test. Find F-test to-prøve for variationer på listen Analyseværktøjer, vælg den, og klik på Okay .

Indtast dine to datasæt i inputintervallets bokse. Lad alfa -værdien være på 0,05, medmindre du har grund til at ændre den - hvis du ikke ved, hvad det betyder, skal du bare forlade. Klik til sidst Okay .

Excel giver dig resultaterne i et nyt ark (medmindre du har valgt Outputområde og en celle i dit nuværende ark):

Du kigger på P-værdien her. Hvis det er mindre end 0,05, har du ulige forskelle . Så at køre t -test, du skal bruge indstillingen ulige varianser.

At køre en t -test, vælg den relevante test i vinduet Analyseværktøjer, og vælg begge sæt af dine data på samme måde, som du gjorde for F-testen. Lad alfa -værdien være 0,05, og tryk på Okay .

Resultaterne indeholder alt, hvad du skal rapportere for a t -test: midlerne, frihedsgrader (df), t-statistik og P-værdierne for både en- og to-haletest. Hvis P-værdien er mindre end 0,05, er de to prøver signifikant forskellige.

Hvis du ikke er sikker på, om du skal bruge en eller to haler t -test, tjek denne forklarer fra UCLA .

ANOVA i Excel

Excel Data Analysis Toolpak tilbyder tre typer af variansanalyser (ANOVA). Desværre giver det dig ikke mulighed for at køre de nødvendige opfølgende tests som Tukey eller Bonferroni. Men du kan se, om der er en sammenhæng mellem et par forskellige variabler.

Her er de tre ANOVA -test i Excel:

  • ANOVA: Single Factor analyserer varians med en afhængig variabel og en uafhængig variabel. Det foretrækkes at bruge flere t -testes, når du har mere end to grupper.
  • ANOVA: To-faktor med replikation ligner det parrede t -prøve; det involverer flere målinger på enkeltemner. 'To-faktor'-delen af ​​denne test indikerer, at der er to uafhængige variabler.
  • ANOVA: To-faktor uden replikation involverer to uafhængige variabler, men ingen replikation i måling.

Vi går her over enkeltfaktoranalysen. I vores eksempel ser vi på tre sæt tal, mærket 'Intervention 1', 'Intervention 2' og 'Intervention 3.' Klik på for at køre en ANOVA Dataanalyse , og vælg derefter ANOVA: Single Factor .

Vælg inputområdet, og sørg for at fortælle Excel, om dine grupper er i kolonner eller rækker. Jeg har også valgt 'Etiketter i første række' her, så gruppens navne vises i resultaterne.

Efter at have slået Okay får vi følgende resultater:

Bemærk, at P-værdien er mindre end 0,05, så vi har et betydeligt resultat. Det betyder, at der er en signifikant forskel mellem mindst to af grupperne i testen. Men fordi Excel ikke giver test til at bestemme hvilken grupper er forskellige, det bedste du kan gøre er at se på de gennemsnit, der vises i resuméet. I vores eksempel ligner intervention 3 det sandsynligvis den der adskiller sig.

Dette er ikke statistisk forsvarligt. Men hvis du bare vil se, om der er en forskel, og se hvilken gruppe der sandsynligvis forårsager det, virker det.

To-faktor ANOVA er mere kompliceret. Hvis du vil lære mere om, hvornår du skal bruge tofaktormetoden, kan du se denne video fra Sophia.org og ' uden replikation 'og' med replikation 'eksempler fra Real Statistics.

Korrelation i Excel

Beregning af korrelation i Excel er meget enklere end t -test eller en ANOVA. Brug Dataanalyse knappen for at åbne vinduet Analyseværktøjer, og vælg Korrelation .

Vælg dit inputinterval, identificer dine grupper som kolonner eller rækker, og fortæl Excel, om du har etiketter. Efter det skal du slå Okay .

Du får ingen målinger af betydning, men du kan se, hvordan hver gruppe er korreleret med de andre. En værdi på en er en absolut korrelation, hvilket indikerer, at værdierne er nøjagtig de samme. Jo tættere på en korrelationsværdien er, desto stærkere er korrelationen.

Regression i Excel

Regression er en af ​​de mest almindeligt anvendte statistiske tests i industrien, og Excel pakker en overraskende mængde strøm til denne beregning. Vi kører en hurtig multipel regression i Excel her. Hvis du ikke er bekendt med regression, skal du tjekke ud HBR's guide til brug af regression til erhvervslivet .

Lad os sige, at vores afhængige variabel er blodtryk, og vores to uafhængige variabler er vægt og saltindtag. Vi vil se, hvad der er en bedre forudsigelse af blodtryk (eller hvis de begge er gode).

Klik på Dataanalyse og vælg Regression . Du skal være forsigtig, når du udfylder inputintervallets bokse denne gang. Det Input Y -område boks skal indeholde din enkelt afhængige variabel. Det Input X -område boks kan indeholde flere uafhængige variabler. For en simpel regression skal du ikke bekymre dig om resten (dog husk at fortælle Excel, hvis du valgte etiketter).

Sådan ser vores beregning ud:

Efter at have slået Okay får du en stor liste med resultater. Jeg har fremhævet P-værdien her for både vægt og saltindtag:

Som du kan se, er P-værdien for vægt større end 0,05, så der er ingen signifikant sammenhæng der. P-værdien for salt er imidlertid under 0,05, hvilket indikerer, at det er en god forudsigelse for blodtryk.

Hvis du planlægger at præsentere dine regressionsdata, skal du huske, at du kan tilføje en regressionslinje til et scatterplot i Excel. Det er en stor visuel hjælp til denne analyse.

Excel -statistik: Overraskende i stand

Selvom Excel ikke er kendt for sin statistiske kraft, pakker det faktisk nogle virkelig nyttige funktioner, som f.eks PowerQuery -værktøjet , hvilket er praktisk til opgaver som at kombinere datasæt. (Lær, hvordan du opretter dit første Microsoft Power Query Script.) Der er også dataanalyse Toolpak statistik-tilføjelsesprogram, som virkelig får nogle af Excel's bedste funktioner frem. Jeg håber, at du har lært, hvordan du bruger Toolpak, og at du nu kan spille rundt på egen hånd for at finde ud af, hvordan du bruger flere af dets funktioner.

gratis offline musik -apps til Android

Med dette nu under dit bælte, skal du tage dine Excel -færdigheder til det næste niveau med vores artikler om ved hjælp af Excel's målsøgningsfunktion til mere dataknusning og søger efter værdier med vlookup . På et tidspunkt vil du måske også lære at importere Excel -data til Python.

Del Del Tweet E -mail Slet disse Windows -filer og mapper for at frigøre diskplads

Har du brug for at rydde diskplads på din Windows -computer? Her er Windows -filer og mapper, der sikkert kan slettes for at frigøre diskplads.

Læs Næste
Relaterede emner
  • Produktivitet
  • Regneark
  • Microsoft Excel
Om forfatteren Derefter Albright(506 artikler udgivet)

Dann er en indholdsstrategi og marketingkonsulent, der hjælper virksomheder med at skabe efterspørgsel og kundeemner. Han blogger også om strategi og content marketing på dannalbright.com.

Mere fra Dann Albright

Abonner på vores nyhedsbrev

Tilmeld dig vores nyhedsbrev for at få tekniske tips, anmeldelser, gratis e -bøger og eksklusive tilbud!

Klik her for at abonnere