Hur man beräknar variansen
Variansen är en indikator på variablerna i en dataset. Ett lågt värde innebär att data grupperas mycket nära varandra, medan en hög variant indikerar mer distribuerad data. Detta är ett koncept som har många applikationer i statistik. Att jämföra variansen mellan två uppsättningar data (till exempel manliga och kvinnliga patienter) är till exempel ett sätt att förstå vilken variabel som ger en uppenbar effekt. Variansen är också användbar när man skapar statistiska modeller, för när den är låg indikerar den ett för grupperat prov.
steg
Metod 1
Beräkna variansen för en prov1
Skriv data som utgör provet. I de flesta fall har statistiker endast tillgång till ett urval eller en grupp av befolkningen som de analyserar. Till exempel istället för att analysera den globala uppsättningen av "Kostnaden för varje bil i Tyskland", en lärare beräknar det av ett slumpmässigt prov bestående av några tusen bilar. På så sätt kan du använda provet för att uppskatta maskinkostnaderna i Tyskland, även om värdet inte sammanfaller exakt med de reella siffrorna.
- exempel: analyserar antalet croissanter som säljs varje dag i en cafeteria, du kommer att få detta slumpmässiga prov samlat på sex dagar: 17-15- 23-7-9-13. Det här är bara ett urval och inte en befolkning, eftersom du inte äger försäljningsuppgifterna för varje dag där baren har öppnats.
- Om du har allt befolkningsdata, gå direkt till nästa metod.
2
Skriv formeln för variansen av ett prov. Detta värde ger dig en uppfattning om fördelningen av data. Ju mer variansen närmar sig noll, desto mer data grupperas ihop. När du arbetar med ett prov använder du följande formel:
3
Beräkna provmedlet. Symbolen x symbol anger medeltalet av datasatsen. Fortsätt med beräkningen som du normalt skulle: Summa alla värden bland dem och dela med antalet data.
Därefter dela resultatet med antalet värden, vilket i detta fall är lika med 6: 84 ÷ 6 = 14.
Provvärdet är x = 14.
4
Subtrahera genomsnittet från varje värde som utgör hela. Nu är det dags att fortsätta med denna beräkning - xiod, var representerar alla data som utgör provet. Varje skillnad informerar dig om avvikelsen av data från medelvärdet eller med andra ord hur mycket värdet flyttar bort från genomsnittet.
- x = 17 - 14 = 3
- x = 15 - 14 = 1
- x = 23 - 14 = 9
- x = 7 - 14 = -7
- x = 9 - 14 = -5
- x = 13 - 14 = -1.
5
Höj varje resultat. Som redan angivits ovan är summan av avvikelser ( - xiod) är noll. Detta innebär att "genomsnittlig avvikelse" Det måste vara noll och ger därför ingen ytterligare information om fördelningen av provet. För att eliminera detta problem, hitta kvadraten för varje avvikelse. På detta sätt får du bara positiva värden och de negativa kan inte avbryta de andra.
( - x)
- x)
92 = 81
(-7)2 = 49
(-5)2 = 25
(-1)2 = 1;
6
Hitta summan av rutorna. Vid denna tidpunkt måste du beräkna täljaren av formeln: Σ [( - x)]. Den grekiska bokstaven sigma, Σ, indikerar att du måste lägga till alla värden som nästa term förutsätter för varje . Du har redan beräknat ( - x) för varje värde av av provet, så vad du behöver göra är att gå vidare till en enkel summa.
7
Dela resultatet med n - 1, där n är antalet data i uppsättningen. Tidigare delades statistikerna endast av n under beräkningen av variansen. På så sätt fick de medelvärdet av standardavvikelsen som perfekt matchar provvarianansen. Du måste dock komma ihåg att provet endast är en uppskattning av en större befolkning. Om du anser ett annat slumpmässigt prov och utför samma beräkningar, hittar du olika resultat. Av denna anledning ger uppdelning av n-1 i stället för n en bättre uppskattning av variationen hos en större befolkning, vilket är vad som verkligen betyder för statistiker. Denna korrigering är så vanlig och allmänt accepterad att den ingår i definitionen av varians.
Provets varians är = 33,2.
8
Förstå variansen och standardavvikelsen. Eftersom det finns ström i täljaren, kom ihåg att variansen uttrycks med den ursprungliga måttenheten i kvadrat. Detta gör det svårt att snabbt förstå dess mening - för detta ändamål används standardavvikelsen mer. Du har inte slösat bort alla insatser som gjorts hittills, eftersom standardavvikelsen definieras som kvadratroten av variansen. Därför uttrycks variansen av ett prov som , medan standardavvikelsen som .
Metod 2
Beräkna variationen för en befolkning1
Tänk på en datapopulation. Termen "population" Hänvisar till hela gruppen som granskats. Till exempel, om du studerar åldern av Veneto invånare, ger den statistiska befolkningen uppgifter om åldern för varje person som bor i denna region. Generellt skapar du en kalkylark för denna typ av storskalig analys, men du kan också fortsätta med en mindre uppsättning:
- exempel: Det finns exakt 6 tankar i det kommunala akvariet. Dessa 6 tankar innehåller följande kvantiteter fisk:
.
2
Skriv variansformeln för en population. Eftersom en befolkning innehåller alla de uppgifter du behöver, kan du med hjälp av formeln beräkna befolkningens exakta variation och inte en uppskattning. För att skilja det från provets (som bara är en uppskattning) använder statistiker olika variabler:
3
Hitta befolkningsgenomsnittet. Vid analys av en hel grupp data, symbolen μ ("mu") representerar det aritmetiska medelvärdet. För att beräkna det, summera alla värden tillsammans och dela dem sedan med antalet data.
4
Subtrahera genomsnittet från varje värde som utgör befolkningen. Om värdena ligger nära medelvärdet kommer skillnaden att vara nära noll. Upprepa subtraktionen för varje del av befolkningen och du kommer att börja förstå distributionen.
- μ = 5 - 10,5 = -5,5
- μ = 5 - 10,5 = -5,5
- μ = 8 - 10,5 = -2,5
- μ = 12 - 10,5 = 1,5
- μ = 15 - 10,5 = 4,5
- μ = 18 - 10,5 = 7,5.
5
Höj varje resultat. Vid denna tidpunkt kommer några av de tidigare beräknade värdena att vara negativa och andra positiva. Om du har data på en rad av tal representerar dessa grupper siffrorna till vänster och höger om genomsnittet. Detta hjälper inte att beräkna variansen, eftersom dessa värden avbryter varandra. Förhöj squared för att bara få positiva data.
( - μ) för varje värde av den från 1 till 6:
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25.
6
Hitta de genomsnittliga resultaten. Nu har du värdet för varje data, relaterat (indirekt) till hur långt det är från medeltalet. Beräkna medelvärdet genom att summera dem och sedan dela resultatet med antalet data.
Variation av befolkningen = 24,25.
7
Länk detta resultat till formeln. Om du inte är säker på att den matchar den formel som beskrivs i början av metoden, skriv om hela ekvationen i sin helhet:
tips
- Eftersom tolkningen av variansen är ganska svår, beräknas den vanligen som utgångspunkt för att få standardavvikelse.
- Under provanalys användes "n-1" i stället för "n" i nämnaren heter det Bessel-korrigering. Provet representerar endast en uppskattning av hela befolkningen och provmedlet anpassar sig endast delvis till denna uppskattning. Korrigeringen tillåter oss att eliminera denna felaktighet. Denna uppskattare är relaterad till det faktum att när n-1 poäng är listade, slutpunkten n-hex är obligatorisk, eftersom endast vissa värden kommer att resultera i provvärdet (x)) som används i variansformeln.
Dela på sociala nätverk:
Relaterade
- Hur man beräknar totalt upplösta fastämnen
- Hur man beräknar de anomala värdena
- Hur man beräknar P-värdet
- Hur man beräknar medelåldern
- Hur man beräknar osäkerhet
- Hur man beräknar standardavvikelse
- Hur man beräknar storleken på en prov
- Så här beräknar du medelvärdet, standardavvikelsen och standardfelet
- Hur man beräknar ökningsprocenten
- Hur man beräknar noggrannhet
- Hur man beräknar interkvartilskrot (IQR)
- Hur man beräknar en förtroendeintervall
- Hur man beräknar en statistisk intervall
- Hur man beräknar en Z-poäng
- Hur man beräknar standardavvikelse med Excel
- Hur man beräknar dataöverföringshastighet
- Hur man skapar en tabell i Excel 2010
- Hur man skapar en slumpmässig datasats i Excel
- Hur man beräknar marginalkostnader
- Så här anger du data i SPSS
- Så här ställer du in en tabell