Hur man beräknar Covariance
Covariance är en statistisk term som hjälper till att förstå korrelationen mellan två uppsättningar data. Antag till exempel att antropologer studerar höjden och vikten av en given population - för varje individ som undersöks uttrycks värdena för höjd och vikt som ett datapar (x-y). Dessa siffror kan anges i en standardformel för att beräkna deras kovariansförhållande. Denna artikel beskriver först den matematiska processen för att komma fram till detta värde och behandlar sedan två automatiska metoder för att erhålla resultatet.
steg
Del 1
Beräkna Hand Covariance med Standardformeln1
Lär dig standardformeln och dess komponenter. Ekvationen för beräkning av kovariansen är: - För att kunna använda den behöver du veta betydelsen av variablerna och symbolerna:
- : den här symbolen är den grekiska bokstaven "sigma" vilken i matematik representerar summan av alla variabler som följer. I kovariansformeln, symbolen Σ indikerar att du måste beräkna värdena som ligger i delningen i fraktionen och lägga till dem innan de delas av nämnaren.
- : Denna variabel läses "x av jag", prenumerationen är en räknare och innebär att du måste utföra beräkningarna genom att överväga varje värde av x närvarande i dataserien.
- : förkortningen "avg" anger medelvärdet för alla data "x"- Ibland anges medelvärdet med bokstaven x med en horisontell streck över den. Symbolen läser "medelvärde av x".
- : i det här fallet måste du läsa "y av jag" och prenumerationen representerar en räknare som indikerar att du måste utföra beräkningarna genom att överväga varje värde av y som finns i dataserien.
- : förkortningen "avg" anger medelvärdet för alla data "y"- ibland anges medlet med bokstaven y med en horisontell streck över den. Symbolen läser "medelvärde av y".
- : representerar antalet data som finns i samlingen. Kom ihåg att för att lösa ett problem relaterat till kovarians måste du betrakta de statistiska elementen som ett par värden (x-y). Värdet på n är lika med antalet par och inte den för de enskilda data.
2
Organisera en datatabell. Innan vi fortsätter med beräkningarna är det värt att samla alla värden. Du borde rita ett bord som består av fem kolumner som märker var och en enligt dessa kriterier:
3
Beräkna medelvärdet av x. Uppsättningen som beskrivs nedan består av nio numbers- att hitta den genomsnittliga siffran du måste lägga till dem och dividera resultatet med 9. Detta betyder att: 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Dela summan med 9 och få medeltalet 4,89. Detta är den genomsnittliga data för x som du använder istället för x (avg) -variabeln under de följande beräkningarna.
4
Beräkna medelvärdet av y. Fortsätt på liknande sätt. Kolumnen som motsvarar data för y består av nio siffror kopplade till de av x-finner genomsnittet av dessa data. För det aktuella exemplet fortsätt med: 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Dela summan med 9 och få 5,44. Detta är det genomsnittliga värdet du använder istället för y (avg) -variabeln i de följande beräkningarna.
5
Hitta värdena för . För varje x-data som anges i motsvarande kolumn måste du hitta skillnaden med medelvärdet. Det här är en enkel beräkning, dvs du måste subtrahera 4,89 från varje x-värde i uppsättningen. Om värdet är lägre än genomsnittet får du ett negativt tal - om det är större får du ett positivt tal. Var försiktig så att du inte glömmer skyltarna.
6
Beräkna värdena för . I denna kolumn måste du rapportera resultaten av en liknande subtraktion, med alla värden på y och medeldata y (avg). Om initialvärdet är lägre än genomsnittet får du ett negativt resultat - annars är resultatet positivt. Var försiktig så att du inte glömmer skyltarna.
7
Beräkna produkten för varje data rad. Fyll i rutorna i den sista kolumnen genom att multiplicera de siffror du skrev i de föregående två och vilka är märkta som och . Var försiktig med att arbeta för rad, multiplicera två siffror som motsvarar dataparren - glöm inte de negativa tecknen när du går.
8
Lägg till de uppgifter som anges i den sista kolumnen till varandra. Detta är den fas där symbolen Σ "kommer till handling". När alla beräkningar har gjorts måste du lägga till resultaten. För den enkla uppsättningen data som betraktas som ett exempel bör du få nio nummer i den sista kolumnen och sammanfatta det genom att uppmärksamma de negativa symbolerna.
9
Beräknar nämnaren av ekvationen. Faktum är att detta värde redan har hittats under det ovan beskrivna förfarandet - det är faktiskt representerat av (n - 1), det vill säga med antalet par av värden minus 1.
10
Dela täljaren av nämnaren. Det sista steget i beräkningen av kovariansen är att dela upp täljaren - - för nämnaren, det vill säga . Kvoten är kovariansen för datasatsen.
Del 2
Använd ett Excel-beräkningsblad för att beräkna Covariance1
Notera de repeterande beräkningarna. Det av kovarians är en matematisk procedur som du bör utföra för hand ett par gånger för att förstå innebörden av risultato- Men om du ständigt använder denna statistiska verktyg för att tolka data är det lämpligt att hitta en snabbare och mer automatiserat sätt att få resultat. Du bör inse att underteckna för serien av relativt små data som har övervägts hittills var du tvungen att hitta två medelvärden, utföra subtraktion åtta singlar, nio separata multiplikation, en addition och en slutlig division. Dessa är 31 elementära beräkningar som är nödvändiga för att få en given-längs vägen, du kan riskera att glömma de negativa tecknen eller kopiera siffrorna felaktigt och därmed ändra resultatet.
2
Skapa ett kalkylblad för att hitta kovariansen. Om du kan använda Excel-programmet (eller ett annat kalkylblad med samma potential) kan du enkelt skapa ett bord. Märk de fem kolumnerna som du skulle för handberäkningar: x, y, (x (i) -x (avg)), (y (i) -y (avg)) och produkt.
3
Skriv ner den numeriska serien. Skriv in värdena för x och y i lämpliga kolumner - kom ihåg att ordningen av punkterna är viktig och att du måste para varje värde av y till motsvarande x.
4
Hitta medelvärdet av x och y. Excel-programmet kan beräkna medelvärdet mycket snabbt. I den första tomma cellen i varje datakolumn skriver du in formeln = MEDIA (A2: A ___). Ange i vitt utrymme det nummer som motsvarar cellen som upptas av de senaste data.
5
Skriv formeln för kolumnen (x (i) -x (avg)). I cell C2 måste du ange funktionen som låter dig beräkna den första subtraktionen som är: = A2 -____. I vitt utrymme måste du rapportera cellen som innehåller medelvärdet av x.
6
Upprepa samma funktion för kolumnen (y (i) -y (avg)). Efter ovanstående exempel måste du ange formeln i cell D2 som = B2-B102.
7
Ange formuläret för produktkolumnen. I E2-rutan i den femte kolumnen måste du skriva in formeln som låter dig beräkna produkten från de två föregående cellerna - skriv i så fall bara: = C2 * D2.
8
Kopiera de olika funktionerna i cellerna under varje kolumn. Hittills har du programmerat beräkningarna endast för det första numeriska paret som upptar linje 2. Använd musen genom att markera cellerna C2, D2 och E2- efteråt, placera markören till den lilla rutan som finns längst ned till höger tills det blir inte ett tecken "+". Klicka med vänster musknapp och dra markören ner för att expandera de markerade rutorna till hela tabellen. Denna åtgärd kopierar automatiskt de tre formlerna i C2, D2 och E2 i nedanstående celler. Du bör observera att beräkningarna utförs automatiskt genom att fylla i talbordet.
9
Ange summan för den sista kolumnen. Du måste beräkna summan av alla värden i kolumnen "produkt". I den första tomma cellen under värdeslistan anger du formeln = SUM (E2: E ___) och fyller i det vita mellanslaget med det cellnummer som innehåller de sista uppgifterna i listan.
10
Hitta kovariansen. I kalkylbladet kan du utföra den senaste operationen. Det sista numret som hittades, som i det föregående exemplet är i E102, representerar covariansformelns täljare - du kan skriva in funktionen direkt under den här cellen: = E102 / ___ Skrivning av antalet data i ditt innehav istället för det vita utrymmet minus 1. I det aktuella exemplet är uppgifterna 100, så du måste skriva 99 - den erhållna kvoten är värdet av kovariansen.
Del 3
Använd en onlinekalkylator1
Gör en online-sökning för att hitta kovariansräknare. Flera skolor, programmeringsföretag eller andra källor har skapat webbsidor som gör att du enkelt kan beräkna kovariansdata - du kan använda vilken sökmotor som helst genom att skriva nyckelord "kovariansräknare".
2
Ange data. Läs noga igenom bruksanvisningen för att skriva in den numeriska serien korrekt. Det är viktigt att datapar beställs, annars får du felresultat. De olika webbsidorna tillhandahåller olika metoder för datainmatning.
3
Beräkna resultaten. Den intressanta aspekten av dessa sidor är att efter att ha skrivit in data behöver du bara klicka på knappen "beräknar" för att få kovariansvärdet omedelbart - de flesta onlinekalkylatorer ger också mellanresultat för medelvärdet av x, y och värdet på n.
Del 4
Tolk Covariance-resultaten1
Leta efter ett positivt eller negativt förhållande. Covariance är ett statistiskt verktyg som representerar förhållandet mellan två uppsättningar data. I exemplet i introduktionen undersöker vi höjden och vikten av en population, du skulle förvänta dig att, när höjden ökar, kommer vikten också att öka, vilket innebär att det finns ett kovariansförhållande positiva. Ett annat exempel är den uppsättning timmar som en individ tränar i golf och de poäng han får - i det här fallet bör du förvänta dig en negativ kovarians, för när personen tränar, hans Gara_Stroke_Play poäng bör minska (i golfspelet vinner spelaren med lägsta poäng).
- Tänk på det ovan beskrivna dataprovet. Den slutliga kovariansen är -8,07, vilket är ett negativt tal, vilket betyder att när x ökar minskar y. Du kan verifiera att detta fenomen är sant genom att observera några datapar - till exempel för värden 1 och 2 av x har vi respektive värden på 7, 8 och 9. Värdena på x lika med 8 och 12 är kopplade, respektive med y = 3 och -y = 2.
2
Den tolkar betydelsen av kovarians absoluta värde. Om siffran är stor, positiv eller negativ, betyder det att de två numeriska serierna är starkt korrelerade med varandra både positivt och negativt.
3
Förstå avsaknaden av ett förhållande. Om du finner ett värde av kovarians som är lika med eller nära 0, kan du dra slutsatsen att dataparren är praktiskt taget oberoende. I detta fall växlar eller minskar ett värde inte det andra: de två termen kopplas slumpmässigt .
4
Observera förhållandet från en grafisk synvinkel. För att förstå kovariansen visuellt kan du rapportera värdet par på ett kartesiskt system. Det gör det lätt att inse att även om de inte bildar en perfekt rak linje fördelas de olika punkterna längs en approximativ diagonal som går från vinkeln i längst upp till vänster till höger - detta är diagrambeskrivningen av en negativ kovarians. Vidare är värdet av kovariansen -8,07, vilket, om det jämförs med data i uppsättningarna, är ett ganska stort antal-detta tyder på att förhållandet mellan de två numeriska serierna är ganska smalt och kan ses från den linjära aspekten av fördelning av poäng.
varningar
- Kovariansen har begränsad tillämpning i statistiken - dess beräkning är ofta ett mellanliggande steg för att hitta korrelationsindex eller andra villkor. Var försiktig så att du inte drar slutsatser som bygger för mycket på detta faktum.
Dela på sociala nätverk:
Relaterade
- Hur man beräknar specifik värme
- Hur man beräknar skalfaktorn
- Hur man beräknar relativ risk
- Hur man beräknar P-värdet
- Hur man beräknar volymen hos en kotte
- Hur man beräknar en kubens volym med hjälp av ytan
- Hur man beräknar acceleration
- Hur man beräknar ytan på ett kvadrat från diagonalen
- Hur man beräknar området för en diamant
- Hur man beräknar en kvadrats diagonal
- Hur man beräknar storleken på en prov
- Hur man beräknar tyngdkraften
- Hur man beräknar längden på vågan
- Hur man beräknar molekylmassan
- Hur man beräknar lutningen på en rak linje genom två punkter
- Hur man beräknar porositet
- Hur man beräknar variansen
- Så här skapar du en kontrollschema
- Hur man beräknar Volemia
- Hur man beräknar ökad andel av en kostnad
- Hur man beräknar hål till mognad eller utgåttid