gushelom.ru

Hur man beräknar Covariance

Covariance är en statistisk term som hjälper till att förstå korrelationen mellan två uppsättningar data. Antag till exempel att antropologer studerar höjden och vikten av en given population - för varje individ som undersöks uttrycks värdena för höjd och vikt som ett datapar (x-y). Dessa siffror kan anges i en standardformel för att beräkna deras kovariansförhållande. Denna artikel beskriver först den matematiska processen för att komma fram till detta värde och behandlar sedan två automatiska metoder för att erhålla resultatet.

Del 1

Beräkna Hand Covariance med Standardformeln
1
Lär dig standardformeln och dess komponenter. Ekvationen för beräkning av kovariansen är: Σ(xden-xavg)(yden-yavg)/(n-1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}- För att kunna använda den behöver du veta betydelsen av variablerna och symbolerna:
  • Σ{ displaystyle Sigma}: den här symbolen är den grekiska bokstaven "sigma" vilken i matematik representerar summan av alla variabler som följer. I kovariansformeln, symbolen Σ indikerar att du måste beräkna värdena som ligger i delningen i fraktionen och lägga till dem innan de delas av nämnaren.
  • xden{ displaystyle x_ {i}}: Denna variabel läses "x av jag", prenumerationen är en räknare och innebär att du måste utföra beräkningarna genom att överväga varje värde av x närvarande i dataserien.
  • xtillvg{ displaystyle x_ {avg}}: förkortningen "avg" anger medelvärdet för alla data "x"- Ibland anges medelvärdet med bokstaven x med en horisontell streck över den. Symbolen läser "medelvärde av x".
  • yden{ displaystyle y_ {i}}: i det här fallet måste du läsa "y av jag" och prenumerationen representerar en räknare som indikerar att du måste utföra beräkningarna genom att överväga varje värde av y som finns i dataserien.
  • ytillvg{ displaystyle y_ {avg}}: förkortningen "avg" anger medelvärdet för alla data "y"- ibland anges medlet med bokstaven y med en horisontell streck över den. Symbolen läser "medelvärde av y".
  • n{ displaystyle n}: representerar antalet data som finns i samlingen. Kom ihåg att för att lösa ett problem relaterat till kovarians måste du betrakta de statistiska elementen som ett par värden (x-y). Värdet på n är lika med antalet par och inte den för de enskilda data.
  • 2
    Organisera en datatabell. Innan vi fortsätter med beräkningarna är det värt att samla alla värden. Du borde rita ett bord som består av fem kolumner som märker var och en enligt dessa kriterier:
  • x{ displaystyle x}: Slutför den här kolumnen med alla värden "x" set;
  • y{ displaystyle y}: skriv ner alla värden på "y" av serien i den här kolumnen. Var försiktig så att du korrigerar varje värde av y med motsvarande x. I problem med kovarians är order- och datapar viktiga;
  • (xden-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}: lämna denna kolumn tom, då skriver du genomsnittet av värdena på x;
  • (yden-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}: skriv inte något i början, du kommer att slutföra det senare med medelvärdet av y-värdena;
  • produkt{ displaystyle { text {Product}}}: för tillfället behöver du inte skriva något, du kommer att slutföra det under proceduren.
  • 3
    Beräkna medelvärdet av x. Uppsättningen som beskrivs nedan består av nio numbers- att hitta den genomsnittliga siffran du måste lägga till dem och dividera resultatet med 9. Detta betyder att: 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Dela summan med 9 och få medeltalet 4,89. Detta är den genomsnittliga data för x som du använder istället för x (avg) -variabeln under de följande beräkningarna.
  • 4
    Beräkna medelvärdet av y. Fortsätt på liknande sätt. Kolumnen som motsvarar data för y består av nio siffror kopplade till de av x-finner genomsnittet av dessa data. För det aktuella exemplet fortsätt med: 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Dela summan med 9 och få 5,44. Detta är det genomsnittliga värdet du använder istället för y (avg) -variabeln i de följande beräkningarna.
  • 5
    Hitta värdena för (xden-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}. För varje x-data som anges i motsvarande kolumn måste du hitta skillnaden med medelvärdet. Det här är en enkel beräkning, dvs du måste subtrahera 4,89 från varje x-värde i uppsättningen. Om värdet är lägre än genomsnittet får du ett negativt tal - om det är större får du ett positivt tal. Var försiktig så att du inte glömmer skyltarna.
  • Till exempel är det första värdet i kolumn x 1. Skriv in det i den första raden i kolumnen (xden-xavg){ displaystyle (x_ {i} -x _ { text {avg}})} och du får 1-4,89 = -3,89.
  • Upprepa proceduren för varje bit av x. Som ett resultat är den andra raden 3-4,89 = -1,89. Den tredje raden är 2-4.89, det vill säga -2.89. Fortsätt på detta sätt för alla värden på x, de nio siffrorna du får ska vara: -3.89-1.89-2.89, 0.11-3.11-2.11-7.11- -2,89- -0,89.
  • 6
    Beräkna värdena för (yden-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}. I denna kolumn måste du rapportera resultaten av en liknande subtraktion, med alla värden på y och medeldata y (avg). Om initialvärdet är lägre än genomsnittet får du ett negativt resultat - annars är resultatet positivt. Var försiktig så att du inte glömmer skyltarna.
  • Så, för första raden är beräkningarna: 8-5.44 = 2.56.
  • Den andra raden är: 6-5.44 = 0.56.
  • Fortsätt att subtrahera till slutet av listan med siffror. I slutet var de nio skillnaderna som du hittade att vara: 2,56-0,56-3,56-1,44-2,44-2,44-3,44-1,56-1, 56.
  • 7
    Beräkna produkten för varje data rad. Fyll i rutorna i den sista kolumnen genom att multiplicera de siffror du skrev i de föregående två och vilka är märkta som (xden-xavg){ displaystyle (x_ {i} -x _ { text {avg}})} och (yden-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}. Var försiktig med att arbeta för rad, multiplicera två siffror som motsvarar dataparren - glöm inte de negativa tecknen när du går.
  • I första raden, i kolumnen för (xden-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}, du skrev siffran -3.89, medan i kolumnen (yden-yavg){ displaystyle (y_ {i} -y _ { text {avg}})} du rapporterade 2,56. Produkten av dessa siffror är -3,89 * 2,56 = -9,96.
  • Längs andra raden multiplicera de två siffrorna: -1,88 * 0,56 = -1,06.
  • Fortsätt så här, rad för rad tills du har uttömt alla paren - i slutet ska de nio siffrorna vara: -9.96- -1.06- -10.29- -0.16- -7.59 - -5,15- -24,46-4,51-1,39.
  • 8
    Lägg till de uppgifter som anges i den sista kolumnen till varandra. Detta är den fas där symbolen Σ "kommer till handling". När alla beräkningar har gjorts måste du lägga till resultaten. För den enkla uppsättningen data som betraktas som ett exempel bör du få nio nummer i den sista kolumnen och sammanfatta det genom att uppmärksamma de negativa symbolerna.
  • I det här fallet är det slutliga värdet -64,57. Skriv det i rutan längst ner på kolumnen - det här är det nummer som du måste skriva till täljaren i standardformeln för kovariansen.
  • 9
    Beräknar nämnaren av ekvationen. Faktum är att detta värde redan har hittats under det ovan beskrivna förfarandet - det är faktiskt representerat av (n - 1), det vill säga med antalet par av värden minus 1.
  • I exemplet som hittills beaktats finns det 9 datapar, så n = 9- följaktligen n-1 = 8.
  • 10
    Dela täljaren av nämnaren. Det sista steget i beräkningen av kovariansen är att dela upp täljaren - Σ(xden-xavg)(yden-yavg){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})} - för nämnaren, det vill säga (n-1){ displaystyle (n-1)}. Kvoten är kovariansen för datasatsen.
  • Med tanke på föregående exempel är operationen -64,75 / 8 = -8,07.
  • Del 2

    Använd ett Excel-beräkningsblad för att beräkna Covariance
    1
    Notera de repeterande beräkningarna. Det av kovarians är en matematisk procedur som du bör utföra för hand ett par gånger för att förstå innebörden av risultato- Men om du ständigt använder denna statistiska verktyg för att tolka data är det lämpligt att hitta en snabbare och mer automatiserat sätt att få resultat. Du bör inse att underteckna för serien av relativt små data som har övervägts hittills var du tvungen att hitta två medelvärden, utföra subtraktion åtta singlar, nio separata multiplikation, en addition och en slutlig division. Dessa är 31 elementära beräkningar som är nödvändiga för att få en given-längs vägen, du kan riskera att glömma de negativa tecknen eller kopiera siffrorna felaktigt och därmed ändra resultatet.
  • 2
    Skapa ett kalkylblad för att hitta kovariansen. Om du kan använda Excel-programmet (eller ett annat kalkylblad med samma potential) kan du enkelt skapa ett bord. Märk de fem kolumnerna som du skulle för handberäkningar: x, y, (x (i) -x (avg)), (y (i) -y (avg)) och produkt.
  • För att förenkla nomenklaturen kan du märka den tredje kolumnen som "skillnad på x" och den fjärde som "skillnad på y"så länge du kommer ihåg betydelsen av data.
  • Om du börjar skriva tabellen i övre vänstra hörnet av kalkylbladet innehåller cell A1 etiketten "x", de andra går till följd av cell E1.
  • 3
    Skriv ner den numeriska serien. Skriv in värdena för x och y i lämpliga kolumner - kom ihåg att ordningen av punkterna är viktig och att du måste para varje värde av y till motsvarande x.
  • Listan med x-värden startar i cell A2 och fortsätter ner för alla nödvändiga lådor.
  • Listan med y-värden börjar i cell B2 och fortsätter ner för alla nödvändiga lådor.
  • 4
    Hitta medelvärdet av x och y. Excel-programmet kan beräkna medelvärdet mycket snabbt. I den första tomma cellen i varje datakolumn skriver du in formeln = MEDIA (A2: A ___). Ange i vitt utrymme det nummer som motsvarar cellen som upptas av de senaste data.
  • Om listan till exempel består av 100 värden, upptar de celler från A2 till A101, så är formeln: = MEDIA (A2: A101).
  • För listan med data y är formeln = MEDIA (B2: B101).
  • Kom ihåg att du måste börja skriva formeln med ett tecken på jämlikhet (=).
  • 5
    Skriv formeln för kolumnen (x (i) -x (avg)). I cell C2 måste du ange funktionen som låter dig beräkna den första subtraktionen som är: = A2 -____. I vitt utrymme måste du rapportera cellen som innehåller medelvärdet av x.
  • I exemplet på 100 data ligger medelvärdet i ruta A102, så formeln är: = A2-A102.
  • 6
    Upprepa samma funktion för kolumnen (y (i) -y (avg)). Efter ovanstående exempel måste du ange formeln i cell D2 som = B2-B102.
  • 7
    Ange formuläret för produktkolumnen. I E2-rutan i den femte kolumnen måste du skriva in formeln som låter dig beräkna produkten från de två föregående cellerna - skriv i så fall bara: = C2 * D2.
  • 8
    Kopiera de olika funktionerna i cellerna under varje kolumn. Hittills har du programmerat beräkningarna endast för det första numeriska paret som upptar linje 2. Använd musen genom att markera cellerna C2, D2 och E2- efteråt, placera markören till den lilla rutan som finns längst ned till höger tills det blir inte ett tecken "+". Klicka med vänster musknapp och dra markören ner för att expandera de markerade rutorna till hela tabellen. Denna åtgärd kopierar automatiskt de tre formlerna i C2, D2 och E2 i nedanstående celler. Du bör observera att beräkningarna utförs automatiskt genom att fylla i talbordet.
  • 9
    Ange summan för den sista kolumnen. Du måste beräkna summan av alla värden i kolumnen "produkt". I den första tomma cellen under värdeslistan anger du formeln = SUM (E2: E ___) och fyller i det vita mellanslaget med det cellnummer som innehåller de sista uppgifterna i listan.
  • För exemplet på 100 dataserierna måste formeln skrivas i cell E102 enligt denna syntax: = SUM (E2: E101).
  • 10
    Hitta kovariansen. I kalkylbladet kan du utföra den senaste operationen. Det sista numret som hittades, som i det föregående exemplet är i E102, representerar covariansformelns täljare - du kan skriva in funktionen direkt under den här cellen: = E102 / ___ Skrivning av antalet data i ditt innehav istället för det vita utrymmet minus 1. I det aktuella exemplet är uppgifterna 100, så du måste skriva 99 - den erhållna kvoten är värdet av kovariansen.
  • Del 3

    Använd en onlinekalkylator
    1
    Gör en online-sökning för att hitta kovariansräknare. Flera skolor, programmeringsföretag eller andra källor har skapat webbsidor som gör att du enkelt kan beräkna kovariansdata - du kan använda vilken sökmotor som helst genom att skriva nyckelord "kovariansräknare".
  • 2
    Ange data. Läs noga igenom bruksanvisningen för att skriva in den numeriska serien korrekt. Det är viktigt att datapar beställs, annars får du felresultat. De olika webbsidorna tillhandahåller olika metoder för datainmatning.
  • Till exempel, detta plats föreslår en horisontell ruta för värdena på "x" och en andra horisontell låda för de av "y". Instruktionerna (på engelska) anger att du måste skriva de två termerna enbart separerade med ett komma - därför värdena "x" betraktas i första delen av artikeln bör skrivas på följande sätt: 1,3,2,5,8,7,12,2,4, medan seriens värden "y" det ska se ut så här: 8,6,9,4,3,3,2,7,7.
  • denna andra webbplats, alltid på engelska krävs det att man sätter in värdena "x" i den första rutan, respektera en vertikal trend och skriva ett tal i varje rad - följaktligen uppsättningen värden "x" han ser så här ut:
  • 1
  • 3
  • 2
  • 5
  • 8
  • 7
  • 12
  • 2
  • 4
  • 3
    Beräkna resultaten. Den intressanta aspekten av dessa sidor är att efter att ha skrivit in data behöver du bara klicka på knappen "beräknar" för att få kovariansvärdet omedelbart - de flesta onlinekalkylatorer ger också mellanresultat för medelvärdet av x, y och värdet på n.
  • Del 4

    Tolk Covariance-resultaten
    1
    Leta efter ett positivt eller negativt förhållande. Covariance är ett statistiskt verktyg som representerar förhållandet mellan två uppsättningar data. I exemplet i introduktionen undersöker vi höjden och vikten av en population, du skulle förvänta dig att, när höjden ökar, kommer vikten också att öka, vilket innebär att det finns ett kovariansförhållande positiva. Ett annat exempel är den uppsättning timmar som en individ tränar i golf och de poäng han får - i det här fallet bör du förvänta dig en negativ kovarians, för när personen tränar, hans Gara_Stroke_Play poäng bör minska (i golfspelet vinner spelaren med lägsta poäng).
    • Tänk på det ovan beskrivna dataprovet. Den slutliga kovariansen är -8,07, vilket är ett negativt tal, vilket betyder att när x ökar minskar y. Du kan verifiera att detta fenomen är sant genom att observera några datapar - till exempel för värden 1 och 2 av x har vi respektive värden på 7, 8 och 9. Värdena på x lika med 8 och 12 är kopplade, respektive med y = 3 och -y = 2.
  • 2
    Den tolkar betydelsen av kovarians absoluta värde. Om siffran är stor, positiv eller negativ, betyder det att de två numeriska serierna är starkt korrelerade med varandra både positivt och negativt.
  • I det aktuella exemplet är kovariansen lika med -8,07 vilket är ett ganska stort värde. Uppgifterna ligger i intervallet mellan 1 och 12, så 8 representerar ett ganska stort antal - det vill säga att varje numeriskt par är länkat med en stark korrelation.
  • 3
    Förstå avsaknaden av ett förhållande. Om du finner ett värde av kovarians som är lika med eller nära 0, kan du dra slutsatsen att dataparren är praktiskt taget oberoende. I detta fall växlar eller minskar ett värde inte det andra: de två termen kopplas slumpmässigt .
  • Antag att du jämföra mätningarna av skor med examenskvaliteter. Eftersom det finns många faktorer som påverkar slutkursen för en universitetsstudent, borde du förvänta dig en kovarians nära noll - det betyder att det inte finns något samband mellan de två uppsättningarna.
  • 4
    Observera förhållandet från en grafisk synvinkel. För att förstå kovariansen visuellt kan du rapportera värdet par på ett kartesiskt system. Det gör det lätt att inse att även om de inte bildar en perfekt rak linje fördelas de olika punkterna längs en approximativ diagonal som går från vinkeln i längst upp till vänster till höger - detta är diagrambeskrivningen av en negativ kovarians. Vidare är värdet av kovariansen -8,07, vilket, om det jämförs med data i uppsättningarna, är ett ganska stort antal-detta tyder på att förhållandet mellan de två numeriska serierna är ganska smalt och kan ses från den linjära aspekten av fördelning av poäng.
  • För att se hur man lägger in värdespar i ett kartesiskt diagram läser du den här artikeln.
  • varningar

    • Kovariansen har begränsad tillämpning i statistiken - dess beräkning är ofta ett mellanliggande steg för att hitta korrelationsindex eller andra villkor. Var försiktig så att du inte drar slutsatser som bygger för mycket på detta faktum.
    Dela på sociala nätverk:

    Relaterade
    Hur man beräknar skalfaktornHur man beräknar skalfaktorn
    Hur man beräknar relativ riskHur man beräknar relativ risk
    Hur man beräknar P-värdetHur man beräknar P-värdet
    Hur man beräknar volymen hos en kotteHur man beräknar volymen hos en kotte
    Hur man beräknar en kubens volym med hjälp av ytanHur man beräknar en kubens volym med hjälp av ytan
    Hur man beräknar accelerationHur man beräknar acceleration
    Hur man beräknar ytan på ett kvadrat från diagonalenHur man beräknar ytan på ett kvadrat från diagonalen
    Hur man beräknar området för en diamantHur man beräknar området för en diamant
    Hur man beräknar en kvadrats diagonalHur man beräknar en kvadrats diagonal
    Hur man beräknar storleken på en provHur man beräknar storleken på en prov
    » » Hur man beräknar Covariance

    © 2011—2021 gushelom.ru