gushelom.ru

Hur man beräknar de anomala värdena

Ett avvikande värde är en numerisk data som skiljer sig väsentligt från de andra data i ett prov. Denna term används i statistiska studier och kan indikera avvikelser i de studerade data eller fel i mätningar. Att veta hur man hanterar outliers är viktigt för att säkerställa en adekvat förståelse av data och möjliggöra mer exakta slutsatser från studien. Det finns ett ganska enkelt förfarande som låter dig beräkna de onormala värdena i en given uppsättning värden.

steg

1
Lär dig att känna igen potentiella avvikande värden. Innan du beräknar om ett visst numeriskt värde är ett anomalt värde, är det användbart att undersöka datauppsättningen och välja de potentiella avvikande värdena. Tänk till exempel en uppsättning data som representerar temperaturen på 12 olika objekt som ligger i samma rum. Om 11 av objekten har en temperatur inom ett visst område av temperaturer nära 21 grader Celsius, men den tolfte objektet (kanske en ugn) har de 150 grader Celsius, kan en ytlig undersökning leda till slutsatsen att mätningen av ugnstemperaturen är ett potentiellt avvikande värde.
  • 2
    Ordna numeriska värden i stigande ordning. Fortsätter med det föregående exemplet, betrakta följande uppsättning nummer som representerar temperaturerna hos vissa objekt: {21, 20, 23, 20, 20, 19, 20, 22, 21, 150, 21, 19}. Denna uppsättning ska beställas enligt följande: {19, 19, 20, 20, 20, 20, 21, 21, 21, 22, 23, 150}.
  • 3
    Beräknar median för datasatsen. Median är numret över vilket hälften av data finns och under vilken den andra halvan är belägen. Om uppsättningen har jämn kardinalitet måste man genomsnitts mellan de två mellanliggande termerna. I det föregående exemplet är de två mellanliggande termerna 20 och 21, så medianen är ((20 + 21) / 2), vilken är 20,5.
  • 4
    Beräkna den första kvartilen. Detta värde, kallat Q1, är det nummer under vilket 25 procent av den numeriska data är belägen. Med hänvisning tillbaka igen till exempel på den första, även i detta fall är det nödvändigt att göra den genomsnittliga mellan två tal, i detta fall är det 20 och 20. Deras genomsnittliga är ((20 + 20) / 2), dvs 20.
  • 5
    Beräkna den tredje kvartilen. Detta värde, kallat Q3, är numret över vilket 25 procent av data finns. Fortsatt med samma exempel ger medelvärdet mellan 2 värden 21 och 22 ett Q2-värde på 21,5.
  • 6
    Hitta "inre staket" för alla data. Det första steget är att multiplicera skillnaden mellan Q1 och Q3 (kallad interkvartilavvikelse) med 1,5. I exemplet är interkvartilskillnaden (21,5-20), dvs 1,5. Multiplicera detta gap med 1,5 får du 2,25. Lägg till detta nummer till Q3 och dra det från Q1 för att bygga de inre staket. I vårt exempel skulle de inre stängselarna vara 17,75 och 23,75.
  • Några numeriska data utanför detta intervall betraktas som ett något anomalöst värde. I värdena i vårt exempel anses endast ugns temperaturen, 150 grader, vara ett mildt avvikande värde.
  • 7
    Hitta "yttre stängsel" för uppsättningen värden. Du kan hitta dem exakt med samma procedur som du använde för inre staket, förutom det faktum att interkvartilskillnaden multipliceras med 3 snarare än 1,5. Multiplicera interkvartilskiktet som erhållits i vårt exempel med 3 get (1.5 * 3) 4.5. De yttre staketen är därför 15,5 och 26.
  • Alla numeriska data som ligger utanför yttre stängsel anses vara ett extremt avvikande värde. I vårt exempel anses ugns temperaturen på 150 grader också vara ett extremt avvikande värde.
  • tips

    • När de avvikande värdena hittats, försök att förklara deras närvaro innan de kasseras från den uppsatta data som detekterats - de kan indikera både mätfel och avvikelser vid fördelningen av data.

    Saker du behöver

    • kalkylator
    Dela på sociala nätverk:

    Relaterade
    Hur man beräknar totalt upplösta fastämnenHur man beräknar totalt upplösta fastämnen
    Hur man beräknar tillväxtenHur man beräknar tillväxten
    Hur man beräknar P-värdetHur man beräknar P-värdet
    Hur man beräknar termisk kapacitetHur man beräknar termisk kapacitet
    Hur man beräknar den genomsnittliga avvikelsen från medelvärdet (för oupphörig data)Hur man beräknar den genomsnittliga avvikelsen från medelvärdet (för oupphörig data)
    Hur man beräknar standardavvikelseHur man beräknar standardavvikelse
    Hur man beräknar storleken på en provHur man beräknar storleken på en prov
    Hur man beräknar kumulativ frekvensHur man beräknar kumulativ frekvens
    Hur man beräknar det viktade medelvärdetHur man beräknar det viktade medelvärdet
    Hur man beräknar noggrannhetHur man beräknar noggrannhet
    » » Hur man beräknar de anomala värdena

    © 2011—2021 gushelom.ru