gushelom.ru

Hur man ligger med statistik

Som alla med ett öga på detaljer vet, kan statistiken vara mycket flexibel utan ett sammanhang som hjälper till att tolka dem. Läs stegen nedan för att lära dig att fånga vilseledande och vilseledande statistik och använda den kunskapen till din fördel.

Metod 1

Ligger med Medium
Bildnamn Lie med statistik Steg 1
1
Lär dig terminologin. Ordet "media" kan betyda många saker när man diskuterar statistiska data. Vid första anblicken är termen ganska enkel: medelvärdet är den mängd som faller ungefär i mitten. Det finns emellertid några olika typer av medelvärden, som vart och ett kan vara vilseledande om det inte förstås tillräckligt.
  • den aritmetisk medelvärde Den erhålls genom att lägga till alla siffror i en lista och dela dem med antalet poster. Med andra ord, om du har siffrorna 3, 3, 5, 4 och 7, erhålls det matematiska medelvärdet genom att summera alla siffror (och du får 22) och dela denna summa med 5 (eftersom det finns fem siffror i provet) .
  • I det här exemplet är genomsnittsvärdet 4,4.
  • den viktat medelvärde representerar det värde som faller halvvägs mellan de lägsta numren och det högsta antalet av ett prov. Med samma data som tidigare (3, 3, 5, 4 och 7) är det vägda genomsnittet 4, eftersom 2 av siffrorna är mindre och 2 är större.
  • den harmonisk medelvärde Det är en representation av det vanligaste numret i datagruppen. Med vårt exempel är det harmoniska medelvärdet 3 eftersom det visas två gånger.
  • Bildnamn Lie med statistik Steg 2
    2
    Ligga med aritmetiska medel. Det här mediet kan tyckas vara mest idiotiskt av de metoder som beskrivits ovan, men det är inte alls så. Detta beror på att extremt höga eller låga siffror i datalistan kan väsentligt fluktuera medelvärdet. Du ligger med ett aritmetiskt medelvärde genom att beakta data i ändarna och använda dem i ekvationen.
  • Tänk dig för exempel att göra en undersökning av inkomsten av 50 familjer i ett grannskap. De flesta familjer tjänar mellan € 40.000 och € 60.000 på ett år, men en familj har en inkomst på 5 miljoner euro per år. Vid beräkning av det aritmetiska genomsnittet kommer numret att vara betydligt högre än medelinkomsten "real" i det området, eftersom värdet på 5 miljoner euro är mycket större än de andra.
  • På samma sätt, om jag hade uppgifter som visar att 9 personer har 1 000 euro vardera i sina bankkonton, men en tiondel person bara har 1 euro skulle det vägda genomsnittet ha varit 900.10 euro - nästan 10% lägre till den vanligaste.
  • Förtroliga undersökningar tar ofta bort mycket högre och mycket lägre siffror innan man beräknar genomsnittet. Men inte alla du ser på TV-nyheterna är pålitliga. Om du inte har direkt tillgång till all data, eller om du har en skriftlig garanti för att avvikande eller extrema värden har tagits bort är det säkrare att anta att de inte är.
  • Bildnamn Lie med statistik Steg 3
    3
    Ligger med vägda medelvärden. Detta genomsnitt är faktiskt det svåraste värdet "lurar"eftersom det aldrig kan vara för högt eller för lågt jämfört med de flesta värdena i listan. Det måste falla tillbaka till mitten med våld. Du kan dock använda det vägda genomsnittet för att dölja ett mycket stort eller mycket litet antal. Om listan exempelvis är 1, 1, 2, 3, 4, 5, 3000, är ​​det vägda genomsnittet 3.
  • När du har en enhetlig mängd data kan du beräkna det vägda genomsnittet för att hitta medelvärdet av de två objekten däremellan. Detta tar emellertid inte hänsyn till de onormala värdena.
  • Var uppmärksam på de viktade medelvärdena som används för att beskriva förändringar över tiden. Ett företag som ökar priset på sina tjänster med 3% varje år kan få dem att växa 20% i år och gömma det genom att presentera ett vägt genomsnitt på 3% under de senaste 9 åren.
  • Bildnamn Lie med statistik Steg 4
    4
    Ligger med harmoniska medelvärden. I vissa fall är det nästan omöjligt att ligga med de harmoniska medelvärdena - det genomsnittliga antalet köpta biljetter per person för en fotbollsmatch är till exempel nästan alltid en tillförlitlig siffra i denna typ av beräkning. De harmoniska medelvärdena kan dock utesluta viktiga data, särskilt i mindre prover.
  • Om du till exempel har en lista över alla tal som sträcker sig från 1 till 100, men numret 1 är inmatat 3 gånger, kommer 1 att vara det harmoniska medelvärdet, även om det aritmetiska medelvärdet (och i det här fallet det mest förnuftiga) är mycket närmare 50
  • Varje storskalig undersökning kan manipuleras genom att accentuera den harmoniska statistiken. Antag att vi gör en undersökning av 100 personer som ber dem att utvärdera ett ämne med en skala från 1 till 10. Om många har givit omröstningen 10 snarare än någon annan omröstning blir harmoniskt medelvärde 10 även om det finns flera personer (men i kvantitet mindre) som avgav en omröstning 1.
  • Bildnamn Lie med statistik Steg 5
    5
    Ligga med representation av siffror. Om du har en lista över abstrakta data, snarare än konkreta siffror (till exempel en kundundersökningsundersökning) är det nästan skrämmande lätt att ljuga med dessa data. Om du ber folk att betygsätta sin tillfredsställelse på en skala från 1 till 3 betyder det inte nödvändigtvis att kunder som har valt 3 är tre gånger lyckligare än de som har valt 1. Denna beräkning används främst för asymmetriska medelvärden, men det kan också användas ibland till det vägda genomsnittet och till och med till det aritmetiska medelvärdet.
  • Metod 2

    Ligga med ett exempel på data
    Bildnamn Lie med statistik Steg 6
    1
    Använd en reducerad uppsättning. Varje bra statsman vet att det enda sättet att närma sig ett användbart medelvärde eller att identifiera en verklig tendens är att samla data från en helhet så bred som möjligt. Om du kan få information från 100 personer är det bra med 10.000 är ännu bättre. Ju fler informationsposter är angivna i datalistan desto mer sannolikt är det att få tillförlitliga medel. Med hjälp av en serie med 3 eller 5 data kan du få resultat som inte exakt återspeglar situationen.
    • Till exempel, om du hittar två personer som nyligen skadade så dum - som med en kudde - och använder dessa data som om de vore en fullständig utredning, kan det få dra slutsatsen att kuddarna är farligt för alla. Oavsett vilket media du väljer att använda, om du inte avslöjar storleken på ditt prov som ges av endast 2 personer, kan du inte åberopa ditt krav.
  • Bildnamn Lie med statistik Steg 7
    2
    Använd ett kontrollerat prov. De mest korrekta dataproverna är inte bara stora, men de är också stora. En geologisk undersökning om typerna av mineraler i en öken kommer att få en mer exakt lista om du samlar in många prover från varje del av öknen, istället för att samla 1 000 prover från samma punkt. Genom att begränsa omfattningen av ditt dataprov kan du väsentligt påverka resultaten.
  • Ibland är detta funktionellt och görs med ändamål. En demografisk forskning för att identifiera det arbete som utförs av män kommer att utföra undersökningen om ett urval av män bara. Så länge detta klart framgår av uppgifterna, är det inget fel med det.
  • Resultaten från små forskningsprojekt som utförs på skolnivå tenderar i synnerhet att jämföra uppgifterna i deras undersökning med ett generellt resultat. Detta beror på att många skolprojekt inte har tid eller resurser att använda ett stort slumpmässigt urval av genomsnittliga medborgare, och bygger endast främst på universitetsstudenter. Återigen, detta är bra så länge sådan information tydligt märkt, men nätverket, alltid på jakt efter sensationella rubriker, har ofta överskuggat detaljerna i en liten universitetsstudie passerar bort det som en utredning av bredare.
  • Bildnamn Lie med statistik Steg 8
    3
    Använd ett obalanserat prov. Denna teknik är särskilt subtil eftersom den kan dölja mycket detaljer från användaren. Tricket är att använda data som objektivt inte kan jämföras och behandla dem som om de var på samma nivå. Om det till exempel finns en stad på 100 000 som har ökat med 10 000 invånare på 10 år och jämfört med en stad på 10 som har tjänat 10 andra invånare under de senaste 10 åren kommer procentsatserna för varje befolkningstillväxt att visas visa att den lilla staden har växt mycket snabbare.
  • Denna metod används ibland av personer som analyserar marknadsdata och presenterar en vilseledande bild av försäljningsuppgifter. Låt oss säga att du gör en analys av försäljningen av äpplen och apelsiner, men halvvägs genom undersökningen, det finns inga fler apelsiner eftersom det finns brist. Om du fortsätter att jämföra data för resten av undersökningen kommer det att finnas en stor stigning i äppelförsäljningen jämfört med försäljningen av apelsiner, även om äpplen troligtvis inte plötsligt blivit mer populära.
  • Metod 3

    Liggande med grafik
    Bildnamn Lie med statistik Steg 9
    1
    Lämna y tomt. Ingenting ger en tydligare bild av ett diagram eller ett bord, men även de kan manipuleras subtilt för att ge olika effekter. Detta beror på att människor tenderar att titta på former och storlekar på diagrammen innan de oroar sig för att kontrollera de numeriska specifikationerna som är relaterade till dem. Det enklaste sättet att manipulera y-axeln är helt enkelt att inte märka det.
    • Om du har ett urval av 5 staplar på x-axeln, men ingen indikation på hur hög de jämförs med varandra, kan du inte bedöma om det finns en signifikant skillnad mellan dem.
  • Bildnamn Lie med statistik Steg 10
    2
    Använd mycket stora eller små siffror på y. Låt oss säga att datasatsen är mellan 1 och 50. För att dölja skillnaderna kan du mäta y-axeln på en skala av 100, men mäta y-axeln i steg om 1/10 förbättrar data felaktigt. En skillnad mellan 3 och 10 verkar enorm, mätt i tiondelar (det här är 70 enheter från varandra!), Men det är knappt synligt på ett diagram vars skala är för varje 100 (det är mycket, mycket mindre än 1 enhet från varandra! ).
  • Bildnamn Lie med statistik Steg 11
    3
    Ställ y-axeln delvis genom intervallen. Om data varierar från 11 till 51 kan du få extrema värden att se ännu högre och lägre, märkning av y-axeln så att den börjar vid 10. Således är stången 11 representerad bara strax ovanför x-axeln. Detta kommer att få data att visas nästan null om inte någon är expert nog att faktiskt observera noggrant och se att diagrammet börjar från värdet 10 och inte från 0.
  • Stången som representerar 51 blir 50 gånger större än stapeln som representerar 11 på ett sådant diagram, eftersom den minsta stapeln endast är en enhet hög. Om grafen hade startat vid O, skulle staven som representerar 51 ha varit 5 gånger högre än höjden på stapeln som representerar 11.
  • Bildnamn Lie med statistik Steg 12
    4
    Använd en felaktig stege. Närhelst du ser orden "inte i skala" i det slutliga trycket är det troligt att ett exempel som detta gjordes. Det är inte alltid olyckligt - ibland är antalet involverade så olika att det inte finns något sätt att korrekt representera dem på samma diagram. Således kan den användas enkelt för icke-rekommenderade ändamål.
  • Exempelvis kan en visuell representation av dimensionerna skalas i höjd men inte i bredd, vilket gör objektet längre (till exempel en byggnad) och också mycket tunnare eller bredare än det faktiskt är.
  • Bildnamn Lie med statistik Steg 13
    5
    Använd grafik som lämnar data. Detta ses vanligtvis i stor statistik som delar upp resultat för vissa kategorier, såsom det kända diagrammet som visar hur en kolsyrad dryck är mer populär i ett län än i USA. Vid första anblicken verkar denna information mycket detaljerad, men frågor uppstår snart: hur stora är undersökningsdata? Vad är tröskeln för att bestämma resultatet? Har en aritmetisk, viktad eller harmonisk medel använts?
  • Om du bara använder ett resultat för varje intervjuat område, och du utesluter allt annat, kan du enkelt kontrollera resultaten efter område utan att någonsin informera om att provstorleken för varje område var liten. Även i detta fall är det brist på konkret information som gör resultaten mycket svår att kvantifiera.
  • tips

    • Vid tvivel, kolla. Om du inte kan få detaljerad och fullständig information om storlek, omfattning, metoder för provtagning av statistik, lita inte på.

    varningar

    • Det är ganska lätt att ljuga med statistiken när du vet hur man gör det, men det är inte strikt etiskt. Var uppmärksam på hur du använder den kunskap du har förvärvat. Använd inte dem för att skada, fuska eller marginalisera någon.
    Dela på sociala nätverk:

    Relaterade
    Hur man beräknar medelåldernHur man beräknar medelåldern
    Hur man beräknar den genomsnittliga avvikelsen från medelvärdet (för oupphörig data)Hur man beräknar den genomsnittliga avvikelsen från medelvärdet (för oupphörig data)
    Hur man beräknar standardavvikelseHur man beräknar standardavvikelse
    Hur man beräknar medelvärdetHur man beräknar medelvärdet
    Så här beräknar du medelvärdet, standardavvikelsen och standardfeletSå här beräknar du medelvärdet, standardavvikelsen och standardfelet
    Hur man beräknar den geometriska medelvärdetHur man beräknar den geometriska medelvärdet
    Hur man beräknar det viktade medelvärdetHur man beräknar det viktade medelvärdet
    Hur man beräknar ökningsprocentenHur man beräknar ökningsprocenten
    Hur man beräknar variansenHur man beräknar variansen
    Hur man beräknar en Z-poängHur man beräknar en Z-poäng
    » » Hur man ligger med statistik

    © 2011—2021 gushelom.ru