Standardavvikelse
(=Standarddeviation)
Denna sida är uppdaterad 2002-10-08
Standardavvikelse är en metod för att skatta spridningen av en kvantitativ variabel. I första hand används standardavvikelse om variabeln är normalfördelad. Om variabeln är snedfördelad ger standardavvikelse en missvisande bild av variabelns spridning och då är det bättre att använda ett annat spridningsmått, exempelvis interkvartilavstånd. Mer information om andra sorters spridningsmått finns på en annan sida.
Bakomliggande teori
En tilltalande metod för att beskriva spridningen i ett material (i en
grupp) är att försöka räkna ut avvikelsen för varje enskilt mätdata från
medelvärdet och sedan räkna ut ett slags medelvärde för alla avvikelserna.
Man skall då först summera alla avvikelser och sedan dividera dem med antalet
avvikelser. Ett första problem man då stöter på är att ungefär lika många
avvikelser ligger ovan medelvärdet som nedanför det. Summan av alla avvikelser
blir alltså alltid noll. Detta problem kringgår man genom att först kvadrera
alla avvikelserna innan man summerar dem. Därefter dividerar man med antalet
observationer. Det mått man då får fram kallas varians och är ett mått på
den genomsnittliga avvikelsen från medelvärdet. Man kan räkna ut variansen
för en total population (Formel 1).
x |
= |
Enskilt mätvärde |
n |
= |
Antal individer i populationen |
Formel 1 - Variansen för en total population |
Oftast är inte den totala populationen undersökt och då räknar man fram variansen för sitt stickprov. Om vi bara var intresserade av variansen i stickprovet kunde vi använda formel 1. Oftast vill vi extrapolera våra fynd till en större total population och då har man funnit att man får en bättre skattning av variationen i denna större totala population genom att dividera med n-1 istället för n (Formel 2).
x |
= |
Enskilt mätvärde |
n |
= |
Antal individer i stickprovet |
Formel 2 - Variansen för ett stickprov |
Kvadraten på alla avvikelserna alltid blir mindre i ett stickprov än i den totala bakomliggande populationen (komplicerat resonemang som inte gås igenom i detalj här). Motivet till att dividera med n-1 istället för n är att variansen då ger en bättre skattning av den genomsnittliga avvikelsen i den bakomliggande populationen. Skillnaden mellan att dividera med n respektive n-1 är försumbar vid större stickprov.
Varians blir standardavvikelse
Variansen har samma enhet som vårt mätvärde fast i kvadrat. Om vi mäter
blodtryck har våra mätvärden enheten mmHg medan variansen har enheten mmHg2.
I många sammanhang är det mer praktiskt om vårt spridningsmått har samma
enhet som mätvärdet. Av detta skäl är vi ofta mer intresserade av standardavvikelsen än variansen i vårt stickprov.
Standardavvikelsen i ett
stickprov är kvadratroten ur variansen (Formel 3).
x |
= |
Enskilt mätvärde |
n |
= |
Antal individer i stickprovet |
Formel 3 - standardavvikelsen i ett stickprov |
När man har räknat ut standardavvikelsen bör den anges med lika många
decimalers noggrannhet som medelvärdet,
eller med en extra decimal (Altman; 1991).
De vanligaste beteckningarna för standardavvikelsen är sd, SD,
s, eller s (den grekiska bokstaven sigma). Standardavvikelsen
är inte den genomsnittliga avvikelsen utan ett mått på den genomsnittliga
avvikelsen. Eftersom standardavvikelsen innehåller en kvadrering är den
liksom måttet medelvärde känslig för extremvärden ("outliners"),
framför allt höga extremvärden.
Referenser
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.