Standardavvikelse (standarddeviation SD)

Standardavvikelse är en metod för att skatta spridningen av en kvantitativ variabel. I första hand används standardavvikelse om variabeln är normalfördelad. Om variabeln är snedfördelad ger standardavvikelse en missvisande bild av variabelns spridning och då är det bättre att använda ett annat spridningsmått, exempelvis interkvartilavstånd. Mer information om andra sorters spridningsmått finns på en annan sida.

Bakomliggande teori
En tilltalande metod för att beskriva spridningen i ett material (i en grupp) är att försöka räkna ut avvikelsen för varje enskilt mätdata från medelvärdet och sedan räkna ut ett slags medelvärde för alla avvikelserna. Man skall då först summera alla avvikelser och sedan dividera dem med antalet avvikelser. Ett första problem man då stöter på är att ungefär lika många avvikelser ligger ovan medelvärdet som nedanför det. Summan av alla avvikelser blir alltså alltid noll. Detta problem kringgår man genom att först kvadrera alla avvikelserna innan man summerar dem. Därefter dividerar man med antalet observationer. Det mått man då får fram kallas varians och är ett mått på den genomsnittliga avvikelsen från medelvärdet. Man kan räkna ut variansen för en total population (Formel 1).


x	=	Enskilt mätvärde
n	=	Antal individer i populationen
Formel 1 - Variansen för en total population

Oftast är inte den totala populationen undersökt och då räknar man fram variansen för sitt stickprov. Om vi bara var intresserade av variansen i stickprovet kunde vi använda formel 1. Oftast vill vi extrapolera våra fynd till en större total population och då har man funnit att man får en bättre skattning av variationen i denna större totala population genom att dividera med n-1 istället för n (Formel 2).


x	=	Enskilt mätvärde
n	=	Antal individer i stickprovet
Formel 2 - Variansen för ett stickprov

Kvadraten på alla avvikelserna alltid blir mindre i ett stickprov än i den totala bakomliggande populationen (komplicerat resonemang som inte gås igenom i detalj här). Motivet till att dividera med n-1 istället för n är att variansen då ger en bättre skattning av den genomsnittliga avvikelsen i den bakomliggande populationen. Skillnaden mellan att dividera med n respektive n-1 är försumbar vid större stickprov.

Varians blir standardavvikelse
Variansen har samma enhet som vårt mätvärde fast i kvadrat. Om vi mäter blodtryck har våra mätvärden enheten mmHg medan variansen har enheten mmHg². I många sammanhang är det mer praktiskt om vårt spridningsmått har samma enhet som mätvärdet. Av detta skäl är vi ofta mer intresserade av standardavvikelsen än variansen i vårt stickprov. Standardavvikelsen i ett stickprov är kvadratroten ur variansen (Formel 3).


x	=	Enskilt mätvärde
n	=	Antal individer i stickprovet
Formel 3 - standardavvikelsen i ett stickprov

När man har räknat ut standardavvikelsen bör den anges med lika många decimalers noggrannhet som medelvärdet, eller med en extra decimal (Altman; 1991).
De vanligaste beteckningarna för standardavvikelsen är sd, SD, s, eller s (den grekiska bokstaven sigma). Standardavvikelsen är inte den genomsnittliga avvikelsen utan ett mått på den genomsnittliga avvikelsen. Eftersom standardavvikelsen innehåller en kvadrering är den liksom måttet medelvärde känslig för extremvärden ("outliners"), framför allt höga extremvärden.

Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare