Spridningsmått
Denna sida är uppdaterad 2002-10-08

När vi har fått ett centralmått vill vi veta hur mätvärdena fördelar sig runt detta centralmått. Ligger de flesta nära centralmåttet eller ligger de utspridda? För att svara på detta räknar vi fram ett eller flera lämpliga spridningsmått. Centralmått och spridningsmått tillhör den beskrivande statistiken. Exempel på spridningsmått är:

Range = Variationsvidd
Det enklaste sättet att beskriva spridningen i ett material är att ange dess range. Range anger det lägsta och högsta mätvärde man har funnit. Alla andra mätvärden ligger mellan dessa två värden. Det är vanligt att man har något eller några enstaka värden som är konstiga och ligger extremt lågt eller högt, så kallade " outliners". Eftersom range blir helt beroende av enstaka outliners är det ett dåligt spridningsmått. Detta är orsaken till att det inte används så ofta (Altman; 1991).

Centiler, Percentiler, Interquartilavstånd
Genom att ange två värden som innefattar de flesta mätvärden, istället för som vid range alla mätvärden, minskar effekterna av enstaka outliners. Dessa värden kallas centiler. De vanligaste varianterna av centiler är percentiler som delar in materialet i 100 lika stora delar, kvartiler delar in materialet i fyra lika stora delar och slutligen deciler som delar materialet i 10 lika stora delar. Vanligt är att ange de mätvärden inom vilka 95% av alla mätvärden ligger, detta kallas 95% central range (Altman; 1991). De mätvärden som innefattar ett 95% range kallas 2,5%-percentilen och 97,5%-percentilen. Ett annat vanligt mått är 50% central range, detta kallas vanligen interkvartilavstånd (interquartil range) eftersom en fjärdedel av mätvärdena är borttagna både nertill och upptill. Centiler och speciellt interquartilavstånd används som spridningsmått när det är olämpligt att använda standardavvikelsen, ofta är variabeln då en ordnad kategorisk variabel, exempelvis VAS (Visuell Analog Skala).

Varians, Standardavvikelse (Standarddeviation)
Standardavvikelsen är det vanligaste sättet för att ange spridning om variabeln är kvantitativ. Varians och standardavvikelse beskriver hur mycket enstaka mätvärden är utspridda från medelvärdet i vårt stickprov. Om variabeln är snedfördelad ger standardavvikelse en missvisande bild av variabelns spridning och då är det bättre att använda ett annat spridningsmått, exempelvis interkvartilavstånd. Mer information om varians och standardavvikelse finns på en annan sida.

Variationskoefficient
Anger hur stor standardavvikelsen är i förhållande till det aritmetiska medelvärdet. Förkortas ofta till C.V.. Variationskoefficienten är ett mått på den relativa spridningen och brukar anges i % (Formel 1). Ett vanligt användningsområde för variationskoefficienten är att jämföra mätnoggrannheten mellan olika laboratoriemetoder.

=

Medelvärdet för variabeln x

S

=

Standardavvikelsen för variabeln x

Formel 1 - Variationskoefficient

Medelfel
Även om en del menar att medelfel är ett slags spridningsmått så hör inte medelfel till området beskrivande statistik utan till den analytiska statistiken. Mer information finns på en särskild sida om medelfel.

Spridningsintervall = variationsintervall = variationsvidd
Spridningsintervall definierar inom vilka gränser en viss andel, exempelvis 95%, av antalet mätvärden i den undersökta gruppen ligger. Spridningsintervallet kan tas fram på två sätt. Det mindre vanliga sättet är direktmetoden, man lägger då alla mätvärden i en lång rad från det lägsta till det högsta och skär sedan bort samma andel av de lägsta respektive högsta mätvärdena. Direktmetoden att beräkna spridningsintervall kallas med ett annat namn för centiler (se ovan). Direktmetoden kräver inte att materialet skall ha en viss fördelning, exempelvis normalfördelning, och är därför en icke-parametrisk metod.
    Ett vanligare sätt är att med en teoretisk modell på matematisk väg räkna fram ett spridningsintervall (Formel 2). Den teoretiska modellen kräver att materialet är normalfördelat och detta är därför en parametrisk metod.

 

=

Medelvärdet för variabeln x

S

=

Standardavvikelsen för variabeln x

Z

=

Standard normal deviate

Formel 2 - Spridningsintervall

Värdet på Z bestämmer hur brett spridningsintervallet är (Tabell 1). Som vi ser ligger lite drygt 95% av alla mätvärden inom ± 2 standardavvikelser från medelvärdet.

Tabell 1 - Spridningsintervall och standard normal deviate

Spridningsintervall

Z (Standard Normal Deviate)

90% 1,645
95% 1,960
99% 2,576
99,9% 3,291
 

Referenser
Altman DG. Describing data. In Practical statistics for medical research. Altman DG. London: Chapman & Hall 1991, pp19-47.


Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.