Konfidensintervall
Denna sida är uppdaterad 2002-10-08

Standardiserad normalfördelad variabel = Standard Normal deviate
Vi har på sidan om medelfel konstaterat att medelvärdet av många olika stickprov är normalfördelade. Varje normalfördelad kurva (diagram 1) har en mittpunkt (ett medelvärde). Bredden på kurvan kan beskrivas med måttet standardavvikelse (=SD). Vid avståndet ± 1 SD från medelvärdet övergår kurvan från konvex till konkav böjning.

Diagram 1

Låt oss anta att vi drar en vertikal linje en bit till höger om medelvärdet och en likadan linje till vänster om medelvärdet. Vi lägger våra nya vertikala linjer på samma avstånd från medelvärdet. Hur stor del av kurvans yta hamnar mellan linjerna (eller med andra ord hur många stickprov hamnar mellan linjerna)? Om avståndet från medelvärdet till linjerna är:

± 1,00 SD hamnar 68,27% av stickproven mellan linjerna
± 1,96 SD hamnar 95,00% av stickproven mellan linjerna
± 2,00 SD hamnar 95,45% av stickproven mellan linjerna
± 2,58 SD hamnar 99,00% av stickproven mellan linjerna
± 3,30 SD hamnar 99,90% av stickproven mellan linjerna

Avståndet från medelvärdet beskrivet som antal standardavvikelser (SD) kallas för Standardiserad normalfördelad variabel (= Standard Normal deviate = Normal score) och betecknas ofta som Z. Man kan få fram den genom att gå in i en tabell över normalfördelningen. Andelen stickprov som hamnar inom vår avgränsning kallas konfidensnivå.

Skillnad mellan spridningsintervall och konfidensintervall
Spridningsintervall talar om hur enskilda mätvärden är utspridda från ett medelvärde. Spridningsintervallet för många medelvärden kallas för konfidensintervall. Konfidensintervallet talar alltså om hur mycket medelvärdet avviker från det sanna medelvärdet (eller egentligen hur sannolikt det är att finna det den bakomliggande populationens verkliga medelvärdet inom ett visst intervall från medelvärdet i vårt stickprov). Spridningsintervall beskriver alltså enskilda mätvärden medan konfidensintervall talar om medelvärden. Man skulle kunna säga att...

...konfidensintervallet är ett mått på den osäkerhet slumpen bidrar med när det vi försöker skatta den bakomliggande populationens medelvärde.

Att räkna fram konfidensintervall
Konfidensintervallet beräknas genom följande formel:

Tabell 1 - Att räkna fram konfidensintervall för kontinuerlig variabel
Princip: Punktskattning ± Felmarginal
Princip: Punktskattning ± tabellvärde * Punktskattningens medelfel
Formel: ± Z * SE
Exempel: 42 ± 1,96 * 3,9
Exempel forts. 42 ± 7,644 = 34,356 - 49,644
Exempel forts. Det är 95% sannolikhet att den bakomliggande populationens sanna medelvärde återfinns i intervallet 34,356 - 49,644

I ovanstående exempel är felmarginalen 7,644 och därmed är konfidensintervallets vidd 2x7,644. Intervallet 34,356 - 49,644 kallar man för konfidensintervall. I det här fallet skulle det kunna vara en kontinuerlig variabel (exempelvis värdet på CRP i en grupp patienter) eller en dikotom variabel (exempelvis könsfördelning i % i en grupp patienter).

Storlek på konfidensintervall
Små konfidensintervall säger att vårt stickprov med stor säkerhet kan förutsäga den bakomliggande populationens verkliga medelvärde. Små konfidensintervall säger oss att slumpen bidrar bara med en liten osäkerhet när vi uttalar oss om populationens sanna medelvärde. Storleken på konfidensintervallet bestäms av:

Tabell 2 - Storleken på konfidensintervallet bestäms av:
* Konfidensnivå

Värdet på Z. Vanlig nivå är 95% och då väljer man Z=1,96. 99% konfidensnivå ger bredare konfidensintervall än 95%.

* Variation

Om det finns stor slumpmässig variation blir medelfelet (SE) högt och då ökar konfidensinteravllet. Alltså viktigt att försöka minimera slumpmässiga fel.

* Stickprovets storlek

Vi kan se på formlerna för medelfel att medelfelet ökar ju mindre stickprovet är. Stort medelfel ger stora konfidensintervall (se tabell 1 ovan).

Konfidensintervall - signifikanstestning
Signifikansnivån kallas alfa och är risken att göra ett typ I fel. Signifikanstestning och konfidensintervall är lite olika sidor av samma mynt. Signifikanstestning med 5% signifikansnivå ger samma resultat som att se om ett medelvärde ligger innanför eller utanför 95% konfidensintervall.
    Låt oss titta på ett exempel. Antag att en grupp patienter har fått C-vitamin. Deras förändring i diastoliskt medelblodtryck är efter 6 månader -3 mm Hg. Innebär det att gruppens medelblodtryck har sjunkit? Ja det har det naturligtvis gjort men kan sänkningen förklaras av slumpen eller är sänkningen statistiskt signifikant? Om vi gör ett 95% konfidensintervall kanske det skulle ligga mellan -6 - 0. Det innebär att vårt konfidensintervall gränsar till 0 (0 innebär ju ingen förändring). Om vi gjorde en vanlig signifikansprövning där vi ser om sänkningen -3 mm Hg skiljer sig från det fixa värdet 0 (exempelvis genom Student's t-test one sample test) skulle vi se att p=0,05. Om det hade varit så att vårt 95%-iga konfidensintervall varit -7 - 1 hade nollan legat en bit inne i intervallet och då borde vi se att p>0,05. Om å andra sidan vårt 95%-iga konfidensintervall hade legat mellan -5 och -1 hade nollan legat utanför konfidensintervallet och då skulle vi finna att p<0,05. Om vi sätter istället gör 99%-iga konfidensintervall gäller samma resonemang för signifikansnivån 0,01.

Mer information


Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.