Konfidensintervall
Denna sida är uppdaterad 2002-10-08
Standardiserad normalfördelad variabel = Standard Normal deviate
Vi har på sidan om medelfel konstaterat att
medelvärdet av många olika stickprov är normalfördelade. Varje
normalfördelad kurva (diagram 1) har en mittpunkt (ett medelvärde). Bredden
på kurvan kan beskrivas med måttet standardavvikelse
(=SD). Vid avståndet ± 1 SD från medelvärdet övergår kurvan från konvex
till konkav böjning.
Diagram 1 |
Låt oss anta att vi drar en vertikal linje en bit till höger om medelvärdet och en likadan linje till vänster om medelvärdet. Vi lägger våra nya vertikala linjer på samma avstånd från medelvärdet. Hur stor del av kurvans yta hamnar mellan linjerna (eller med andra ord hur många stickprov hamnar mellan linjerna)? Om avståndet från medelvärdet till linjerna är:
± 1,00 SD | hamnar 68,27% av stickproven mellan linjerna |
± 1,96 SD | hamnar 95,00% av stickproven mellan linjerna |
± 2,00 SD | hamnar 95,45% av stickproven mellan linjerna |
± 2,58 SD | hamnar 99,00% av stickproven mellan linjerna |
± 3,30 SD | hamnar 99,90% av stickproven mellan linjerna |
Avståndet från medelvärdet beskrivet som antal standardavvikelser (SD) kallas för Standardiserad normalfördelad variabel (= Standard Normal deviate = Normal score) och betecknas ofta som Z. Man kan få fram den genom att gå in i en tabell över normalfördelningen. Andelen stickprov som hamnar inom vår avgränsning kallas konfidensnivå.
Skillnad mellan spridningsintervall och konfidensintervall
Spridningsintervall talar om hur enskilda mätvärden är utspridda
från ett medelvärde. Spridningsintervallet för många medelvärden kallas
för konfidensintervall. Konfidensintervallet talar alltså om hur mycket medelvärdet
avviker från det sanna medelvärdet (eller egentligen hur sannolikt det är att
finna det den bakomliggande populationens verkliga medelvärdet inom ett visst intervall från medelvärdet i
vårt stickprov). Spridningsintervall beskriver alltså enskilda mätvärden
medan konfidensintervall talar om medelvärden. Man skulle kunna säga att...
...konfidensintervallet är ett mått på den osäkerhet slumpen bidrar med när det vi försöker skatta den bakomliggande populationens medelvärde. |
Att räkna fram konfidensintervall
Konfidensintervallet beräknas genom följande formel:
Tabell 1 - Att räkna fram konfidensintervall för kontinuerlig variabel | |||||
Princip: | Punktskattning | ± | Felmarginal | ||
Princip: | Punktskattning | ± | tabellvärde | * | Punktskattningens medelfel |
Formel: | ± | Z | * | SE | |
Exempel: | 42 | ± | 1,96 | * | 3,9 |
Exempel forts. | 42 ± 7,644 = 34,356 - 49,644 | ||||
Exempel forts. | Det är 95% sannolikhet att den bakomliggande populationens sanna medelvärde återfinns i intervallet 34,356 - 49,644 |
I ovanstående exempel är felmarginalen 7,644 och därmed är konfidensintervallets vidd 2x7,644. Intervallet 34,356 - 49,644 kallar man för konfidensintervall. I det här fallet skulle det kunna vara en kontinuerlig variabel (exempelvis värdet på CRP i en grupp patienter) eller en dikotom variabel (exempelvis könsfördelning i % i en grupp patienter).
Storlek på konfidensintervall
Små konfidensintervall säger att vårt stickprov med stor säkerhet kan
förutsäga den bakomliggande populationens verkliga medelvärde. Små
konfidensintervall säger oss att slumpen bidrar bara med en liten osäkerhet
när vi uttalar oss om populationens sanna medelvärde. Storleken på
konfidensintervallet bestäms av:
Tabell 2 - Storleken på konfidensintervallet bestäms av: | ||
* | Konfidensnivå |
Värdet på Z. Vanlig nivå är 95% och då väljer man Z=1,96. 99% konfidensnivå ger bredare konfidensintervall än 95%. |
* | Variation |
Om det finns stor slumpmässig variation blir medelfelet (SE) högt och då ökar konfidensinteravllet. Alltså viktigt att försöka minimera slumpmässiga fel. |
* | Stickprovets storlek |
Vi kan se på formlerna för medelfel att medelfelet ökar ju mindre stickprovet är. Stort medelfel ger stora konfidensintervall (se tabell 1 ovan). |
Konfidensintervall - signifikanstestning
Signifikansnivån kallas alfa och är risken att göra ett typ I fel.
Signifikanstestning och konfidensintervall är lite
olika sidor av samma mynt. Signifikanstestning med 5% signifikansnivå ger samma
resultat som att se om ett medelvärde ligger innanför eller utanför 95%
konfidensintervall.
Låt oss titta på ett exempel. Antag att en grupp patienter
har fått C-vitamin. Deras förändring i diastoliskt medelblodtryck är efter 6
månader -3 mm Hg. Innebär det att gruppens medelblodtryck har sjunkit? Ja det
har det naturligtvis gjort men kan sänkningen förklaras av slumpen eller är
sänkningen statistiskt signifikant? Om vi gör ett 95% konfidensintervall kanske
det skulle ligga mellan -6 - 0. Det innebär att vårt konfidensintervall gränsar
till 0 (0 innebär ju ingen förändring). Om vi gjorde en vanlig
signifikansprövning där vi ser om sänkningen -3 mm Hg skiljer sig från det fixa
värdet 0 (exempelvis genom Student's t-test one sample
test) skulle vi se att p=0,05. Om det hade varit så att vårt 95%-iga
konfidensintervall varit -7 - 1 hade nollan legat en bit inne i intervallet och
då borde vi se att p>0,05. Om å andra sidan vårt 95%-iga konfidensintervall hade
legat mellan -5 och -1 hade nollan legat utanför konfidensintervallet och då
skulle vi finna att p<0,05. Om vi sätter istället gör 99%-iga konfidensintervall
gäller samma resonemang för signifikansnivån 0,01.
Mer information
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.