Chi-square test
= Chitvå-test
Denna sida är uppdaterad 2005-09-13
Här hittar du allmän information om ovan nämnda test samt beskrivning av hur man gör testet i statistikprogrammet Epi-Info.
Användningsområde
Metoden jämför fördelningen av en variabel som mäts
enligt nominalskalan. Även om det bara är en variabel vi vill utvärdera rör
vi oss oftast med två variabler. Den ena variabeln anger vårt egentliga mätvärde,
exempelvis könsfördelning eller fördelning till olika blodgrupper. Den andra
variabeln anger gruppindelning. Jämförelsen kan ske mellan en grupp och ett
förväntat fast värde, mellan två olika grupper eller mellan mer än två grupper.
Den principiella formeln för chi-två (x2) är:
O står för observerat värde och E för förväntat (Expected) värde. Man fyller i sina värden på O och E och räknar fram ett chi-två-värde. Man går sedan in i en tabell över chi-två-fördelningen och ser vilket p-värde detta motsvarar. I praktiken låter man oftast en dator räkna fram chi-två och motsvarande p-värde.
Jämförelse med fast förväntat värde
Det kan påpekas att det är betydligt vanligare att chi-två testet
används för att jämföra två oberoende grupper - två oberoende stickprov (se
nedan). Chi-två testet kan dock användas för jämförelse mellan en grupp (ett
stickprov) och ett fast förväntat värde. Detta kan vara av intresse
om man vill veta om ett stickprov man har samlat in skiljer sig från det som kan anses normalt
för den här populationen. Här anser man att "det som är normalt" är fastställt i
tidigare större undersökningar och det betraktas då som ett fast värde. Om dessa
tidigare undersökningar är små kan det riktas kritik mot en sådan här analys
eftersom "det som är normalt" kanske bara är en osäker gissning.
Låt oss räkna på ett exempel. Antag att vi planerar en
sjukvårdsinsats i ett u-land. Operationer måste kunna genomföras och
blodtransfusioner skall kunna ges. Hur fördelar sig de olika blodgrupperna i
detta u-land
jämfört med vad som kan anses normalt i Europa? Vi tar ett prov på 200
slumpmässigt utvalda personer från u-landet.
Blodgrupp | U-landet (Vårt stickprov) |
Europa (Fast fördelning) |
A | 58st | 45% |
B | 34st | 8% |
AB | 8st | 4% |
0 | 100st | 43% |
Vi kan förtydliga tabellen genom att byta ut kolumnen med den fasta fördelningen till en kolumn för förväntat antal om stickprovet på 200 individer hade följt den fasta fördelningen
Blodgrupp | Observerat värde (Vårt stickprov) |
Förväntat (expected) värde (Fast fördelning) |
A | 58st | 90 |
B | 34st | 16 |
AB | 8st | 8 |
0 | 100st | 86 |
I det här exemplet räknas chitvå ut enligt
Värdet 56,44 slår vi upp i en tabell över chi-två-fördelningen och ser att det motsvarar p<0,001 (vid tre frihetsgrader). Slutsatsen blir att i det aktuella u-landet har man i befolkningen en annan fördelning av blodgrupper än i Europa.
Jämförelse mellan två matchade grupper
Här kan chi-square inte användas utan man får använda
Teckentest (eller
Mc Nemar´s test).
Jämförelse mellan två omatchade grupper
Chi-två test för jämförelse mellan två omatchade grupper är ett av de
vanligaste statistiska testen som görs. Är jämförelsen mellan två grupper kan det exempelvis vara behandlingsgrupp och kontrollgrupp eller exempelvis
grupper utsatta för exponering A respektive exponering B. Vid fyrfältstabell är Fisher´s
exakta test ett bra alternativ till Chi-square.
Låt oss som exempel anta att vi vill jämföra fördelningen av
blodgrupper mellan två stickprov, det ena taget från européer och det andra från
ett land i Afrika.
Blodgrupp | Afrika (Stickprov) |
Europa (Stickprov) |
A | 58st | 90st |
B | 34st | 16st |
AB | 8st | 8st |
0 | 100st | 86st |
Som i ovanstående exempel förtydligar vi tabellen genom att lägga till kolumner för förväntat antal om vi antar att det inte är någon skillnad i fördelning av blodgrupper mellan Afrika respektive Europa. Exempelvis är förväntat antal afrikaner som har blodgrupp A det totala antalet observationer av blodgrupp A (148st) multiplicerat med totala antalet afrikaner (200st) delat med totala antalet individer (400st). De andra förväntade värdena räknas fram på samma sätt. Eftersom antalet afrikaner och antalet européer i det här exemplet råkar vara samma (200st) blir förväntat antal samma i kolumnen för afrikaner och européer. Hade det varit olika antal afrikaner respektiver européer hade deras förväntade antal blivit lite olika.
----- Afrika ----- | ----- Europa ----- | Summa | |||
Blodgrupp | Observerat | Förväntat | Observerat | Förväntat | observerat antal |
A | 58st | (148*200)/400=74st | 90st | 74st | 148 |
B | 34st | (50*200)/400=25st | 16st | 25st | 50 |
AB | 8st | (16*200)/400=8st | 8st | 8st | 16 |
0 | 100st | (186*200)/400=93st | 86st | 93st | 186 |
Summa | 200st | 200st | 400 |
I det här exemplet räknas chi-två ut enligt
Värdet 14,45 slår vi upp i en tabell över chi-två-fördelningen och ser att det motsvarar
p<0,01 men samtidigt >0,001 (vid tre frihetsgrader). Slutsatsen
blir att det föreligger statistiskt signifikant skillnad i
fördelning av blodgrupper mellan européer och afrikaner.
Det intressanta är att chi-två-värdet är lägre vid exemplet med två stickprov jämfört med ett stickprov
som jämförs mot en fix "sanning". Motsvarande p-värde blir högre i exemplet med
två stickprov jämfört med ett stickprov som jämförs med en "sanning".
Förklaringen är att i exemplet med två stickprov som jämförs med varandra får vi
med att fördelningen av blodgrupper hos européerna inte är en fix "sanning" utan
har en viss osäkerhet. Oftast är det så att vårt fixa värde som vi jämför med
inte är en fixerad "sanning" utan bara ett antagande baserat på tidigare
stickprov som givetvis haft viss osäkerhet. Det är då givetvis mer rättvisande
att inte anta en "sanning" utan hellre jämföra två stickprov och minimera
antalet antagna "sanningar".
Jämförelse mellan flera omatchade grupper
Ett exempel på jämförelse mellan flera grupper kan vara att jämföra
könsfördelning eller kategorier av fritidsintressen mellan olika bostadsområden.
Variablerna mäts alltså enligt nominalskalan och antalet
möjliga kombinationer bildar en n1 x n2 -tabell, där n är antalet
möjliga värden för respektive variabel. Om båda variablerna är dikotoma (ja/nej,
finns/saknas, 1/0, grupp A/grupp B, etc) fås en fyrfältstabell.
(Under konstruktion)
Krav för att få göra denna analys | |
(Under konstruktion) | |
1. | Båda variablerna mäts enligt nominalskalan. |
2. | Det förväntade antalet måste vara minst 5 individer i vart och ett av rutorna i tabellen. Man kan möjligen nöja sig med att >80% av rutorna uppfyller detta krav. Epi-Info testar detta automatiskt. Om detta villkor inte uppfylls (och om variabeln är dikotom) görs automatiskt Fisher´s exakta test och man bör använda det istället. |
3. | Tillräckligt stort antal patienter så att binomialfördelningen kan approximeras med normalfördelningen. |
Användbarhet
Mycket vanligt använt test. Om man bara har 2x2 tabeller kan man
alltid överväga att använda Fisher´s exakta test oavsett om materialet är
litet eller stort.
Hur man gör i datorprogrammet Epi-Info
Låt variabel-1 vara skillnad mellan patienterna (till exempel kön), och låt
variabel-2 vara skillnad i utfall (sjuk eller inte sjuk). Skriv i Epi-Info TABLES variabel-1
variabel-2. Man får då en korstabell följt av diverse statistik (som inte
kommenteras här). Sist kommer resultatet av Chi-square.
(Under konstruktion)
Chi-square med Yate´s korrektion
Samma test som Chi-square. Man har infört en korrektion i formeln som ger ett
mer korrekt resultat om antalet individer inte är så stort. Epi-Info ger alltid både
Chi-square okorrigerat och korrigerat enligt Yate. Vid stort antal individer blir
resultatet nästan exakt detsamma. Om resultatet av Chi-square med respektive utan Yate's korrektion blir
olika är det bäst att använda Chi-square med Yate's korrektion. Yate´s korrektion
fungerar bara
på 2x2-tabeller. Vid större tabeller (om variablerna inte är dikotoma utan kan
innehålla mer an två alternativ)
kan Yate's korrektion inte användas.
(Under konstruktion)
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.