Chi-square test med eller utan Yate's korrektion

Här hittar du allmän information om ovan nämnda test samt beskrivning av hur man gör testet i statistikprogrammet Epi-Info.

Användningsområde
Metoden jämför fördelningen av en variabel som mäts enligt nominalskalan. Även om det bara är en variabel vi vill utvärdera rör vi oss oftast med två variabler. Den ena variabeln anger vårt egentliga mätvärde, exempelvis könsfördelning eller fördelning till olika blodgrupper. Den andra variabeln anger gruppindelning. Jämförelsen kan ske mellan en grupp och ett förväntat fast värde, mellan två olika grupper eller mellan mer än två grupper. Den principiella formeln för chi-två (x²) är:

O står för observerat värde och E för förväntat (Expected) värde. Man fyller i sina värden på O och E och räknar fram ett chi-två-värde. Man går sedan in i en tabell över chi-två-fördelningen och ser vilket p-värde detta motsvarar. I praktiken låter man oftast en dator räkna fram chi-två och motsvarande p-värde.

Jämförelse med fast förväntat värde
Det kan påpekas att det är betydligt vanligare att chi-två testet används för att jämföra två oberoende grupper - två oberoende stickprov (se nedan). Chi-två testet kan dock användas för jämförelse mellan en grupp (ett stickprov) och ett fast förväntat värde. Detta kan vara av intresse om man vill veta om ett stickprov man har samlat in skiljer sig från det som kan anses normalt för den här populationen. Här anser man att "det som är normalt" är fastställt i tidigare större undersökningar och det betraktas då som ett fast värde. Om dessa tidigare undersökningar är små kan det riktas kritik mot en sådan här analys eftersom "det som är normalt" kanske bara är en osäker gissning.
Låt oss räkna på ett exempel. Antag att vi planerar en sjukvårdsinsats i ett u-land. Operationer måste kunna genomföras och blodtransfusioner skall kunna ges. Hur fördelar sig de olika blodgrupperna i detta u-land jämfört med vad som kan anses normalt i Europa? Vi tar ett prov på 200 slumpmässigt utvalda personer från u-landet.

Vi kan förtydliga tabellen genom att byta ut kolumnen med den fasta fördelningen till en kolumn för förväntat antal om stickprovet på 200 individer hade följt den fasta fördelningen

Blodgrupp	Observerat värde (Vårt stickprov)	Förväntat (expected) värde (Fast fördelning)
A	58st	90
B	34st	16
AB	8st	8
0	100st	86

Värdet 56,44 slår vi upp i en tabell över chi-två-fördelningen och ser att det motsvarar p<0,001 (vid tre frihetsgrader). Slutsatsen blir att i det aktuella u-landet har man i befolkningen en annan fördelning av blodgrupper än i Europa.

Jämförelse mellan två matchade grupper
Här kan chi-square inte användas utan man får använda Teckentest (eller Mc Nemar´s test).

Jämförelse mellan två omatchade grupper
Chi-två test för jämförelse mellan två omatchade grupper är ett av de vanligaste statistiska testen som görs. Är jämförelsen mellan två grupper kan det exempelvis vara behandlingsgrupp och kontrollgrupp eller exempelvis grupper utsatta för exponering A respektive exponering B. Vid fyrfältstabell är Fisher´s exakta test ett bra alternativ till Chi-square.
Låt oss som exempel anta att vi vill jämföra fördelningen av blodgrupper mellan två stickprov, det ena taget från européer och det andra från ett land i Afrika.

Som i ovanstående exempel förtydligar vi tabellen genom att lägga till kolumner för förväntat antal om vi antar att det inte är någon skillnad i fördelning av blodgrupper mellan Afrika respektive Europa. Exempelvis är förväntat antal afrikaner som har blodgrupp A det totala antalet observationer av blodgrupp A (148st) multiplicerat med totala antalet afrikaner (200st) delat med totala antalet individer (400st). De andra förväntade värdena räknas fram på samma sätt. Eftersom antalet afrikaner och antalet européer i det här exemplet råkar vara samma (200st) blir förväntat antal samma i kolumnen för afrikaner och européer. Hade det varit olika antal afrikaner respektiver européer hade deras förväntade antal blivit lite olika.

	----- Afrika -----		----- Europa -----		Summa
Blodgrupp	Observerat	Förväntat	Observerat	Förväntat	observerat antal
A	58st	(148*200)/400=74st	90st	74st	148
B	34st	(50*200)/400=25st	16st	25st	50
AB	8st	(16*200)/400=8st	8st	8st	16
0	100st	(186*200)/400=93st	86st	93st	186
Summa	200st		200st		400

Värdet 14,45 slår vi upp i en tabell över chi-två-fördelningen och ser att det motsvarar p<0,01 men samtidigt >0,001 (vid tre frihetsgrader). Slutsatsen blir att det föreligger statistiskt signifikant skillnad i fördelning av blodgrupper mellan européer och afrikaner.
Det intressanta är att chi-två-värdet är lägre vid exemplet med två stickprov jämfört med ett stickprov som jämförs mot en fix "sanning". Motsvarande p-värde blir högre i exemplet med två stickprov jämfört med ett stickprov som jämförs med en "sanning". Förklaringen är att i exemplet med två stickprov som jämförs med varandra får vi med att fördelningen av blodgrupper hos européerna inte är en fix "sanning" utan har en viss osäkerhet. Oftast är det så att vårt fixa värde som vi jämför med inte är en fixerad "sanning" utan bara ett antagande baserat på tidigare stickprov som givetvis haft viss osäkerhet. Det är då givetvis mer rättvisande att inte anta en "sanning" utan hellre jämföra två stickprov och minimera antalet antagna "sanningar".

Jämförelse mellan flera omatchade grupper
Ett exempel på jämförelse mellan flera grupper kan vara att jämföra könsfördelning eller kategorier av fritidsintressen mellan olika bostadsområden.
Variablerna mäts alltså enligt nominalskalan och antalet möjliga kombinationer bildar en n₁ x n₂ -tabell, där n är antalet möjliga värden för respektive variabel. Om båda variablerna är dikotoma (ja/nej, finns/saknas, 1/0, grupp A/grupp B, etc) fås en fyrfältstabell.
(Under konstruktion)

Krav för att få göra denna analys
(Under konstruktion)
1.	Båda variablerna mäts enligt nominalskalan.
2.	Det förväntade antalet måste vara minst 5 individer i vart och ett av rutorna i tabellen. Man kan möjligen nöja sig med att >80% av rutorna uppfyller detta krav. Epi-Info testar detta automatiskt. Om detta villkor inte uppfylls (och om variabeln är dikotom) görs automatiskt Fisher´s exakta test och man bör använda det istället.
3.	Tillräckligt stort antal patienter så att binomialfördelningen kan approximeras med normalfördelningen.

Användbarhet
Mycket vanligt använt test. Om man bara har 2x2 tabeller kan man alltid överväga att använda Fisher´s exakta test oavsett om materialet är litet eller stort.

Hur man gör i datorprogrammet Epi-Info
Låt variabel-1 vara skillnad mellan patienterna (till exempel kön), och låt variabel-2 vara skillnad i utfall (sjuk eller inte sjuk). Skriv i Epi-Info TABLES variabel-1 variabel-2. Man får då en korstabell följt av diverse statistik (som inte kommenteras här). Sist kommer resultatet av Chi-square.
(Under konstruktion)

Chi-square med Yate´s korrektion
Samma test som Chi-square. Man har infört en korrektion i formeln som ger ett mer korrekt resultat om antalet individer inte är så stort. Epi-Info ger alltid både Chi-square okorrigerat och korrigerat enligt Yate. Vid stort antal individer blir resultatet nästan exakt detsamma. Om resultatet av Chi-square med respektive utan Yate's korrektion blir olika är det bäst att använda Chi-square med Yate's korrektion. Yate´s korrektion fungerar bara på 2x2-tabeller. Vid större tabeller (om variablerna inte är dikotoma utan kan innehålla mer an två alternativ) kan Yate's korrektion inte användas.
(Under konstruktion)

Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Blodgrupp	U-landet (Vårt stickprov)	Europa (Fast fördelning)
A	58st	45%
B	34st	8%
AB	8st	4%
0	100st	43%

Blodgrupp	Afrika (Stickprov)	Europa (Stickprov)
A	58st	90st
B	34st	16st
AB	8st	8st
0	100st	86st