Urvalsstrategier

Urvalsstrategier
Denna sida är uppdaterad 2005-03-08

(Titta gärna på vår uppdaterade sida: Nya INFOVOICE.SE om "Urvalsstrategier och datainsamling".)

I alla studier som är empiriska (slutsatser dras genom att studera verkligheten) gör man någon form av datainsamling. Insamlade data analyseras och därefter drar man sina slutsatser. När man skall samla in data måste man bestämma sig för varifrån de skall samlas in. Man måste välja vilka individer som skall svara på enkäter, bli undersökta etc. Hur väljer man bäst fram vilka individer som skall undersökas / intervjuas? Hur påverkar urvalet resultatet? Kan man göra fel??

Urval vid kvantitativ forskningsansats
Låt oss anta att man vill veta förekomsten av övervikt i landet. Hur går man tillväga? Efter att man definierat vad man menar med övervikt börjar det bli dags att ge sig ut och mäta. Rent teoretiskt kan man tänka sig att alla landets invånare undersökt med avseende på förekomsten av övervikt. När det gäller hela befolkningen i ett land är det oftast inte möjligt. Det kostar för mycket och tar för lång tid. Om det inte handlade om hela befolkningen i ett land utan en mindre mängd människor, exempelvis alla i den lilla staden Grönköping, så vore det möjligt att undersöka alla individer. Att undersöka alla individer i den population man sedan vill kunna uttala sig om kallas totalundersökning. I sällsynta fall kan man göra en totalundersökning. I de allra flesta fallen gör man istället en urvalsundersökning, det vill säga endast en del av alla individer undersöks . De som väljs ut att bli undersökta kallas stickprov. Om stickprovet väljs ut på rätt sätt kan det anses vara en liten miniatyrkopia av den bakomliggande större populationen. Resultatet från stickprovet får sedan representera alla individer i det som kallas den bakomliggande populationen. Att urvalet görs på rätt sätt är viktigare vid epidemiologiska undersökningar jämfört med experimentella.

Olika typer av urval vid kvantitativ ansats

I.	Icke slumpmässigt urval = non-probability samples
	"Man tager vad man haver", d.v.s. man undersöker de individer som man har lättast att få tag i. Resultaten gäller då för de individer som är undersökta. Gäller de även för individer som inte är undersökta? Kanske, men det vet man oftast inte. Detta är det stora problemet som gör att man, framför allt vid epidemiologiska undersökningar, bör undvika icke slumpmässigt urval. Trots detta används det av kostnadsskäl eller i situationer där man av olika skäl inte har så stora krav på att få exakt rätt svar. Det finns några olika specialvarianter:
	A.	Kvoturval
			Antag att vi vet att i den population vi vill uttala oss finns 40% män och 60% kvinnor. Man bestämmer då att undersöka 40 män och 60 kvinnor som handplockas på enklast möjliga sätt, exempelvis de första 40 männen respektive 60 kvinnorna som kommer till mottagningen. Man plockar fram individer enligt ett bekvämlighetsurval för att få på förhand bestämda antal i varje grupp. Detta kallas ibland felaktigt för stratifierat urval (se nedan). Skillnaden är att vid stratifierat urval, som är en variant av slumpmässigt urval, är sannolikheten för varje individ som teoretiskt kan tänkas bli vald bestämd i förväg medan vid kvoturval sker urvalet inte slumpmässigt och då kan inte sannolikheten för en individ att bli vald bestämmas i förväg.
	B.	Telefonkatalogsurval
			Man ringer upp telefonnummer och de som svarar och accepterar deltagande får ingå i undersökningen. Detta förfarande medför två olika systematiska fel. De som är hemma när man ringer är kanske inte representativa för befolkningen i sin helhet, speciellt om man ringer under kontorstid. Ett annat fel är att alla med hemligt telefonnummer sållas bort och de kanske skiljer sig från de som inte har hemligt telefonnummer.
	C.	Typiskt urval
			Man väljer subjektivt individer som man tycker är typiska för den bakomliggande population av individer som man senare vill uttala sig om. Sannolikheten för varje individ att bli utvald är i regel helt okänd.
	C.	Rent bekvämlighetsurval
			Man väljer subjektivt individer utan annan tanke än att de skall vara så lätta som möjligt att få tag i. Det kan vara arbetskamrater, vänner eller släktingar. Frågan som förblir obesvarad är hur de utvalda individerna liknar den bakomliggande population där resultaten skall tillämpas. Det är få situationer när detta är vetenskapligt acceptabelt.
	C.	Ja-sägarurval
			Alla i en population tillfrågas/inbjuds om de vill delta och de som accepterar/hör av sig undersöks. Om endast en liten del avstår liknar det en totalundersökning. Om en stor del avstår är frågan vilka de som accepterat deltagande kan tänkas representera. Ja-sägarurval bör undvikas.
	D.	Konsekutivt urval = consecutive selection
			Alla individer som passerar en mottagning under en viss fördefinerad tidsperiod och som uppfyller vissa inklusionskriterier blir vårt stickprov. En fara med detta är att det finns en tidseffekt, något fenomen som verkar just under vår tidsperiod och som påverkar resultatet. För att undvika detta bör insamlandet av individer pågå så länge att tidseffekter rimligtvis undviks. En speciell variant av konsekutivt urval är att undersöka en viss del av patienterna som under en tid kommer till en mottagning. Antingen kan det vara var 7:e patient eller att man under en tidsperiod väljer ut alla patienter som kommer till en mottagning var 7:e dag. I sistnämnda fallet väljs en viss veckodag. Kanske skiljer sig måndagspatienterna från fredagspatienterna? I det läget är det kanske bättre att välja patienter så att man omväxlande får patienter från olika veckodagar. Konsekutivt urval används flitigt i experimentella studier där man är mindre intresserad av att exakt kartlägga exempelvis blodtrycket utan är mer intresserad av att studera olika mediciners (eller andra åtgärders) effekt på blodtrycket. Om ett konsekutivt urval där en viss del av patienterna väljs pågår så länge att nästan hela mottagningens patientstock hinner passera revy blir det nästan samma sak som systematiskt urval.
II.	Slumpmässigt urval = sannolikhetsurval = random sample = probability samples
	Sannolikhetsurval innebär att individerna väljs ut på ett slumpmässigt sätt, d.v.s sannolikheten för var och en av individerna i den bakomliggande populationen att bli vald lika och i förväg känd. Fördelen med sannolikhetsurval är att man vid epidemiologiska studier eliminerar systematiska fel och man kan också i förväg gissa hur stort stickprov som behövs. Det finns olika varianter av slumpmässigt urval:
	A.	Obundet slumpmässigt urval = sinmple random sample
			Alla individerna i den bakomliggande populationen har här samma chans att bli valda. Vill man veta andelen i befolkningen med övervikt dras slumpmässigt ett stickprov ur hela befolkningen.
	B.	Systematiskt urval = systematic sample
			Här fastställs en systematik enligt vilken individer väljs ut. Det kan exempelvis vara var 10:e eller var 50:e av de patienter som finns i vårdenhetens totala journalarkiv. Man utgår då från den ordning de presenteras i journalarkivet (eller i journaldatabasen). Detta kan i praktiken behandlas som en variant av obundet slumpmässigt urval. Det finns dock en allvarlig potentiell felkälla, nämligen om det finns ett tidsfenomen (eller annat liknande fenomen) som introducerar ett systematiskt fel.
	C.	Stratifierat urval = stratified sample
			Alla individer i den population man vill kunna uttala sig om delas in i tänkta grupper (strata). Exempelvis kan det vara åldersgrupper och/eller könstillhörighet. Ur varje grupp dras sedan ett slumpmässigt obundet urval. Är andelen individer som väljs i varje grupp lika stor som gruppens andel i bakomliggande populationen kallas det för proportionellt stratifierat urval. Om det däremot även finns behov av att kunna redovisa resultat separat från varje strata kan man ibland låta andelen individer som tas ur de olika grupperna skilja sig från gruppernas representation i populationen. Antalet grupper (strata) bör inte överstiga 6 (Aczel 1999).
	D.	Klusterurval = cluster sample
			Individerna finns naturligt grupperade. Exempel på naturliga grupperingar kan vara elever i skolklasser, läkare på en vårdcentral, patienter som sköts på olika sjukhus, individer som besöks av olika instruktörer, etc. Det kan vara opraktiskt all välja individer helt obundet, exempelvis bara några elever i en klass. Lösningen är att slumpmässigt välja ett stickprov av grupper (klasser eller liknande). Det finns sedan två varianter. Om gruppstorleken inte är alltför stor undersöks sedan alla individer i de utvalda grupperna. Det kallas ettstegs klusterurval (single-stage cluster sampling). Om varje grupp är stor kan det vara praktiskt att ur varje utvald grupp istället göra ett slumpmässigt obundet urval. Det kallas tvåstegs klusterurval (two-stage cluster sampling). Nackdelen med klusterurval är att merparten av grupperna (merparten av den bakomliggande populationen) är oftast inte alls representerade i stickprovet och detta kan medföra systematiska fel om grupperna skulle skilja sig åt på ett oväntat sätt.

Vilken urvalsmetod skall jag välja?
Vid experimentella studier används oftast konsekutivt urval. Man är här inte lika intresserad av att göra en exakt nulägesbeskrivning utan intresset ligger mer på att undersöka vilka förändringar olika interventioner medför. Eftersom nulägesbeskrivningen inte är det viktigaste kan man välja ett enklare förfarande när man tar fram stickprovet.
Vid epidemiologiska undersökningar där man vill göra en nulägesbeskrivning bör man sträva efter att använda någon form av slumpmässigt urval. Då har systematiskt urval och klusterurval fördelen av att vara praktiskt enkla och de minskar ofta kostnaden för att sampla in stickprovet (Aczel 1999). Vid analys av data är obundet slumpmässigt urval eller stratifierat urval i de flesta fall något bättre än systematiskt urval eller klusterurval. Motivet är att systematiskt urval eller klusterurval har lite större risk att drabbas av systematiska fel.
Proportionellt stratifierat urval och slumpmässigt obundet urval fungerar likartat och resultatet för att skatta den bakomliggande populationens medelvärden och variation (exempelvis genom standardavvikelse) blir detsamma (Aczel 1999). Icke proportionellt stratifierat urval innebär också en möjlighet att låta grupper som är små i populationen bli bättre representerade. Denna variant av stratifierat urval är krångligare att använda (framför allt vid den statistiska bearbetningen) men den ger bättre precision (mindre slumpmässig variation) än slumpmässigt obundet urval (Aczel 1999).

Speciella fallgropar

Väntrumsenkäten:	Alla som passerar ett väntrum får svara på en enkät. De som ofta besöker vårdenheten blir då överrepresenterade jämfört med de som kommer sällan. Om då en av frågorna är hur ofta du besöker vårdenheten kan det bli fel. Det är då bättre att slumpmässigt välja ut patienter från vårdenhetens journalarkiv och skicka enkät till dessa.
Tidsurval:	En felaktig variant är att slumpmässigt välja ett antal starttidpunkter och sedan bara ta den första individen som kommer efter varje starttidpunkt. Detta är fel eftersom individer som oftast brukar komma när det är mindre rusning blir överrepresenterade. dessa individer kanske skiljer sig åt på ett okänt sätt och det introducerar ett systematiskt fel.

"Explanatory versus pragmatic study" vid interventionsstudier
Antag att du vill studera effekten av en ny revolutionerande sjukgymnastisk behandlingsmetod mot ryggvärk. Skall du då bara inkludera patienter med en snäv definition av just den typ av ryggbesvär som du tror behandlingen är effektivast mot (homogen grupp) eller skall du inkludera patienter med varierande sorters ryggbesvär (en heterogen grupp) liknande verkligheten på de flesta sjukgymnastmottagningar? Denna fråga är inte svart-vit utan har en gråskala, det vill säga man kan tänka sig många olika alternativ mellan en extremt homogen grupp respektive en mycket heterogen grupp.
Ur statistisk synpunkt är det bäst att göra en rent experimentell studie med en mycket homogen grupp och detta används också mest när man bara vill påvisa om en behandling överhuvud taget har effekt (explanatory study). Ur generaliseringssynpunkt och för att efterlikna verkliga livet vill man hellre sträva efter ett rimligt heterogent urval som efterliknar den brokiga verkligheten på en vis typ av mottagning. Heterogent urval används oftast i fas IV-studier av nya läkemedel när man vill ha ett resultat som går att generalisera och tillämpa ute i vårdens vardag (pragmatic study).

Urval vid kvalitativ forskningsansats
(Ej klart)

Lästips
Webbsidan om flernivåmodeller

Referenser
Aczel AD. Sampling methods. Complete business statistics fourth edition. Boston: Irwin/McGraw-Hill; 1999, pp 826-53.

Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.