Variabler
Denna sida är uppdaterad 2002-01-05
(Titta gärna på vår uppdaterade sida: Nya INFOVOICE.SE om "Observationer och variabler".)
Vid forskning med användande av kvantitativ metodik är det vanligt att man ställer upp en eller flera hypoteser. En hypotes är ett försök att beskriva en liten avgränsad del av verkligheten genom att sätta olika begrepp i relation till varandra. De här begreppen översätts (operationaliseras) till något som kan mätas. De mätvärden som intresserar oss kallas variabler. Det kan vara kroppslängd, blodsockernivån, blodgruppstillhörighet eller svaret på en enkätfråga. Dessa olika variabler kan beskrivas på olika sätt. Ofta beskriver man variabeln med hjälp av en mätskala. Vilket mätskala man väljer beror på vilken slags variabel det är. När man sedan skall räkna statistik beror valet av metod på vilken slags variabel det är. Detta är en viktig grund som all vidare statistisk bearbetning vilar på. Den stora skillnaden går mellan kvantitativa variabler och kvalitativa variabler.
Kvantitativa variabler
Det som kännetecknar kvantitativa variabler är två saker, ordning mellan
mätvärdena och ekvidistanta (lika stora) skalsteg. Tänk dig att du vill mäta antalet
barn i alla familjer som bor i ett villaområde. En familj har fyra barn och den andra
två. Du kan säga att det råder en ordning på så sätt att fyra är mer än två.
Eftersom varje skalsteg, ett barn, är lika stort, kan du säga att fyra barn är exakt
dubbelt så många barn som två. När skalstegen är lika stora kallas det ekvidistanta
skalsteg. Det finns två huvudgrupper av kvantitativa variabler, diskreta variabler och
kontinuerliga variabler. Kontinuerliga variabler kan anta vilket värde som helst,
exempelvis blodtryck eller blodsockernivån. Variabler som bara kan anta vissa värden,
till exempel heltal, kallas diskreta variabler. Exempel på diskreta variabler är antal
barn i en familj eller antal besök per år. Om antalet tänkbara värden för en diskret
variabel är många är det förnuftigt att betrakta den som en kontinuerlig variabel. I
praktiken kan man säga att om variabeln är kvantitativ, det vill säga har en ordning
mellan olika mätdata och har ekvidistanta skalsteg, behöver vi sällan bry oss om
huruvida det är en diskret eller kontinuerlig variabel. Vi behandlar den som en
kontinuerlig variabel.
När man skall beskriva kvantitativa variabler beskriver man dem utifrån endera av
två möjliga mätskalor. Båda dessa mätskalor har ekvidistanta skalsteg. Den första
mätskalan kallas kvotskala. Det som kännetecknar en kvotskala är att den har en
noll-punkt. Exempel på en diskret variabel som lämpligen beskrivs med en kvotskala är
antal läkarbesök på en vårdcentral. Om det finns en nollpunkt kan man beräkna kvoter,
exempelvis antal besök per år. Man kan också säga att antalet barn kan vara dubbelt
så högt på ett daghem jämfört med ett annat. Temperatur enligt Kelvinskalan är ett
exempel på en kontinuerlig variabel som bäst beskrivs med en kvotskala. Eftersom
temperaturen enligt Kelvinskalan inte kan gå under 0 kan man säga att +20° K är exakt dubbelt så mycket som +10°
K. Den andra mätskalan kallas intervallskala. Den saknar noll-punkt och därför kan man
inte beräkna kvoter. Temperatur enligt Celsiusskalan är ett exempel på en kontinuerlig
variabel som bäst beskrivs med en intervallskala. Man kan säga att +20° C är mer än +10° C. Eftersom
temperaturen enligt Celsiusskalan kan gå under 0 kan man inte säga att +20° C är dubbelt så mycket som +10° C.
Kvalitativa variabler = Kategoriska variabler
Kvalitativa variabler inget att göra med kvalitativa metoder.
Kvalitativa variabler används inom statistiken (=inom kvantitativa metoder) för att
beteckna vissa slag (typer) av variabler. En kvalitativ variabel beskriver, som namnet
säger, en kvalité. Det kan vara blodgrupp, nationalitet eller hur intensivt jag just nu
upplever smärta. Man skiljer mellan två typer av kvalitativa variabler, ordnade
och oordnade.
Ordnade kategoriska variabler kallas även ordinaldata. Här finns en ordning mellan de
olika kategorierna. Exempel kan vara smärtupplevande enligt visuell analog skala (VAS).
Individen uppmanas beskriva sin nuvarande smärtupplevelse genom att sätta ett kryss på
linjen. Mätvärdet fås sedan genom att mäta avståndet från skalans början (till
vänster) och fram till krysset. Hela skalan är 100 mm lång. Man kan säga att 40 mm på smärtskalan är mer smärta
än 20 mm. På så sätt finns en ordning där värden åt höger på skalan innebär mer
smärta än värden åt vänster på skalan. 40 mm är exakt dubbelt så långt avstånd
som 20 mm. Däremot representerar 40 mm inte exakt dubbelt så mycket smärta som 20 mm.
Även om det finns en ordning är skalstegen inte lika stora, de är inte ekvidistanta. Om
ekvidistans saknas kan man inte räkna på mätvärdena som om de var en kvantitativ
variabel.
Oordnade kategoriska variabler har som namnet säger ingen direkt ordning.
Blodgruppstillhörighet är ett klassiskt exempel. Man kan inte säga att blodgrupp A är
mer eller bättre än blodgrupp B. De är helt enkelt bara olika blodgrupper. Ett annat
klassiskt exempel på oordnade kategoriska variabler är könstillhörighet.
När man skall beskriva kvalitativa variabler beskriver man dem utifrån endera av två
möjliga mätskalor. Ingen av dessa mätskalor har ekvidistanta skalsteg. Den första
mätskalan kallas ordinalskala. Det som kännetecknar en ordinalskala är att den har en
ordning. Med ordinalskalan beskriver man ordnade kategoriska data, exempelvis VAS. Den
andra skalan kallas nominalskala. Den är som namnet säger enbart en namngivning,
exempelvis blodgrupp A. Om variabeln man vill beskriva bara har två möjliga utfall,
exempelvis för kön, använder man en variant av nominalskalan som kallas dikotom skala
eller binär skala.
Även om kvalitativa variabler beskriver kvalitéter så blir slutresultatet ett antal
siffror. För blodgrupp kan det vara antalet individer som hade blodgrupp A, antalet som
hade blodgrupp B, o.s.v. Om VAS har använts blir resultatet ett antal längduppgifter i
mm (eller cm om man hellre vill det). Det är viktigt att komma ihåg vad siffrorna står
för.
Några specialfall av variabler
De egentliga mätresultaten kan användas för att tillverka nya variabler.
Könstillhörighet räknas i antalet kvinnor respektive antalet män. Mätenheten är
antal. Dessa uppgifter kan användas för att beräkna en ny variabel som vi kan kalla
andel kvinnor. Denna nya variabel har inte enheten antal utan enheten andel (0-1) eller
enheten procent (0-100). Enheten andel och enheten procent är båda exempel på en kvot.
Ett annat exempel på kvot är incidens. Incidens fås genom att dela en frekvens med ett
annat mått. Detta andra mått kan vara en tidsperiod (frekvens/tidsenhet) eller ett antal
(frekvens/antal). Vanliga exempel på incidens är antal nya fall av en sjukdom per år
eller antal avlidna per 100 000 invånare. Kvoter som anger incidens kan betraktas som kontinuerliga data.
Kvantitativa variabler, eller ordnade kategoriska variabler med mer än två möjliga
utfall, passar inte för att göra kvoter. För att göra kvoter bör det vara ordnade
kategoriska variabler med endast två möjliga utfall eller oordnade kategoriska
variabler. Man kan naturligtvis omvandla ordnade kategoriska variabler och kvantitativa
variabler till en ny ordnad kategorisk variabel med endast två utfall.
Ett helt annat sätt att beräkna en ny variabel är genom att göra ranker
/ranger. Ranker / ranger kan
bara göras med variabler som har ordning, antingen ordnade kategoriska variabler eller
kvantitativa variabler. Man sorterar alla mätdata efter storlek. Därefter rangordnar man
dem. Lägsta (eller högsta) mätvärdet får rangvärde 1, näst lägsta (eller högsta)
rangvärde 2, o.s.v. Mätvärdet i den nya variabeln är rangvärdet. Rangvärden är en
ordnad kategorisk variabel.
Val av statistik
Som nämnts ovan kan variablerna mätas med olika mätskalor. Den mätskala
som passar anger också hur man får bearbeta variablerna.
Mätskala |
||||
Nominal | Ordinal | Intervall | Kvot | |
Kategorier | + | + | ||
Ordning | + | + | + | |
Ekvidistans | + | + | ||
Enhetlig kvot | + |
Addition och subtraktion saknar innebörd om variabeln inte har ekvidistans.
Detta innebär exempelvis att man inte får räkna sumscore, inte får räkna ut
ett medelvärde och man får inte räkna fram differenser. Sistnämnda trasslar
till det om man vill titta på förändringar över tid mätt med exempelvis en
VAS (Visuell Analog Skala). Man kan alltså inte ta ett slutvärde minus ett
initialvärde om variabeln är kvalitativ och mäts enligt ordinalskalan.
Det finns speciella statistiska metoder för att räkna på
kvantitativa variabler. Dessa metoder förutsätter bland annat att den kvantitativa variabeln är
normalfördelad. Dessa metoder kallas parametriska. Om variabeln inte är normalfördelad
kan man omvandla den kvantitativa variabeln till en kvalitativ ordnad rangvariabel. Man
kan sedan använda en icke parametrisk statistisk metod anpassad till kvalitativa ordnade
variabler. Detta är ett mycket vanligt förfaringssätt.
Olika variabler och hur
de presenteras
När olika variabler redovisas med beskrivande
(deskriptiv) statistik brukar man ofta ange ett centralmått
och ett spridningsmått. Det finns olika centralmått
(exempelvis medelvärde och medianvärde) och olika spridningsmått (exempelvis
interkvartilavstånd och range). Vilket av måtten som skall användas beror på
vad det är för variabel som skall presenteras:
= Centralmått = |
= Spridningsmått = |
|||||
Medel | Median | Andel | SDa | Kvartil-avstånd eller Rangeb |
Totalt antal eller konfidensintervallc | |
Kvotskala / intervallskala med normal fördelning | + | + | ||||
Kvotskala / intervallskala med sned fördelning | + | + | ||||
Ordinalskala | + | + | ||||
Nominalskala | + | + |
a | Standardavvikelse |
b | För mer information om Centiler, Percentiler, Interquartilavstånd och Range läs sidan om spridningsmått. |
c | Totalt antal som ligger till grund för beräkningen av kvoten/andelen är egentligen inget spridningsmått men att ange totalt antal är det vanligaste sättet att beskriva osäkerheten i centralmåttet (kvoten/andelen). Man kan gå vidare och med hjälp av det totala antalet räkna ut ett konfidensintervall för andelen. Konfidensintervall för andelar används ofta som ett spridningsmått för andelar. |
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.