Variabler
Denna sida är uppdaterad 2002-01-05

(Titta gärna på vår engelska uppdaterade hemsida: Science-Network.TV "Observations and Variables")

Vid forskning med användande av kvantitativ metodik är det vanligt att man ställer upp en eller flera hypoteser. En hypotes är ett försök att beskriva en liten avgränsad del av verkligheten genom att sätta olika begrepp i relation till varandra. De här begreppen översätts (operationaliseras) till något som kan mätas. De mätvärden som intresserar oss kallas variabler. Det kan vara kroppslängd, blodsockernivån, blodgruppstillhörighet eller svaret på en enkätfråga. Dessa olika variabler kan beskrivas på olika sätt. Ofta beskriver man variabeln med hjälp av en mätskala. Vilket mätskala man väljer beror på vilken slags variabel det är. När man sedan skall räkna statistik beror valet av metod på vilken slags variabel det är. Detta är en viktig grund som all vidare statistisk bearbetning vilar på. Den stora skillnaden går mellan kvantitativa variabler och kvalitativa variabler.


Kvantitativa variabler
Det som kännetecknar kvantitativa variabler är två saker, ordning mellan mätvärdena och ekvidistanta (lika stora) skalsteg. Tänk dig att du vill mäta antalet barn i alla familjer som bor i ett villaområde. En familj har fyra barn och den andra två. Du kan säga att det råder en ordning på så sätt att fyra är mer än två. Eftersom varje skalsteg, ett barn, är lika stort, kan du säga att fyra barn är exakt dubbelt så många barn som två. När skalstegen är lika stora kallas det ekvidistanta skalsteg. Det finns två huvudgrupper av kvantitativa variabler, diskreta variabler och kontinuerliga variabler. Kontinuerliga variabler kan anta vilket värde som helst, exempelvis blodtryck eller blodsockernivån. Variabler som bara kan anta vissa värden, till exempel heltal, kallas diskreta variabler. Exempel på diskreta variabler är antal barn i en familj eller antal besök per år. Om antalet tänkbara värden för en diskret variabel är många är det förnuftigt att betrakta den som en kontinuerlig variabel. I praktiken kan man säga att om variabeln är kvantitativ, det vill säga har en ordning mellan olika mätdata och har ekvidistanta skalsteg, behöver vi sällan bry oss om huruvida det är en diskret eller kontinuerlig variabel. Vi behandlar den som en kontinuerlig variabel.
    När man skall beskriva kvantitativa variabler beskriver man dem utifrån endera av två möjliga mätskalor. Båda dessa mätskalor har ekvidistanta skalsteg. Den första mätskalan kallas kvotskala. Det som kännetecknar en kvotskala är att den har en noll-punkt. Exempel på en diskret variabel som lämpligen beskrivs med en kvotskala är antal läkarbesök på en vårdcentral. Om det finns en nollpunkt kan man beräkna kvoter, exempelvis antal besök per år. Man kan också säga att antalet barn kan vara dubbelt så högt på ett daghem jämfört med ett annat. Temperatur enligt Kelvinskalan är ett exempel på en kontinuerlig variabel som bäst beskrivs med en kvotskala. Eftersom temperaturen enligt Kelvinskalan inte kan gå under 0 kan man säga att +20° K är exakt dubbelt så mycket som +10° K. Den andra mätskalan kallas intervallskala. Den saknar noll-punkt och därför kan man inte beräkna kvoter. Temperatur enligt Celsiusskalan är ett exempel på en kontinuerlig variabel som bäst beskrivs med en intervallskala. Man kan säga att +20° C är mer än +10° C. Eftersom temperaturen enligt Celsiusskalan kan gå under 0 kan man inte säga att +20° C är dubbelt så mycket som +10° C.

Kvalitativa variabler = Kategoriska variabler
Kvalitativa variabler inget att göra med kvalitativa metoder. Kvalitativa variabler används inom statistiken (=inom kvantitativa metoder) för att beteckna vissa slag (typer) av variabler. En kvalitativ variabel beskriver, som namnet säger, en kvalité. Det kan vara blodgrupp, nationalitet eller hur intensivt jag just nu upplever smärta. Man skiljer mellan två typer av kvalitativa variabler, ordnade och oordnade.
    Ordnade kategoriska variabler kallas även ordinaldata. Här finns en ordning mellan de olika kategorierna. Exempel kan vara smärtupplevande enligt visuell analog skala (VAS). Individen uppmanas beskriva sin nuvarande smärtupplevelse genom att sätta ett kryss på linjen. Mätvärdet fås sedan genom att mäta avståndet från skalans början (till vänster) och fram till krysset. Hela skalan är 100 mm lång. Man kan säga att 40 mm på smärtskalan är mer smärta än 20 mm. På så sätt finns en ordning där värden åt höger på skalan innebär mer smärta än värden åt vänster på skalan. 40 mm är exakt dubbelt så långt avstånd som 20 mm. Däremot representerar 40 mm inte exakt dubbelt så mycket smärta som 20 mm. Även om det finns en ordning är skalstegen inte lika stora, de är inte ekvidistanta. Om ekvidistans saknas kan man inte räkna på mätvärdena som om de var en kvantitativ variabel.
    Oordnade kategoriska variabler har som namnet säger ingen direkt ordning. Blodgruppstillhörighet är ett klassiskt exempel. Man kan inte säga att blodgrupp A är mer eller bättre än blodgrupp B. De är helt enkelt bara olika blodgrupper. Ett annat klassiskt exempel på oordnade kategoriska variabler är könstillhörighet.
    När man skall beskriva kvalitativa variabler beskriver man dem utifrån endera av två möjliga mätskalor. Ingen av dessa mätskalor har ekvidistanta skalsteg. Den första mätskalan kallas ordinalskala. Det som kännetecknar en ordinalskala är att den har en ordning. Med ordinalskalan beskriver man ordnade kategoriska data, exempelvis VAS. Den andra skalan kallas nominalskala. Den är som namnet säger enbart en namngivning, exempelvis blodgrupp A. Om variabeln man vill beskriva bara har två möjliga utfall, exempelvis för kön, använder man en variant av nominalskalan som kallas dikotom skala eller binär skala.
    Även om kvalitativa variabler beskriver kvalitéter så blir slutresultatet ett antal siffror. För blodgrupp kan det vara antalet individer som hade blodgrupp A, antalet som hade blodgrupp B, o.s.v. Om VAS har använts blir resultatet ett antal längduppgifter i mm (eller cm om man hellre vill det). Det är viktigt att komma ihåg vad siffrorna står för.

Några specialfall av variabler
De egentliga mätresultaten kan användas för att tillverka nya variabler. Könstillhörighet räknas i antalet kvinnor respektive antalet män. Mätenheten är antal. Dessa uppgifter kan användas för att beräkna en ny variabel som vi kan kalla andel kvinnor. Denna nya variabel har inte enheten antal utan enheten andel (0-1) eller enheten procent (0-100). Enheten andel och enheten procent är båda exempel på en kvot.
    Ett annat exempel på kvot är incidens. Incidens fås genom att dela en frekvens med ett annat mått. Detta andra mått kan vara en tidsperiod (frekvens/tidsenhet) eller ett antal (frekvens/antal). Vanliga exempel på incidens är antal nya fall av en sjukdom per år eller antal avlidna per 100 000 invånare. Kvoter som anger incidens kan betraktas som kontinuerliga data.
    Kvantitativa variabler, eller ordnade kategoriska variabler med mer än två möjliga utfall, passar inte för att göra kvoter. För att göra kvoter bör det vara ordnade kategoriska variabler med endast två möjliga utfall eller oordnade kategoriska variabler. Man kan naturligtvis omvandla ordnade kategoriska variabler och kvantitativa variabler till en ny ordnad kategorisk variabel med endast två utfall.
    Ett helt annat sätt att beräkna en ny variabel är genom att göra ranker /ranger. Ranker / ranger kan bara göras med variabler som har ordning, antingen ordnade kategoriska variabler eller kvantitativa variabler. Man sorterar alla mätdata efter storlek. Därefter rangordnar man dem. Lägsta (eller högsta) mätvärdet får rangvärde 1, näst lägsta (eller högsta) rangvärde 2, o.s.v. Mätvärdet i den nya variabeln är rangvärdet. Rangvärden är en ordnad kategorisk variabel.

Val av statistik
Som nämnts ovan kan variablerna mätas med olika mätskalor. Den mätskala som passar anger också hur man får bearbeta variablerna.

Mätskala

Nominal Ordinal Intervall Kvot
Kategorier + +
Ordning + + +
Ekvidistans + +
Enhetlig kvot +

Addition och subtraktion saknar innebörd om variabeln inte har ekvidistans. Detta innebär exempelvis att man inte får räkna sumscore, inte får räkna ut ett medelvärde och man får inte räkna fram differenser. Sistnämnda trasslar till det om man vill titta på förändringar över tid mätt med exempelvis en VAS (Visuell Analog Skala). Man kan alltså inte ta ett slutvärde minus ett initialvärde om variabeln är kvalitativ och mäts enligt ordinalskalan.
    Det finns speciella statistiska metoder för att räkna på kvantitativa variabler. Dessa metoder förutsätter bland annat att den kvantitativa variabeln är normalfördelad. Dessa metoder kallas parametriska. Om variabeln inte är normalfördelad kan man omvandla den kvantitativa variabeln till en kvalitativ ordnad rangvariabel. Man kan sedan använda en icke parametrisk statistisk metod anpassad till kvalitativa ordnade variabler. Detta är ett mycket vanligt förfaringssätt.

Olika variabler och hur de presenteras
När olika variabler redovisas med beskrivande (deskriptiv) statistik brukar man ofta ange ett centralmått och ett spridningsmått. Det finns olika centralmått (exempelvis medelvärde och medianvärde) och olika spridningsmått (exempelvis interkvartilavstånd och range). Vilket av måtten som skall användas beror på vad det är för variabel som skall presenteras:

 

= Centralmått =

= Spridningsmått =

  Medel Median Andel SDa Kvartil-avstånd
eller Rangeb
Totalt antal eller konfidensintervallc
Kvotskala / intervallskala med normal fördelning +     +    
Kvotskala / intervallskala med sned fördelning   +     +  
Ordinalskala   +     +  
Nominalskala     +     +
a Standardavvikelse
b För mer information om Centiler, Percentiler, Interquartilavstånd och Range läs sidan om spridningsmått.
c Totalt antal som ligger till grund för beräkningen av kvoten/andelen är egentligen inget spridningsmått men att ange totalt antal är det vanligaste sättet att beskriva osäkerheten i centralmåttet (kvoten/andelen). Man kan gå vidare och med hjälp av det totala antalet räkna ut ett konfidensintervall för andelen. Konfidensintervall för andelar används ofta som ett spridningsmått för andelar.

Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.