Översikt över sambandsanalys
Denna sida är uppdaterad 2003-02-04

Förkunskaper för denna webbsida
För att förstå denna webbsida bör du ha läst sidan om variabler och sidan om att välja statistisk metod.

Översikt över sambandsanalys
Metoder som i en enda undersökt grupp letar efter samband mellan två eller flera variabler faller under en grupp av metoder som kallas sambandsanalys. Sambandsanalysen kan delas in i metoder som letar efter samvariation mellan olika fenomen (kallas i engelskspråkig litteratur för "association") och metoder som letar efter likhet ("agreement") mellan olika sätt att mäta / undersöka / se på ett och samma fenomen.

Samvariation
Samvariation kan användas i två olika syften. För det första för att undersöka om två olika fenomen samvarierar, och för det andra, att använda en variabel för att förutsäga rimliga värden på en annan variabel. Exempel på det förstnämnda är korrelationsanalys och exempel på det sistnämnda är regressionsanalys.

Grad av likhet
Här tittar vi på hur olika mätningar, olika bedömningar, olika undersökningar av samma fenomen stämmer överens med varandra. Här handlar det om att bedöma graden av likhet mellan olika sätt att mäta / undersöka / se på ett och samma fenomen.


Nedan följer ett enkelt flödesschema som hjälper dig att välja en passande statistisk metod vid sambandsanalys. Du hittar även länkar till mer information om enskilda metoder. Detta flödesschema gör inte anspråk på att vara fullständigt men innehåller ändå tillräckligt mycket alternativ för att man skall klara sig i de flesta situationer.

Du letar dig bäst fram i översikten genom att i tur och ordning ställa dig följande frågor:

  1. Är detta en undersökning som handlar om samvariation (sektion A nedan) eller att visa grad av likhet (sektion B nedan)?
  2. Vilka typer av variabler är iblandad i jämförelsen? Mäts de med nominalskala, ordinalskala eller intervall / kvotskala? (Är du osäker så klicka på länken och läs sidan om variabler)
  3. Om variabeln mäts med nominalskala är den dikotom (kan bara anta två värden) eller kan variabeln anta mer än två värden?
  4. Valet av statistisk metod styrs helt av om det är samband eller likhet som skall visas samt vilka typer av variabler som är inblandade. Gå nu in i nedanstående översikt så hittar du en passande statistisk metod. (Det finns ännu inte länkar till detaljerad information om alla nämnda statistiska metoder. Med tiden kommer fler länkar att dyka upp).

A. Samvariation ("association")

  

Samvariation mellan två variabler (Bivariat sambandsanalys)

Samvariation mellan två variabler där båda mäts med nominalskalan (icke parametriska test)
Båda variablerna är dikotoma, d.v.s. kan bara anta två värden
Phi-koefficient
Cramer's phi-koefficient = Cramer's V-index
Relativ risk (=RR)
Odds kvot = Odds ratio (=OR)
Minst en av variabler anta mer än två värden (är inte dikotom)
Cramer's phi-koefficient = Cramer's V-index

Samvariation mellan två variabler där båda mäts med ordinalskalan (icke parametriska test)
Spearman´s rangkorrelation / rangregression
Gamma
Somer's D
Kendalls's tau

Samvariation mellan två variabler där båda mäts med intervall/kvotskalan men åtminstone en av dem är snedfördelad (icke parametriska test)
Spearman´s rangkorrelation / rangregression

Samvariation mellan två variabler där båda mäts med intervall/kvotskalan och där båda är normalfördelade (parametriska test)
Pearsson´s korrelation / regression

En av variablerna mäts enligt nominalskalan och är dikotom. Den andra mäts enligt ordinalskalan eller enligt intervall/kvotskalan (icke parametriska test)
Logistisk linjär korrelation / regression

En av variablerna mäts enligt nominalskalan. Den andra mäts enligt intervall/kvotskalan och är normalfördelad (parametriska test)
Eta [Sambandsanalysens motsvarighet till signifikansanalysens one-way ANOVA]
  

Samvariation med mer än två variabler inblandade (Multivariat sambandsanalys)

Den beroende variabeln (Y) mäts enligt nominalskalan och är dikotom.
De oberoende variablerna (X1, X2, etc) mäts alla enligt nominalskalan och är alla dikotoma (ja/nej, närvaro/icke närvaro, 1/0 etc)
Mantel-Haenszels stratifierade analys [Används när det är en oberoende variabel (X) som huvudsakligen förutsäger värdet på Y. Fler X kan förekomma som confounders. Interaktion mellan olika X är liten.]
Logistisk linjär korrelation / regression
Minst en av de oberoende variablerna (X1, X2, etc) mäts enligt ordinalskalan eller intervall/kvotskalan
Logistisk linjär korrelation / regression
Samtliga de oberoende variablerna (X1, X2, etc) mäts enligt intervall/kvotskalan och är normalfördelade
Logistisk linjär korrelation / regression
Diskriminantanalys [Sambandsanalysens motsvarighet till signifikansanalysens ANOVA/MANOVA]

Den beroende variabeln (Y) mäts enligt nominalskalan men är inte dikotom.
Samtliga de oberoende variablerna (X1, X2, etc) mäts enligt intervall/kvotskalan och är normalfördelade
Diskriminantanalys [Sambandsanalysens motsvarighet till signifikansanalysens ANOVA/MANOVA]

Den beroende variabeln (Y) mäts inte enligt nominalskalan.
Någon av variablerna (Y eller X1, eller X2, etc) mäts enligt ordinalskalan eller är en snedfördelad kvantitativ variabel som mäts enligt intervall / kvotskalan (icke parametriska test)
Spearman´s rangkorrelation / rangregression
Spearman´s partiella rangkorrelation
[Exempel: Om du får fram att två variabler korrelerar lika mycket till resultatvariabeln och du vill utesluta att de båda variablerna inte bara är utryck för samma fenomen]
Pitman´s permutationstest
[Ger ett p-värde som testar om samvariationen beskrivet som korrelationsfaktor är statistiskt signifikant eller ej]
Alla ingående variabler är normalfördelade kvantitativa variabler som mäts enligt intervall / kvotskalan (parametriska test)
Pearsson´s korrelation / regression
Pitman´s permutationstest [Ger ett p-värde som testar om samvariationen beskrivet som korrelationsfaktor är statistiskt signifikant eller ej]
  

Några specialfall av samvariationsanalyser

Ett scatterdiagram över två variabler som mäts enligt intervall/kvotskalan antyder ett samband som inte är en rät linje.
Icke linjär korrelation / regression

Analys av överlevnadstid
Överlevnadstid som beroende variabel utvärderas avseende en oberoende variabel
Kaplan-Meyer och logrank test
Överlevnadstid som beroende variabel utvärderas avseende flera oberoende variabler
Coxregression (=Proportional hazards regression analysis)
  

B. Likhet ("agreement")

  

Likhet mellan två variabler

Likhet mellan variabler som mäts enligt nominalskalan
Utfallet är dikotomt, d.v.s. kan bara anta två värden
Kappakoefficient
Sensitivitet / Specificitet*
Likelihood ratio*
Prediktivt värde*
Etiologiskt prediktivt värde (EPV)*
Utfallet kan anta mer än två olika värden
Kappakoefficient

Kvalitativ variabel som mäts enligt ordinalskalan (Icke parametriska test)
Kappakoefficient
Viktad kappakoefficient [Se Kappakoefficient]

Kvantitativ variabel som mäts enligt intervall / kvotskalan (Parametriska test)
Grad av överensstämmelse (=limits of agreement)
Intra Class Correlation (=ICC)
  

*Sensitivitet, specificitet, likelihood ratio och prediktiva värden är metoder som är mycket vanliga och de används för att utvärdera tester


Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.