Att jämföra vårdgivare, kliniker, sjukhus e.t.c.
Denna sida är uppdaterad 2006-08-21

För att bäst förstå den här sidan bör du först ha läst:

Ofta är verkligheten sorterad i olika grupper. Det kan vara patienter som finns på olika kliniker eller skolelever som finns i olika skolor. När man analyserar dessa grupperade data finns några principiellt olika situationer:

  1. Man är inte intresserad av grupperingen i sig men måste ta hänsyn till den i den statistiska analysen. Den här sidan säger inget mer om detta men du kan läsa om det på sidan om flernivåmodeller.
  2. Den andra situationen är att vårt intresse ligger i att skatta vilken betydelse grupperingen i sig har. Vi vill kunna skatta en allmän klinikfaktor (eller skolfaktor) utan att direkt jämföra enstaka kliniker (skolor).
  3. I den tredje situationen vill vi göra jämförelser mellan utvalda kliniker (skolor).

Låt oss fortsättningsvis utgå från ett tänkt exempel som är att vi vill jämföra ett resultatmått, dödligheten i hjärtinfarkt, mellan 10 olika sjukhus av varierande storlek. Låt oss utgå från följande resultat (tabell 1):

Tabell 1 - Exempel på dödlighet i hjärtinfarkt under ett givet år
Sjukhus Antal hjärtinfarktpatienter per år Dödlighet (%)
A 193 4,2
B 346 24
C 384 18
D 654 16
E 692 11
F 769 7,0
G 961 10
H 1231 16
I 1539 12
J 1923 12

Som vi ser har sjukhus A en dödlighet på 4% medan sjukhus B toppar på 24%. Det finns alltså en variation i dödlighet mellan sjukhusen som kan förklaras av a) slumpmässig variation och systematiska skillnader i patienternas tillströmning och skick, b) slumpmässig variation i personalbemanning och sjukhusorganisation samt c) systematiska skillnader mellan sjukhusen i behandlingen av hjärtinfarktpatienter. I den första variationen återfinns förutom skillnad i patienternas kön och ålder att vissa sjukhus kan ha större andel patienter med diabetes, större andel rökare, större andel med högt blodtryck eller större andel med högt kolesterol jämfört med genomsnittet för alla sjukhusen. Om ett sjukhus i sitt upptagningsområde har en befolkning som har högre blodtryck och kolesterol än befolkningen i andra sjukhusområden riskerar naturligtvis detta sjukhus att hamna i dålig dager. Det som är mest intressant är förstås om det finns systematiska skillnader i omhändertagande som ger skillnad i dödlighet.

Jämförelse mellan utvalda sjukhus, kliniker, skolor (eller något annat)
I vårt exempel vill vi jämföra dödligheten i hjärtinfarkt mellan några olika utvalda sjukhus. Som väntat fann skillnader mellan sjukhusen. Hur skall detta tolkas? Det finns då flera sätt att göra jämförelsen på:

  1. Rangordning
    Rangordna sjukhusen och säga att sjukhus A är bäst och sjukhus B sämst. Att det finns skillnader mellan sjukhusen förvånar inte och denna rangordning säger inget om huruvida skillnaderna mellan sjukhusen kan förklaras av slumpen. Att göra enbart detta är alltså för enkelt och kan leda till felaktiga slutsatser.
     
  2. Signifikansanalys
    Eftersom resultatmåttet i vårt exempel är binärt (död eller överlevande) kan man jämföra sjukhusens resultat med den statistiska metoden chitvå. Vi gör en tabell passande för en chitvåberäkning (tabell 2).
     

    Tabell 2 - Exemplet omskrivet för chitvåberäkning

    Sjukhus Avlidna Överlevande
    A 8 185
    B 83 263
    C 69 315
    D 105 549
    E 76 616
    F 54 715
    G 96 865
    H 197 1034
    I 185 1354
    J 231 1692

    Beräkning medför chitvå 112,9 vilket med nio frihetsgrader motsvarar p<0,001. Slutsatsen är då att alla sjukhus inte har samma dödlighet, dvs den skillnad som finns mellan sjukhusen ligger utanför det man kan förvänta sig av slumpen. Sannolikheten för att ha fel när man påstår detta är mindre än en på tusen (p<0,001). Vad betyder då detta? Vi att det finns skillnader mellan sjukhusen men inte mellan vilka sjukhus och vi vet inte heller vad skillnaderna beror på. Har man två enheter att jämföra kan man göra signifikansanalys (i vårt exempel chitvå) men i de flesta fall, speciellt om man har fler än två enheter, är det bättre att direkt använda konfidensintervall (se nedan). Hade vårt resultatmått mätts med en kontinuerlig skala, exempelvis vårddagar, hade man istället för chitvå kunnat använda Student's t-test (eller vid snedfördelade data Mann-Whitney's test).
     

  3. Konfidensintervall
    De resultat vi fått för varje sjukhus skulle bli annorlunda om studien upprepades från år till år. Vi kan ta fram var 95% av resultaten sannolikt skulle ligga om studien upprepades oändligt många gånger. Detta kallas att ta fram 95 % konfidensintervall. Konfidensintervall kan tas fram oavsett om vårt jämförelsetal är binärt (som i det här exemplet med död eller överlevande) eller kontinuerligt (som exempelvis antal vårddagar). Det finns här två alternativ. Det ena är att ta fram ett konfidensintervall för varje sjukhus observerade dödlighet och jämföra det med alla sjukhusens viktade medelvärde (figur 1, för viktat medelvärde läs om detta på sidan om flernivåanalyser). Ett annat alternativ är att ta fram konfidensintervall för sjukhusens dödlighet om sjukhuset hade följt alla sjukhus viktade medelvärde. Sjukhusens faktiska dödlighet jämförs sedan med detta konfidensintervall (figur 2). På x-axeln anges i båda diagrammen storleken på sjukhuset som förväntat antal döda i hjärtinfarkt om sjukhuset hade följt alla sjukhus viktade medeldödlighet. I båda fallen ses att ju större sjukhus (ju fler antal förväntade dödsfall på sjukhuset) desto snävare konfidensintervall.


Figur 1 (ovan) - Box-Whisker diagram över dödlighet i hjärtinfarkt för varje sjukhus jämfört med alla patienters medeldödlighet


Figur 2 (ovan) - Olika sjukhus dödlighet i hjärtinfarkt (kryss) jämfört med 95% konfidensintervall för förväntad dödlighet

I detta exempel ser vi att de flesta sjukhusen skiljer sig åt jämfört med förväntat. I verkligheten brukar det vara så att endast ett fåtal (eller ingen) enhet skiljer sig från förväntat. Det är givetvis bara de sjukhus som med konfidensintervallberäkning skiljer sig åt jämfört med förväntat som är intressanta. Skillnader mellan sjukhusen som ligger inom slumpens förväntade variation behöver inte diskuteras eller analyseras vidare.
   
Konfidensintervallanalysen har i det här exemplet klarlagt att några sjukhus skiljer sig åt jämfört med förväntat. Vi bör komma ihåg att om vi använder 95% konfidensintervall och jämför många enheter kommer av ren slump cirka 5% att hamna utanför konfidensintervallgränsen. Det innebär att vi bör vara försiktiga att tolka resultatet för sjukhus som bara lite grand ligger utanför 95% konfidensintervall. Konfidensintervallberäkningen har dock inte förklarat varför det finns skillnader mellan sjukhusen. För att göra detta måste vi gå vidare till flernivåanalys.

  1. Flernivåanalys
    Nästa steg i analysen blir att försöka ta hänsyn till några av de faktorer som inte är systematiska skillnader mellan sjukhusen i behandlingen av hjärtinfarktpatienter. Här tar man hänsyn till patienternas ålder, kön, förekomst av diabetes, rökning, etc. Om det bara är ett fåtal enheter som jämförs kan man använda kovariansanalys. Bäst är att göra en riktig flernivåanalys med programvara avsedd för detta. (Läs mer om detta på sidan om flernivåanalys). Om denna analys visar på skillnader mellan enheterna som finns kvar även efter justering av ett antal faktorer är det intressant. Dessa skillnader skulle kunna bero på systematiska skillnader mellan sjukhusen i behandlingen av hjärtinfarktpatienter. Viktigt att komma ihåg är att andra förklaringar är inte uteslutna.

Referenser

Rice N, Leyland A. Multilevel models: applications to health data. Journal of Health Services Research and Policy 1996;1(3):154-64.

Taube A. Missbruk av registerdata 1 - Osäkra data om infarkt resultaten övertolkade. Lakartidningen 1996;93(50):4620-2.

Taube A. Kvalitetsindikatorer i sjukvården 1: Flera metodfrågor obesvarade. Lakartidningen 1999;96(26-27):3180-1.

 


Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.