Tabeller och diagram
Denna sida är uppdaterad 2002-10-21
Först kommer lite råd om användandet av tabeller och därefter om diagram.
Tabeller
Tabeller är ett bra sätt att presentera siffror. Det är ofta mer överskådligt att presentera siffror i en tabell jämfört med att presentera dem i löpande text. Tabeller är speciellt lämpliga om resultatet från flera grupper skall jämföras. En fördel som tabeller har framför diagram är att de exakta siffrorna anges. Många läsare vill ha de exakta siffrorna för att kunna jämföra dem med resultat från andra studier.
Man kan använda en tabell för att presentera alla mätresultat från varje individ. Detta bör endast göras om antalet mätdata inte är för många. Om antalet mätdata överstiger 10-20st brukar man inte redovisa varje enskilt mätresultat. Man redovisar då sammanfattningar i form av centralmått och spridningsmått. Tabeller är mycket lämpliga för att presentera sådana sammanfattningar.
Om man skall jämföra grupper brukar man låta varje grupp bilda en kolumn (Tabell 1). De värden man vill presentera blir raderna.
Behandlingsgrupper |
||||
Behandling A |
Behandling B |
Placebo |
||
Antal patienter | 52 | 48 | 65 | |
Kön | 28K/24M | 23K/25M | 34K/31M | |
Medelålder i år (SD)* | 35 (11) | 33 (9) | 34 (10) | |
Symptomduration i år (SD)* | 8 (2) | 7 (2) | 9 (2) | |
Genomsnittlig förbättring** | 34 (23-48) | 23 (11-34) | 2 (-12-16) | |
* Efter centralmåttet anges ofta ett spridningsmått, standardavvikelse eller interkvartilavstånd. | ||||
**Genomsnittlig förändring i gruppen av ett mätvärde. Mätvärdet är oftast räknat på alla individernas differenser mellan mätning 1 och mätning 2. |
Tabell 1 - Exempel på utformning av en tabell
Man kan jämföra en tabell med ett stapeldiagram. De resultat vi vill presentera hamnar i rader. Dessa rader motsvarar diagrammets y-axel. Gruppindelningen (kolumnerna) motsvarar staplarna på x-axeln. Ibland är variabeln på x-axeln kontinuerlig. I ett stapeldiagram skulle man då klassindela materialet och göra ett histogram (beskrivs längre ner). På samma sätt bör kontinuerliga data klassindelas om de skall presenteras i en tabell (Tabell 2).
|
Ålder i år |
|||
20-40 |
40-60 |
60-80 |
||
Antal patienter | 25 | 84 | 56 | |
Kön | 13K/12M | 47K/37M | 27K/29M | |
Behandlingstid i år (SD)* | 3,2 (0,2) | 3,3 (0,2) | 3,5 (0,3) | |
Genomsnittlig symptomförbättring** | 34 (23-48) | 23 (11-34) | 8 (2-16) | |
* Efter centralmåttet anges ofta ett spridningsmått, standardavvikelse eller interkvartilavstånd. | ||||
**Genomsnittlig förändring i gruppen av ett mätvärde. Mätvärdet är oftast räknat på alla individernas differenser mellan mätning 1 och mätning 2. |
Tabell 2 - Exempel på klassindelad tabell
En tabell är oftast mer lättläst om vertikala linjer undviks. Man bör därför undvika vertikala linjer och ha så få horisontella linjer som möjligt. En tabell bör inte bli för stor. Här finns inga exakta regler, som en enkel tumregel kan man säga att mer än 10 kolumner eller 20 rader blir för mycket. Om man har mycket mätdata som skall presenteras är ofta ett diagram en bättre lösning.
Diagram
När man redovisar mätdata i löpande text eller i tabeller anger man i regel exakta siffror. Redovisning av exakta siffror är något man bör sträva efter. Om man har många siffror är diagram mer överskådligt. Diagram kan ibland vara missvisande och därför bör diagram inte ersätta redovisning av de exakta siffrorna utan mer ses som ett komplement till siffrorna (Bland, 1992). Ett vanligt fel i diagram som har en y- och en x-skala är att inte låta skalan på y-axeln börja på noll. Om man utelämnar nollan innebär det att man bara visar en del av y-skalan, denna del tänjs ut och visas förstorad. Man får då fel perspektiv. Om vi exempelvis vill titta på hur mycket åldern samvarierar med risken för att avlida, kan det tyckas som att risken ökar brant omedelbart efter pensioneringen (Diagram 1). Om vi istället låter y-axeln börja på noll får vi ett riktigare perspektiv (Diagram 2), d.v.s. risken ökar lite grand men inte så dramatiskt som det felaktigt ritade diagrammet (Diagram 1) förespeglade. Som en tumregel för alla diagram som har en y-axel gäller att y-axeln alltid skall börja på noll, undantaget som bekräftar denna regel är scatterdiagrammet (Bland, 1992).
Ålder i år
Diagram 1 - Exempel på diagram där y-axeln inte börjar på noll
Ålder i år
Diagram 2 - Exempel på diagram där y-axeln börjar på noll
När det gäller x-axeln spelar det mindre roll om man utelämnar nollan. Nollan saknas på x-axeln i exemplet med ålder och risk att avlida (Diagram 2). Detta beror dels på att det inte är så noga hur man definierar vilken kategori (ålder) som är noll. Är det 0 år? 40 år? 50 år? 60 År? Dessutom antar man i regel att värdet på y-axeln ändras beroende på värdet på x-axeln men inte nödvändigtvis tvärtom. Stigande ålder medför ökad risk att avlida. Ökad risk att avlida innebär inte nödvändigtvis stigande ålder. En mängd andra faktorer än ålder kan ligga bakom en ökande risk att avlida.
Olika typer av diagram
Stapeldiagram lämpar sig för både kvalitativa och kvantitativa variabler. Antal, andel i procent, medelvärde och direkta mätresultat är vanliga variabler som avsätts på y-axeln. På x-axeln gör man en stapel för varje grupp/individ (Diagram 2). Ibland är staplarna på x-axeln grupperade (Diagram 3). Ett alternativ till grupperade staplar är att lägga staplarna på varandra (Diagram 4). Ett stapeldiagram blir lätt rörigt om det är för många staplar. Om antalet staplar överstiger 10 bör man överväga ett annat sätt att presentera sina data, kanske med ett linjediagram. Som tidigare nämnts är det viktigt att y-axeln alltid börjar på noll.
Diagram 3 - Exempel på grupperade staplar
Diagram 4 - Stapeldiagram visande fördelning mellan grupper
FrekvensdiagramVid diskreta variabler som endast kan anta ett begränsat antal värden så använder man ofta en speciell variant av stapeldiagram som kallas stolpdiagram. Här avsätter man variabelvärdena, exempelvis antal besök individen har gjort på en och samma vårdcentral under ett år, på x-axeln och antal eller frekvenser på y-axeln (Diagram 6).
Antal besök under senaste 12 mån
Diagram 5 - Exempel på stolpdiagram
HistogramVid kontinuerliga variabler och då man har en diskret variabel som kan anta många olika värden är det olämpligt att använda ett stolpdiagram. Man använder lämpligen en variant av stapeldiagram som kallas histogram. I Histogrammet klassindelas variabeln och avsätts på x-axeln, antal eller frekvens avsätts på y-axeln. Staplarna har inget mellanrum mellan sig. Ytan av varje stapel är proportionellt mot antal eller frekvens. Om man ville åskådliggöra hur det systoliska blodtrycket fördelar sig bland en grupp patienter vore ett histogram lämpligt (Diagram 6).
Systoliskt Blodtryck i mm Hg
Diagram 6 - Exempel på histogram
FrekvenspolygonDet ovan nämnda exemplet med systoliskt blodtryck (Diagram 6) skulle lika gärna kunna visas som en frekvenspolygon (Diagram 7). Frekvenspolygon och histogram visar samma information. Det är vanligt att man i en frekvenspolygon före första klassen och efter sista klassen lägger in en extra tom klass med frekvensen noll, detta för att frekvenspolygonen skall börja och sluta på noll.
Systoliskt Blodtryck i mm Hg
Diagram 7 - Exempel på frekvenspolygon
Kumulativa diagram
Både histogrammet och frekvenspolygonen kan göras som ett kumulativt diagram. Man låter då y-axeln visa andel patienter som har uppnått det värde som anges på x-axeln. Värdet längst till höger på x-axeln når då det högsta värdet på y-axeln, 100%. (Diagram 7 ser då ut som Diagram 8). Kumulativ frekvenspolygon kallas även summapolygon.
Blodtryck mmHg
Diagram 8 - Exempel på kumulativ frekvenspolygon
Om antalet tänkbara värden för variabeln på x-axeln är många, är det förnuftigt att använda ett linjediagram istället för ett stapeldiagram. Linjediagram kräver att variabeln på x-axeln är kvantitativ, ett exempel på detta är tid. Linjediagram är speciellt lämpliga när man vill visa förändringar över tiden. Diagram 2 skulle lika gärna kunna ritas som ett linjediagram (Diagram 9). Som tidigare nämnts är det viktigt att y-axeln börjar vid noll. Man kan ibland acceptera undantag från regeln om att y-axeln alltid skall börja på 0 om man har flera linjer och inte är intresserad av att visa deras absoluta värde utan bara deras inbördes relation (Diagram 10).
Ålder i år
Diagram 9 - Exempel på linjediagram
Diagram 10 - Linjediagram där y-skalan inte börjar på 0
CirkeldiagramCirkeldiagrammet är det bästa valet när man vill visa hur en kvalitativ variabel fördelar sig (Diagram 11). Cirkeldiagrammet blir snabbt rörigt om antalet kategorier ökar. Som en tumregel kan man säga att cirkeldiagrammet är olämpligt om antalet kategorier överstiger fem.
Diagram 11 - Exempel på cirkeldiagram
Scatterdiagram
Ett bra sätt att åskådliggöra sambandet mellan två kontinuerliga variabler är scatterdiagrammet (Diagram 12). Scatterdiagram brukar ofta utelämna origo (nollpunkten). Orsaken till att man här utelämnar nollpunkten är att man med ett scatterdiagram är mindre intresserad av variablernas absoluta värden utan mer intresserad av sambandet mellan de två kontinuerliga variablerna. Oftast är man då mindre intresserad av den exakta storleken av sambanden, något som man bäst får fram genom en korrelation- regressionsanalys, utan mer av att schematiskt visa att ett samband tycks föreligga.
Förklaring till x-axeln
Diagram 12 - Exempel på scatterdiagram visande linjärt samband
Om man försöker analysera eventuella samband mellan variabler med kontinuerliga data bör man alltid titta på mätdata med ett scatterdiagram för att förvissa sig om att ett eventuellt samband är linjärt. En linjär regressionsanalys skulle kunna säga att det inte finns något samband. Ett scatterdiagram skulle då kunna visa att det trots allt finns ett starkt samband mellan de två variablerna men att sambandet inte är linjärt (Diagram 13). Som en tumregel kan man säga att de flesta samband i naturen är linjära, åtminstone inom vissa rimliga gränser.
Förklaring till x-axeln
Diagram 13 - Scatterdiagram visande icke linjärt samband
Valet av diagram beror på typ av variabel, vad man avser visa, antal möjliga mätvärden och för kvalitativa variabler antal grupper av individer. Nedan följer ett översiktligt schema för vilken typ av diagram som passar bäst. Schemat bör ses som ett förslag och inte som en absolut regel.
A. Kvantitativ variabel1. Visa frekvens eller antala) Diskret variabel
1) Antalet möjliga variabelvärden £ 10
- Stolpdiagram
2) Antalet möjliga variabelvärden >10
- Histogram
- Linjediagram
- Frekvenspolygon
- Summapolygon
2. Visa samband mellan två (eller flera) variabler
Om antalet möjliga variabelvärden är litet finns det ingen anledning att grafiskt försöka påvisa samband mellan två variabler. Om antalet variabelvärden är stort kan en diskret variabel behandlas som om den vore kontinuerlig. I praktiken är det vanligt att diskreta variabler betraktas som kontinuerliga. Se vidare nedan angående att visa samband för kontinuerliga variabler.
b) Kontinuerlig variabel
1. Visa frekvens eller antal
- Histogram
- Linjediagram
- Frekvenspolygon
- Summapolygon
2. Visa samband
B. Kvalitativ variabel
- Linjediagram (fr.a. tidssamband)
- Scatterdiagram
1. Visa frekvens eller antal
£ 51. Antalet grupper
2. Antalet grupper 5-10
3. Antalet grupper >10
(Olämpligt att presentera detta i ett och samma diagram. Det blir rörigt.)
2. Visa samband mellan två (eller flera) variabler
(Samband kan inte visas grafiskt för kvalitativa variabler)
Referenser
Bland M. Presenting data. In An introduction to medical statistics. Bland M. Oxford: Oxford University Press 1992, pp75-94.
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.