Exempel för Epi-Info:
nr 1
Denna sida är uppdaterad 2005-07-31
För att förstå den här sidan bör du först ha läst:
Epi-Info översikt
Innehållsförteckning för manualen till statistikprogrammet
Epi-Info
Introduktion till Epi-Info
Här beskrivs statistikprogrammet Epi-Info översiktligt
(hela statistikprogrammet kan laddas ner gratis)
Modulen MakeView
Beskriver den del av statistikprogrammet som används när man
lägger upp inmatningsformulär och databasens struktur
Modulen Enter Data
Beskriver den del av statistikprogrammet som används för att mata
in data.
Modulen Analyze data
Beskriver den del av statistikprogrammet som används när man
analyserar inmatade data. I denna modul körs programkod
Analysprogram i Analyze Data
Beskriver vad ett analysprogram i modulen Analyze Data är och hur
det fungerar. Exempel ges.
Denna övning gäller Windows-versionen av Epi-Info, inte den äldre DOS-versionen. Du kan ha denna webbsida och Epi-Info igång samtidigt. I Windows växlar du mellan dessa program genom att hålla nere knappen "Alt" och trycka till på knappen "Tab" på tangentbordet. På så sätt kan du sekundsnabbt hoppa mellan programmen.
Bakgrund
Läs exemplet om gruppbehandling av
överviktiga.
Uppgift A - Skapa ett inmatningsformulär (en View) med bakomliggande datatabell
Du skall skapa ett inmatningsformulär i Epi-Info där du sedan kan
registrera uppgifterna för varje överviktig patient. Det innebär att i tur
och ordning lägga upp variablerna. I denna övning skall du skapa ett
registreringsformulär med variablerna
x00, x02, a01 och b01. De andra variablerna i exemplet bryr vi oss inte om i den
här övningen. Gör så här:
Uppgift B - Registrera uppgifterna i tabellen/databasen
Uppgifterna för alla patienterna skall nu lagras i en databas. En databas
är ett lagringsutrymme för strukturerad information. Ofta kan man likna
strukturen vid en tabell med rader och kolumner. Kolumnerna kallas fält eller
variabler och raderna kallas för poster. I vårt fall är varje patient en
post. Man kan ha flera tabeller som är länkade till varandra och detta kallas
relationsdatabas (relationsdatabaser berör vi inte i den här övningen). Gör
så här:
Uppgift C - Rensa data
Nu skall du titta på data i Epi-Info. Verkar det
rimligt? Om inte vad är fel? Behöver du göra rättningar? När du är färdig godkänner du databasen i Epi-Info.
Gör så här:
Uppgift D - Sammanställ beskrivande statistik
Vad är medelåldern och könsfördelningen i de olika grupperna? Är
initialvikterna lika i de båda grupperna? I den här uppgiften skall vi bara
titta på könsfördelning och initialvikter. Jag förutsätter att du nu är
kvar i analysdelen av Epi-Info (om inte så gör enligt punkt 2 och 3 ovan).
Gör nu så här:
Vi har nu konstaterat att den aktiva gruppen och kontrollgruppen initialt visade likartad könsfördelning och genomsnittlig vikt. De små skillnader som sågs mellan grupperna föll inom slumpens felmarginal. Vi kan säga att vi inte hittar något som talar emot att grupperna initialt var jämförbara.
Uppgift E - Ta fram analytisk statistik
Är resultaten bättre eller sämre i den tidiga gruppen jämfört med den
sena? Vi skall nu räkna fram viktändringen för varje patient. Vi skall sedan
jämföra den genomsnittliga viktförändringen mellan den aktiva gruppen och
kontrollgruppen.
Slutsatsen är att den aktiva gruppen har minskat mer i vikt än kontrollgruppen. Sannolikheten för att vi har fel när vi påstår detta är 0,003. (För mer information om hur man tolkar p-värden läs sidan om signifikansanalys).
Prova själv
Gör övningen ovan så lär du dig en hel del om de olika stegen i Epi Info. Om du bara vill prova att analysera data utan att behöva skapa databasen och mata in värdena
(övning C-E ovan) kan du hämta hem filen obesitas.mdb
med ifyllda data. När du klickat på filnamnet får du frågan om du vill
öppna eller spara filen. Välj spara och lägg den i katalogen för Epi Info. Du kan även
använda den filen för att göra övning 2.
Beskrivning av de kommandon i modulen Analyze Data som nämns ovan
ASSIGN | Betyder tilldela det som står till vänster om = värdet av det som står
till höger om =. Oftast används ganska enkel matematik, sällan mer avancerat
än de fyra räknesätten. Det som står till höger om = måste omges med " om
det är text. Man kan börja med ASSIGN eller LET eller så skippar man dessa
kommandoord. Exempel på ASSIGN-kommandot: ===================== ASSIGN County = "Yellow Medicine" ===================== LET Address = StreetNumber & " " &StreetName &" " & AptNumber ===================== now = systemtime ===================== duration = uears(01/01/88, dateonset) ===================== group = 1 (Om grupp är en numerisk variabel ) ===================== group = "1" (Om grupp är en textvariabel) ===================== |
DEFINE | Betyder skapa en ny variabel. Man kan
se en variabel som varande kolumnen i en tabell där raderna (kallas även
poster) är varje registrerad individ (om det nu är individer som man
registrerar). Nästa steg är att fylla kolumnen med värden som räknas fram ur
de kolumner som fanns tidigare. Define följs alltså nästan alltid av
kommandot assign eller recode. Direkt när en ny variabel är skapad med
define accepterar den att man fyller den med siffror eller text. Om man
första gången fyller variabeln med siffror kan den sedan inte ta emot text
(och tvärtom). Om man gör fel får man använda kommandot undefine och sedan
göra rätt. Den nya variabeln kan göras så att den lagras
permanent eller bara tillfälligt. Om man inte gör annat än att skriva define
lagras den tillfälligt vilket innebär att när man avslutar programmet
Analyze Data eller kör ett nytt read-kommando försvinner variabeln (såvida
man inte genom write-kommandot har skrivit den till en annan datatabell). Om
man efter define-kommandot lägger till global sparas värdet tills modulen
Analyze Data stängs av. Lägger man till permanent sparas informationen (även
om datorn stängs av) till man använder kommandot undefine. Exempel på
define-kommandot: ===================== DEFINE change ===================== DEFINE totalitems GLOBAL ===================== DEFINE totalitems PERMANENT ===================== Endast tillfälliga variabler innehåller vanligen data (ett värde) för varje post/rad i tabellen. Variabler som är globala/permanenta kan bara innehålla ett enda värde. |
LIST | Detta kommando listar upp variablerna i den tabell som är inläst i
datorns minne med read-kommandot. Om en * anges efter list listas alla
variabler. Om några variabelnamn anges efter kommandot list listas bara
dessa. Normalt listas data som en html-fil i "Analysis Output". Om man
sist lägger till GRIDTABLE listas data som en Excel-liknande tabell.
Tillägget UPDATE listar data som en tabell där ändringar i data kan göras
direkt (fungerar bara om data lagrats i en Epi-Info tabell). Exempel: ===================== LIST * ===================== LIST age sex group GRIDTABLE ===================== LIST * EXCEPT x01 UPDATE |
MEANS | Används för att ta fram medelvärde och median och passande
spridningsmått. Efter kommandot means
kommer den variabel man vill ha medelvärdet för. Om man efter den variabeln
anger en andra variabel som härbärgerar gruppindelningen så ger means medel
och median separat för grupperna och dessutom görs en
signifikansanalys där sannolikheten för att
man har fel när man påstår att grupperna skiljer sig åt beräknas (det så
kallade p-värdet). P-värdet räknas fram med både
parametriska och icke parametriska statistiska
metoder. Den parametriska metoden som används är
one way anova vilket för två
grupper är detsamma som t-test. Den
icke parametriska metoden är
Kruskal-Wallis one way analysis of variance vilket för två grupper är
detsamma som Mann-Whitney's U-test.
Eftersom programmet självt omöjligt kan veta om siffror representerar en
kvantitativ eller kvalitativ variabel måste
man själv avgöra om man skall använda resultatet framräknat med
parametrisk eller icke parametrisk metod.
Mellan resultatet framräknat med anova respektive Kruskal-Wallis presenteras
Bartlett's test som testar om spridningen är ungefär lika i grupperna. Detta
är nämligen ett av kraven för att få göra anova / Student's t-test. Exempel
på detta kommando. ===================== MEANS change ===================== MEANS change group |
READ | Läser in de data man vill använda. Oftast lagras alla data till ett
projekt i en separat fil. Har man registrerat data i Epi Info ligger de
lagrade i en fil med ändelsen .mdb (samma filformat som access). Registrerar
man data i andra program har filen en annan ändelse. Excel har .xls.
Read-kommandot kan läsa excelfiler förutsatt att de bara innehåller data och
att översta raden anger variabelns namn. När man använder read-kommandot
försvinner tillfälliga variabler man räknat fram. Det gör oftast inget för
de kan snabbt räknas fram igen från grunddata. Exempel på READ-kommandot: ===================== READ 'c:\epi_info\cts.mdb':viewbasdata ===================== READ "Excel 8.0" 'c:\epi_info\projekt_a':'visits$' FILESPEC HDR="YES" END ===================== READ "dBASE IV" 'c:\epi_info\burkinaFaso.dbf' ===================== READ "Epi6" 'c:\epi_info\sf36.rec' LINKNAME=sf36 ===================== READ "ODBC" sqldatadsn:bigtable LINKNAME=projekt_b FILESPEC UID="Username" PWD="Password" END ===================== Om filnamnet innehåller ett mellanslag måste det omges av '-tecken. Det finns ingen nackdel med att använda '-tecken om mellanslag saknas. Om filen som innehåller rådata inte är i filformatet för Epi2000 eller Microsoft Access måste en länk till rådata skapas. Om man inte anger ett speciellt länknamn skapas en tillfällig länk som kallas lnk# där # är ett löpnummer. Den tillfälliga länken (men inte filen med rådata) raderas när man gör ett nytt READ-kommando. Man kan skapa en permanent länk genom att ange ett LINKNAME. Denna permanenta länk (bara länkinformation, inte alla data) sparas i den senast använda Epi2000-filen. Om man vill kan man skapa en egen Epi2000-fil utan egna data som används för att härbärgera länkinformation till en mängd externa databasfiler. Om man läser in en Excelfil som innehåller flera blad anges namnet på bladet sist följt av $. |
TABLES | Används för att jämföra procentuella fördelningar mellan grupper. Efter kommandot tables kommer den variabel man vill ha fördelningen för. Om man efter den
variabeln anger en andra variabel som härbärgerar gruppindelningen så ger
tables fördelningen separat för grupperna och dessutom görs en
signifikansanalys där sannolikheten för att
man har fel när man påstår att grupperna skiljer sig åt beräknas (det så
kallade p-värdet). P-värdet räknas fram med
icke parametriska statistiska metoder. Vid 2x2-tabell levereras odds
ratio, relativ risk, chitvå-test
samt Fisher's exakta test. Vid en
större tabell än 2x2 levereras enbart chitvå. Man kan även göra flera
2x2-tabeller och få en sammanställning av dem. Används när man vill se om en
viss variabel interagerar. Exempel: ===================== TABLES ill group ===================== TABLES ill group STRATAVAR=sex ===================== I första exemplet vill vi se om två olika grupper skiljer sig åt i andelen sjuka individer. I sistnämnda exemplet vill man se om kön interagerar med hur de två grupperna är sjuka. Ett alternativ vore att istället göra logistisk regression. |
Grattis! Du är nu klar med denna övningen.
Åter till innehållsförteckningen för Epi-Info
Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare
Läs om regler för ansvar och copyright som gäller för denna webbsida.