Exempel för Epi-Info: nr 1
Denna sida är uppdaterad 2005-07-31

För att förstå den här sidan bör du först ha läst:

Denna övning gäller Windows-versionen av Epi-Info, inte den äldre DOS-versionen. Du kan ha denna webbsida och Epi-Info igång samtidigt. I Windows växlar du mellan dessa program genom att hålla nere knappen "Alt" och trycka till på knappen "Tab" på tangentbordet. På så sätt kan du sekundsnabbt hoppa mellan programmen.


Bakgrund
Läs exemplet om gruppbehandling av överviktiga.

Uppgift A - Skapa ett inmatningsformulär (en View) med bakomliggande datatabell
Du skall skapa ett inmatningsformulär i Epi-Info där du sedan kan registrera uppgifterna för varje överviktig patient. Det innebär att i tur och ordning lägga upp variablerna. I denna övning skall du skapa ett registreringsformulär med variablerna x00, x02, a01 och b01. De andra variablerna i exemplet bryr vi oss inte om i den här övningen. Gör så här:

  1. Starta Epi-Info. Rulla ner rullgardinsmenyn längst upp till vänster (den heter "Programs") och välj "MakeView" (Registreringsformulär kallas i Epi-Info för Views).
  2. När du kommer dit rulla ner rullgardinsmenyn "File" och klicka på "Open". Du får då upp en ruta där du förväntas ange ett filnamn på ett nytt projekt (en ny datafil). Kalla projektet/filen obesitas. När du gjort det kommer en ny ruta som ber dig ange namnet på View:n (registreringsformuläret). Man kan ha många olika registreringsformulär till ett projekt. I det här projektet har vi bara ett registreringsformulär. Kalla registreringsformuläret i den här övningen för  formular1.
  3. Högerklicka upp till höger på formulärytan som nu dyker upp. När du högerklickar dyker en ny ruta upp till höger. I den här rutan skall du ange egenskaper för den variabel du nu vill skapa. I Rutan "Question or Prompt" skriver du Grupp. I rutan "Field Name" skriver du x00. Klicka sedan på knappen "Legal values". I den nya rutan som dyker upp klicka på "Create new". Det skapas då en liten tabell. På översta raden skriver du a, på nästa rad skriver du k. När du gjort detta så klicka på ok. Du kommer då tillbaka till rutan där du angav namnet på variabeln. Där skall du bocka för "Required". När du gjort detta så klicka på ok. Du har nu definierat en ny variabel.
  4. Gör nu likadant med variabeln kön. Den skall ha som "Field Name" x02. Ange som "Legal values" m och k.
  5. Gör nu likadant med variabeln sockersjuka. Den skall ha som "Field Name" x03. Ange som "Legal values" j och n.
  6. Högerklicka igen på formulärytan. I Rutan "Question or prompt" skriver du Vikt vid mätning 1. I rutan "Field Name" skriver du a01. Ungefär mitt på bildskärmen kan du ange vilken sort/typ variabeln är. Förvalt är text. Ändra detta till "Number" och i rutan under ändrar du "Pattern" till ###. Bocka för "Range" och ange "Lower" till 50 och "Upper" till 300.
  7. Gör nu likadant med variabeln vikt vid mätning 2. Den skall ha som "Field Name" b01.
  8. Rulla ner rullgardinsmenyn "File" och välj "Save".

Uppgift B - Registrera uppgifterna i tabellen/databasen
Uppgifterna för alla patienterna skall nu lagras i en databas. En databas är ett lagringsutrymme för strukturerad information. Ofta kan man likna strukturen vid en tabell med rader och kolumner. Kolumnerna kallas fält eller variabler och raderna kallas för poster. I vårt fall är varje patient en post. Man kan ha flera tabeller som är länkade till varandra och detta kallas relationsdatabas (relationsdatabaser berör vi inte i den här övningen). Gör så här:

  1. Om du är kvar i "MakeView" så avsluta detta genom att rulla ner File-rullgardinen och välj "Exit". Du skall därefter vara i Epi-Info´s startmeny. Rulla ner rullgardinsmenyn längst upp till vänster (den heter "Programs") och välj "Enter Data".
  2. I den nya skärmbild som nu kommer fram så rulla ner File-rullgardinen och välj "Open". I rutan som dyker upp välj "obesitas.MDB". I rutan som nu dyker upp uppmanas du namnge vilket registreringsformulär / vilken tabell du vill använda dig av. Som vi sade tidigare kan ett projekt ha många olika registreringsformulär / tabeller. I det här projektet har vi bara ett formulär / en tabell. Välj formulär 1 och klicka på OK
  3. Börja fylla i data för patient nr 1. OBS! du skall inte hitta på egna data utan hämta data från exemplet om gruppbehandling. Data finns på en särskild tabellsida). Flytta dig mellan de olika fälten (variablerna) med tab-tangenten. När du fyllt i sista fältet och trycker på tab hoppar du automatiskt vidare till nästa patient, som du fyller i, etc etc.. Titta efter för varje patient att du är på rätt nummer (varje patient har ett slags kontrollnummer). I registreringsformuläret ser du patientens nr längst ner till vänster.
  4. När du är klar med patient nr 30 så avsluta registreringen genom att rulla ner File-rullgardinen och välj "Exit".

Uppgift C - Rensa data
Nu skall du titta på data i Epi-Info. Verkar det rimligt? Om inte vad är fel? Behöver du göra rättningar? När du är färdig godkänner du databasen i Epi-Info. Gör så här:

  1. Om du är kvar i "Enter Data" så avsluta detta genom att rulla ner File-rullgardinen och välj "Exit".
  2. Du skall därefter vara i Epi-Info´s startmeny. Rulla ner rullgardinsmenyn längst upp till vänster (den heter "Programs") och välj "Analyze Data". Som du ser nu består analysdelen av tre stora rutor. Den långsmala till vänster innehåller alla tillgängliga kommandon. Den mindre ner till höger visar alla kommandon du har gjort tidigare. Den större upptill höger visar resultatet av det du gör.
  3. Börja nu med att klicka på kommandot "READ". I den nya ruta som dyker upp finns ett område som kallas "Data Source". Längst till höger där finns en klickbar liten knapp med tre punkter. Klicka på den. I den nya rutan som nu kommer fram välj obesitas.MDB och klicka sedan på "Öppna". Klicka en gång på "viewformulär1" och klicka sedan på "OK". Om det dyker upp en extra ruta som frågar efter namn på en länk så klicka på OK.
  4. Klicka på kommandot "LIST". I rutan som dyker upp bocka för alternativen "All" och "Allow Updates". Klicka sedan på OK.
  5. Titta på resultatet och jämför med originalet. Du kan justera bredden på varje fält. Ta tag i dem med muspekaren och gör dem smalare så du ser alla fyra fälten på en gång. Har du matat in rätt? Om inte så ändra felaktigheter

Uppgift D - Sammanställ beskrivande statistik
Vad är medelåldern och könsfördelningen i de olika grupperna? Är initialvikterna lika i de båda grupperna? I den här uppgiften skall vi bara titta på könsfördelning och initialvikter. Jag förutsätter att du nu är kvar i analysdelen av Epi-Info (om inte så gör enligt punkt 2 och 3 ovan). Gör nu så här:

  1.  Klicka på kommandot "TABLES". Nu skall du ange vilka vilken variabel som statistiken skall räknas på och vilken variabel som anger gruppindelningen. När du anger variablerna är det bäst att använda den lilla nedåtpil som indikerar att du kan rulla ner en lista över tillgängliga variabler. När du gör det så klicka på rätt variabel. I rutan som dyker upp ange "Exposure variable" till x02 (=kön) och "Outcome variable" till x00 (gruppindelningen). Klicka sedan på OK. Du får nu fram könsfördelningen i den aktiva gruppen och i kontrollgruppen. Som du ser är den ungefär likadan i båda grupperna. Chi-square test visar att den minimala skillnad i könsfördelning som finns mellan grupperna ligger inom slumpens felmarginal (p>0,05).
  2.  Klicka på kommandot "MEANS". I rutan som dyker upp ange "Means of" till a01 (=vikt vid mätning 1) och "Cross tabulated by value of" till x00 (gruppindelningen). Klicka sedan på OK. Du får nu fram medelvikten i den aktiva gruppen (97,1 kg) och i kontrollgruppen (92,7 kg). Som du ser är den ungefär likadan i båda grupperna. Anova för två grupper (=T-test för två oparade grupper) visar att den skillnad i utgångsvikt som finns mellan grupperna ligger inom slumpens felmarginal (p=0,2474).

Vi har nu konstaterat att den aktiva gruppen och kontrollgruppen initialt visade likartad könsfördelning och genomsnittlig vikt. De små skillnader som sågs mellan grupperna föll inom slumpens felmarginal. Vi kan säga att vi inte hittar något som talar emot att grupperna initialt var jämförbara.

Uppgift E - Ta fram analytisk statistik
Är resultaten bättre eller sämre i den tidiga gruppen jämfört med den sena? Vi skall nu räkna fram viktändringen för varje patient. Vi skall sedan jämföra den genomsnittliga viktförändringen mellan den aktiva gruppen och kontrollgruppen.

  1. Klicka på kommandot "DEFINE". I rutan som dyker upp ange som namn på den nya variabeln Viktändring. Klicka sedan på ok. Du har nu gjort en ny variabel.
  2. Nu skall vi fylla den nya variabeln med något. Klicka på kommandot "ASSIGN". Det dyker nu upp en ny dialogruta. Ange där som "Assign variable" Viktändring. Klicka i rutan "=Expression". Klicka sedan i "Available variables" och välj b01. Klicka sedan på minustecknet lite till höger. Klicka sedan igen i "Available variables" och välj nu a01. Klicka sedan på ok.
  3. Nu skall vi se vad som har hänt! Klicka på kommandot "LIST". I rutan som dyker upp bocka för alternativen "All" och "Grid". Klicka sedan på OK. Nu ser du att du har fått ett nytt fält som heter Viktändring. Där finns skillnaden mellan första och andra vikten.
  4. Klicka på kommandot "MEANS". I rutan som dyker upp ange "Means of" till Viktändring och "Cross tabulated by value of" till x00 (gruppindelningen). Klicka sedan på OK. Du får nu fram den genomsnittliga viktändringen i den aktiva gruppen (-6,0 kg) och i kontrollgruppen (-0,07 kg). Som du ser har den aktiva gruppen minskat mer i vikt än kontrollgruppen. Anova för två grupper (=T-test för två oparade grupper) visar att den skillnad i viktminskning som finns mellan grupperna är statistiskt signifikant (p=0,0046). Emellertid är ett krav för att få göra den här analysen att spridningen (varianserna eller standarddeviationen) är ungefär lika stor i båda grupperna. Detta testas med Bartlett's test och i detta fallet ser vi att spridningen skiljer sig åt (lågt p-värde vid Bartlett's test). Vi får alltså inte använda anova utan istället den icke parametriska motsvarigheten som heter Mann-Whitney's test. Resultatet av den ses längst ner ser, p=0,0027=0,003.

Slutsatsen är att den aktiva gruppen har minskat mer i vikt än kontrollgruppen. Sannolikheten för att vi har fel när vi påstår detta är 0,003. (För mer information om hur man tolkar p-värden läs sidan om signifikansanalys).

Prova själv
Gör övningen ovan så lär du dig en hel del om de olika stegen i Epi Info. Om du bara vill prova att analysera data utan att behöva skapa databasen och mata in värdena (övning C-E ovan) kan du hämta hem filen obesitas.mdb med ifyllda data. När du klickat på filnamnet får du frågan om du vill öppna eller spara filen. Välj spara och lägg den i katalogen för Epi Info. Du kan även använda den filen för att göra övning 2.

Beskrivning av de kommandon i modulen Analyze Data som nämns ovan

ASSIGN Betyder tilldela det som står till vänster om = värdet av det som står till höger om =. Oftast används ganska enkel matematik, sällan mer avancerat än de fyra räknesätten. Det som står till höger om = måste omges med " om det är text. Man kan börja med ASSIGN eller LET eller så skippar man dessa kommandoord. Exempel på ASSIGN-kommandot:
=====================
ASSIGN County = "Yellow Medicine"
=====================
LET Address = StreetNumber & " " &StreetName &" " & AptNumber
=====================
now = systemtime
=====================
duration = uears(01/01/88, dateonset)
=====================
group = 1 (Om grupp är en numerisk variabel )
=====================
group = "1" (Om grupp är en textvariabel)
=====================
DEFINE Betyder skapa en ny variabel. Man kan se en variabel som varande kolumnen i en tabell där raderna (kallas även poster) är varje registrerad individ (om det nu är individer som man registrerar). Nästa steg är att fylla kolumnen med värden som räknas fram ur de kolumner som fanns tidigare. Define följs alltså nästan alltid av kommandot assign eller recode. Direkt när en ny variabel är skapad med define accepterar den att man fyller den med siffror eller text. Om man första gången fyller variabeln med siffror kan den sedan inte ta emot text (och tvärtom). Om man gör fel får man använda kommandot undefine och sedan göra rätt. Den nya variabeln kan göras så att den lagras permanent eller bara tillfälligt. Om man inte gör annat än att skriva define lagras den tillfälligt vilket innebär att när man avslutar programmet Analyze Data eller kör ett nytt read-kommando försvinner variabeln (såvida man inte genom write-kommandot har skrivit den till en annan datatabell). Om man efter define-kommandot lägger till global sparas värdet tills modulen Analyze Data stängs av. Lägger man till permanent sparas informationen (även om datorn stängs av) till man använder kommandot undefine. Exempel på define-kommandot:
=====================
DEFINE change
=====================
DEFINE totalitems GLOBAL
=====================
DEFINE totalitems PERMANENT
=====================
Endast tillfälliga variabler innehåller vanligen data (ett värde) för varje post/rad i tabellen. Variabler som är globala/permanenta kan bara innehålla ett enda värde.
LIST Detta kommando listar upp variablerna i den tabell som är inläst i datorns minne med read-kommandot. Om en * anges efter list listas alla variabler. Om några variabelnamn anges efter kommandot list listas bara dessa.  Normalt listas data som en html-fil i "Analysis Output". Om man sist lägger till GRIDTABLE listas data som en Excel-liknande tabell. Tillägget UPDATE listar data som en tabell där ändringar i data kan göras direkt (fungerar bara om data lagrats i en Epi-Info tabell). Exempel:
=====================
LIST *
=====================
LIST age sex group GRIDTABLE
=====================
LIST * EXCEPT  x01 UPDATE
MEANS Används för att ta fram medelvärde och median och passande spridningsmått. Efter kommandot means kommer den variabel man vill ha medelvärdet för. Om man efter den variabeln anger en andra variabel som härbärgerar gruppindelningen så ger means medel och median separat för grupperna och dessutom görs en signifikansanalys där sannolikheten för att man har fel när man påstår att grupperna skiljer sig åt beräknas (det så kallade p-värdet). P-värdet räknas fram med både parametriska och icke parametriska statistiska metoder. Den parametriska metoden som används är one way anova vilket för två grupper är detsamma som t-test. Den icke parametriska metoden är Kruskal-Wallis one way analysis of variance vilket för två grupper är detsamma som Mann-Whitney's U-test. Eftersom programmet självt omöjligt kan veta om siffror representerar en kvantitativ eller kvalitativ variabel måste man själv avgöra om man skall använda resultatet framräknat med parametrisk eller icke parametrisk metod. Mellan resultatet framräknat med anova respektive Kruskal-Wallis presenteras Bartlett's test som testar om spridningen är ungefär lika i grupperna. Detta är nämligen ett av kraven för att få göra anova / Student's t-test. Exempel på detta kommando.
=====================
MEANS change
=====================
MEANS change group
READ Läser in de data man vill använda. Oftast lagras alla data till ett projekt i en separat fil. Har man registrerat data i Epi Info ligger de lagrade i en fil med ändelsen .mdb (samma filformat som access). Registrerar man data i andra program har filen en annan ändelse. Excel har .xls. Read-kommandot kan läsa excelfiler förutsatt att de bara innehåller data och att översta raden anger variabelns namn. När man använder read-kommandot försvinner tillfälliga variabler man räknat fram. Det gör oftast inget för de kan snabbt räknas fram igen från grunddata. Exempel på READ-kommandot:
=====================
READ 'c:\epi_info\cts.mdb':viewbasdata
=====================
READ "Excel 8.0" 'c:\epi_info\projekt_a':'visits$'
FILESPEC HDR="YES" END
=====================
READ "dBASE IV" 'c:\epi_info\burkinaFaso.dbf'
=====================
READ "Epi6" 'c:\epi_info\sf36.rec' LINKNAME=sf36
=====================
READ "ODBC" sqldatadsn:bigtable LINKNAME=projekt_b
FILESPEC UID="Username" PWD="Password" END
=====================
Om filnamnet innehåller ett mellanslag måste det omges av '-tecken. Det finns ingen nackdel med att använda '-tecken om mellanslag saknas. Om filen som innehåller rådata inte är i filformatet för Epi2000 eller Microsoft Access måste en länk till rådata skapas. Om man inte anger ett speciellt länknamn skapas en tillfällig länk som kallas lnk# där # är ett löpnummer. Den tillfälliga länken (men inte filen med rådata) raderas när man gör ett nytt READ-kommando. Man kan skapa en permanent länk genom att ange ett LINKNAME. Denna permanenta länk (bara länkinformation, inte alla data) sparas i den senast använda Epi2000-filen. Om man vill kan man skapa en egen Epi2000-fil utan egna data som används för att härbärgera länkinformation till en mängd externa databasfiler. Om man läser in en Excelfil som innehåller flera blad anges namnet på bladet sist följt av $.
TABLES Används för att jämföra procentuella fördelningar mellan grupper. Efter kommandot tables kommer den variabel man vill ha fördelningen för. Om man efter den variabeln anger en andra variabel som härbärgerar gruppindelningen så ger tables fördelningen separat för grupperna och dessutom görs en signifikansanalys där sannolikheten för att man har fel när man påstår att grupperna skiljer sig åt beräknas (det så kallade p-värdet). P-värdet räknas fram med icke parametriska statistiska metoder. Vid 2x2-tabell levereras odds ratio, relativ risk, chitvå-test samt Fisher's exakta test. Vid en större tabell än 2x2 levereras enbart chitvå. Man kan även göra flera 2x2-tabeller och få en sammanställning av dem. Används när man vill se om en viss variabel interagerar. Exempel:
=====================
TABLES ill group
=====================
TABLES ill group STRATAVAR=sex
=====================
I första exemplet vill vi se om två olika grupper skiljer sig åt i andelen sjuka individer. I sistnämnda exemplet vill man se om kön interagerar med hur de två grupperna är sjuka. Ett alternativ vore att istället göra logistisk regression.

Grattis! Du är nu klar med denna övningen.

Åter till innehållsförteckningen för Epi-Info


Denna webbsida är författad av
Doc. Ronny Gunnarsson
Distriktsläkare/Familjeläkare

Läs om regler för ansvar och copyright som gäller för denna webbsida.