Du är en av...aktiva besökare på den svenska delen - dessutom...aktiva besökare på den engelska delen

(antal aktiva besökare uppdateras automatiskt var 4:e minut)

Citera denna sida som:

-

Introduktion till statistik

-

Först publiserad:

på:

INFOVOICE.SE

Senast updaterad:

Om du vill informera om att denna webbsida finns...

Denna webbsida ger dig en kort översikt över statistik. Du hittar många länkar från denna sida till andra webbsidor som ger mer information. (En annan sida beskriver hur du väljer analytisk statistik som passar ditt projekt.)

Du förstår denna webbsida bäst om du först har läst sidan Vad är forskning.

Algoritmer och matematik

En algoritm är en uppsättning väldefinierade instruktioner eller steg för att uppnå ett mål. Det kan handla om hur man går från A till B. Matematiska algoritmer är precisa instruktioner för hur man löser ett definierat matematiskt problem.

Matematiken använder tal i olika former för att dra slutsatser, vanligtvis i syfte att lösa ett problem. Det kan röra sig om rent teoretiska problem eller praktiska problem som innefattar insamling av observationer från den verkliga världen. Matematisk forskning utforskar nya vägar för att dra slutsatser. När en väg för att lösa ett specifikt problem väl har etablerats, definieras den oftast som en matematisk algoritm. Därmed är alla statistiska metoder matematiska algoritmer, men alla matematiska algoritmer är inte statistiska metoder.

Statistikens fågelperspektiv

Statistik är metoden som används för att hitta ett mönster bland observationer som består av, eller omvandlas till, siffror. Därmed används statistik endast inom empirisk-holistiska (kvantitativa) forskningsansatser och baseras på matematik. De områden som omfattas av statistiken är:

Ett fågelperspektiv på analytisk statistik
(klicka på bilden om du vill ladda ner en högupplöst bild för att använda i dina egna Powerpoint-bilder)

Beskrivande statistik försöker beskriva observationerna med hjälp av siffror (ett centralmått och ett spridningsmått), tabeller och diagram.

Analytisk statistik är ett brett begrepp som syftar på processen att analysera data för att upptäcka mönster, samband och insikter. Detta involverar oftast användning av inferentiella (slutledande) statistiska metoder, men kan även inkludera beskrivande statistik och datavisualisering.

Inferentiell (slutledande) statistik är ett snävare begrepp som försöker sammanfatta data och dra slutsatser från dina observationer genom att a) beräkna sannolikheten att ha fel när du förkastar nollhypotesen, vilket beskrivs med ett p-värdet, och b) beräkna en effektstorlek såsom Cohens d, oddskvoter, hazardkvoter etc. På svenska används ofta begreppet analytisk statistik även när man enbart syftar på inferentiell statistik. På denna webbplats kommer vi använda begreppet “analytisk statistik” även när vi enbart avser inferentiell statistik eftersom det är så begreppet vanligen används i Sverige.

Statistikens historia i korthet

Tidig beskrivande statistik

Vi har haft beskrivande statistik i tusentals år. Den främsta drivkraften var statskonst – behovet för härskare att styra sina riken effektivt.

  • Beskattning: Monarker behövde veta hur många människor som bodde i deras länder och hur mycket rikedom de ägde för att kunna ta ut skatt på ett korrekt sätt.
  • Militär makt: Härskare behövde uppskatta antalet vapenföra män som fanns tillgängliga för att skrivas ut till arméer.
  • Resurshantering: Regeringar behövde data om livsmedelsförsörjning, boskap och markanvändning för att förhindra svält och upprätthålla stabilitet.

Detta ger oss etymologin för själva ordet: Statistik kommer från det italienska ordet statista (“statsman”) och det tyska ordet Statistik (“statliga angelägenheter”). Det var ursprungligen, helt bokstavligt, “vetenskapen om staten”. Statistik handlade till en början helt enkelt om att räkna. Forntida civilisationer så tidigt som 3800 f.Kr., såsom babylonierna, använde lertavlor för att registrera jordbruksskördar . Egyptierna genomförde detaljerade folkräkningar för att organisera arbetskraft till byggandet av pyramiderna . Romarriket var mästare på byråkrati. De genomförde regelbundna folkräkningar (vart femte år) för att registrera medborgare och deras egendom .

Tidig analytisk statistik

Skiftet från att “bara räkna” till att “analysera mönster” skedde på 1600-talet. Det var då den analytiska statistiken som vetenskaplig disciplin verkligen föddes. John Graunt (1620–1674), en enkel sybehörshandlare (köpman) i London, tillskrivs ofta titeln “statistikens fader” eftersom han var den förste att analysera siffror. År 1662 publicerade Graunt Natural and Political Observations Made upon the Bills of Mortality . Han studerade veckorapporterna över dödsfall i London (som ursprungligen skapades för att spåra böldpesten). Istället för att bara läsa listorna letade han efter mönster. London hade drabbats av pestutbrott med jämna mellanrum och kungen ville använda ett system för tidig varning för hotet om nya utbrott. Veckovisa register fördes över dödlighet och dödsorsaker i huvudstaden. På basis av dessa dödslistor (Bills of Mortality) gjorde Graunt en uppskattning av Londons befolkning. Han beräknade överlevnadsgraden, noterade att fler pojkar föddes än flickor (men att pojkar dog i högre utsträckning), och skapade den första livslängdstabellen för att förutsäga förväntad livslängd. Han bevisade att sociala fenomen (som död och födelse) följde förutsägbara lagar, vilket förvandlade statistik till ett verktyg för att förstå samhället, inte bara beskatta det.

En vän till Graunt, Sir William Petty (1623–1687), myntade begreppet “politisk aritmetik” . Han hävdade att regeringens politik borde baseras på data och kvantitativa bevis snarare än enbart retorik eller intuition . Han tillämpade Graunts statistiska metoder på ekonomi och uppskattade nationalinkomst och värdet av arbete. Gottfried Achenwall (1719–1772), en tysk professor, citeras ofta för att ha myntat själva termen Statistik år 1749. Han definierade det dock som den allmänna beskrivningen av staten (geografi, politik, ekonomi), snarare än den matematiska analys av data vi använder idag.

Abraham de Moivre (1667–1754) var en fransk matematiker som arbetade i London och var vän med Isaac Newton. De Moivre var den förste att beskriva normalfördelningens egenskaper. Tack vare de Moivres arbete kan vi ange den exakta andelen av en population som ligger mellan två godtyckliga värden. Paralellt tillämpade Carl Friedrich Gauss (1777–1855) och Pierre-Simon Laplace (1749–1827) sannolikhetslära på fel i astronomiska observationer, vilket också gav oss ”klockkurvan” (normalfördelningen).

Adolphe Quetelet (1796–1874) var en belgisk matematiker som när han studerade fördelningen av mänskliga egenskaper observerade och studerade normalfördelningskurvans egenskaper – ett av de centrala begreppen inom statistik. Han tillämpade klockkurvan på data om människor. Han uppfann begreppet “Medelmannen” (l’homme moyen) och skapade till och med Body Mass Index (BMI). Han visade att frekvensen av brott, äktenskap och självmord var förvånansvärt konstant, vilket tydde på att statistik kunde användas för att studera moraliskt och socialt beteende. Quetelet fördelade de olika längderna hos personerna han studerade längs en horisontell axel, och markerade det totala antalet personer av en specifik längd i staplar parallellt med den vertikala axeln. Han såg att de högsta staplarna i hans diagram var samlade kring en mittpunkt . Staplarnas höjd avtog symmetriskt på båda sidor om den högsta stapeln tills de, vid intervallets extremvärden, var mycket små. Han använde dessa observationer för att hävda att sannolikheten för stora avvikelser i någon egenskap var begränsad. En avgörande insikt var också att fördelningen av en egenskap i en befolkning följer formen av en klocka när den visualiseras i ett diagram. Egenskaperna hos den klockformade fördelningen är Quetelets största bidrag till den moderna statistiken.

Matematiker som Blaise Pascal (1623–1662) och Pierre de Fermat (1601–1665) uppfann sannolikhetsteorin för att lösa tvister kring spel. Anledningen till att det blev intressant som en disciplin var när 1600-talets matematiker började beräkna oddsen i olika hasardspel. Det var uppenbart att denna kunskap hade potential att vara ekonomiskt lönsam. Dessa teorier om spel kunde sedan tillämpas i andra sammanhang. Under 1700- och 1800-talen förenades de två spåren statlig datainsamling och matematisk sannolikhet.

Modern analytisk statistik

William Gosset (1876–1937) arbetade inledningsvis som kemist på bryggeriet Guinness i Dublin 1899 och gjorde viktiga insatser inom statistiken. Han uppfann t-testet för att hantera små stickprov vid kvalitetskontroll inom bryggning. Han skrev under pseudonymen “Student” och uppfann Students t-test.

Karl Pearson (1857–1936) tillämpade statistik på biologiska problem rörande ärftlighet och evolution. Från 1893 till 1912 skrev han 18 artiklar med titeln Mathematical Contribution to the Theory of Evolution som innehåller hans mest värdefulla arbete. Dessa artiklar innehåller bidrag till regressionsanalys och korrelationskoefficienten. Pearson myntade termen “standardavvikelse” 1893.

Ronald Fisher (1890–1962) gav 1922 en ny definition av statistik. Dess syfte var datareduktion och han identifierade tre grundläggande problem. Dessa är för det första specifikation av vilken typ av population datan kom ifrån, för det andra skattning (estimering) och för det tredje fördelning. Fishers bidrag inkluderade utvecklingen av metoder lämpade för små stickprov, likt Gossets, upptäckten av de exakta fördelningarna av observationer för många stickprov och uppfinningen av variansanalys (ANOVA). Han introducerade termen maximum likelihood och studerade hypotesprövning. Fisher anses vara en av grundarna till den moderna statistiken på grund av sina många viktiga bidrag.

Rekommenderad fortsatt läsning

  1. Observationer och variabler.
  2. Studiedesign.
  3. Att välja statistisk metod.
  4. Skattning av stickprovsstorlek.
  5. Urvalsstrategier och datainsamling
  6. Projektplan.
  7. Signifikanta siffror
  8. Beskrivande statistik.
  9. Analytisk statistik.

Referenser

{2262766:Y38PWFUP};{2262766:Y38PWFUP};{2262766:Y38PWFUP};{2262766:NYTUSBXA};{2262766:RJ5TAQVI};{2262766:7RU4F7DH} vancouver default asc 0 72