|
|
Varför behövs en speciell kurs om analys av surveydata?
I vanlig statistik antar man ofta att alla observationer är oberoende och kommer från en
bakomliggande fördelning. När man har gjort en urvalsundersökning med varierande
urvalssannolikheter har observationerna olika sannolikhet att komma med. Tänk dig t ex att man
vill studera sambandet mellan hur många år man gått i skola/universitet och nuvarande
lön. Vid urvalet har man valt ut personer inom vissa tjänstemannagrupper med högre
sannolikhet än andra. Eftersom man också vet att det finns samband mellan både yrke
och lön och utbildning och yrke, måste man vid analysen ta hänsyn till urvalsmetoden.
Ett annat problem är att normala surveyundersökningar syftar till att beskriva läget i
en viss population. Gör man en totalundersökning har man inte heller något slumpfel.
Vid många statistiska analyser är syftet istället att undersöka om sambanden
gäller i en större hypo-tetisk grupp. Det betyder att korrektionen för ändliga
populationer måste behandlas på annat sätt. Om man t ex ett visst år studerade
147 blindtarmsoperationer på ett visst sjukhus (ett 90% sannolikhetsurval) varav 92 med en metod
och 55 med en annan varav 18 resp. 8 drabbades av komplikationer så är det statistiskt
signifikant att det året och det sjukhuset var det en skillnad mellan andelen komplikationer i
de båda metoderna. Men det är ointressant om man vill kunna uttala sig om alla operationer
i landet eller om framtida operationer vid samma sjukhus.
|