Emneopgave beskrivende statistik
Indledning
Ordet ’’statistik’’ oprinder fra det latinske ord ’’statisticum collegium’’, hvilket betyder
’’statsrådgiver’’. Ordet kom til Danmark i 1749, og beskrev i datiden data for staten via grafik og
tabeller.
I dag er statistik ikke kun et begreb, brugt i praksis af statsmænd, men et vigtigt værktøj til
bearbejdelse af alverdens data, brugt af alverdens mennesker. Statistik er en metode, såvel som
en videnskab, vedrørende indsamling og behandling af talbaserede masseiagttagelser som
grundlag for sandsynlighedsberegninger og en evt. konklusion, hvilket netop sædvanligvis er
formålet, så de eventuelle grafiske materialer og tabeller kan fusioneres til en konklusion og
dermed give datasættet et mere konkluderende og beskrivende resultat.
Den forklarende del
Når man skal udarbejde statistik over et emne, og skal have samlet noget materiale, så kan man
vælge at foretage en stikprøve i stedet for at kigge på hele populationen. Dette kan billiggøre en
ellers dyr undersøgelse, eller rent faktisk muliggøre den. Er formålet fx at undersøge hvordan
meningsmålingerne på de pågældende danske partier udformer sig, så vil det være alt for dyrt og
næsten umuligt at undersøge hele populationen (danskere over 18 år.) Derfor kan man lave en
stikprøve, i denne sammenhæng en såkaldt megafonmåling. Her bliver en et begrænset antal
spurgt, og ud fra denne lille gruppe kan man få et billede af meningsmålingerne. Der skal
selvfølgelig tages forbehold for variation, da der er mange faktorer der spiller ind, når man
foretager en stikprøveundersøgelse. En stikprøve kan give et nuanceret billede, men den giver ikke
det konkrete svar.
Senere i opgaven vil en stikprøve blive omtalt som , samt en population som ࡺ. Begge bogstaver
beskriver antallet af individer.
Kvantitative data, altså data der kan måles og vejes, kan inddeles i diskrete -og kontinuerte
måleværdier. De diskrete kan tælles, altså enkeltværdier der er adskilt fra hinanden. 1,2,3.
Hvorimod de kontinuerte måleværdier er værdier der ikke kan opgøres nøjagtigt fx π eller data
som forandrer sig konstant.
Når et datasæt er svært at opgøre, når ingen af svarene er ens eller når serien er meget stor,
grupperes dataserien ofte i intervaller. Her vælger man hvordan man vil behandle sit data. Fx vil
man ved kontinuere data som højden i en klasse, inddele højden i intervaller, da ingen i klassen er
præcis lige høje. Hvorimod man ved diskret analyse vil analysere det mere nøjagtigt. Fx kan man
ved en diskret analyse se de konkrete resultater af hvor mange elever der går i klasserne (), på
en hel skole (ࡺ), hvorimod man med grupperede, vil dele det op i intervaller, dog for at
overskueliggøre det, men det utydeliggøre resultatet en smule. Når man vælger at undersøge et
emne med en grupperet eller en diskret analyse, så er der forskellig grafik der skal bruges, hvilket
1
1.A-INT
1/11-2010