Statistikk
Tenk deg at du tilbringer en dag med å kaste 1000 tennisballer på en bane. Langs banen er det merker som markerer hver meter. I begynnelsen av dagen kaster du kanskje lengre, men etter hvert som du blir sliten, kaster du kortere. Resultatet er at de fleste ballene vil lande rundt et bestemt område på banen.
Vi måler antall meter til første ball. Vi kan kalle den for Kortest. Deretter måler vi antall meter til ballen som ble kastet lengst og kaller den for Lengst. Deretter grupperer vi ballene for hver meter.
For å finne gjennomsnittlig lengde teller vi antall baller i hver av gruppene. Deretter summerer vi tallene fra gruppene og dividerer på antall grupper. Gjennomsnittlig lengde vil ligge i nærheten av det stedet med flest baller.
Antall baller for hver gruppe (ballene innenfor en meter) kaller vi for frekvens.
Hvis vi ser at de fleste ballene havner i samme gruppe, vil gjennomsnittlig avstand fra gjennomsnittlig lengde. Det vil si hvor mye ballene sprer seg fra gjennomsnittet. Spredningen kan være ganske liten. Dette betyr at ballene er konsentrert rundt et bestemt punkt.
I motsatt tilfelle at ballene har fordelt seg likt mellom Kortest og Lengst. Da vil gjennomsnittlig avstand fra gjennomsnittlig lengde være mye mer.
For å måle denne spredningen av baller, kan vi bruke et mål som heter standardavvik. Dette tallet forteller oss gjennomsnittlig avstand fra gjennomsnittet, og gir oss en ide om hvor mye ballene varierer fra gjennomsnittet.
Hvis ballene er samlet rundt medianen, vil standardavviket være lite, som betyr at ballene er tett samlet. Du kan teste dette ved å se hvor ballene lander, og kanskje oppdage at standardavviket blir veldig lite hvis ballene er samlet på ett sted.
Vi grupperte ballene for hver meter, og fra en meter til den neste blir det noen baller, eller kanskje bare en. Uansett kaller vi dette for frekvens.
Vi kan telle opp antall baller for hver meter som har baller, og lage en tabell. Denne tabellen heter frekvenstabell. Når vi har en frekvenstabell, kan vi lage et søylediagram, der høyden av hver søyle er antallet baller for en gruppe.
Dersom søylediagrammet har formen som en kirkeklokke, kalles det en normalfordeling. Dette betyr at de fleste ballene er samlet rundt et bestemt punkt, mens færre baller er spredt lenger unna. Mange datasett i statistikk følger denne typen fordeling.