"
>

Binomialfordeling

En binomialfordeling er en sandsynlighedsfordeling, der bruges til at beskrive sandsynligheden af et Bernoulli-forsøg. Et Bernoulli-forsøg er et forsøg, der gentages et antal gange, og som kan give to forskellige udfald. Normalt siger man, at forsøget enten kan være en succes eller en fiasko.

En binomialfordeling kan altså beskrive, hvad sandsynligheden er for at få succes i x af de n gange forsøget gentages. Det er vigtigt, at hvert forsøg er uafhængigt af de andre forsøg, og vi bliver nødt til at have en fast sandsynlighed for succes/fiasko for at kunne skabe fordelingen.

Binomialfordelingen har en fordelingsfunktion, P, af en bestemt form:

P(X = x) = \begin{pmatrix} n\\x \end{pmatrix} \cdot p^x \cdot (1-p)^{n-x}

X er her den stokastiske variabel vi arbejder med, og x er det antal gange forsøget giver succes. n er antallet af gange forsøget gentages, og p er sandsynligheden for succes. Vi vil nu gennemgå, hvad de forskellige dele af funktionen betyder.

Binomialkoefficient

Den første parentes med n over x er binomialkoefficienten. Binomialkoefficienten kommer fra kombinatorik, og udregner på hvor mange måder de x succes forsøg kan fordele sig på de n forsøg. Binomialkoefficienten har følgende ligning:

\begin{pmatrix} n\\x \end{pmatrix} = \frac{n!}{x!(n-x)!}

Udråbstegnet er fakultetsfunktionen. Fakultetsfunktionen fungerer på den måde, at hvis man bruger den på for eksempel tallet 6, skal man gange 6 med alle de forgående tal indtil 1:

6! = 6\cdot5\cdot4\cdot3\cdot2\cdot1

Grunden til at man ikke bare skriver funktionen for binomialkoefficienten direkte ind, er at den bruges så ofte i alle mulige sammenhænge, at det giver bedre mening at repræsentere den på en simpel genkendelig måde.

Da Bernoulli-forsøg (succes/fiasko) skal være uafhængige, skal vi, for at finde sandsynligheden for at få succes x gange, gange med sandsynligheden for succes x gange. Altså p i x'te potens. Da vi samtidig kræver, at de resterende (n-x) førsøg skal være fiaskoer, skal vi i også gange med deres sandsynlighed (1-p), (n-x) gange.

Når vi sætter dette sammen, får vi funktionen for en binomialfordeling. Vi udregner sandsynligheden for at få x succeer og (n-x) fiaskoer, og ganger med antallet af måder vi kan få dette resultat.

Når vi har en binomialfordeling givet, kan der være nogle egenskaber, vi er interesserede i at kende til. For eksempel den såkaldte middelværdi, som giver os det mest sandsynlige antal succeser. Det mest sandsynlige kan ikke være andet end antallet af gentagelser n gange sandsynligheden for succes p:

\text{Middelv\ae rdi} = \mu = n \cdot p

Middelværdien gives ofte det græske bogstav \(\mu\) (my). Den anden egenskab man kan være interesseret i er fordelingens varians, som er en værdi, der siger noget om hvor meget fordelingen breder sig.

\text{Varians} = n \cdot p \cdot (1-p)

Varians siger ikke så meget om selve forsøget, men bruges ofte til at sammenligne med andre forsøg.

Binomialtest

En binomialtest foretages, når man har en sandsynlighed og et forsøgsresultat givet. I dette tilfælde kan man være interesseret i, hvor sandsynligt vores testresultat er. For eksempel,hvis vi slår 6 terninger og får 6 øjne på dem alle. Hvor sandsynligt er det at få dette slag? Og er det eventuelt så usandsynligt, at der er noget i vejen med terningerne?

Vi laver denne binomialtest ved at regne sandsynligheden ud for x = 6 og n = 6:

P(X = x) = \begin{pmatrix} 6\\6 \end{pmatrix} \cdot \left ( \frac{1}{6} \right )^6 \cdot \left (\frac{5}{6} \right )^{6-6} = \left ( \frac{1}{6} \right )^6 \cdot = 0,000021 = 0,002 \%

Dette slag er altså ekstremt usandsynligt, så det er muligt, at terningerne har større chance for at slå 6.

Eksempel 1

Vi vil udregne sandsynligheden for at få x antal seksere ved 10 kast med en terning. Sandsynligheden for at få en sekser med en terning er 1/6. Vi kalder vores stokastiske variabel X. Altså må binomialfunktionen se således ud:

P(X = x) = \begin{pmatrix} 10\\x \end{pmatrix} \cdot \left ( \frac{1}{6} \right )^x \cdot \left (\frac{5}{6} \right )^{10-x}

Denne funktion giver kurven i den nedenstående figur.


Binomialfordelingen over antal seksere ved 10 kast af en terning.

Som vi kan kan se på grafen, har vi størst chance for at slå en sekser 1-2 gange. Vi har også en rimelig chance for at slå ingen eller 3 seksere, men fra 4 og opefter bliver vores chancer meget svindende.

Vi beregner middelværdien:

\text{Middelv\ae rdi} = 10 \cdot \frac{1}{6} = 1,67

Vi kan selvfølgelig ikke slå 1,67 seksere, men middelværdien fortæller os at der er større chance for at slå to seksere end en sekser.

Vi beregner variansen:

\text{Varians} = 10 \cdot \frac{1}{6} \cdot \frac{5}{6} = 1,39