Sandsynlighed

Sandsynlighed er en matematisk beskrivelse af chancen for forskellige udfald af en mere eller mindre tilfældig hændelse.

Når vi regner på en bestemt tilfældig hændelse, bruger vi en såkaldt stokastisk variabel til at repræsentere udfaldet. En stokastisk variabel kan enten tage en værdi fra et begrænset antal værdier, eller den kan tage en værdi blandt et ubegrænset antal værdier. Vi kalder de værdier en stokastisk variabel kan tage for dens udfaldsrum.

Til ethvert udfald har den stokastiske variabel knyttet en sandsynlighed. En sandsynlighed er et tal i intervallet fra 0 til 1. Et udfald med sandsynlighed på 0 betyder at dette udfald aldrig vil forekomme. Et udfald med sandsynlighed på 1 betyder at det altid vil forekomme. Alt i mellem 0 og 1 betyder således, at udfaldet kun forekommer nogle gange, en sandsynlighed på 0.5 betyder for eksempel, at hændelsen forekommer halvdelen af gangene. Man omregner ofte sandsynlighed til procent. 1 er 100% og 0 er 0%.

Betinget sandsynlighed

Betinget sandsynlighed er sandsynligheden af en hændelse, hvor udfaldet afhænger af et andet udfald. Vi opskriver betinget sandsynlighed således:

P(A|B) = \frac{P(A \cap B)}{P(B)}

Her er udfaldet af A afhængig af udfaldet af B, og P er sandsynlighedsfunktionen. For eksempel hvis man trækker et kort fra et spil kort og får at vide, at kortet er et billedkort, hvad er så sandsynligheden for, at det er en konge?

A er hændelsen at det er en konge og B er hændelsen at det er et billedkort. Sandsynligheden for A er 1/13, da kongen er en ud af de 13 mulige kort (kulør spiller ikke ind). Og sandsynligheden for at få et billedkort er 3/13, da 3 ud af de tretten kort er billedkort. Altså har vi:

P(A|B) = \frac{1/13}{3/13} = \frac{1}{3}

Et billedkort har en tredjedel chance for at være en konge.

De to udfald A og B skal være afhængige af hinanden ellers passer formlen ikke. For eksempel har udfaldet af et møntkast og et terningekast ikke nogen indflydelse på hinanden. Vi kalder dem uafhængige hændelser.

Sandsynlighedsfordeling

En sandsynlighedsfordeling er en beskrivelse af sandsynlighederne for udfaldene i et udfaldsrum. Oftest bruger man en funktion, som giver sandsynligheden, når den får udfaldet som input.

I en diskret sandsynlighedsfordeling knytter man en sandsynlighed til hvert enkelt udfald, men hvis man har at gøre med en kontinuert sandsynlighedsfordeling må man arbejde mere generelt. Hvis man for eksempel regner på et hold af maraton-løberes løbetid, vil hver løber (hvis man regner præcist) have en unik løbetid. Derfor skal man bruger en kontinuert sandsynlighedsfordeling for at finde sandsynligheder for en løbers løbetid.


Eksempel på sandsynlighedsfordeling over en løbetiden for maraton. Langt de fleste vil have en løbetid på 4 til 5 timer, men der er også en mindre sandsynlighed for at en løber færdiggør på kortere eller længere tid.

Med funktionen for en kurve som på den ovenstående figur, kan man udregne sandsynlighed for hvert eneste punkt, lige så præcist som man ønsker det.

Vi kigger på en kontinuert sandsynlighedsfordeling i artiklen Binomialfordeling.