Matematik

Fødselsdags paradoks

26. juni 2018 af Oxim - Niveau: B-niveau

Fødselsdags paradokset siger at der er en stor sandsynlighed for at to mennesker har samme fødselsdag. Sandsynligheden er

p=1-\frac{365}{365}\cdot \frac{364}{365}\cdot\frac{363}{365}...\frac{365-(N-1)}{365}

Men hvert 4. år er der skudår, dvs. nogle mennesker kan have fødselsdag 29. februar, hvilket komplicerer regnestykket.

Nogle der kan hjælpe med det? Altså beregne sandsynligheden for at mindst to personer blandt N personer har samme fødselsdag, hvis man regner skudår med.


Brugbart svar (1)

Svar #1
26. juni 2018 af SuneChr

I praksis vil en ekstra dag ikke forrykke sandsynligheden i det væsentlige.
Vi skal blot være sikker på, at alle personer også kan være født den 29. feb.
Vi har for f.eks. 23 personer, hvor vi regner med 365 dage:

1-\frac{P_{365,23}}{365^{23}}=0,5072...   
og for 23 personer, hvor vi regner med 366 dage:

1-\frac{P_{366,23}}{366^{23}}=0,5063...
Vi ser, i begge tilfælde, at der er større sandsynlighed for sammenfald af fødselsdag, end der ikke er sammenfald. Ja, - det lyder rigtignok som et paradoks.

        


Svar #2
26. juni 2018 af Oxim

Okay så svaret er mellem 0,5072 og 0,5063. Men hvad er svaret præcist? Vi ved jo der er 1/4 sandsynlighed for at have fødselsdag d. 29. februar ift. enhver anden dag, så det må være muligt at regne ud præcist? Der er en meget lille sandsynlighed for at to har fødselsdag d. 29. februar, men det at man har en ekstra dag gør det jo også mindre sandsynligt at to har fødselsdag samme dag, fordi der er flere dage... (gælder det så stadig at svaret er mellem 0,5072 og 0,5063?)


Brugbart svar (1)

Svar #3
26. juni 2018 af SuneChr

Vi skal passe på med at holde styr på udfaldsrummet, således at alle datoer har lige sandsynlighed for at blive udtrukket. Kan vi på forhånd sikre os, at alle personer er født i et ikke-skudår, kan beregningsmodellen benyttes med 365 dage, eller, kan vi på forhånd sikre os, at alle personer er født i et skudår, kan beregningsmodellen benyttes med 366 dage.
Hvis vi f.eks. vil undersøge evt. sammenfald af fødselsdage for småbørn født i 2013, 2014 eller 2015, er modellen med 365 dage korrekt.  


Svar #4
01. juli 2018 af Oxim

Lad os sige at det er helt tilfældigt, fx vi undersøger børn født i 2012-2015. Jeg er helt på bar bund, jeg ved ikke hvordan man "blander" det når der er forskellig sandsynlighed.


Brugbart svar (1)

Svar #5
02. juli 2018 af guuoo2

#4 Kald antallet af børn for n.

Sandsynligheden for at 0 af dem er født 29 februar er
   PDFbinom(n, 1/(365*3 + 366)(0) = 0.91986069    .....når n = 122
denne sandsynlighed ganges med sandsynligheden for at ingen af n børn har fødselsdag samme dag med 365 mulige og lige sandsynlige dage.

Sandsynligheden for at 1 af dem er født 29 februar er
   PDFbinom(n, 1/(365*3 + 366)(1) = 0.076865072    .....når n = 122
denne sandsynlighed ganges med sandsynligheden for at ingen af n - 1 børn har fødselsdag samme dag med 365 mulige og lige sandsynlige dage.

Hvis flere end 1 er født 29 februar, så er der 0% sansynlighed for at ingen har samme fødselsdag.

Summen af de 2 første produkter skal trækkes fra 1, da ovenstående handler om komplementærhændelsen.


Svar #6
07. juli 2018 af Oxim

Tak for hjælpen!

Med n = 122 er sandsynligheden så stor at det bare giver 1. Jeg prøvede med n = 23 og det giver 0,506865... ganske rigtigt i intervallet fra #1.


Svar #7
07. juli 2018 af Oxim

Jeg har en anden opgave ligesom den her (men ikke om fødselsdage), jeg vil prøve at forklare forskellen: Eneste forskel i opgaven er at der er "9 flere 29. februar", men de har samme sandsynlighed (i alt 10 udfald med samme sandsynlighed, og der er stadig alle de andre udfald). Hvad gør man så? Skal man bare gange med 10 et eller andet sted?

Jeg skriver lige den formel du har forklaret:

P'=1-PDF_{binom(n,P)}(0)\cdot \frac{1}{365^n}\cdot \frac{365!}{(365-n)!}-PDF_{binom(n,P)}(1)\cdot \frac{1}{365^{n-1}}\cdot \frac{365!}{(365-(n-1))!}


Brugbart svar (0)

Svar #8
07. juli 2018 af guuoo2

Så er der 365*4 + 10 dage i alt, og lad n betegne antallet af børn.

De to hændelser:
 - "Ingen sammentræf blandt de m børn over 10 dage"
 - "Ingen sammentræf blandt de n-m børn over 365 dage"
er uafhængige når m og n er givet.

Dvs. hændelsernes simultane sandsynlighed er produktet af hver af sandsynlighederne, hvilke beregnes som i #0. Hvis m er større end 10, så er der sammentræf i den første hændelse, så du skal kun beregne de 11 produkter hvor 0 ≤ m ≤ 10.

Sandsynligheden for ingen sammentræf i det hele taget, er det vægtet gennemsnit af produkterne med vægte lig sandsynligheden for at m børn har fødselsdag i 10-dagsperioden: PDFbinom(n, 10/(365*4 + 10)(m)


Svar #9
07. juli 2018 af Oxim

Okay det var ikke så simpelt som jeg lige troede. Jeg skriver lige opgaven, måske er der en nemmere måde at løse den på så.

Der udtages 50 bolde i tilfældig rækkefølge. Der er tre farver bolde, og hver bold har et nummer. Den samme bold kan optræde flere gange. 

Sandsynligheden for at trække en blå bold er 1:500 og de blå bolde kan have heltal 1 til 450.

Sandsynligheden for at trække en rød bold er 1:1000 og de røde bolde kan have heltal 1 til 90.

Sandsynligheden for at trække en gul bold er 1:2000 og de gule bolde kan have heltal 1 til 20.

a) Hvad er sandsynligheden for at trække to identiske bolde (farve og nummer) hvis man trækker 50 bolde?

b) Hvad er sandsynligheden for at trække to identiske bolde (farve og nummer) lige efter hinanden, hvis man trækker 50 bolde?

Jeg har beregnet sandsynligheden for at trække enhver bold, og den er selvfølgelig 100% så det er jo rart.

Jeg tænker at opgaven ligner meget det vi har lavet. n = 50. p er opgivet for hver farve bold, og k må vel være lig 2. Hvis der kun var fx blå bolde, så er det ligesom fødselsdagsparadokset. I stedet tænker jeg at lave et vægtet gennemsnit ligesom du har forklaret, men jeg forstår ikke helt hvordan jeg skal stille det op.

Hvis man beregner for blå bolde ligesom #0 så får jeg:

\frac{1}{500^{50}}\cdot \frac{450!}{400!}\approx 0,00030477...


Brugbart svar (0)

Svar #10
07. juli 2018 af guuoo2

Jeg forstår ikke udtrækningen. Sandsynlighederne for hver farve summer jo ikke til 1.
1:500 = 0.2%    1:1000 = 0.1%     1:2000 = 0.05%

Er det som hvis man trak 1 bold (med tilbagelægning) blandt 6 hvor 4 er blå, 2 er røde og 1 er gule, og i samme omgang afhængigt af farven så at trække et tal mellem 1 og 450/90/20 med lige sandsynlighed? 


Svar #11
07. juli 2018 af Oxim

Ikke helt. Selvom der er en lille sandsynlighed på 1:500 for at trække enhver blå bold skal man huske på at langt de fleste bolde er blå, så sandsynligheden for at trække en blå bold er meget stor, men sandsynligheden for at man trækker fx Blå-301 er kun 1:500.

Sandsynligheden for at trække en blå bold må vel være 450/500 = 90%.

De resterende 10% er røde (90/1000 = 9%) og gule bolde (20/2000 = 1%).

Der er tilbagelægning ja.


Brugbart svar (0)

Svar #12
07. juli 2018 af guuoo2

Så er der 560 forskellige bolde.
Dvs. a) spørger om sandsynligheden for sammentræf når 50 børn har fødselsdag tilfældigt over 560 dage. 

i b) er der 49 forsøg med sandsyndlighed 1:560 for succes. Sandsynligheden for mindst en succes er
1 - PDFbinom(49, 1/560)(0)


Svar #13
07. juli 2018 af Oxim

Men de 560 dage er ikke lige sandsynlige. 450 af dem har sandsynlighed 1:500 osv, 90 af dem har sandsynlighed 1:1000 og resterende 20 dage har 1:2000.


Brugbart svar (0)

Svar #14
07. juli 2018 af guuoo2

Ok så skal fordelingen af farver blandt de 50 udtrukne betinges.

Lad antalsfordelingen i et givet tilfælde være
Gule: m
Røde: n
Blå: 50 - m - n

Sandsynligheden for det case kommer fra multinomialfordelingen:
    vægt(m, n) = PDFmultinomial(50, [1%, 9%, 90%])([m ; n ; 50 - n - m])

Givet m og n beregnes i hver farvegruppe sandsynligheden for at der ikke er sammenfald mellem heltallene med formlen fra #0. Pga. uafhængig skal de ganges sammen for at få den simultane sandsynlighed:
\left(\prod _{i\,=\,20-m+1}^{20} \frac{i}{20} \right ) \left(\prod _{i\,=\,90-n+1}^{90} \frac{i}{90} \right ) \left(\prod _{i\,=\,450-(50-m-n)+1}^{450} \frac{i}{450} \right )

Dette ganges med vægten, og så summes hvor m går fra 0 til 20, og n går fra 0 til 50-m.
Summen skal trækkes fra 1 til sidst.

Jeg får det til
216640786181935971350304152647700854950869939119506001213980008650754273087860102328415378272521316266566638497704869380814446921999 / 238418579101562500000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 ≈ 0.908657


Brugbart svar (0)

Svar #15
07. juli 2018 af guuoo2

i b) er sandsynligheden for at den seneste var blå 90%.
I så fald er sandsynlighed for at den næste har samme farve og nummer  90% * (1:450)

Hvis den forrige var gul (vægt 1%), så er sandsynligheden 1% * (1:2000).

Samlet giver det en sandsynlighed for at den næste er identisk på
  p = 90% * (90% * (1:450)) + 9% * (9% * (1:1000)) + 1% * (1% * (1:2000)) ≈ 0.00180815

Resten er som i #12
  1 - PDFbinom(49, 0.00180815)(0)


Skriv et svar til: Fødselsdags paradoks

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.