Matematik

SRP - Betinget sandsynlighed (syg matematiklærer) => brug for hjælp!!

18. december 2010 af janjanjannemand (Slettet) - Niveau: A-niveau

Jeg ved ikke om der er en, der kan tage sig tid midt i weekendens pjat og ballade, til lige at se om han/hun kan forklare mig hvad jeg ikke forstår:

"På en natklub bliver Jesper testet positiv for brug af kokain, testen rammer i 93,5% af tilfældene rigtigt i at identificere kokain-brugere, og rammer i 92,8% af tilfældene rigtigt i at identificere ikke-brugere. 3% af den danske befolkning har indenfor en periode på 3 dage taget kokain".

Jeg har sagt at testens "sand positiv" rate= 93,5%
Jeg har sagt at testens "sand negativ" rate= 92,8 %
og jeg har sagt at testens "initiale sandsynlighed" = 3%, altså raten for forekomsten i den samlede population.

Spørgsmål:
Jeg skal beskrive hvilke parametre i Bayes' formel, som repræsenterer hvilke af disse begreber. Så hvis man f.eks. skal beregne sandsynligheden for, at Jesper er blevet testet "falsk positiv" hvordan skal det så stå i Bayes' formel.

Bayes' formel: P(A|B) = P(fællesmængden for A og B)/P(B)

Jeg håber virkelig du kan hjælpe mig idet min SRP skal afleveres på Mandag, og jeg dermed ikke kan blive vejledt af min lære inden.
Vh. Anders


Brugbart svar (1)

Svar #1
18. december 2010 af AMelev

Det er ikke Bayes formel, du har skrevet op, men definitionen på betinget sandsynlighed.

Du skal dele befolkningen op efter 2 forskellige kriterier:

1) A1: Har taget kokain og A2: Har ikke taget kokain

2) H1: Testet positiv og H2: Testet negativ

Du skal så oversætte oplysningerne til sandsynligheder, fx  P(H1|A1) = 93.5% og dermed P(H2|A1) = 6.5% osv.

Du skal så bestemme sandsynligheden P(H1) for at blive testet positiv,  og derefter skal du bruge Bayes formel til at bestemme P(A2|H1).

Se evt. vedhæftede.


Svar #2
18. december 2010 af janjanjannemand (Slettet)

Mange tak for hjælpen!

Men hvordan bruger man oplysningen om initial sandsynlighed? Altså, det har vel indflydelse på den betingede sandsynlighed?


Brugbart svar (1)

Svar #3
18. december 2010 af AMelev

Det er jo P(A1) og derudfra skal du så bestemme P(A2). Dem skal du bruge, når du skal bestemme P(H1).

Et konstrueret eksempel

80% af overvægtige og 15 % ikke overvægtige har forhøjet kolesteroltal. 25% af den danske befolkning er overvægtige.
(De to første procentangivelser er betingede sandsynlighder og den sidste er den, du kalder initial sandsynlighed). 

Andelen af den danske befolkning med forhøjet kolesteroltal består af  dels af 
de overvægtige med forhøjet kolesteroltal (80% af 25%) og dels af
de ikke-overvægtige med forhøjet kolesteroltal (15% af 75%).

Ialt er der altså 80%·25% + 15%·75% = 31.25% af den danske befolkning, der har forhøjet kolesteroltal. 

80%·25% = 20% af den danske befolkning er både overvægtige og har forhøjet kolesteroltal. Disse udgør 20%/31.25% = 64% af den gruppe, der har forhøjet kolesteroltal, så fordelingen af overvægtige/ikke-overvægtige er 64%/36% i gruppen med forhøjet kolesroltal, mod 25%/75% i hele befolkningen

Prøv at oversætte fra dette eksempel til sandsynligheder og anvendelser af formlerne.


Svar #4
18. december 2010 af janjanjannemand (Slettet)

Så kommer det vel til at hedde:
 

93,5 % af de 3 % kokainbrugere i danmark bliver testet positive = 2,805 % = P(H1 | A1) * P(A1)
 

6,5 % af de 97 % ikke-brugere i Danmark bliver testet poitive = 6,305 % = P(H2 | A1) * P(A2)

P(H2 | A1) * P(A2) + P(H1 | A1) * P(A1) = 9,11 % Hvilket betyder, at 9,11 % af den danske befolkning bliver testet positive alt i alt.

(P(H1 | A1) * P(A1)) / 9,11 % = 2,805 % / 9,11 % = 30,79 %, Dvs. at 30,79 % af hele den mængde, som bliver testet positive, rent faktisk er kokainbrugere.

Altså er fordelingen af kokain-brugere/ikke-brugereden som testes positive for brug af kokain  = 30,79%/69,21%

Og i forhold til hele befolkningen, er fordelingen 3%/97%.?

- er det rigtigt nok? :)


Brugbart svar (2)

Svar #5
18. december 2010 af AMelev

Det lyder rigtigt, men du skal lige kigge på det oprindelige spørgsmål om Jesper.


Svar #6
18. december 2010 af janjanjannemand (Slettet)

Okay, men så må Jesper vel med 69,21 % sandsynlighed, være testet falsk positiv?, idet fordelingen af kokain-brugere/ikke-brugere som testes positive for brug af kokain = 30,79%/69,21%


Svar #7
18. december 2010 af janjanjannemand (Slettet)

Jeg ved ikke om det er den rigitge fremgangsmåde jeg bruger, og hvordan jeg kommer frem til at bruge Bayes' formel. For opgaven lægger op til, at jeg skal beregne det, via Bayes' formel. Som det kan ses har jeg indsat et spørgsmålstegn, i den nederste betingede sandsynlighed, da jeg ikke ved, hvilken hændelse, som betinger hændelse B1, og hvad jeg skal kalde den?

Først beregnes, hvor mange procent af de 3 % af den danske befolkning, som er kokain-brugere, der testes positive: P(B1 | A1) * P(A1) = 93,5 % * 3 % = 2,805 %
 

Herefter beregnes hvor mange procent af de 97 % af den danske befolkning, som er ikke-brugere, der bliver testet positive: P(B1 | A2) * P(A2) = 6,5 % * 97 % = 6,305 %


Den samlede mængde af den danske befolkning, som testes positive = P(B1 | A1) * P(A1) + P(B1 | A2) * P(A2) = 2,805 % + 6,305 % = 9,11 %


Ud af de her 9,11 % som testes positive, beregnes hvor mange procent, kokainbrugerne rent faktisk udgør: P(B1|?) = P(B1 | A1)*P(A1)/(( P(B1 | A1) * P(A1) + P(B2 | A1) * P(A2))
 

Vh. Anders


Svar #8
18. december 2010 af janjanjannemand (Slettet)

Omvendt.. Det bliver vel nu P(A1 | B1) så hvor det førhen var sandsynligheden for at blive testet positiv, når man var kokain-bruger. Er det nu sandsynligheden for at være kokainbruger, når man testes positiv. Og det er dermed P(B1) man har fundet?


Brugbart svar (1)

Svar #9
18. december 2010 af AMelev

Du skal tænke dig om. Du skal finde sandsynligheden for at Jesper er "Clean" | han er testet positiv. Hvad hedder de hændelser?
Se #1 sidste sætning.
Har du kigget på det vedhæftede i #1, så du har Bayes formel rigtig?

I den næstsidste sætning i #7: P(B1) = .....


Svar #10
18. december 2010 af janjanjannemand (Slettet)

Er det ikke rigtigt hvad jeg har skrevet i #8 ?


Brugbart svar (1)

Svar #11
18. december 2010 af AMelev

Jo nemlig! Og her kommer Bayes formel ind i billedet.

Jeg er ikke helt med på, hvad du mener med den sidste sætning, men hvis du mener, der er P(B1), du har fundet som de 9.11%, så har du ret - det er derfor, du skal skrive det ved beregningen (#7).


Svar #12
18. december 2010 af janjanjannemand (Slettet)

jeps, det hele er gået op i en højere enhed! :D Og jeg kan nu bruge Bayes' formel;
P(A1 | B1) = P(B1 | A1)*P(A1)/(P(B1) = (2,805%)/(9,11%) = 30,79 %.

Tak for hjælpen!!!! Det har virkelig reddet min aften :)


Brugbart svar (1)

Svar #13
18. december 2010 af AMelev

Sorry, men aftenen er alligevel ikke helt reddet.

Der er en fejl i P(B1|A2) - du skal lige kigge på de opgivne procenter igen - de 6.5% er P(B2|A1)

A1 indebærer jo at Jesper HAR taget kokain - så du finder sandsynligheden for kokainindtagelse | testet positiv - det var vist ikke det, du ville finde?

Good luck!


Svar #14
18. december 2010 af janjanjannemand (Slettet)

Tak fordi du opdagde det. Nu har jeg fået P(B) til at være 9,789 %. Kan det passe? Idet jeg siger at P(B1|A2) = 7,2 %.


Brugbart svar (1)

Svar #15
18. december 2010 af AMelev

Jep!  Så skal du bare have stakkels Jesper frikendt.

Tænk over resultatet. Over 90% sikkerhed for at ramme rigtigt i en test som denne lyder jo umiddelbart tilforladelig, men .....


Svar #16
19. december 2010 af janjanjannemand (Slettet)

Tak for hjælpen! - det var yderst behjælpeligt!


Skriv et svar til: SRP - Betinget sandsynlighed (syg matematiklærer) => brug for hjælp!!

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.