Matematik

Har brug for hjælp; Position weight matrix

31. oktober 2018 af Rossa - Niveau: Universitet/Videregående

Hej derude.
Jeg skal forstå  et emne, der hedder Position weight matrix.
Desværre har jeg svært med at forstå.

På wikipedia står der et eksempel, men jeg kan kun delvis forstå det.

Vil nogen derude prøve at hjælpe mig med forståelsen?

Problemet findes på  https://en.wikipedia.org/wiki/Position_weight_matrix, hvor man kan læse et eksemplel 
som:  Conversion of sequence to position probability matrix:


Der er givet 10 sequences med nucleotide, og der er beregnet position frequency matrix (PFM).
Jeg forstår hvordan er PFM beregnet.

Der er beregnet Position Probability Matrix (PPM), og det forstår jeg.
Der er også beregnet sansynligheden for den første sequence, og tilsvarende kan man beregne sansynligheden med de andre "sequences".

Jeg kan ikke forstå hvordan man beregner Position weight matrix.

Altså hvad er 
M_{j,k} = \frac{1}{N} \ \sum_{i=1}^{N}I(X_{i,j}=k)
og hvorfor møder vi det samme formel anderledes som
M_{j,k} = \log_2\Big(\frac{M_{k,j}}{b_k} \Big)

Vil nogen derude lave 2 eller 3 små regnestykke i den sidste matrix, som hedder Position weight matrix, altså hvordan kommer man fra position probability matrix til Position weight matrix.

Jeg håber, at nogen vil hjælpe 
På forhånd tak


Brugbart svar (0)

Svar #1
31. oktober 2018 af swpply (Slettet)

Din forviring skyldes at wikipedia artiklen bruger en slet notation.

Lad

                                         M_{kj} = \frac{1}{N}\sum_{i=1}^NI(X_{ij}=k) 

benævne the position probability matrix (PPM). Da bør du istedet bruge følgende notation

                                               W_{kj} = \log_2\bigg(\frac{M_{kj}}{b_k}\bigg)

for benævelsen af the position weight matrix (PWM), fremfor den i artiklen inkorekte skrivemåde

                                                M_{kj} = \log_2\bigg(\frac{M_{kj}}{b_k}\bigg).

–– Husk, M_{kj} benævner PPM og W_{kj} benævner PWM. Du har alså at M_{kj} og W_{kj} generalt er to forskellige matricer, hvorfor at det er inkorekt og misvisende at bruge den i wikipedia artiklen anførte notation.


Svar #2
31. oktober 2018 af Rossa

Det kan jeg se nu, tak

Jeg kan se, at du har styr på det.
Er lidt forvirret over for
  M_{kj} = \frac{1}{N}\sum_{i=1}^NI(X_{ij}=k).
Det er beregnet ovenpå, f. eks på første søjle,   \begin{bmatrix} 3/10 &\\ 2 /10 &\\ 1/10 &\\ 4/10 \end{bmatrix} og det forvirrer mig. Jeg ser som om det passer ikke til formlen M_{kj} = \frac{1}{N}\sum_{i=1}^NI(X_{ij}=k).



Hvordan beregnes b_k, ville du beregne en eller flere af dem?


Skriv et svar til: Har brug for hjælp; Position weight matrix

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.