Matematik
Statistik fra den virkelige verden
Jeg ser på en række fejl i et telekommunikationsnet, som faktisk bliver talt op af noget netværksovervågningsudstyr. Jeg har brug for at se, om disse fejl fordeler sig jævnt, eller om de kommer i tidsmæssige peaks, f.eks. forårsaget af udstyrsfejl eller midlertidige problemer i nettet.
Lad os antage at jeg over en periode fra 08:00 til 16:00 målet over N tidsintervaller, og der i alt kommer M hændelser. N kan f.eks. være 100 og M kan være 9.
Når dagen er gået kan jeg se, at der i det af tidsintervallerne, hvor der skete flest hændelser, skete Q hændelser. Q kunne f.eks. være 3.
Hvis hændelserne var fordelt jævnt og tilfældigt, hvad er så sandsynligheden for det udfald?
Det er over 30 år siden jeg selv sad og studerede statistik på H.C. Ørsted Instituttet. Så nu r jeg rusten og vil høre, om nogen kan hjælpe mig med en formel! Der kan selvfølgelig godt være andre tidsintervaller, hvor der også blev målt Q hændelser, men det skal ikke indgå i formlen - min viden er begrænset.
M.v.h. Jon Brüel
Svar #1
09. marts 2012 af peter lind
Der er forskel på om aktiviteten på netværket er stor eller lille. Hvis aktiviteten er stor vil du alt andet lige have større samdsynlighed for fejl. Der kan også være andre problemer, som jeg ikke har kendskab nok til at kunne sige noget om.Du kunne vælge intervallerne op så der er lige meget aktivitet på netværket i hvert interval. Derefter kan du beregne sandsynlighedsfordeling for hvor mange fejl der sker et interval. Hvis du vælger intervallængderne så sandsynligheden for flere fejl er forsvindene bliver det særligt simpelt. Hvis intervallerne er ens har du en binomialfordeling (eller multnomialfordeling) med den fundne sandsynlighed. Hvis du holder dig til binomialfordelingen kan du så teste om antallet af intervaller med fejl er usandsynlig. I en multinomialfordeling kan du lave en χ2 test på om det holder se http://ga.randers-hf-vuc.dk/matlex/statistik.html#X
Svar #2
09. marts 2012 af JonBruel (Slettet)
Tak for dit indspark.
Jeg måler på mange forskellige typer fejl, så jeg kan ikke bare ændre tidsintervallerne.
Mit mål er at kunne sige, at med en så stor peak, er der lille sandsynlighed for, at vi har tale om en fejltype, der fordeler sig tidsmæssigt jævnt. Der er ofte store peaks, men jeg mangler en kvantitativ formel, der opjektivt fortæller mig: med en så stor peak, er der nok tale om fejl i nettet, der opstor i netop det tidsinterval, hvor peaken blev målt.
Men jeg kigger lige på den test, du henviser til.
Jon
Skriv et svar til: Statistik fra den virkelige verden
Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk?
Klik her for at oprette en bruger.
