Matematik

Konveksitet

16. november 2006 af Waterhouse (Slettet)

Sidder og forbereder mig til SSO'en, hvor jeg bl.a. bliver nødt til at omtale nogle konvekse funktioner. Så vidt jeg har forstået er den grundlæggende definition på konveksitet, at en funktion f er konveks i et interval I, hvis det for alle punkter (x1,x2) E I, hvor x2>x1 gælder at

f(t*x1+(1-t)*x2)<t*f(x1)+(1-t)*f(x2), t E [0,1]

Den definition synes jeg, at jeg forstår forholdvist godt - mit problem er nu, at de fleste tekster så umiddelbart går videre til at konstatere, at dette medfører, såfremt f er differentiabel, at f''(x)>0 i I. Hvordan kan man argumentere for dette? Det behøver ikke være fuldstændig formelt, men en eller anden for for skitse af et bevis ville være dejligt.

Svar #1
16. november 2006 af Waterhouse (Slettet)

Hmm, forummet snuppede min matematik - den midterste formel skal være

f(t*x1+(1-t)*x2) < t*f(x1)+(1-t)*f(x2)

Brugbart svar (2)

Svar #2
17. november 2006 af fixer (Slettet)

En måde at gøre det på er første at vise førsteordensbetingelsen, at f er strengt konveks (note 1) hviss for ethvert x,y E S

f(y)>f(x)+f'(x)*(y-x) (I)

hvor S er en åben konveks delmængde af R og f en differentiable funktion f:S->R. Det er nemt udfra definitionen i #1. Prøv selv og skriv igen hvis det svigter.

Andenordensbetingelsen, at f er strengt konveks på S hviss hvis den anden afledede i ethvert punkt er positiv kan så vises som nedenfor:

Nødvendig betingelse:
- - - - - - - - - - -
Antag f er en strengt konveks funktion og vælgt et punkt y E S. Det skal vises at f''(y) > 0. Dertil vælges et andet punkt y+k*p E S, hvor k er en reel konstant, p E R. Af (I) følger så ved at erstatte y med y+kp og x med y

f(y+kp) > f(y) + f'(y)*kp (i)

Da f er to gange differentiabel i y gælder (Taylor):

f(y+kp) = f(y) + f'(y)*kp + ½f''(y)*(kp)^2 + O(||kp||^2) (ii)

Indsæt (ii) i (i) og få

½f''(y)*(kp)^2 + O(||kp||^2) > 0

Bortdivider k^2 og lad k gå mod 0 og slut at f''(y) > 0.

Tilstrækkelig betingelse:
- - - - - - - - - - - - -
Antag at f''(y) > 0 i ethvert punkt x E S. Udtag to punkter x,y E S og benyt middelværdisætningen

f(x) = f(y) + f'(y)(x-y) + ½f''(z)*(x-y)^2 (iii)

hvor z er et punkt på liniestykket der forbinder x og y, d.v.s. z = y+t(x-y), t E ]0,1[. Da S er konveks gælder z E S. Af antagelsen følger nu af (iii)

f(x) > f(y) + f'(y)(x-y)

altså at f er konveks ifølge (I).

note 1:
-------
Den rette notation med definitionen i #1 er 'strengt konveks funktion'. Havde der stået "<=" (mindre end eller lig) ville den rette term være 'konveks'.

Svar #3
17. november 2006 af Waterhouse (Slettet)

Tusind tak, fixer - du har reddet mig igen-igen. Jeg prøver at kigge på det i morgen, når jeg forhåbentlig har en dansk stil mindre at tænke på, og ellers vender jeg tilbage.

Svar #4
18. november 2006 af Waterhouse (Slettet)

Hmm, synes ikke helt jeg kan vise førsteordensbetingelsen - jeg kan godt se, at det rent geometrisk giver god mening, hvis man tegner grafen og ser på den, men jeg kan ikke få det udledt. Kan ikke se hvordan jeg får bugt med t'et i definitionen.

Brugbart svar (2)

Svar #5
18. november 2006 af fixer (Slettet)

Det skal vises, at hvis S er en konveks åben delmængde af R og f:S->R er differentiabel på S så er f konveks hviss det for ethvert x,y E S gælder at

f(y) > f(x) + f'(x)(y-x) (*)

Termen 'hviss' er en sammentrækning af 'hvis og kun hvis' som er den verbale udgave af biimplikationen P<=>Q, hvor P og Q er to logiske udsagn. Beviser får sådanne strikkes sammen af to dele.

I den ene del viser man at hvis P så Q, d.v.s P=>Q. Man viser altså, at hvis P er sand så er Q også sand. Med andre ord: hvis Q ikke er sand, så er P heller ikke. Derimod kan man godt tænke sig at Q er sand uden at P er det.

I den anden del viser man, at hvis Q så P, d.v.s. Q=>P. Man viser altså, at hvis Q er sand så er P ligeså. Med andre ord: hvis P ikke er sand, så er Q heller ikke. Derimod kan man godt tænke sig, at P er sand uden at Q er det.

Kan man vise begge implikationer så er udsagnene P og Q ækvivalente, og man har vist P<=>Q.

I det konkrete tilfælde har vi udsagnene:

P: f er konveks
Q: f(y) > f(x) + f'(x)(y-x)

Vi viser først P=>Q (nødvendig betingelse) og lader os inspirere af tilstedeværelsen af den første afledede af f og sammenhængen mellem differenskvotienter af f i en passende grænseovergang.

Dernæst vises Q=>P (tilstrækkelig betingelse) og håber på at man kan slippe af med den afledede i (*) ved passende anvendelse af Taylorudvikling.

Nødvendig betingelse:
- - - - - - - - - - -
Da f er konveks gælder for alle 0<t<1

f(ty+(1-t)x) < tf(y) + (1-t)f(x)

som omskrives til

(f(x + t(y-x)) - f(x))/t < f(y) - f(x)

Lad t gå mod 0 og udnyt differentiabiliteten af f

f'(x)(y-x) < f(y) - f(x)

Tilstrækkelig betingelse:
- - - - - - - - - - - - -
Antag at (*) gælder. Vælg to vilkårlige punkter x1, x2 E S og dan deres konvekse kombination x = tx1 + (1-t)x2, 0<t<1. Så fås af (*)

f(x1) > f(x) + f'(x)(x-x1)
f(x2) > f(x) + f'(x)(x-x2)

Af disse fås ved udregning

tf(x1) + (1-t)f(x2) > f(x) + f'(x)(tx1 + (1-t)x2 - x) = f(tx1 - (1-t)x2)

ved en 1. ordens Taylor (restled udeladt). Altså er f konveks.

Man kan ved simple udvidelser vise, at samme sætninger gælder for konvekse funktioner af flere reelle variable f:R^n->R, hvor f' ersattes med gradienten.

Skriv igen hvis der er uklarheder.

Brugbart svar (2)

Svar #6
20. november 2006 af fixer (Slettet)

Jeg har efterhånden ingen tillid til den nye portalversion.

Ved genlæsning ser jeg, at dele af indlægget er bortkommet. Specielt er betingelsen

x, y E S, 0<t<1

blevet erstatte med '0' i:

"Da f er konveks gælder for alle 0 "

og samme skæbne er overgået

0<t<1

i

"konvekse kombination x = tx1 + (1-t)x2, 0 "

Det er ganske enkelt uacceptabelt at indlæggene ikke modtages og præsenteres verbatum.

Brugbart svar (2)

Svar #7
20. november 2006 af fixer (Slettet)

Argh, med løg på.

Slut herfra !

Brugbart svar (2)

Svar #8
22. november 2006 af fixer (Slettet)

0 < t < 1

Brugbart svar (2)

Svar #9
22. november 2006 af fixer (Slettet)

Test:

Noget
Noget andet

<i>Symplektisk</i> topologi er ikke kendt af <u>mange</u>.

Brugbart svar (2)

Svar #10
22. november 2006 af fixer (Slettet)

Risikabelt, da det kun understøttes af HTML 4.0:

α ∃ ∀ ∂ ∅ ∈ ∋ √

Brugbart svar (2)

Svar #11
23. november 2006 af Jean

Vi får lige kigget på problemet i #5. Har du for at præcisere hvad der er galt, så en programmør kan forstå det?

Brugbart svar (2)

Svar #12
27. november 2006 af fixer (Slettet)

Der er det galt, at visse tegn, der oftest anvendes i matematik/LaTeX-foraene, har særlig betydning i HTML. Det betyder, at de ikke præsenteres verbatum, men forsøges tydet som en del af HTML-notationen. Det går sjældent godt.

Et eksempel:

Vil jeg skrive udsagnet 0 < t < 1 kan jeg ikke gøre det verbatum. Gør jeg det, kommer det til at se således ud:

0 < t < 1

Det skyldes, at tegnet < er åbningsklammen i HTML-sproget; derfor tolkes mindre end tegnet som begyndelsen på et reserveret HTML-ord. Men da resten af teksten ikke matcher noget kendt i HTML, præsenteres enten ingenting eller noget meget underligt.

Man kan omgå det, hvis man ved det, ved at benytte HTML's escape characters. Men det hjælper ikke på gamle indlæg som bliver fejlpræsenteret i den nye version.

Hjalp det ?

Brugbart svar (2)

Svar #13
27. november 2006 af fixer (Slettet)

Ja det er jo typisk. Når man skal vise noget ikke virker, så virker det, og vice versa. Men jeg står ved, at problemet eksisterer.

Brugbart svar (2)

Svar #14
27. november 2006 af fixer (Slettet)

Indlæggene i denne tråd gående på fejl i præsentationen kobles hermed sammen med den mere passende rubricerede om samme:

https://www.studieportalen.dk/Forums/Thread.aspx?id=283294

Skriv et svar til: Konveksitet

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.