Optimierung - Wiederholung Analysis
Wiederholung Analysis
In der einführenden Lektion werden grundlegende Konzepte der Analysis besprochen, die an sich bereits vom Schulunterricht und vom Bachelor Studium vertraut sein sollten, deren Wiederholung allerdings sicherlich nicht schadet. Zur Vorbereitung auf die späteren Kapitel, welche auf den hier vorgestellten Begriffen basieren, wird ein etwas formalerer Zugang gewählt als im Bachelor Studium.
Reelle Funktionen einer Veränderlichen
In der Finanzmathematik wurden bereits verschiedenste reelle Funktionen besprochen, etwa die Abhängigkeit des Kapitals von der Zeit , wenn Verzinsung erfolgt. Abbildung 1.1 zeigt den Graphen von zwei Funktionen.
In diesem Beispiel wäre die Zeit t (in Jahren) die unabhängige Variable, und wir haben zwei verschiedene Funktionen: das Kapital unter einfacher Verzinsung, und unter Berücksichtigung der Zinseszinsen. Dabei wird jedem Wert aus dem Intervall [0,40] eine Zahl bzw. zugeordnet. Üblicherweise wird die Funktion der Verzinsung nur für natürliche Zahlen ausgewertet. Wir möchten hier die entsprechenden Funktionen auf beliebige reelle Zahlen im Intervall [0,40] fortsetzen. Im Allgemeinen versteht man unter einer reellen Funktion, bzw. einer reellen Abbildung eine Zuordnungsvorschrift, wo jedem Wert der unabhängigen Variablen genau ein Wert der abhängigen Variable zugeordnet wird. Mitunter ist die Funktion nicht für alle reellen Zahlen definiert, sondern hat einen eingeschränkten Definitionsbereich. So ist zum Beispiel der Logarithmus nur für positive reelle Zahlen definiert. Um eine Funktion vollständig zu charakterisieren schreibt man
wobei in der ersten Zeile festgelegt wird für welche Werte von x die Abbildung definiert ist (Definitionsbereich ), und dass der Bildbereich in den reellen Zahlen liegt. Die zweite Zeile gibt konkret die Rechenvorschrift an.
Beispiel 1: In Abbildung 1 haben wir
Zu den wichtigsten Funktionen gehören lineare Funktionen, Polynome, trigonometrische Funktionen, die Exponentialfunktion und die Logarithmusfunktion, deren Gestalt als bekannt vorausgesetzt wird.
Aufgabe 1 Zeichne mit R und Maxima ähnlich zu Abbildung 1.1 die Graphen folgender Funktionen:
Bei der Bildung einer zusammengesetzten Funktion ist darauf zu achten, dass der Bildbereich von f im Definitionsbereich von liegt.
Umkehrabbildung
Ein wesentliches Merkmal einer Funktion ist, dass jedem Wert von genau eine reelle Zahl zugeordnet wird. Manchmal ist es der Fall, dass auch umgekehrt jeder Bildwert genau einem Urbildwert entspricht. Dies gilt speziell dann, wenn eine Funktion streng monoton steigend bzw. streng monoton fallend ist. Dies bedeutet, dass für jedes entweder (steigend) oder (fallend). In diesen Fällen kann die sogenannte Umkehrabbildung gebildet werden, die jedem Bildwert den entsprechenden Urbildwert zuordnet. Es gilt
Beispiel 2: In Abbildung 2 finden wir ein wichtiges Beispiel: Die streng monoton steigende Funktion und deren Umkehrfunktion Beachte, dass man im Graphen die Umkehrfunktion durch Spiegelung an der ersten Hauptdiagonale erhält. Klarerweise gilt . Andererseits gilt auch für , ansonsten liegt nicht im Definitionsbereich der Logarithmus-Funktion.
Ein Beispiel für eine Funktion die sich nicht umkehren lässt wäre .
Aufgabe 2 Skizziere ähnlich zu Abbildung 2 den Graphen von
\begin{aligned}f^+:&\mathbb{R}^+\rightarrow\mathbb{R}\\\ &x\mapsto x^2\\\end{aligned} und überlege, warum es keine eindeutige Umkehrfunktion gibt. Zeichne die beiden Umkehrfunktionen zu und
Löse algebraisch die Gleichung nach und vergleiche mit den graphischen Lösungen
Differentiation
Als nächstes wollen wir uns mit Glattheitseigenschaften von Funktionen beschäftigen. Als erstes wäre da der Begriff der Stetigkeit. Eine Funktion ist an einem Punkt x im Wesentlichen dann stetig, wenn sie dort nicht springt.
Beispiel 3: In Abbildung 3 ist folgende Funktion gezeichnet:
Die Funktion ist überall stetig außer an wo sie einen Sprung der Höhe 1 hat.
Formal wird die Stetigkeit dadurch definiert, dass an einer bestimmten Stelle sowohl der rechtsseitige Limes als auch der linksseitige Limes mit dem Funktionswert übereinstimmt. Also
sowohl für beliebige Folgen mit als auch für .
In Beispiel 3 bedeutet dies, dass an der Stelle zwar der rechts-seitige Limes mit dem Funktionswert übereinstimmt:
Hingegen gilt für den linksseitigen Limes:
(nachrechnen mit !) Daher ist die Funktion an der Stelle nicht stetig. In Abbildung 1.3 ist der rechtsseitige Limes durch einen Punkt, der linksseitige Limes durch einen Ring gekennzeichnet.
Differenzierbarkeit hängt nun damit zusammen, ob eine Funktion an einem Punkt einigermaßen glatt ist und nicht etwa einen Knick aufweist. Anschaulich gesprochen bedeutet dies, dass man im Graphen der Funktion an einem Punkt eine Tangente anpassen kann. Stetigkeit ist dafür eine notwendige Voraussetzung, allerdings nicht hinreichend. Die Funktion aus Abbildung 1.3 etwa ist an der Stelle zwar stetig, aber nicht differenzierbar. Die Theorie der Differentialrechnung wurde in der Finanzmathematik ausführlich besprochen.
Rechenregeln
Wir wollen nur die wichtigsten Rechenregeln der Differentialrechnung wiederholen. Die folgende Tabelle beinhaltet die Ableitungen der gängigsten Funktionen, wobei hier a eine beliebige reelle Zahl sein kann:
Zusätzlich von Bedeutung sind
Die Kettenregel kann auch in folgender Form geschrieben werden:
Aufgabe 3 Differenziere folgende Funktionen und überprüfe das Ergebnis mit Maxima!
Die erste Ableitung ist wiederum eine Funktion von nach , deren Ableitung man als Ableitung zweiter Ordnung bezeichnet. Entsprechend können Ableitungen höherer Ordnung definiert werden. Die erste Ableitung einer Funktion gibt deren Steigung an. Die Gleichung bestimmt potentielle lokale Extremstellen der Funktion. Die Ableitung zweiter Ordnung beschreibt die Krümmung einer Kurve und definiert potentielle Wendepunkte. All diese Überlegungen fließen bei der wohlbekannten Diskussion von Kurven ein.
Integration
Geometrisch gesehen dient das Integrieren zum Berechnen von Flächen.
Beispiel 4: In Abbildung 1.4 ist das Polynom geplottet. Es soll die Fläche zwischen der Funktion und der x-Achse im Bereich berechnet werden, die in der Abbildung hervorgehoben wurde. Die Berechnung erfolgt mit einem sogenannten bestimmten Integral, bei dem die obere und die untere Grenze des Integrationsbereichs feststehen (im Beispiel eben die Grenzen -1 und 1).
Im folgenden Abschnitt werden wir die Details zu dieser Berechnung genau erläutern. Für die allgemeine Integrationstheorie ist der Zusammenhang zwischen Integralrechnung und Differentialrechnung von entscheidender Bedeutung:
Hauptsatz der Analysis
Dieser fundamentale Satz besagt, dass Integrieren und Differenzieren zueinander inverse Operationen sind. Um dies zu verstehen brauchen wir zunächst folgende Begriffe: Das unbestimmte Integral einer Funktion f sowie deren Stammfunktion. Ein unbestimmtes Integral von erhält man, indem man die untere Grenze des Integrals festhält, während man die obere Grenze variieren lässt:
Für jedes feste wird dadurch eine Funktion in definiert. Unter eine Stammfunktion von versteht man eine differenzierbare Funktion für die gilt
Es gibt davon unendlich viele, da man zu jeder Stammfunktion eine Konstante addieren kann und wiederum gilt
D.h. die Stammfunktion ist nur bis auf eine Konstante eindeutig bestimmbar. Der Hauptsatz der Analysis besagt nun, dass jedes unbestimmte Integral von gerade eine Stammfunktion von ist:
Umgekehrt erhalte ich alle Stammfunktionen mittels unbestimmter Integrale
wobei als Integrationskonstante bezeichnet wird. Die folgende Tabelle gibt die Stammfunktionen der wichtigsten einfachen Funktionen, wobei hier jede beliebige reelle Zahl mit Ausnahme von sein kann.
Die Tabelle ist gerade die Umkehrung von jener der Differentiation.
Ist die Stammfunktion F(x) einer Funktion f(x) bekannt, so können bestimmte Integrale für ein Intervall [a,b] recht einfach berechnet werden:
Die Integrationskonstante des unbestimmten Integrals kürzt sich weg, und daher genügt es eine einzige Stammfunktion zu kennen um beliebige bestimmte Integrale von f zu berechnen. Man verwendet häufig die Notation
um in einem Zwischenschritt zu verdeutlichen, wie die Stammfunktion explizit aussieht. Nun sollte die Berechnung des Integrals in Beispiel 4 kein Problem mehr machen.
Aufgabe 4:
Das Berechnen von Wahrscheinlichkeiten entspricht hier gerade der Integration. Eine in der Praxis häufig auftretende Verteilung ist die Exponentialverteilung, mit Dichte
Berechne die Wahrscheinlichkeit, dass eine exponentialverteilte Zufallsvariable mit Parameter Werte zwischen 1 und 2 annimmt.
Partielle Integration, Substitution
Während das Differenzieren nach Erlernen der Grundtechniken weitgehend mechanisch abläuft ist dies beim Integrieren leider nicht der Fall. Im Gegenteil, häufig gleicht die Suche nach einer Stammfunktion einer höheren Kunstform, und in vielen Fällen ist eine geschlossene Darstellung eines unbestimmten Integrals gar nicht möglich. So besitzt beispielsweise die Dichte der Normalverteilung keine einfach darstellbare Stammfunktion, und zur Berechnung von Wahrscheinlichkeiten ist man hier entweder auf Tabellen oder auf numerische Integration angewiesen. Zwei Basistechniken zur Bestimmung von Stammfunktionen sollen hier allerdings Erwähnung finden:
Partielle Integration:
Dies ist das Pendant zur Produktregel, was durch Differenzieren unter Verwendung des Hauptsatzes der Analysis unmittelbar klar wird:
Substitution:
für streng monoton steigend.
Man kann zeigen, dass es sich hier um das Pendant zur Kettenregel beim Differenzieren handelt. Wir wollen beide Techniken anhand eines konkreten Beispiels vorführen. In den Wiederholungsaufgaben gibt es einige weitere Beispiele.
Beispiel 5: Der Erwartungswert einer Zufallsvariable mit Dichte ist definiert als
Für die Exponentialverteilung (aus Aufgabe 4) erhält man
Man beachte, dass
weil die Exponentialfunktion wesentlich rascher gegen 0 konvergiert als der Faktor wächst.
Reelle Funktionen mehrerer Veränderlicher
Vorbemerkung: in diesem Abschnitt wird mit Vektoren und Matrizen gerechnet; zwar werden die einzelnen Schritte erläutert, - falls diese Schritte aber große Schwierigkeiten bereiten, sollten Sie die erforderlichen Grundlagen der Linearen Algebra rekapitulieren. Bislang haben wir uns auf Funktionen einer freien Variablen beschränkt, d.h. der Definitionsbereich und der Bildbereich waren jeweils Teilmengen der Zahlengerade. Allgemeiner betrachtet kann man Abbildungen mit n Veränderlichen studieren; diese schreibt man in der Form:
Nun ist diese Verallgemeinerung – trotz der etwas sperrigen Notation (und es wird noch schlimmer!) durchaus naheliegend: in der Praxis wird eine Zielvariable ja häufig nicht nur von einer einzigen Einflussvariablen bestimmt, sondern von mehreren – nehmen wir etwa die Nachfrage nach Bier in einem Gastgarten: sie wird vom Preis des Bieres abhängen, von der Temperatur und vom Datum zu Monatsbeginn haben viele Gäste noch mehr Geld zur Verfügung als gegen Monatsende; diese drei freien Variablen können wir nennen – oder eben . Funktionen mit eindimensionalem Definitionsbereich konnten wir durch den Graphen veranschaulichen – auf der x-Achse wird die freie Variable aufgetragen, auf der y-Achse die Abhängige – dann erhalten wir bei einer stetigen Funktion eine Kurve (oder Gerade) im Raum. Bei Funktionen mit mehrdimensionalem Definitionsbereich ist eine solche Veranschaulichung im Allgemeinen nicht mehr möglich; eine Ausnahme sind die Funktionen
hier ist der Definitionsbereich ein Teilbereich der (zweidimensionalen) Ebene, und jedem Punkt aus diesem Ebenen-Bereich wird ein Funktionswert zugeordnet – den wir uns als Höhe vorstellen können. Der Graph der Funktion wird also eine – möglicherweise sehr unebene – Fläche im Raum sein; als Beispiel können Sie sich eine Landschaft vorstellen: jeder Punkt hat eine x- und eine y- Koordinate in der Ebene, und diesem Punkt wird eine Höhe zugeordnet; je nachdem wie stetig die Funktion nun ist, wird die Landschaft glatt oder zerklüftet sein. Funktionen mit höherdimensionalem Definitionsbereich kann man sich nicht mehr so einfach veranschaulichen. Die Definition der Stetigkeit wird nun etwas komplizierter, da man sich einem Punkt in der Ebene – oder einem höherdimensionalen Raum – nicht nur aus zwei Richtungen, sondern aus beliebig vielen Richtungen nähern kann. Das Konzept bleibt ansonsten aber das Gleiche. Eine Funktion f ist an einer Stelle stetig, falls für jede Folge von Punkten, die gegen diesen Punkt konvergiert die entsprechende Folge der Funktionswerte gegengegen den Funktionswert dieses Punktes konvergiert.
Beispiel 6: Großer Beliebtheit erfreut sich in den Wirtschaftswissenschaften die Cobb-Douglas Funktion, die den Einfluss von mehreren Faktoren auf die Produktion modelliert. So ließ sich in den Jahren 1960 bis 1975 die Produktion Y der Beiersdorf AG in Abhängigkeitn von den beiden Faktoren L (Arbeit) und K (Kapital) durch die Funktion
gut beschreiben. Die Abbildung zeigt den Graphen der Funktion: der Definitionsbereich ist die Menge aller Punkte , also der positive Quadrant der Ebene; jedem dieser Punkte wird nun eine Funktionswert zugeordnet. Ist einer der beiden Faktoren 0, so ist die Produktivität auch 0; für jeden anderen Wert des einen Faktors ist die Funktion streng monoton steigend im anderen – das sehen wir an den Gitterlinien auf dem Graphen; diese sind die Bilder von Geraden parallel zur K- bzw. zur L-Achse. Offensichtlich ist die Funktion auf jeder dieser Gitterlinien streng monoton steigend. Die Abbildung daneben zeigt die Höhenschichtlinien der Funktion; sie verbinden Punkte aus dem Definitionsbereich mit jeweils gleichem Funktionswert. Im Wikipedia – Eintrag zur Cobb-Douglas Funktion finden Sie eine schöne Animation!
Funktionen in mehreren Variablen können wir uns im Allgemeinen nicht vorstellen; wir können aber versuchen, jede dieser Variablen „getrennt“ zu betrachten, d.h., wir weisen allen anderen einen konstanten Wert zu – dann nehmen diese in der Funktionsgleichung die Rolle von Konstanten ein – und betrachten die Änderung des Funktionswertes bei Änderung der einen Variablen im Fokus.
Beispiel 6 (Fortsetzung): Nehmen wir an, wir wissen, wir wollen nur wissen, wie sich die Produktivität bei konstanter Arbeitsleistung entwickelt, wenn variiert. Dann können wir
schreiben – also die Funktion nur noch abhängig von betrachten. In der linken Graphik würde das heißen, dass wir uns jene Gitterlinie suchen, die zu gehört, und auf dieser variable Werte von betrachten. In dieser Betrachtung können wir nun das Werkzeug aus der eindimensionalen Analysis einsetzen; z.B. können wir Ableitungen in Richtung einer Variablen definieren, wenn alle anderen Festgehalten werden – formal:
Beispiel 6 (Fortsetzung): Bilden wir die partiellen Ableitungen der Cobb-Douglas-Funktion, so erhalten wir:
Der Zeilen-Vektor aus den partiellen Ableitungen wird als Jacobi-Matrix bezeichnet,
Der Spalten-Vektor bestehend aus allen partiellen Ableitungen wird als Gradient bezeichnet,
Existieren die partiellen Ableitungen für alle Variablen und sind ihrerseits stetig, so bezeichnet man die Funktion als differenzierbar. Der Gradientenvektor steht in jedem Punkt normal auf die Höhenschichtlinie durch den Punkt und zeigt in die Richtung des steilsten Anstiegs.
Beispiel 6 (Fortsetzung): Die Jacobi Matrix der Cobb-Douglas Funktion, ausgewertet für :
Die untere Abbildung zeigt den Gradienten der Cobb-Douglas Funktion als Vektorfeld; in jedem Punkt zeigt die horizontale Komponente des Pfeils die partielle Ableitung nach K, die vertikale die partielle Ableitung nach L. Sie stehen normal auf die Höhenschichtlinien. Die rechte Graphik stückelt diese Gradienten-Vektoren zu Trajektorien zusammen – jene Wege, auf denen man von einem gegebenen Startpunkt aus am schnellsten steigt. Auf diesen werden wir bei der Suche nach Maxima bewegen – zumindest annähernd.
In der Jacobi-Matrix stehen die Richtungsableitungen in Richtung jeder einzelnen Variablen – d.h., sie gibt die Steigung der Tangenten an den Funktionsgraph in jeder dieser Richtungen an. Gibt es nur zwei freie Variable, dann ist der Graph einer stetigen Funktion eine Fläche im Raum, und die Tangenten an einen Punkt spannen eine Ebene aus – die Tangentialebene; bei höherdimensionalen Funktionen spricht man von Hyperebenen. Mithilfe der Jacobi-Matrix lässt sich nun die Richtungsableitung in beliebiger Richtung definieren. Die partiellen Ableitungen geben ja an, wie sich der Funktionswert auf der Tangentialebene verändert, wenn man eine Einheit in Richtung jeder einzelnen Variablen geht. Will man nun in eine beliebige Richtung gehen, so sucht man deren Einheitsvektor und multipliziert jede Komponente mit der entsprechenden partiellen Ableitung – man bildet das Matrix-Produkt der Jacobi-Matrix mit dem Richtungsvektor der Veränderung.
Beispiel 6 (Fortsetzung): Die Jacobi Matrix der Cobb-Douglas Funktion, ausgewertet für :
D.h. Wenn ich über dem Punkte eine Tangentialebene anlege, so hat diese über dem Punkt die Höhe , verändere ich nun die erste Komponente, so erhöht sich die Höhe der Tangentialebene um einen Betrag von 1.15; gehen wir stattdessen von P eine Einheit in Richtung der 2. Komponente, so ergibt sich ein Zuwachs von 0.27.
Wie aber verändert sich der Funktionswert, wenn wir uns in beliebiger Richtung vom Punkt P fortbewegen? Dann brauchen wir den Einheitsvektor dieser Richtung: z.B. in Richtung : Die Länge des Vektors ist
D.h.: der Vektor
ist der Einheitsvektor in dieser Richtung. Wenn wir als vom Punkt P eine Einheit in diese Richtung gehen, so ergibt sich ein Höhenzuwachs von aus der Bewegung in die erste Richtung, aus der Bewegung in der zweiten Richtung – und der gesamte Höhenzuwachs ist die Summe dieser beiden.
Mathematisch ausgedrückt erhalten wir die Richtungsableitung als Produkt der Jacobi-Matrix mit dem Richtungsvektor, oder – äquivalent – als inneres Produkt des Gradientenvektors mit dem Richtungsvektor. Die folgenden Schreibweisen sind äquivalent – die letzte nicht ganz exakt aber gebräuchlich:
Beispiel 6 (Fortsetzung): Der Gradient der Cobb-Douglas Funktion war
Die partiellen zweiten Ableitungen werden nun wieder nach beiden Variablen abgeleitet – analog zu den ersten:
Für die Hessematrix ergibt sich daher:
Die gemischten 2. Ableitungen sind immer gleich unabhängig von der Reihenfolge, in der abgeleitet wird – d.h., die Matrix ist symmetrisch. Mit dieser Hessematrix kann nun die 2. Ableitung in jeder beliebigen Richtung bestimmt werden: die zweite Ableitung in Richtung eines Vektors der Länge 1 ergibt sich durch die sogenannte quadratische Form Ist nun diese 2. Ableitung in jeder Richtung positiv, so heißt das, die Funktion ist in jeder Richtung konvex – d.h., ein Punkt, an dem alle partiellen Ableitungen 0 sind (und damit auch der Gradient der Nullvektor) ist ein Minimum. Ist die 2. Richtungsableitung in allen Richtungen negativ, so ist die Funktion in allen Richtungen konkav – d.h., der kritische Punkt ist ein Maximizer. Und gibt es Richtungen, in denen die 2. Richtungsableitung positiv ist, ander, in denen sie negativ ist, so handelt es sich um einen Sattelpunkt. Beispiele finden Sie in der Abbildung:
Beispiel 6 (Fortsetzung): Für die Hessematrix der Cobb-Douglas-Funktion im Punkt ist:
Für die 2 Richtungsableitung in Richtung bilden wir zunächst das Matrix-Vektor Produkt:
gebildet. Es gibt uns die 2. Richtungsableitung in dieser Richtung an. Es ist negativ – d.h. die Funktion ist in diesem Punkt in dieser Richtung konkav. (Die Cobb-Douglas Funktion ist in jedem Punkt in jeder Richtung konkav)
Ein Kriterium, anhand dessen wir diese Eigenschaften der Hessematrix bestimmen können, findet sich in der 2 Lektion (Definitheitskriterien).
Einige Beispiele dazu finden sich in den Wiederholungsaufgaben.
Zusammenfassung Ziel dieses Kapitels war es, in sehr komprimierter Weise grundlegendes mathematisches Basiswissen zu wiederholen, das zum Teil bereits von der Mittelschule bekannt sein sollte, und zum Teil im Bachelor Studium erworben wurde. Speziell die Techniken des Differenzierens und Integrierens sollten beherrscht werden, können aber aufgrund von Platzmangel in diesem Skriptum nicht ausführlicher behandelt werden. Für eine umfangreiche und sehr lesbare Quelle zum Thema mit konkretem Bezug zu den Wirtschaftswissenschaften empfehle ich zum Beispiel das Buch von Sydsaeter und Hammond (2004).
Wiederholungsaufgaben/Übungen
Aufgabe 1 Differenziere folgende Funktionen:
Aufgabe 2 Führe für die Funktion eine Kurvendiskussion durch! (d.h. Definitionsbereich, Nullstellen, Extremwerte, Wendepunkte, Zeichnung)
Aufgabe 3 Suche die Stammfunktionen folgender Funktionen mittels Substitution:
Aufgabe 4 Berechne folgende Integrale
Aufgabe 5 Bestimme den Definitionsbereich folgender Funktionen und berechne Gradienten und Hessematrix: