Mehrdimensionale Extremalprobleme
Worum geht's?
In diesem Artikel werden Extremalprobleme mehrerer Veränderlicher
behandelt, d.h. wir haben folgendes Problem gegeben: Sei U eine Teilmenge
des \(\R^n\) und \(f:U \rightarrow \R\) eine Funktion. Wir
suchen dann die Punkte x aus U, in denen die Funktion \(f(x)\) lokale oder
globale Extremwerte annimmt.
Dies ist ein in Anwendungen häufig auftretendes Problem, daher wollen wir
es hier in der gebotenen Ausführlichkeit behandeln.
Eine kurze Erinnerung und Einleitung
Wir wollen uns anfangs noch einmal in Erinnerung rufen, was wir über
Extremalprobleme für Funktionen \(f:[a,b] \rightarrow \R\) wissen (nachzulesen
zum Beispiel hier):
Die (lokalen) Extrema x (also Maxima und Minima von f), die im Inneren
des Intervalls liegen, genügen - im Fall der Differenzierbarkeit von f -
der Gleichung f '(x) = 0 und wir können die Art des Extremums mit
Hilfe der zweiten Ableitung erkennen (positive zweite Ableitung bedeutet Minimum, negative zweite Ableitung bedeutet Maximum).
Des Weiteren haben wir die Punkte auf dem Rand des Intervalls zu berücksichtigen,
was wir zum Beispiel dadurch tun können, dass wir a und b in
die Funktion f einsetzen und die Werte am Rand mit den ermittelten Werte
der inneren Extrema vergleichen. Beispiele finden Sie hier.
Nun betrachten wir eine Funktion \(f:U \rightarrow \R\) mit
einer Teilmenge U des \(\R^n\). Wir wollen wieder annehmen,
dass f differenzierbar ist (was das bedeutet, steht hier). Dazu sollte U offen sein, das ist
aber im Allgemeinen nicht der Fall. Wir wollen also annehmen, dass f auf
einer offenen Menge V, die U umfasst, definiert und dort differenzierbar
ist. Wieder können wir uns überlegen, dass im Inneren bei Extrema die
Ableitung verschwinden muss: Das ist einfach die Beobachtung, dass es z.B. auf
einem Berggipfel in alle Richtungen nach unten geht:

Aber (wie auch im eindimensionalen Fall) ist eine Stelle mit verschwindender Ableitung nicht notwendig ein Extremum

Im mehrdimensionalen Fall tritt jedoch ein Problem auf, dass wir im eindimensionalen Fall nicht haben: Wir müssen die Randpunkte gesondert betrachten, Randextrema können nicht durch einfaches Einsetzen erkannt werden, da der Rand in diesem Fall in der Regel nicht nur aus zwei Punkten besteht:

Wir wollen uns im Folgenden zuerst mit der Bestimmung innerer Extrema beschäftigen. Randextrema wollen wir - da ihre Bestimmung im Allgemeinen schwieriger ist - erst im Anschluss behandeln.
Innere Extrema
Zuerst wollen wir uns also mit der Bestimmung und Klassifikation innerer Extrema
beschäftigen, wir nehmen hier an, dass \(f:U \rightarrow \R\) differenzierbar
auf der offenen Menge U ist.
Wie schon oben bemerkt, müssen wir innere Maxima unter denjenigen
Punkten mit \(d\,f(x)=0 \) suchen (\(d\,f\) bezeichne hier die Ableitung von \(f\), siehe auch hier). Man bestimme also zunächst diese
Punkte. Als nächstes wollen wir in Analogie zum eindimensionalen Fall
hinreichende Kriterien für Maxima und Minima motivieren: Wie auch im Eindimensionalen,
so spielt auch hier die zweite Ableitung eine fundamentale Rolle. In diesem Fall ist es - sofern
f zweimal differenzierbar ist - die Matrix aller zweiten partiellen
Ableitungen, die wir mit d2f(x) bezeichnen wollen. Wir setzen also:
\[
d^2f(x) :=
\left(\begin{array}{ccc}
\frac{\partial^2 f}{\partial x_1 \partial x_1}(x) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_1}(x)\\
\vdots & \ddots & \vdots \\
\frac{\partial^2 f}{\partial x_1 \partial x_n}(x) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_n}(x)
\end{array}\right)
\]
Man kann zeigen, dass in einem Punkt mit verschwindender Ableitung die zweite
Ableitung das Verhalten der Funktion lokal beschreibt, wir betrachten also
zunächst Abbildungen der Form
\[ x \mapsto \left<Ax,x\right> = \sum_{i=1}^n a_{ij}\ x_i\ x_j \]
mit einer \(n \times n\) - Matrix A für n = 2 und betrachten ihre
Graphen:

Der Nullpunkt ist ein Minimum unserer Abbildung, falls <Ax,x> stets
positiv ist, Matrizen, für die das gilt, wollen wir positiv definit
nennen. Ist <Ax,x> für x ungleich Null stets negativ, so
heißt A negativ definit, treten beide Vorzeichen auf, so heißt
A indefinit.
Hier nun die hinreichenden Kriterien für Extrema in Punkten mit verschwindender
Ableitung, es gilt:
- Ist d2f(x) positiv definit, so ist x ein lokales Minimum.
- Ist d2f(x) negativ definit, so ist x ein lokales Maximum.
- Ist d2f(x) indefinit, so ist x kein lokales Extremum.
Es gibt verschiedene Kriterien für die Definitheit einer Matrix, wir wollen uns hier auf den Fall von 2x2-Matrizen beschränken. Es sei

eine symmetrische 2x2-Matrix, dann ist A
- positiv definit, falls a > 0 und ac - b2 > 0.
- negativ definit, falls a < 0 und ac - b2 > 0.
- indefinit, falls ac - b2 < 0.
Also hat eine Funktion \(f:U \rightarrow \R\) auf einer offenen Teilmenge des \(\R^2\) in einem Punkt x mit \(d\,f(x)=0\) ein
- lokales Minimum, falls \[ \frac{\partial^2 f}{\partial x_1^2}(x) > 0 \quad\mbox{ und } \quad \frac{\partial^2 f}{\partial x_1^2}(x) \cdot \frac{\partial^2 f}{\partial x_2^2}(x) - \left(\frac{\partial^2 f}{\partial x_1\partial x_2}(x) \right)^2 > 0 \]
- lokales Maximum, falls \[ \frac{\partial^2 f}{\partial x_1^2}(x) < 0 \quad\mbox{ und } \quad \frac{\partial^2 f}{\partial x_1^2}(x) \cdot \frac{\partial^2 f}{\partial x_2^2}(x) - \left(\frac{\partial^2 f}{\partial x_1\partial x_2}(x) \right)^2 > 0 \]
- kein lokales Extremum, falls \[ \frac{\partial^2 f}{\partial x_1^2}(x) \cdot \frac{\partial^2 f}{\partial x_2^2}(x) - \left(\frac{\partial^2 f}{\partial x_1\partial x_2}(x) \right)^2 < 0 \]
Tritt keiner der obigen Fälle ein, so kann man mit unseren Mitteln nicht
entscheiden, ob ein Extremum vorliegt, man muss dann die Funktion lokal betrachten
und versuchen, es anders zu entscheiden.
Beispiele
- Als erstes Beispiel berechnen wir Lage und Art der lokalen Extrema von
\[ f: \R^2 \to \R, \quad
x \mapsto \bigl(4\ x_1^2+ x_2^2\bigr)\ \exp\bigl(-x_1^2-4\ x_2^2\bigr)
\]
Eine erste Idee können wir uns mit Hilfe des Graphen von \(f(x)\) verschaffen:
Nun berechnen wir die ersten partiellen Ableitungen: \[ \begin{eqnarray*} \frac{\partial f}{\partial x_1}(x) &= 8\ x_1 \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) + \bigl(4\ x_1^2+x_2^2\bigr) \cdot (-2\ x_1) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr)\\ &= \bigl(8\ x_1 - 8\ x_1^3 - 2\ x_1\ x_2^2\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr)\\ \frac{\partial f}{\partial x_2}(x) &= 2\ x^2 \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) + \bigl(4\ x_1^2 + x_2^2\bigr) \cdot (-8\ x_2) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) \\ &= \bigl(2\ x_2 - 32\ x_1^2\ x_2 - 8\ x_2^3\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) \end{eqnarray*} \] Also ist \(d\, f(x) = 0\) äquivalent zum Gleichungssystem \[ \begin{eqnarray*} \bigl(8\ x_1 - 8\ x_1^3 - 2\ x_1\ x_2^2\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) &=& 0\\ \bigl(2\ x_2 - 32\ x_1^2\ x_2 - 8\ x_2^3\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) &=& 0 \end{eqnarray*} \] Da die Exponentialfunktion keine Nullstellen hat, ist das äquivalent zu \[ \begin{eqnarray*} 2\ x_1 \cdot \bigl(4 - 4\ x_1^2 + x_2^2\bigr) &=& 0\\ 2\ x_2 \cdot \bigl(1 - 16\ x_1^2 - 4\ x_2^2\bigr) &=& 0 \end{eqnarray*} \] Da ein Produkt genau dann Null ist, wenn einer seiner Faktoren es ist, haben wir folgende Möglichkeiten:
- Es ist x1 = 0, x2 = 0, also ist x = 0 eine Lösung.
- Es ist x1 = 0 und \( 1 - 16\ x_1^2 - 4\ x_2^2 = 0 \) also \[ \begin{eqnarray*} 1 - 16 \cdot 0^2 - 4\ x_2^2 &=& 0\\ \iff x_2^2 &=& \frac 14\\ \iff x_2 &=& \pm \frac 12 \end{eqnarray*} \] Also sind \(\left(0,\frac 12\right)\) und \(\left(0,-\frac 12\right)\) Lösungen.
- Es ist x2=0 und \[ 4 - 4\ x_1^2 + x_2^2 = 0 \] also \[ \begin{eqnarray*} 4 - 4 \cdot x_1^2 + 0^2 &=& 0\\ \iff x_1^2 &=& 1\\ \iff x_1 &=& \pm 1 \end{eqnarray*} \] Also sind (1,0) und (-1,0) Lösungen.
- Es ist \[ \begin{eqnarray*} 4 - 4\ x_1^2 + x_2^2 &=& 0\\ 1 - 16\ x_1^2 - 4\ x_2^2 &=& 0 \end{eqnarray*} \] Multiplizieren wir die erste Gleichung mit -4, so erhalten wir das äquivalente System \[ \begin{eqnarray*} -16 + 16\ x_1^2 - 4\ x_2^2 &=& 0\\ 1 - 16\ x_1^2 - 4\ x_2^2 &=& 0 \end{eqnarray*} \] Addieren wir beide Gleichungen, so folgt \[ \begin{eqnarray*} -15 - 8\ x_2^2 &=& 0\\ \iff x_2^2 &=& -\frac{15}8 \end{eqnarray*} \] was unmöglich ist. Also tritt dieser Fall nie ein.
Die Lösungen von \(d\, f(x)=0\) sind also
\[ \begin{eqnarray*} 1.\ \hbox{Loesung:}\quad & x= & (0,0)\\ 2.\ \hbox{Loesung:}\quad & x= & \left(0, \frac 12\right)\\ 3.\ \hbox{Loesung:}\quad & x= & \left(0, -\frac 12\right)\\ 4.\ \hbox{Loesung:}\quad & x= & (1,0)\\ 5.\ \hbox{Loesung:}\quad & x= & (-1,0) \end{eqnarray*} \]Wir müssen nun für jeden dieser Punkte untersuchen, ob ein Extremum vorliegt, und wenn ja, welcher Art es ist. Dazu bestimmen wir die zweiten partiellen Ableitungen, es ist:
\[ \begin{eqnarray*} \frac{\partial^2 f}{\partial x_1^2}(x) &=& \bigl( 8-40\ x_1^{2}-2\ x_2^{2}+16\ x_1^{4}+4\ x_1^2\ x_2^2\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr)\\ \frac{\partial^2 f}{\partial x_1\partial x_2}(x) &=& 4\ x_1\ x_2 \cdot \bigl(-17 + 16\ x_1^2 + 4\ x_2^2\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr)\\ \frac{\partial^2 f}{\partial x_2^2}(x) &=& \bigl(2-40\ x_2^2 - 32\ x_1^2 + 256\ x_1^2\ x_2^2 + 64\ x_2^4\bigr) \cdot \exp\bigl(-x_1^2-4\ x_2^2\bigr) \end{eqnarray*} \]Nun setzen wir unsere Punkte ein, das Ergebnis können wir übersichtlich in einer Tabelle darstellen:
Also ist die erste Lösung (0,0) ein Minimum, die vierte (1,0) und fünfte (-1,0) sind Maxima und in der zweiten \(\left(0,\frac 12\right)\) und dritten \(\left(0,-\frac 12\right)\) liegen keine Extrema vor.
- Wir betrachten nun ein weiteres Beispiel: Wir haben eine Pappe der
Fläche O
und möchten aus ihr ein Paket möglichst großen Volumens bauen.
Zunächst ist ein Paket beschrieben durch die drei Seitenlängen, die wir mit xi, i = 1,2,3, bezeichnen wollen. Dann ist \[ O = 2\ (x_1\ x_2 + x_1\ x_3 + x_2\ x_3), \quad V = x_1\ x_2\ x_3 \] Da nun aber die Menge der Punkte im \(\R^3\), für die die Oberflächengleichung gilt, nicht offen ist, lösen wir sie nach x3 auf, um ein zweidimensionales Problem zu erhalten: \[ \begin{eqnarray*} O &=& 2\ (x_1\ x_2 + x_1\ x_3 + x_2\ x_3)\\ \iff 2\ x_3\ (x_1 + x_2) &=& O - 2\ x_1\ x_2\\ \iff x_3 &=& \frac{O - 2\ x_1\ x_2}{2\ (x_1 + x_2)} \end{eqnarray*} \] Nun können wir die Funktion \[ V(x) = x_1 \cdot x_2 \cdot \frac{O - 2\ x_1\ x_2}{2\ (x_1 + x_2)} \] auf der offenen Teilmenge \[ U := \left\{x \in \R^2: x_1 > 0, x_2 > 0, \frac{O - 2\ x_1\ x_2}{2\ (x_1 + x_2)} > 0 \right\} \] des \(\R^2\) maximieren. Die Menge ergibt sich aus der Forderung, dass Seitenlängen positiv sein müssen.
Um die Extrema zu finden, bestimmen wir nun zunächst die Ableitung, in dem wir die partiellen Ableitungen bestimmen: \[ \begin{eqnarray*} \frac{\partial V}{\partial x_1}(x) &=& x_2 \cdot \frac{O - 2\ x_1\ x_2}{2\ (x_1 + x_2)} + x_1\ x_2 \cdot \frac 1{4\ (x_1 + x_2)^2} \cdot \bigl( -4\ x_2\ (x_1 + x_2) - (O - 2\ x_1\ x_2)\cdot 2\bigr)\\ &=& \frac{O\ x_2 - 2\ x_1\ x_2^2}{2\ (x_1 + x_2)} + \frac {x_1\ x_2}{4\ (x_1+x_2)^2} \cdot \bigl(-4\ x_1\ x_2 - 4\ x_2^2 - 2O + 4\ x_1\ x_2\bigr)\\ &=& \frac{O\ x_2 - 2\ x_1\ x_2^2}{2\ (x_1 + x_2)} + \frac{x_1\ x_2}{2\ (x_1+x_2)^2} \cdot \bigl(-O-2\ x_2^2\bigr)\\ &=& \frac{\bigl(O\ x_2 - 2\ x_1\ x_2^2\bigr)(x_1 + x_2) - O\ x_1\ x_2 - 2\ x_1\ x_2^3}{2\ (x_1+ x_2)^2}\\ &=& \frac{O\ x_2^2 - 2\ x_1^2\ x_2^2 - 4\ x_1\ x_2^3}{2\ (x_1+x_2)^2}\\ &=& \frac{x_2^2 \cdot \bigl(O - 2\ x_1^2 - 4\ x_1\ x_2)\bigr)}{2\ (x_1 + x_2)^2}\\ \frac{\partial V}{\partial x_2}(x) &=& \frac{x_1^2 \cdot \bigl(O - 2\ x_2^2 - 4\ x_1\ x_2)\bigr)}{2\ (x_1 + x_2)^2} \end{eqnarray*} \] Dabei ergibt sich die partielle Ableitung nach x2 wie diejenige nach x1, wir haben wegen der Ähnlichkeit der Rechnungen nur eine ausgeführt.
Nun ist aber \(d\,f(x)=0\) äquivalent dazu, dass in x beide partiellen Ableitungen verschwinden, wir müssen also die Lösungen des Gleichungssystems \[ \begin{eqnarray*} \frac{x_2^2 \cdot \bigl(O - 2\ x_1^2 - 4\ x_1\ x_2)\bigr)}{2\ (x_1 + x_2)^2} &=& 0\\ \frac{x_1^2 \cdot \bigl(O - 2\ x_2^2 - 4\ x_1\ x_2)\bigr)}{2\ (x_1 + x_2)^2} &=& 0 \end{eqnarray*} \] bestimmen, nach Multiplikation mit dem Nenner (x muss ja in U liegen, also positive Koordinaten haben) und einer Division durch das führende Quadrat haben wir das Gleichungssystem \[ \begin{eqnarray*} O - 2\ x_1^2 - 4\ x_1\ x_2 = 0 \iff 4\ x_1\ x_2 &=& O - 2\ x_1^2\\ O - 2\ x_2^2 - 4\ x_1\ x_2 = 0 \iff 4\ x_1\ x_2 &=& O - 2\ x_2^2 \end{eqnarray*} \] Durch Gleichsetzen folgt, da x1 und x2 positiv sein müssen, dass x1=x2 und damit \[ \begin{eqnarray*} O - 2\ x_1^2 - 4\ x_1\ x_2 &=& 0\\ \iff 6\ x_1^2 &=& O\\ \iff x_1 &=& \sqrt{\frac{O}{6}} \end{eqnarray*} \] Nun müssen wir überprüfen, ob wir die Art des Extremums mit Hilfe unserer obigen Methoden herleiten können: Berechnen wir also die zweiten partiellen Ableitungen (die Rechnung haben wir ausgelassen), so ergibt sich: \[ \begin{eqnarray*} \frac{\partial^2 V}{\partial x_1^2}(x) &=& \frac{-x_2^2 \cdot \bigl(2\ x_2^2 + O\bigr)}{(x_1+x_2)^3}\\ \frac{\partial^2 V}{\partial x_1\partial x_2}(x) &=& \frac{x_1\ x_2\ \bigl(O- 2\ x_1^2 - 6\ x_1\ x_2 - 2\ x_2^2\bigr)}{(x_1+x_2)^3}\\ \frac{\partial^2 V}{\partial x_2^2}(x) &=& \frac{-x_1^2 \cdot \bigl(2\ x_1^2 + O\bigr)}{(x_1+x_2)^3} \end{eqnarray*} \] An der uns interessierenden Stelle \( \left(\sqrt{\frac O6}, \sqrt{\frac O6}\right) \) erhalten wir \[ \begin{eqnarray*} \frac{\partial^2 V}{\partial x_1^2}\left(\sqrt{\frac O6}, \sqrt{\frac O6}\right) &=& - \sqrt{\frac O6}\\ \frac{\partial^2 V}{\partial x_1\partial x_2}\left(\sqrt{\frac O6}, \sqrt{\frac O6}\right) &=& - \frac 12 \cdot \sqrt{\frac O6}\\ \frac{\partial^2 V}{\partial x_2^2}\left(\sqrt{\frac O6}, \sqrt{\frac O6}\right) &=& - \sqrt{\frac O6}\\ \end{eqnarray*} \] Es ist also \[ \begin{eqnarray*} \frac{\partial^2 V}{\partial x_1^2}\left(\sqrt{\frac O6}, \sqrt{\frac O6}\right) & < & 0\\ \left(\frac{\partial^2 V}{\partial x_1^2} \cdot \frac{\partial^2 V}{\partial x_2^2} - \left(\frac{\partial^2 V}{\partial x_1\partial x_2}\right)^2\right) &=& \frac O6 - \frac 14 \cdot \frac O6\\ &=& \frac O{8} > 0 \end{eqnarray*} \] Also liegt ein Maximum vor. Die dritte Seite des maximalen Pakets hat die Länge: \[ \begin{eqnarray*} x_3 &=& \frac{O-2\ x_1\ x_2}{2\ (x_1+x_2)}\\ &=& \frac{O-\frac O3}{4\cdot \sqrt{\frac O6}}\\ &=& \sqrt{\frac O6} \end{eqnarray*} \] Das maximale Paket ist also würfelförmig! Hier noch der Graph unserer Volumenfunktion (auch daran hätte man erkennen können, dass ein Maximum vorliegt):
Extrema unter Nebenbedingungen
Häufig ist die Menge, auf der wir die Extrema einer Funktion \(f:U \rightarrow \R \) bestimmen
wollen, nicht offen im \(\R^n\), so dass wir obige Kriterien nicht anwenden können. Wie
schon im Eindimensionalen muss in diesem Fall nämlich die Ableitung in einem Extremum nicht
notwendig verschwinden. Also müssen wir uns überlegen, wie hier die Extrema charakterisiert werden
können.
Definitionsbereiche
Zunächst einmal aber wollen wir uns damit beschäftigen, welche Mengen U wir zulassen wollen. Eine Einschränkung ist sicherlich notwendig, wie schon große endliche Mengen U zeigen sollten. Dort bleibt einem nur Einsetzen aller Punkte. Wir wollen hier so genannte "Untermannigfaltigkeiten" des \(\R^n\) betrachten und auch diese nicht in ihrer allgemeinsten Form. Genauer gesagt soll die Menge U, auf der wir die Extrema bestimmen wollen, als Nullstellenmenge von Funktionen F1, ..., Fk gegeben sein, die auf einer offenen Menge V des \(\R^n\) definiert sind. Es soll also

sein. Die Fi sollen außerdem differenzierbar sein (das ist wie die Differenzierbarkeitsvoraussetzung an f notwendig, um überhaupt Methoden der Differentialrechnung anwenden zu können) und zusätzlich soll eine Regularitätsannahme erfüllt sein, die in gewissem Sinne besagt, dass zur Beschreibung von U nicht weniger als k Funktionen verwendet werden können: In jedem Punkt x von U sollen die Ableitungen
\[\ d\,F_1(x),\, d\,F_2(x),\, \ldots,\, d\,F_k(x) \] linear unabhängig sein, d.h. gilt \[ \sum_{i=1}^k b_i\ d\,F_i(x) = 0 \]mit reellen bi, so müssen schon die bi alle gleich Null sein. Mit anderen Worten: Die Matrix
\[ \left(\begin{array}{@{}*3c@{}} \frac{\partial F_1}{\partial x_1}(x) & \cdots & \frac{\partial F_k}{\partial x_1}(x)\\ \vdots & & \vdots\\ \frac{\partial F_1}{\partial x_n}(x) & \cdots & \frac{\partial F_k}{\partial x_n}(x) \end{array}\right) \]hat Rang k.
Extremwerte
Nun wollen wir versuchen, eine notwendige Bedingung für Extremwerte auf

zu motivieren. Wir benötigen dazu die Beobachtung, dass die Funktion

auf der Einheitssphäre (d. h. auf der Menge derjenigen Punkte mit Abstand Eins zum Ursprung) ihren maximalen Wert in
\[ h= \frac{\left(\frac{\partial f}{\partial x_1}(x), \ldots, \frac{\partial f}{\partial x_n}(x)\right)} {\sqrt{\left(\frac{\partial f}{\partial x_1}(x)\right)^2 + \cdots + \left(\frac{\partial f}{\partial x_n}(x)\right)^2}} \] annimmt, d. h. f "wächst in der Nähe von x am stärksten" in die Richtung des Vektors \[ \left(\frac{\partial f}{\partial x_1}(x), \ldots, \frac{\partial f}{\partial x_n}(x)\right). \]Liegt dieser nun "senkrecht" zu U, so wächst f in der Nähe von x auf U nicht, hat also dort ein Extremum.
Man kann zeigen, dass dies genau dann der Fall ist, wenn Zahlen (die sog. Lagrange-Multiplikatoren) l1, ..., lk existieren, so dass
\[ d\,f(x) = \sum_{i=1}^k \ell_i\ d\,F_i(x) \]gilt, wenn also die Ableitung von F an der Stelle x durch die der Nebenbedingungen linear dargestellt werden kann. Das ist also in diesem Fall das notwendige Kriterium für einen Extremwert.
Wie findet man nun aber die Extremstellen, wir wissen doch nichts über die Zahlen li? Nun: Wir müssen ein Gleichungssystem lösen, in den n+k Unbekannten x1, ..., xn, l1, ..., lk. Dieses Gleichungssystem besteht aus den k Nebenbedingungen und den n Gleichungen, die sich aus unserer notwendigen Bedingung ergeben, wenn wir sie für jede partielle Ableitung einzeln hinschreiben.
\[ \begin{eqnarray*} F_1(x) &=& 0\\ &\cdots&\\ F_k(x) &=& 0\\ \frac{\partial f}{\partial x_1}(x) &=& \ell_1 \cdot \frac{\partial F_1}{\partial x_1}(x) + \cdots + \ell_k \frac{\partial F_k}{\partial x_1}(x) \\ &\cdots&\\ \frac{\partial f}{\partial x_n}(x) &=& \ell_1 \cdot \frac{\partial F_1}{\partial x_n}(x) + \cdots + \ell_k \frac{\partial F_k}{\partial x_n}(x) \end{eqnarray*} \]Beispiele
Als erstes Beispiel wollen wir noch einmal unser Paket von oben betrachten. Zur Erinnerung: Wir haben eine Pappe der Fläche O und möchten aus ihr ein Paket möglichst großen Volumens bauen.
\[ V(x) := x_1\ x_2\ x_3 \]
Es mögen wieder x1, x2 und x3 die Längen der Seiten des Pakets bezeichnen, dann ist die Funktion, die wir maximieren wollen, gegeben durchund die Nebenbedingung, die wir beachten müssen, ist
\[ F(x) := 2(x_1\ x_2 + x_1\ x_3 + x_2\ x_3) - O = 0 \]Man beachte: Die Nebenbedingung ist stets so zu formulieren, dass auf der rechten Seite eine Null steht. Die partiellen Ableitungen von V und F berechnen wir als
\[ \begin{eqnarray*} \frac{\partial V}{\partial x_1}(x) &=& x_2\ x_3\\ \frac{\partial V}{\partial x_2}(x) &=& x_1\ x_3\\ \frac{\partial V}{\partial x_3}(x) &=& x_1\ x_2\\ \frac{\partial F}{\partial x_1}(x) &=& 2\ x_2 + 2\ x_3\\ \frac{\partial F}{\partial x_2}(x) &=& 2\ x_1 + 2\ x_3\\ \frac{\partial F}{\partial x_3}(x) &=& 2\ x_1 + 2\ x_2 \end{eqnarray*} \]Damit ist unser Gleichungssystem
\[ \begin{eqnarray*} 2(x_1\ x_2 + x_1\ x_3 + x_2\ x_3) - O &=& 0\\ x_2\ x_3 &=& \ell \cdot 2\ (x_2 + x_3)\\ x_1\ x_3 &=& \ell \cdot 2\ (x_1 + x_3)\\ x_1\ x_2 &=& \ell \cdot 2\ (x_1 + x_2). \end{eqnarray*} \]Wir erhalten durch Umformen der dritten Gleichung, dass
\[ \begin{eqnarray*} x_1\ x_3 &=& \ell \cdot 2\ (x_1 + x_3)\\ \iff x_1\ x_3 - x_1 \cdot 2\ \ell &=& 2\ \ell \ x_3\\ \iff x_1\ (x_3 - 2\ \ell) &=& 2\ \ell \ x_3. \end{eqnarray*} \]Ist nun x3 = 2 l, so folgt, dass 2 l x3 = 0, also l = 0 oder 2 l = x3 = 0, also ist dann l = 0. Damit müssen, wie wir aus den letzten drei Gleichungen unseres System erhalten, mindestens zwei der xi Null sein und damit O = 0. Da im Fall einer nicht vorhandenen Pappe klar sein sollte, wie das größte Paket aussieht, dürfen wir also im Folgenden annehmen, dass /
\[ x_3 \neq 2\ \ell \iff x_3 - 2\ \ell \neq 0. \]
Damit erhalten wir
\[ \begin{eqnarray*} x_1\ (x_3 - 2\ \ell) &=& 2\ \ell x_3\\ \iff x_1 &=& \frac{2\ \ell x_3}{x_3 - 2\ \ell}. \end{eqnarray*} \]Aus der zweiten Gleichung des Systems erhalten wir genauso
\[ \begin{eqnarray*} x_2\ x_3 &=& 2\ \ell(x_2 + x_3)\\ \iff x_2\ x_3 - 2\ \ell x_2 &=& 2\ \ell x_3\\ \iff x_2\ (x_3 - 2\ \ell) &=& 2\ \ell x_3\\ \iff x_2 &=& \frac{2\ \ell x_3}{x_3 - 2\ \ell}, \end{eqnarray*} \]damit ist
\[ x_1 = \frac{2\ \ell x_3}{x_3 - 2\ \ell} = x_2. \]Betrachtet man nun die vierte und die dritte Gleichung, so erhalten wir auf genau dieselbe Weise (wieder den trivialen Fall ausschließend), dass
\[ x_2 = \frac{2\ \ell x_1}{x_1 - 2\ \ell} = x_3 \]und damit
\[ x_1 = x_2 = x_3 \]Das liefert, wenn wir in die erste Gleichung einsetzen, dass
\[ \begin{eqnarray*} 2\ (x_1\ x_1 + x_1\ x_1 + x_1\ x_1) &=& O\\ \iff x_1^2 &=& \frac O6\\ \iff x_1 &=& \sqrt{\frac O6} = x_2 = x_3 \end{eqnarray*} \]Also ist unser optimales Paket - das hatten wir auch oben erhalten - ein Würfel mit der Seitenlänge \(\sqrt{\frac{O}{6}}\).
Als weiteres Beispiel wollen wir uns überlegen, wo auf der Einheitssphäre eine lineare Funktion \[ f: x \mapsto \sum_{i=1}^n a_i\ x_i \]
ihre extremalen Werte annimmt.
Die Einheitssphäre ist die Menge der Punkte, die Abstand eins vom Ursprung haben, im \(\R^3\) sieht sie so aus:
Wir können sie also durch
\[ U = \left\{x \in \R^n: \lvert x\rvert^2 = \sum_{i=1}^n x_i^2 = 1\right\} \]beschreiben. Auf U wollen wir nun unsere Funktion f minimieren, dazu müssen wir U zunächst als Nullstellenmenge einer Funktion F darstellen. Obige Darstellung von U führt uns zu
\[ F: \R^n \to \R, \quad x \mapsto \sum_{i=1}^n x_i^2 - 1. \]Um nun f auf U zu maximieren, bestimmen wir zunächst die partiellen Ableitungen von F und f. Wir haben zunächst
\[ \begin{eqnarray*} \frac{\partial f}{\partial x_1}(x) &=& a_1\\ \frac{\partial f}{\partial x_2}(x) &=& a_2\\ &\cdots\\ \frac{\partial f}{\partial x_n}(x) &=& a_n\\ \frac{\partial F}{\partial x_1}(x) &=& 2\ x_1\\ \frac{\partial F}{\partial x_2}(x) &=& 2\ x_2\\ &\cdots\\ \frac{\partial F}{\partial x_n}(x) &=& 2\ x_n. \end{eqnarray*} \]Damit erhalten wir das Gleichungssystem
\[ \begin{eqnarray*} \sum_{i=1}^n x_i^2 - 1 &=& 0\\ a_1 &=& \ell \cdot 2\ x_1\\ a_2 &=& \ell \cdot 2\ x_2\\ &\cdots\\ a_n &=& \ell \cdot 2\ x_n. \end{eqnarray*} \]Wir können nun die letzten n Gleichungen nach den xi auflösen, wenn l von Null verschieden ist. Ist aber l Null, so erhalten wir, dass alle ai Null sein müssen, dann ist aber f die Nullfunktion, und die Frage nach Extrema ist leicht zu beantworten: Jeder Punkt der Einheitssphäre ist maximal und minimal. Wir dürfen also im Folgenden annehmen, dass l von Null verschieden ist, wir erhalten dann das Gleichungssystem
\[ \begin{eqnarray*} \sum_{i=1}^n x_i^2 - 1 &=& 0\\ x_1 &=& \frac{a_1}{2\ \ell}\\ x_2 &=& \frac{a_2}{2\ \ell}\\ &\cdots\\ x_n &=& \frac{a_n}{2\ \ell}. \end{eqnarray*} \]Setzen wir nun die xi in die erste Gleichung ein, so ergibt sich
\[ \begin{eqnarray*} \sum_{i=1}^n \left(\frac{a_i}{2\ \ell}\right)^2 - 1 &=& 0\\ \iff \sum_{i=1}^n a_i^2 - 4\ \ell^2 &=& 0\\ \iff \ell^2 &=& \frac 14 \sum_{i=1}^n a_i^2\\ \iff \ell &=& \pm \frac 12 \sqrt{\sum_{i=1}^n a_i^2}\\ &=& \pm \frac 12 \lvert a\rvert \end{eqnarray*} \]Betrachten wir zunähst den positiven Wert von l, wir erhalten dann
\[ \begin{eqnarray*} x_1 &=& \frac{a_1}{2 \cdot \frac 12 \ |a|}\\ &=& \frac{a_1}{|a|}\\ x_2 &=& \frac{a_2}{|a|}\\ &\cdots\\ x_n &=& \frac{a_n}{|a|} \end{eqnarray*} \]also als erste Lösung unseres Gleichungssystems
\[ 1.\ \hbox{Loesung:} \qquad \ell = \frac 12 \ |a|, \quad x = \frac{a}{|a|}. \]Rechnen wir analog mit dem negativen Wert von l, so erhalten wir die zweite Lösung
\[2.\ \hbox{Loesung:} \qquad \ell = -\frac 12 |a|, \quad x = -\frac{a}{|a|}. \]Um nun festzustellen, welcher Art die Extrema sind, setzen wir die Lösungen in die Funktion f ein und erhalten
\[ \begin{eqnarray*} 1.\ \hbox{Loesung:} \qquad f\left(\frac{a}{|a|}\right) &=& \sum_{i=1}^n a_i \cdot \frac{a_i}{|a|}\\ &=& \frac 1{|a|} \sum_{i=1}^n a_i^2\\ &=& \frac{|a|^2}{|a|}\\ &=& |a|,\\ 2.\ \hbox{Loesung:} \qquad f\left(-\frac{a}{|a|}\right) &=& \sum_{i=1}^n a_i \cdot \left(-\frac{a_i}{|a|}\right)\\ &=& -\frac 1{|a|} \sum_{i=1}^n a_i^2\\ &=& -|a|. \end{eqnarray*} \]Also ist (außer im Falle a = 0, den wir oben schon diskutiert haben), die erste Lösung \(\frac{a}{|a|}\) ein Maximum und die zweite \(-\frac{a}{|a|}\) ein Minimum.
-
Als letztes Beispiel wollen wir nun ein Beispiel betrachten, in dem mehr als eine Nebenbedingung auftritt, wir wollen die Extrema der Funktion
\[ f: \R^3 \to \R, \quad x \mapsto 5\ x_1 + x_2 - 3\ x_3 \]auf einem Kreis bestimmen. Man kann sich überlegen, dass ein Kreis nicht Nullstellenmenge einer reellen Funktion, die den erforderlichen Bedingungen genügt, sein kann, da die Nullstellenmenge einer solchen Funktion immer in gewissem Sinne zweidimensional ist; wir können unseren Kreis aber als Schnitt der Ebene
\[ E = \{x \in \R^3: x_1 + x_2 + x_3 = 0\} \]mit der Kugeloberfläche
\[ S = \{x \in \R^3: x_1^2 + x_2^2 + x_3^2 = 1 \} \]darstellen. Setzen wir also
\[ \begin{eqnarray*} F_1(x) &:=& x_1 + x_2 + x_3\\ F_2(x) &:=& x_1^2 + x_2^2 + x_3^2 - 1, \end{eqnarray*} \]so ist die Menge, auf der wir die Extrema von f bestimmen wollen, durch
\[ U = \{x \in \R^3: F_1(x) = F_2(x) = 0\} \]gegeben. Wir können sie so darstellen:

Wir erhalten als partielle Ableitungen
\[ \begin{eqnarray*} \frac{\partial F_1}{\partial x_1} &=& 1\\ \frac{\partial F_1}{\partial x_2} &=& 1\\ \frac{\partial F_1}{\partial x_3} &=& 1\\ \frac{\partial F_2}{\partial x_1} &=& 2\ x_1\\ \frac{\partial F_2}{\partial x_2} &=& 2\ x_2\\ \frac{\partial F_3}{\partial x_3} &=& 2\ x_3 \end{eqnarray*} \]Nun sind aber damit d F1(x) und d F2(x) genau dann linear abhängig, wenn x ein Vielfaches von (1,1,1) ist, wenn also \[ x_1 = x_2 = x_3 \] gilt. Auf der Ebene E gibt es genau einen solchen Punkt, nämlich 0, der nicht auf S liegt, d.h. die Ableitungen unserer Nebenbedingungen sind auf U linear unabhängig.
\[ \begin{eqnarray*} \frac{\partial f}{\partial x_1}(x) &=& 5\\ \frac{\partial f}{\partial x_2}(x) &=& 1\\ \frac{\partial f}{\partial x_3}(x) &=& -3. \end{eqnarray*} \]
Wir dürfen also das Verfahren mit den Lagrange-Multiplikatoren anwenden und berechnen dazu zunächst die partiellen Ableitungen von f. Es istWir erhalten also das Gleichungssystem
\[ \begin{eqnarray*} x_1 + x_2 + x_3 &=& 0\\ x_1^2 + x_2^2 + x_3^2 - 1 &=& 0\\ 5 &=& \ell_1 \cdot 1 + \ell_2 \cdot 2\ x_1\\ 1 &=& \ell_1 \cdot 1 + \ell_2 \cdot 2\ x_2\\ -3 &=& \ell_1 \cdot 1 + \ell_2 \cdot 2\ x_3 \end{eqnarray*} \]Addiert man nun die letzten drei Gleichungen, so erhält man
\[ \begin{eqnarray*} 5+1-3 &=& 3\ \ell_1 + 2\ \ell_2\ (x_1 + x_2 + x_3)\\ \overset{\mbox{erste Gleichung}}{\iff}\quad 3 &=& 3\ \ell_1\\ \iff \ell_1 &=& 1 \end{eqnarray*} \]Setzen wir das ein, so lautet unser Rest-Gleichungssystem
\[ \begin{eqnarray*} x_1 + x_2 + x_3 &=& 0\\ x_1^2 + x_2^2 + x_3^2 - 1 &=& 0\\ 4 &=& \ell_2 \cdot 2\ x_1\\ 0 &=& \ell_2 \cdot 2\ x_2\\ -4 &=& \ell_2 \cdot 2\ x_3 \end{eqnarray*} \]Aus der vierten Gleichung erhalten wir nun, dass x2 = 0 oder l2 = 0 ist, ersteres ist wegen der dritten Gleichung unmöglich, also ist x2 = 0. Setzen wir das ein, so verbleibt das System
\[ \begin{eqnarray*} x_1 + x_3 &=& 0\\ x_1^2 + x_3^2 - 1 &=& 0\\ 4 &=& \ell_2 \cdot 2\ x_1\\ -4 &=& \ell_2 \cdot 2\ x_3 \end{eqnarray*} \]Aus der ersten Gleichung folgt, dass x1 = - x3 ist, aus der zweiten folgt damit, dass
\[ \begin{eqnarray*} x_1^2 + (-x_1)^2 - 1 &=& 0\\ \iff 2\ x_1^2 &=& 1\\ \iff x_1 &=& \pm \frac{1}{\sqrt 2} \end{eqnarray*} \]Also sind die Lösungen des Gleichungssystems durch
\[ \begin{eqnarray*} \mbox{1. Loesung:} \qquad x &=& \left(\frac 1{\sqrt 2}, 0, -\frac 1{\sqrt 2}\right)\\ \mbox{2. Loesung:} \qquad x &=& \left(-\frac 1{\sqrt 2}, 0, \frac 1{\sqrt 2}\right) \end{eqnarray*} \]gegeben. Um die Art der Extrema zu bestimmen, setzen wir diese in f ein und erhalten
\[ \begin{eqnarray*} \mbox{1. Loesung:} \qquad f\left(\frac 1{\sqrt 2}, 0, -\frac 1{\sqrt 2}\right) &=& 3\cdot \frac 1{\sqrt 2} + 0 - 5 \cdot \left(-\frac{1}{\sqrt 2}\right)\\ &=& \frac{8}{\sqrt 2}\\ &=& 4\sqrt 2\\ \mbox{2. Loesung:} \qquad f\left(-\frac 1{\sqrt 2}, 0, \frac 1{\sqrt 2}\right) &=& -f\left(\frac 1{\sqrt 2}, 0, -\frac 1{\sqrt 2}\right)\\ &=& -4\sqrt 2. \end{eqnarray*} \]also ist die erste Lösung \(\left(\frac 1{\sqrt 2}, 0, -\frac 1{\sqrt 2}\right)\) ein Maximum und die zweite \(\left(-\frac 1{\sqrt 2}, 0, \frac 1{\sqrt 2}\right)\) ein Minimum.

