Banner der Website mathematik.de. Motiv: Überall ist Mathematik

Ableitung

1. Die Ableitung als Steigung einer Funktion

Das Problem

Eine gegebene reelle Funktion in einem Punkt linear zu approximieren ist gleichbedeutend mit dem Problem, in dem gegebenen Punkt die Tangente an die Funktion zu finden. Diese Tangente ist nämlich genau die bestmögliche lineare Approximation.

Ausgangspunkt hierfür war die Frage, Maxima und Minima einer gegebenen Funktion zu errechnen, wie z.B. bei Extremwertaufgaben. Wie man in einer graphischen Darstellung leicht erkennt, ist es für die Beantwortung dieser Frage notwendig, die Punkte zu finden, an denen die Funktion eine waagerechte Tangente besitzt.

Von Interesse ist also die Steigung der Geraden, die eine Tangente an die Funktion darstellt. Ist diese Steigung positiv, so steigt die Funktion, ist sie negativ, so fällt diese.

Die Ableitung einer Funktion f an einer Stelle x ist also die Steigung der Tangente an f im Punkt x.

Berechnung der Ableitung

Um die Steigung einer Geraden zu berechnen, benötigen wir bekannterweise zwei Punkte auf dieser Geraden.
Bezeichnen wir diese Punkte mit P = (x, y) und Q = (u, v), so ist die Steigung der Geraden durch P und Q gleich:

Bei unserem Problem haben wir jedoch nur einen Punkt P = (x, f(x)) gegeben.
Um die Steigung der Tangente zu berechnen, behelfen wir uns mit einem Grenzwertprozess. Wir wählen zunächst eine Stelle u in der Nähe von x und erhalten dadurch einen Punkt Q = (u, f(u)) auf dem Graphen von f in der Nähe von P.
Nun können wir die Steigung der Geraden g durch P und Q berechnen, nämlich:

.

Wählen wir nun nach und nach weitere Punkte auf dem Graphen von f, die immer näher an unserem Punkt P = (x, f(x)) liegen, so werden die resultierenden Geraden im Grenzwert mit der Tangente von f im Punkt P übereinstimmen.
Somit ist die Steigung der Tangente im Punkt P = (x, f(x)), welche auch mit f '(x) bezeichnet wird, gleich

.

Beispiel

f(x) = x²
Dann gilt mit der 3. binomischen Formel:

Dieser Term strebt für ux gegen 2 x.
Das heißt f '(x) = 2 x.

2. Die Ableitung als lineare Approximation

Animation zum Ableitungsbegriff

Man ziehe den schwarzen Punkt (links oben) mit der Maus nach links bzw. rechts,
um den Wert von h zu verändern, und beobachte dabei die Gleichung und die Grafik.

Sorry, the GeoGebra Applet could not be started. Please make sure that Java 1.4.2 (or later) is installed and active in your browser (Click here to install Java now)

erstellt mit GeoGebra von at für www.mathematik.de

Das Problem

Es ist sicherlich jedem klar, dass man es z.B. bei der Beschreibung physikalischer Phänomene, wie etwa der Geschwindigkeit, leichter hat, wenn es sich um lineare Prozesse handelt. Die Beschreibung der Bewegung eines Autos, welches sich mit konstanter Geschwindigkeit bewegt, ist einfacher, als wenn man ein Auto betrachtet, welches beschleunigt und bremst.

Daher versucht man in der Mathematik, Nichtlineares durch Lineares zu approximieren, und genau das passiert beim Ableiten. Man erhält statt einer nichtlinearen Funktion eine lineare, welche der Ausgangsfunktion sehr ähnlich ist. Das funktioniert allerdings nur lokal, also in der Nähe eines speziellen Punktes und nicht global, was aber nicht so problematisch ist, da man das Verfahren an jeder Stelle durchführen kann. Da differenzierbare Funktionen (also solche, die man ableiten kann) insbesondere stetig sind, d.h. keine Sprünge haben, macht all dies auch Sinn. Entfernt man sich nämlich von einer Stelle nur ein sehr kleines Stück, so wird sich auch der Funktionswert nur um ein Geringes verändern, und man kann - ohne besonders viel Genauigkeit zu verlieren - annehmen, dass das Verhalten auf diesem sehr kleinen Stück linear ist.
Hierbei ist jedoch zu beachten, dass der Begriff "sehr klein" nicht besonders aussagekräftig ist, da es von der Funktion selbst und der angestrebten Genauigkeit abhängig ist, wie "klein" der Bereich wirklich gewählt werden muss.
Wir haben also nun herausgefunden, dass es sich beim Ableiten darum handelt, eine Funktion linear zu approximieren und dass dies nur lokal in einem bestimmten Punkt möglich ist. Da man es aber in jedem Punkt machen kann, erhält man eine neue Funktion, die jedem Punkt des Definitionsbereichs der eigentlichen Funktion f eine lineare Funktion zuordnet, nämlich genau die lineare Approximation in diesem Punkt. Das hört sich alles sehr kompliziert an. Daher wird es in der Schule auch sehr vereinfacht, damit gewisse Aspekte der Ableitung benutzt werden können, um z.B. Kurvendiskussion, Extremwertaufgaben oder Ähnliches durchzuführen.
Der schulische Ansatz für Ableitungen entspricht eher dem in Teil 1 diskutierten Ansatz über die Steigung der Funktion.

Wir wollen uns hier nur auf solche Funktionen konzentrieren, die, wie es in der Schule üblich ist, reelle Zahlen auf ebensolche abbilden.

Berechnung der Ableitung

Wie wir oben gesehen haben, ist es das Ziel, die eigentliche Funktion f in der Nähe einer Stelle x durch eine lineare Funktion bzw. Gerade zu approximieren. Man ist also an dem Wert f(x+h) interessiert, wobei - wie ebenfalls oben erläutert - h klein sein soll.
Die lineare Approximation der Funktion f in einer Umgebung von x ist einfach gegeben durch die Tangente an f im Punkt (x, f(x)). Damit lautet der Ansatz also

Man berechnet also f(x+h) durch den Wert f(x) (wir wissen ja, dass, wenn h klein ist, der Wert f(x+h) nicht sehr weit von f(x) entfernt sein kann), den Wert h · f '(x) (das entspricht genau dem Anteil, der durch die lineare Approximation von f im Punkt x hinzukommt) und den Wert e(x,h). Dieser stellt den Fehler dar, den man macht, da man, statt genau den Wert f(x+h) zu berechnen, zu einer linearen Approximation übergeht. Der Fehler ist sowohl von der Stelle x als auch von h abhängig, da die Approximation sicherlich im Allgemeinen ungenauer wird, je weiter man sich von der bekannten Stelle x entfernt.

Bild

Auf nahe liegende Weise nennt man dann eine Funktion differenzierbar (d.h. man kann sie ableiten), wenn dieser Fehler genügend klein wird. Dieser Begriff ist mathematisch gar nicht so einfach, wir wollen ihn hier deswegen auch nicht weiter erläutern, sondern nur erwähnen, dass die geforderte Eigenschaft ist, dass e(x, h) / h gegen 0 geht, wenn h beliebig klein wird.
Das bedeutet, dass eine Funktion genau dann differenzierbar ist, wenn folgender Grenzwert existiert:

Beispiel:

f(x) = x²
Dann gilt:

Dieser Term strebt für h→0 gegen 2 x.
Das heißt f '(x) = 2 x.

Vergleich der zwei Ansätze

Mathematisch gesehen handelt es sich bei beiden Verfahren um die gleiche Rechnung, setzen wir nämlich u = x + h, so erhalten wir:

  1. ux ist das Gleiche wie h→0.

Beide Ansätze liefern also das gleiche Ergebnis.

Will man das Konzept des Ableitens allerdings auf andere Situationen anwenden als auf Funktionen, welche reelle Zahlen auf reelle Zahlen abbilden, zum Beispiel auf höherdimensionale Funktionen, so stellt sich heraus, dass man am einfachsten das Konzept der linearen Approximation übertragen kann.