Grundlegende DefinitionEdit
Die Funktion f kann als eine Familie von Funktionen einer Variablen interpretiert werden, die durch die anderen Variablen indiziert wird:
f (x, y ) = fy (x) = x 2 + xy + y 2. {\ displaystyle f (x, y) = f_ {y} (x) = x ^ {2} + xy + y ^ {2}.}
Mit anderen Worten, jeder Wert von y definiert eine Funktion, die mit fy bezeichnet wird , die eine Funktion einer Variablen x ist. Das heißt,
f y (x) = x 2 + x y + y 2. {\ displaystyle f_ {y} (x) = x ^ {2} + xy + y ^ {2}.}
In diesem Abschnitt bezeichnet die tiefgestellte Notation fy eine Funktion, die von einem festen Wert von y abhängig ist, und nicht a partielle Ableitung.
fa (x) = x 2 + ax + a 2. {\ displaystyle f_ {a} (x) = x ^ {2} + ax + a ^ {2}.}
In diesem Ausdruck ist a eine Konstante, keine Variable, also ist fa eine Funktion von nur einer reelle Variable, das ist x. Folglich gilt die Definition der Ableitung für eine Funktion einer Variablen: f a (x) = 2 x + a. {\ displaystyle f_ {a} „(x) = 2x + a.}
Das obige Verfahren kann für jede Wahl von a durchgeführt werden. Das Zusammensetzen der Ableitungen zu einer Funktion ergibt eine Funktion, die die Variation von f in der beschreibt x-Richtung:
∂ f ∂ x (x, y) = 2 x + y. {\ Anzeigestil {\ frac {\ partielles f} {\ partielles x}} (x, y) = 2x + y.}
Dies ist die partielle Ableitung von f in Bezug auf x. Hier ist ∂ ein gerundetes d, das als partielles Ableitungssymbol bezeichnet wird. Um es vom Buchstaben d zu unterscheiden, wird ∂ manchmal als „partiell“ ausgesprochen.
Im Allgemeinen wird die partielle Ableitung einer n-fachen Funktion f (x1, …, xn) in der Richtung xi am Punkt (a1, …, an) wie folgt definiert:
∂ f ∂ xi (a 1,…, an) = lim h → 0 f (a 1,…, ai + h,…, an) – f (a 1,…, ai,…, an) h. {\ displaystyle {\ frac {\ partielles f} {\ partielles x_ {i}}} (a_ {1}, \ ldots, a_ {n}) = \ lim _ {h \ bis 0} {\ frac {f (a_ {1}, \ ldots, a_ {i} + h, \ ldots, a_ {n}) – f (a_ {1}, \ ldots, a_ {i}, \ dots, a_ {n})} {h}}.}
Im obigen Differenzquotienten alle Variablen außer x Ich werde festgehalten. Diese Wahl fester Werte bestimmt eine Funktion einer Variablen
fa 1,…, ai – 1, ai + 1,…, an (xi) = f (a 1,…, ai – 1, xi, ai + 1,…, an), {\ displaystyle f_ {a_ {1}, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_ {n}} (x_ {i}) = f (a_ {1}, \ ldots, a_ {i-1}, x_ {i}, a_ {i + 1}, \ ldots, a_ {n}),}
und per Definition
dfa 1,…, ai – 1, ai + 1,…, andxi (ai) = ∂ f ∂ xi (a 1,…, an). {\ displaystyle {\ frac {df_ {a_ {1}, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_ {n}}} {dx_ {i}}} (a_ { i}) = {\ frac {\ partielle f} {\ partielle x_ {i}}} (a_ {1}, \ ldots, a_ {n}).}
Mit anderen Worten, die verschiedenen Auswahlmöglichkeiten eines Index Eine Familie von Variablen mit einer Variablen funktioniert genau wie im obigen Beispiel. Dieser Ausdruck zeigt auch, dass sich die Berechnung partieller Ableitungen auf die Berechnung einvariabler Ableitungen reduziert.
∇ f (a) = (∂ f ∂ x 1 (a),…, ∂ f ∂ xn (a)) . {\ displaystyle \ nabla f (a) = \ left ({\ frac {\ partielle f} {\ partielle x_ {1}} (a), \ ldots, {\ frac {\ partielle f} {\ partielle x_ { n}}} (a) \ right).}
Dieser Vektor wird als Gradient von f bei a bezeichnet. Wenn f an jedem Punkt in einem Bereich differenzierbar ist, ist der Gradient eine vektorwertige Funktion ∇f, die den Punkt a zum Vektor ∇f (a) bringt. Folglich erzeugt der Gradient ein Vektorfeld.
∇ = i ^ + j ^ + k ^ {\ displaystyle \ nabla = \ left {\ hat {\ mathbf {i}}} + \ left {\ hat {\ mathbf {j}}} + \ left {\ hat {\ mathbf {k}}}} ∇ = ∑ j = 1 ne ^ j = e ^ 1 + e ^ 2 +… + e ^ n {\ displaystyle \ nabla = \ sum _ {j = 1} ^ {n} \ left {\ hat {\ mathbf {e}}} _ {j} = \ left {\ hat {\ mathbf {e}}} _ {1} + \ left {\ hat {\ mathbf {e}}} _ {2} + \ ldots + \ left {\ hat {\ mathbf {e}}} _ {n}}
Formale DefinitionEdit
∂ ∂ xif ( a) = lim h → 0 f (a 1,…, ai – 1, ai + h, ai + 1,…, an) – f (a 1,…, ai,…, an) h = lim h → 0 f (a + hei) – f (a) h {\ Anzeigestil {\ begin {ausgerichtet} {\ frac {\ partiell} {\ partiell x_ {i}}} f (\ mathbf {a}) & = \ lim _ {h \ bis 0} {\ frac {f (a_ {1}, \ ldots, a_ {i-1}, a_ {i} + h, a_ {i + 1 }, \ ldots, a_ {n}) – f (a_ {1}, \ ldots, a_ {i}, \ dots, a_ {n})} {h}} \\ & = \ lim _ {h \ bis 0} {\ frac {f (\ mathbf {a} + he_ {i}) – f (\ mathbf {a})} {h}} \ end {align}} }
Auch wenn alle partiellen Ableitungen ∂f / ∂xi (a) an einem bestimmten Punkt a existieren, ist die Funktion muss dort nicht kontinuierlich sein. Wenn jedoch alle partiellen Ableitungen in einer Nachbarschaft von a existieren und dort stetig sind, ist f in dieser Nachbarschaft vollständig differenzierbar und die gesamte Ableitung ist stetig. In diesem Fall wird gesagt, dass f eine C1-Funktion ist. Dies kann verwendet werden, um für vektorwertige Funktionen f: U → R m, {\ Anzeigestil f: U \ bis \ mathbb {R} ^ {m},} zu verallgemeinern, indem sorgfältig ein komponentenweises Argument verwendet wird.
Die partielle Ableitung ∂ f ∂ x {\ displaystyle {\ frac {\ partielle f} {\ partielle x}}} kann als eine andere auf U definierte Funktion angesehen und wiederum teilweise differenziert werden. Wenn alle gemischten partiellen Ableitungen zweiter Ordnung an einem Punkt (oder auf einer Menge) stetig sind, wird f an diesem Punkt (oder auf dieser Menge) als C2-Funktion bezeichnet; in diesem Fall können die partiellen Ableitungen durch den Satz von Clairaut ausgetauscht werden:
∂ 2 f ∂ x i ∂ x j = ∂ 2 f ∂ x j ∂ x i.{\ displaystyle {\ frac {\ partiell ^ {2} f} {\ partiell x_ {i} \ partiell x_ {j}}} = {\ frac {\ partiell ^ {2} f} {\ partiell x_ {j} \ partielle x_ {i}}}.}