合成関数の微分公式の内容、具体例、証明について記します。
(英:chain rule)
■微分の定義と公式は別途に詳しくまとめています。
公式の内容
合成関数の微分公式は、f(x)=f(y(x))の形、つまり合成関数の形である時に次のように表されます。
$$\frac{df}{dx}=\frac{df}{dy}\frac{dy}{dx}$$ 形としてはあたかも「dy」が分母分子で「約分される」かのような形となっている事が特徴です。これは覚えるコツでもありますが、数学的にも間接的に意味のある形(例えば証明の仕方との関連)になっています。
これはどういう事かというと、次のような手順を踏めば微分ができるという事です。
- f(x)=f(y(x)) で y=y(x)とおき、
f(x)=f(y(x)) =f(y)のように、yが変数であるかのような形にする。 - f(y) をyが変数であるとみなしyで微分する。これがdf/dy
- y=y(x)を微分する。これがdy/dx
- df/dyとdy/dxを掛け算する。
(この段階では見かけ上の変数としてxとyが混在しています。) - y=y(x)を代入して式の変数をxだけにする。これがf(x)=f((y(x))をxによって微分して得る導関数に一致する。
合成関数とは、例えばf(x) = (2x+3)2のような形の関数の事で、y(x)=2x+3のようにおいてf(y(x)) =(y(x))2という構造になっています。
これを微分する時に、f(x) = (2x+3)2であれば式を展開してから普通にxで微分する事もできますが、y(x)=2x+3のxによる微分と組み合わせて計算できる事もできるというのが合成関数の微分公式です。しかも、その組み合わせ方は「掛け算」するだけでよいというのがこの公式の意味です。
★y=y(x)と実際におくのは丁寧に計算する場合で、この置き換えが簡単な式である場合には頭の中で計算をしてしまう事もできます。
例えばf(x) = (2x+3)2のような関数であれば、
yという文字を使わずに「(2x+3)という塊とその2乗」で考えるという事です。
下図のように f(x) = cos(ωx) 【例えば cos 2x】のように表される関数の他に、$$e^{2x},\hspace{10pt}\sin^2x(=(\sin x)^2)\hspace{10pt}\frac{1}{1-x},\hspace{10pt}\sqrt{1-x^2}\hspace{10pt}$$なども、みな合成関数の仲間達です。
これらを微分する時には、普通の微分公式をそのままでは適用できない場合があります。そのようなものについては「合成関数の微分公式」で微分をして導関数を計算します。
具体的な計算例
この微分公式を使った計算は理論・応用ともに重要なのですが初見では計算の仕方が紛らわしく理解しにくい面もあるので、ここでは具体例についてかなり詳しく挙げておきます。
f(x) = (2x+3)2の微分を合成関数の微分公式で計算する場合は次のようにします。
y(x)=2x+3とおき、yをxで微分して得る導関数dy/dx=2と、yを変数とみなしたf(y)=y2をyで微分して得る導関数df/dy=2y=2(2x+3)を用意します。これらを掛け算します。
すると、df/dx=(df/dy)・(dy/dx)=2・2(2x+3)=8x+12です。
f(x) = (2x+3)2=4x2+12x+9のように式展開して直接xで微分すると、df/dx=8x+12となります。この結果は、合成関数の微分公式を使った場合の結果と確かに一致しています。
他の合成関数の場合の微分についても見てみましょう。特に重要度が高いのは(大学入試だけでなくその後についても)、三角関数(および三角比)や指数関数が合成関数の形になっている場合です。
cos(ωx) という形の関数の、さらにより具体的な関数として、
f(x) = cos(2x)という「2x」という形が余弦関数に入っている場合の微分計算を、例として手順を追って見てみましょう。
f(x) = cos(2x) = sin y の「x による微分」は、合成関数の微分公式を利用して計算できるのです。
- cos(2x)の 2x を y とおき、cos y を「y で」微分します。
公式により、これは -sin y になります。
$$\frac{d}{dy}\cos y=-\sin y$$ - 次に、y = 2x を x で微分します。
これは、一次関数x の微分「1」に定数 2 をかければよいので 2 になります。
$$\frac{d}{dy}(2x)=2$$ - df/dyとdy/dxの積をつくります。
これは、本当に「掛け算するだけ」の計算です。
$$\frac{df}{dy}\frac{dy}{dx}=(-\sin y)\cdot 2 =-2\sin y$$ - ・・最後に、y に y = 2x を代入し、x だけの式にします。それがf(x)を x で微分して得られる導関数に等しいわけです。
$$\frac{df}{dx}=\frac{df}{dy}\frac{dy}{dx}=-2\sin y=-2\sin (2x)$$
このタイプの微分は、イラストでも触れていますように、じつは物理でもよく使う微分計算です。
慣れてくると、cos(2x) のような形である時点で微積分する時には「2」を忘れてはいけないという事にすぐに気付くようになるでしょう。
次に、指数関数が合成関数になっている場合です。考え方は上記と同じになります。
ここでは特に自然対数の底の指数関数を扱います。理論上も応用上もその場合が特に重要です。
f(x) = e(2x)は、指数関数の変数が「2x」などになった形の合成関数です。
このタイプも、微分方程式の解法などを含めて物理学で比較的よく使う微分計算だと思います。
2x = y とおきます。
元の関数をyで表すと、f(x)=e2x=ey(=f(y))です。
- y を x で微分します。$$\frac{dy}{dx}=\frac{d}{dx}(2x)=2$$※少し慣れれば、このへんは暗算でやってしまうくらいになると思います。
- f(y)を y で微分します。$$\frac{df}{dy}=\frac{d}{dy}e^y=e^y$$これは、e の指数関数の微分公式そのままですね。
- 合成関数の微分公式を適用します。
ここでは、y を x の形に直すところまで一緒にやってしまいます。 $$\frac{d}{dx}e^{2x}=\frac{df}{dy}\frac{dy}{dx}=2\cdot e^y=2e^{2x}$$
この計算方法を見ると、一般に次のように、
$$「定数 a に対して、\frac{d}{dx}e^{ax}=ae^{ax}」$$
という事が言える事も、分かるかと思います。
f(x) = e2x の 2x が、3x でもあっても ax であっても、計算方法は同じだからです。
もっとも、これを新しく公式として「暗記」する必要は、ありません。
必要なのはあくまで普通の指数関数の微分公式と、合成関数の微分公式なのです。
注意点としては、y=y(x)の置き換えをした時には、最後に y を x の形に直す必要がある(場合が多い)という事だと思いますが、忘れさえしなければ数学でも物理でも、難しい計算は少ないと思います。
前述の通り、簡単な合成関数であれば置き換えは頭の中だけでやってしまっても支障ありません。
三角関数の合成関数で、少し紛らわしいタイプのものを挙げておきます。
三角関数を「2乗した」sin2x などの場合です。
この場合は、 sin x = y と考えて、元の関数が \(f(y)=y^2\)であると考えるのです。
従いまして、微分の計算は次のようになります。
- まず合成関数の微分公式に必要な材料を計算します。
$$\frac{df}{dy}=\frac{d}{dy}y^2=2y,\hspace{10pt}\frac{dy}{dx}=\frac{d}{dx}\sin x=\frac{dy}{dx}\cos x $$ - 2つの材料を、掛け合わせてできあがりです。
$$\frac{d}{dx}\sin^2x=\frac{df}{dy}\frac{dy}{dx}=2y\cos x=2\sin x \cos x = \sin 2x$$
(ここで sin 2x は、sin(2x) の事です。)
他方、sin 2x の微分は 2cos(2x) になります。(上の例のcos 2x と同様の手順です。)
sin2 x の微分とは、少々違った結果になる事が分かるかと思います。
一見、「似てるっぽい?」かもしれませんが、計算方法を間違えないようにしたい例のひとつであるわけです。
尚、最後の結果が「x の半角」の正弦の形になる事は、三角関数の半角の公式を導出する手順で使う式(加法定理由来)を使って$$\sin^2 x=\frac{1-\cos 2x}{2}である事から、$$
$$\frac{d}{dx}\frac{1-\cos 2x}{2}=\frac{2\sin 2x}{2}=\sin 2x$$となる事と調和しています。
また、この例の微分は積の形の微分公式で計算する事も可能で、同じ結果を得ます。
他に、うっかりすると合成関数である事を見落としがちなタイプのものを挙げます。
$$続いて、f(x)=\frac{1}{1-x}という関数の微分を考えてみましょう。$$
これも、合成関数として微分する必要があるのです。
「これのどこが合成関数?」かと思われるかもしれませんが、分母の 1-x を y と考えて合成関数と見る必要があるのです。この y = 1 – x の微分においては、定数の「1」は微分すると0になって消えます。
- 再び、材料作りです。
$$\frac{df}{dy}=\frac{d}{dy}\frac{1}{y}=\frac{d}{dy}y^{-1}=-y^{-2},\hspace{10pt}\frac{dy}{dx}=\frac{d}{dx}(1-x)=-1 $$ - 合成関数なので掛け合わせます。
$$\frac{d}{dx}\frac{1}{1-x}=\frac{df}{dy}\frac{dy}{dx}=(-1)(-y^{-2})=y^{-2}=\frac{1}{(1-x)^2}$$
「うっかり合成関数である事を見落とすと」符号を間違えてしまう例と言えます。
「マイナス1乗」の微分で1つマイナス符号がつきますが、この例では合成関数の部分に―xの項があるのでさらにもう1つマイナスがつき、結果はプラスになるわけです。
似たような関数でも、$$\frac{d}{dx}\frac{1}{1+x} の場合だと$$ $$\frac{d}{dx}(1+x)=1ですから、$$ $$\frac{d}{dx}\frac{1}{1+x}=-(1+x)^{-2}=-\frac{1}{(1+x)^2}$$となり、こちらはマイナスの符号がつくわけです。符号の違いは、xの増加に対して関数が増加するか減少するかに対応しています。
平方根がかかっている形の関数も、「1/2乗」という事ですから合成関数の形になります。
例として、$$f(x)=\sqrt{1-x^2}$$という関数の場合は、1-x2 = y として微分計算をします。
この関数は、図形で言うと原点を中心とした半径1の円の「第1象限」の部分を関数として表したものです。
-
前の例と同じように材料をまず作りますが、今回再び丁寧に、2つに分けます。
まず、かんたんなほうからです。
$$\frac{dy}{dx}=\frac{d}{dx}(1-x^2)=-2x$$ - 同じく材料として、「y の平方根」の形の関数の微分を計算します。
これは単項式の微分公式で「a=1/2」の場合を使えばいいのですが、少し分かりにくいかもしれません。
$$\frac{df}{dy}=\frac{d}{dy}\sqrt{y}=\frac{d}{dy}y^{\frac{1}{2}}=\frac{1}{2}y^{-\frac{1}{2}}=\frac{1}{2}\frac{1}{\sqrt{y}}$$ - 2つの材料がそろえば、あとは掛け合わせて、yを x の関数の形に戻すだけです。
$$\frac{d}{dx}\sqrt{1-x^2}=\frac{df}{dy}\frac{dy}{dx}=(-2x)\frac{1}{2}y^{-\frac{1}{2}}=\frac{-x}{\sqrt{y}}=\frac{-x}{\sqrt{1-x^2}}$$
この例で用いている「平方根の微分」は慣れないと、とっつきにくい場合も多いかと思います。
ただ、このタイプの関数の微分は物理でもよく使いますので、知っておくと便利です。
物理や工学等の理論でこれらの関数の微積分を使用するには「これは合成関数の形だから・・」という説明は省略して結果だけ書く事が普通ですので、その意味でも計算の仕方に慣れておく事は大事かと思います。計算に慣れれば簡単な合成関数であれば「公式」としての形を特に暗記しようと努めなくても自然に計算できるようになります。
公式の証明
合成関数の微分公式の証明は次のようにします。
f(x) = f(y(x)) 、 y = y(x) である時、まず次のように考えます。
- f(y(x))の導関数を、定義の極限を含む形で書きます。
- fの中の変数部分y(x+h)について、y(x+h)=y(x+h)-y(x)+y(x)と変形します。
$$\frac{d}{dx}f(x)=\lim_{h \to 0}\frac{f(y(x+h))-f(y(x))}{h}=\lim_{h \to 0}\frac{f(y(x+h)-y(x)+y(x))-f(y(x))}{h} $$
次に、y(x+h)-y(x)という項を「掛けて割る」操作をします。これは値としては「1」を掛ける操作なので自由に行ってよいのです。
$$ \frac{d}{dx}f(x)=\lim_{h \to 0}\frac{f(y(x+h)-y(x)+y(x))-f(y(x))}{h}\cdot \frac{y(x+h)-y(x)}{y(x+h)-y(x)}$$
$$=\lim_{h \to 0}\frac{f(y(x+h)-y(x)+y(x))-f(y(x))}{y(x+h)-y(x)}\cdot\frac{y(x+h)-y(x)}{h}$$
ここで、z=y(x+h)-y(x)とおきます。そのようにおかなくても証明できますが、見やすくするという意味です。zに置き換わる部分は3つあり、df/dxは次のような形になります。
$$\frac{d}{dx}f(x)=\lim_{h \to 0}\frac{f(z+y(x))-f(y(x))}{z}\cdot\frac{z}{h}$$
ここで、h→0のとき、limh→0z=limh→0(y(x+h)-y(x))=y(x)-y(x)
=0ですから、hとzの両方を0に近づけるという意味で 「limh,z→0 」と書く事ができます。このときに、
$$\lim_{h \to 0}\frac{z}{h}=\lim_{h \to 0}\frac{y(x+h)-y(x)}{h}=\frac{dy}{dx}$$
である事に注意し、y=y(x) を変数とみなしてyと書くと次のようになります。
$$\frac{d}{dx}f(x)=\lim_{h,z \to 0}\frac{f(z+y)-f(y)}{z}\cdot\frac{z}{h} =\frac{df}{dy}\frac{dy}{dx}【証明終り】$$
このように、1つの導関数を別の導関数の積で表せるという結果になるのです。