偏微分の応用の例:位置エネルギーと保存力の関係

合成関数に関する偏微分の公式の物理での使用例を、ここでは1つ述べます。

★ このページではベクトル解析で使用する「勾配」という考え方を使用します。
これは、多変数関数(多変数のスカラー関数)に対する偏微分によって表されるものです。

参考(サイト内リンク):接線線積分の定義と考え方

保存力の力ベクトルは、位置エネルギーの勾配ベクトルで表せる

先に結論の式を書きますと、力が「保存力」である場合に、位置エネルギーのxでの偏微分をx成分、yでの偏微分をy成分、zでの偏微分をz成分に持つベクトルは、保存力の力ベクトルに等しいという関係式があります。【※保存力で無い場合は成立しませんので注意。】

保存力の力ベクトルは、位置エネルギーの勾配ベクトルで表せる

まず、「位置エネルギー」(あるいはポテンシャルエネルギー)U(x,y,z) を次のように定義します。これはベクトルでは無く、スカラー関数です。 $$\large U(x,y,z)=-\int_{\overrightarrow{R_O}}^{\overrightarrow{R}}\overrightarrow{F}(x,y,z)\cdot d\overrightarrow{r}$$ $$\large \mathrm{grad} U(x,y,z)=\left(\frac{\partial U}{\partial x},\frac{\partial U}{\partial y},\frac{\partial U}{\partial z}\right)$$ 力ベクトル F(x,y,z) が保存力である場合、次式が成立します:$$\large -\mathrm{grad} U(x,y,z)=\overrightarrow{F}(x,y,z) $$

★ プラスマイナスの符号の関係が、ちょっとごちゃごちゃするので注意。

「勾配」grad (または∇「ナブラ」)については、詳しくはベクトル解析という分野で説明されます。

この関係式は、古典力学の理論としては仕事とエネルギーの関係の話の延長線上にあります。

これは要するに数学的には、
接線線積分の形の多変数関数の勾配ベクトルは、もとのベクトル関数と同じ形になる」
という事を言っています。通常の不定積分(あるいは積分区間に変数が入った定積分)は、通常の微分を考える事で元の関数に戻るという「微積分学の基本定理」がありました。それと似た形の式という事になります。

この関係式の証明のポイントは、合成関数の偏微分公式です。
ベクトルの内積の計算も直接的に関わります。

\(-\mathrm{gradU(x,y,z)}= \overrightarrow{F}(x,y,z)\) の証明

まず通常の微積分学の基本定理を用いたうえで、ベクトルの内積と合成関数の偏微分の公式をうまくかみ合わせます。

位置座標は全て「物体の位置」であるとして、位置座標に対応する時間成分tを考えます。
力ベクトルの成分についても同様に tの関数であると考えます。

$$\large \overrightarrow{F}(t)=(F_X(t),F_Y(t),F_Z(t))$$

$$\large 点\overrightarrow{R} での時刻をt、点\overrightarrow{R_O} での時刻を t_O とします。$$

最初のステップ $$\large -U(x,y,z)=\int_{ \overrightarrow{R_O}}^{\overrightarrow{R}} \overrightarrow {F} (x,y,z) \cdot d\overrightarrow{r}=\int_{t_O}^{t} \overrightarrow {F} (\tau) \cdot \frac{d \overrightarrow{r} }{d\tau}d\tau$$ $$\large =\int_{t_O}^{t}F_X(\tau) \frac{dx}{d\tau} d \tau + \int_{t_O}^{t}F_Y(\tau) \frac{dy}{d \tau } d \tau + \int_{t_O}^{t} F_Z(\tau) \frac{dz}{d \tau } d \tau $$ $$★ 時間についての積分変数の表記はt → \tau (タウ)に変えています。$$

Uの定義(力学での定義です)にマイナス符号があるので、
ここでは最初から「-U」を考えて、積分での表記をプラス符号で考えています。

★ 後述しますが、力が「保存力」であるという条件がないと、じつはまずこの式変形ができません。なぜかというと一般の接線線積分は、2つの端点だけでなく、その2点を結ぶ経路によって値が変わってしまうからです。力が保存力であるという条件は、この値が経路によらず一定の値であるとしてよいという条件です。

★ 古典力学の理論の中では、もともとは一般の力に対して時間で表したほうの式が先にあって、次に「保存力」という位置座標のみで決定するものを考えます。

★ 積分区間にベクトルが入っている部分は、次の意味になります。 $$\large \int_{ \overrightarrow{R_O} }^{\overrightarrow{R}} \overrightarrow {F} (x,y,z) \cdot{d\overrightarrow{r}} $$ $$\large =\int_{x_O}^{x}F_X(x,y,z)dx+ \int_{y_O}^{y}F_Y(x,y,z)dy+ \int_{z_O}^{z}F_Z(x,y,z)dz $$ $$\large \overrightarrow {F}=(F_X,F_Y,F_Z),\hspace{10pt}\overrightarrow{R_O}=(x_O,y_O,z_O),\hspace{10pt}\overrightarrow{R}=(x,y,z)$$ dx の部分は x に関してだけ積分し、yやzは定数同様に扱います。つまり、偏微分と同じような考え方をするわけです。この場合の微積分学の基本定理は、積分と「偏微分」との関係になります。

次に、時間成分tで U(x,y,z) = U(x(t), y(t), z(t)) を微分します。
内積計算で3つの項の和にした部分は共通の積分変数tでの積分になっているので、通常の微積分学の基本定理がそのまま使えます。

この時、積分する対象として $$\large F_X(t) \frac{dx}{dt}$$ を1つの関数と捉える事がポイントです。
積分中の表記では$$\large {F_X( \tau ) \frac{dx}{d\tau}}$$ にしています。

成立する式:その①

$$\large\frac{dU}{dt}= \frac{d}{dt}\left(\int_{t_O}^{t}F_X( \tau ) \frac{dx}{d\tau} d \tau + \int_{t_O}^{t}F_Y( \tau ) \frac{dy}{d \tau } d \tau + \int_{t_O}^{t} F_Z( \tau ) \frac{dz}{d \tau } d \tau \right)$$

$$\large = F_X(t) \frac{dx}{dt} + F_Y(t) \frac{dy}{dt} + F_Z(t) \frac{dz}{dt}=\overrightarrow{F}(x,y,z)\cdot \frac{ d\overrightarrow {R}}{dt} $$

他方で、合成関数の偏微分公式を使うと U の時間微分の計算を別途に表現できるのです。
この場合、多変数 x、y、z が1つだけの変数tの合成関数になっているという事なので、表記としては$$\large \frac{\partial U}{\partial t}=\frac{dU}{dt}です。$$

ただし、もとの関数が U(x,y,z) という多変数関数なので、偏微分のほうの合成関数の微分公式を使う点に注意しましょう。

成立する式:その②

$$\large \frac{\partial U}{\partial t}=\frac{dU}{dt}= \frac{\partial U}{\partial x} \frac{\partial x}{\partial t}+ \frac{\partial U}{\partial y} \frac{\partial y}{\partial t} + \frac{\partial U}{\partial z} \frac{\partial z}{\partial t} $$ $$\large = \frac{\partial U}{\partial x} \frac{dx}{dt}+ \frac{\partial U}{\partial y} \frac{dy}{dt} + \frac{\partial U}{\partial z} \frac{dz}{dt} =(\mathrm{gradU})\cdot \left( \frac{ d\overrightarrow {R}}{dt}\right) $$

最後の結果は「Uの勾配ベクトル」と「速度ベクトル」との内積です。
内積はスカラーであり、勾配はスカラー関数をベクトルの関数変換する演算である事を意識すると分かりやすいと思います。

同じものを2通りの数式で表せる事になるので、等号で結ぶ事ができます。
これによって、次の関係式が成立する事になります。

$$\large – \overrightarrow{F}(x,y,z)\cdot \frac{ d\overrightarrow {R}}{dt} = \mathrm{gradU}\cdot \frac{ d\overrightarrow {R}}{dt} $$

$$これは、\overrightarrow{A}\cdot \overrightarrow {C} = \overrightarrow{B}\cdot \overrightarrow {C} という関係になっています。 $$

これが証明の根拠になるわけですが、数学的には
\(\overrightarrow{A}\cdot \overrightarrow {C} = \overrightarrow{B}\cdot \overrightarrow {C} \) から直ちに\(\overrightarrow{A}= \overrightarrow{B}\) とは言えない事には注意しましょう。
そうならない場合もあるのです。
しかし、この場合は \(\overrightarrow {R}\) が特定の座標点では無くて「任意の座標点」です
特定の点だけではなく、どんな座標の点を考えたとしてもこの関係式は成り立つ、という意味です。
ですから、\(\overrightarrow {R}\) に対して内積をとると等しい値になる2つのベクトル\(– \overrightarrow{F}(x,y,z)と\mathrm{gradU(x,y,z)}\) は、全く同じ関数でなければならないのです。

$$ つまり 、- \overrightarrow{F}(x,y,z)\cdot \frac{ d\overrightarrow {R}}{dt} = \mathrm{gradU}\cdot \frac{ d\overrightarrow {R}}{dt} かつ 「\overrightarrow {R} は任意の(実)ベクトル」なので、$$

$$-\overrightarrow{F}(x,y,z)=\mathrm{gradU}(x,y,z)\Leftrightarrow -\mathrm{gradU}(x,y,z)= \overrightarrow{F}(x,y,z) という事です。【証明終り】$$

「保存力」の物理的な意味

保存力とは力がなす仕事が経路に依存せず、始点と終点の位置だけに依存する力を言います。これは結構強い条件が課されている事になりますが、万有引力、重力(地表面での万有引力を近似したもの)、ばねの力、クーロン力などは保存力になるので、物理の理論の中では結構使い物になります。

逆に、保存力でない力の簡単な例は摩擦力などです。

一般の力ベクトルに対しては、少しだけ上述でも触れましたが、
次の形の時間変数による積分が先にあります。

$$\large T(t)-T(t_O)=\int_{t_O}^{t} \overrightarrow {F} (\tau) \cdot \frac{d \overrightarrow{r} }{d\tau}d\tau$$

ここで、1変数の通常の積分であれば積分変数をtからxに変換できます。

しかし、この場合は「接線線積分」なので、経路は1通りでは無く様々なものがあるのです。

経路によって値が異なりますから、同じ値の定積分になるという意味での積分変数の変換は無条件にはできない・・という事です。

ベクトルに対する一般の接線線積分の場合、値が始点と終点だけでは決定しないので次のように表記します:

$$一般の接線線積分の表記:\int_C \overrightarrow {F} \cdot d \overrightarrow {r}\hspace{10pt}Cは特定の関数で表される経路 $$

ここで、経路によらず「経路の始点と終点だけをしていれば値が定まる」という条件をつけると、もちろん数学的な扱いは簡単になります。
そのような条件がつけられた種類の力が保存力であり、上記のように具体的に当てはまる力も存在するというわけです。

保存力がなす仕事の値(仕事量)は始点と終点の位置だけで決まります。これを「位置エネルギー」あるいは「ポテンシャルエネルギー」などと呼びます。
これは運動エネルギーに対する用語です。位置エネルギーと運動エネルギーの合計を、力学的エネルギーと呼びます。
尚、保存力ではない摩擦力などの力に対しては、位置エネルギーは考えないのです。

これを数学的に取り扱った場合、上述いたしましたように、合成関数に対する偏微分の公式などが重要な役割を担っているというわけです。

微積分学の基本定理の理論

このページでは、高校で教わる範囲の積分公式についての、
やや理論的な一般的性質と式表現の一部について詳しく説明します。
(英:微積分学の基本定理 fundamental theorem of calculus)

積分は微分の逆演算という関係

■ ここでは、合わせて原始関数についての説明も続けてしています。

微積分学の基本定理

微積分学の基本定理の数式表現

「微分操作の逆演算は積分操作」というのが微積分学の基本定理の内容です。表現の方法はいくつかありますが、てきとうな定数を c として$$\frac{d}{dx}\int_c^xf(t)dt=f(x)$$という表現をするのが、1つの形です。(※変数の表記方法に注意してください。関数としての変数は、あくまで x です。)「ある関数の積分を微分すると元の関数」という事実の表現という事です。$$\int_c^xf(t)dt$$ という表現は、「定積分で積分区間の片方の端の値を変数と考えた場合」の事を言っているのですが、
分かりにくい場合、$$S(x)=\int_c^xf(t)d$$ とおくと、少し見やすくなるかもしれません。
積分区間の片方の端の値 a は固定して、右側の値をずずずっと変化させると「面積」の値も変わります。変化させる「右側の端の値」を変数 x として、面積である定積分を関数 S(x) として考えているわけです。

後述する「不定積分」の形で微積分学の基本定理を表す事もできます。
その場合の表記は、$$\frac{d}{dx}\int f(x)dx=f(x)$$ です。
微積分学の基本定理の証明(このページ内リンク)・・考え方としては、かなり平易です。

原始関数

「原始関数」とは?

\(S(x)=\int_c^xf(t)dt\) とおく時、微積分学の基本定理は\(\frac{d}{dx}S(x)=f(x)\)とも書けて、
S(x) は「微分すると f(x) になる関数」と見る事もできます。

このように\(\frac{d}{dx}G(x)=f(x)\)を満たす G(x) を f(x) の「原始関数」と言い、
\(S(x)=\int_c^xf(t)dt\)は、f(x)の「原始関数の『1つ』」です。
この時、任意の定数 C を用いて S(x) + C もf(x)の原始関数なのです。(※定数を微分しても0なので。)
この任意の定数 C は「任意定数」「積分定数」などと呼ばれます。

定積分は原始関数で表せる

さて、この\(S(x)=\int_c^xf(t)dt\)に具体的な値 x = a, b を代入する事を考えます。
\(S(a)=\int_c^af(x)dx,\hspace{10pt}S(b)=\int_c^bf(x)dx\) であるわけですが、
(※積分区間に変数 x を含んでいないので dt ではなくdx 表記にしています。また、積分区間の端点が定数であれば、定積分は x の関数ではなく、あくまで何らかの「定数」になる事にも注意が必要です。)

積分する方向と符号との関係、および積分区間の合算の事を考えますと、$${\small S(b)-S(a)=\int_c^bf(x)dx-\int_c^af(x)dx=\int_c^bf(x)dx+\int_a^cf(x)dx=\int_a^cf(x)dx+\int_c^bf(x)dx}=\int_a^bf(x)dx$$
となり、[a, b] 上で関数を積分する定積分が 「S(b)-S(a)」で表される事を意味するのです。(c というてきとうな定数は、中間点にあるものと考えて、定積分の値には影響しないというわけです。)

そして微積分学の基本定理によれば、S(x) は「f(x) の原始関数(の1つ)」
です。
原始関数同士の引き算を考える場合、(S(b) + C) – (S(a) + C) = S(b)-S(a) となり任意定数は必ず消える事に注意すると、

[a, b] 上で f(x) を積分して得られる定積分は、
原始関数(=微分するとf(x)になる関数) S(x) を用いて次のように表せます:
$$\int_a^bf(x)dx=S(b)-S(a)$$
そして、このS(b)-S(a)の事を通常、次のように書くのです。
$$S(b)-S(a)=\left[S(x)\right]_a^b $$

この記号を用いると、
$$定積分は\int_a^bf(x)dx=\left[S(x)\right]_a^b と表されます。$$
この表現方法が、数学の理論でも物理でも、通常用いられる定積分の計算になります。この意味で、面積としての積分の考え方も重要なのですが、同じく重要なのが「微分と関連付けされた積分演算」というわけです。

積分の変数を dx ではなく dt などに変えるのはどんな場合?

上記の微積分学の基本定理の形では、積分区間(積分する閉区間)に x という変数が入っていて、その x を微分をしています。このような時、f(x)dx については数学では一般的に、f(t)dt などのように、文字を変える決まりになっています。

物理の本などでは「\(\int_a^x f(x)dx\)」のような表記がしてある事もありますが、一応数学的にはあまり良くないので、このサイトでは一般的な数学の決まりに従って積分区間に変数がある時は\(\int_a^x f(t)dt\)のように記します。(記号として t を用いると「時間」と紛らわしい場合は、適宜ギリシャ文字の τ で代用するなどして対応します。)

導関数(関数の微分)を積分すると?・・もとの関数に戻る!

微積分学の基本定理を、ある関数の導関数(ある関数の微分)に適用すると、
「微分したものを積分すると元の関数になる」事が言えるので、微分と積分の関係がより明確になるかと思います。この関係は、微分方程式論で重要です。

$$\frac{d}{dx}\int_c^xf^{\prime}(t)dt=f^{\prime}(x)\hspace{10pt}しかしf^{\prime}(x) の原始関数は f(x) + C に他ならないので $$
$$\int_c^xf^{\prime}(t)dt=f(x) + C$$

微分方程式論においては、任意定数 C というオマケを、任意ではなく「特定の」値に決定するための処理をします。
これは、例えば具体的な f(0) = 0 などと言った値が(1つでも)決まれば C の値も決まるので、積分操作によって関数が1つにきちんと定まるというものです。


原始関数の例

例えば、sin x の原始関数は – cos x + C です。定数を微分するとゼロになるので、原始関数としては任意の定数として積分定数がオマケとしてくっついてくるわけです。cos x の微分は -sin x なので、「マイナス符号を消す」ために -cos x を考えている事に注意してください。

また、\(x^2\) の原始関数は、\(\frac{1}{3}x^3+C\) です。
3次の単項式を微分すると2次の単項式にはなりますが、3 という係数もくっついてくるので、それを「消す」ために 1/3 が原始関数としては必要になるわけです。
このへんが、微分と比べて積分の計算が面倒な点ですが、微分の公式さえあればパズル感覚でも行けるのではないかとも、思います。

微積分学の基本定理から、原始関数を使って定積分を計算する手順
  1. f(x)の原始関数を、任意定数に関しては何でもいいから探す。普通は、任意定数がゼロのものを考えます。(それが一番簡単なため。)
    例:\(e^x の原始関数で加える定数を0としたものは e^x\)
  2. 積分する閉区間の端点を代入し、大きい値を代入したものから小さい値を代入したものを引きます。
    例えば e の指数関数を x = 0 から 1 まで積分すると、次のようになるのです。
    \(\int_0^1e^xdx=\left[e^x\right]_0^1=e^1-e^0=e-1 (=1.718・・)\)

「不定積分」とは?・・任意定数が含まれる形の積分

定積分に対して、「不定積分」という言葉も微積分学ではよく使われますので、少し説明いたします。
「不定」という表現には、ある関数の原始関数は
「制限をかけなければ任意定数がおまけとして必ずくっついてくるので『1つには定まらない』」
・・という事と、大いに関係があります。

不定積分

この「不定積分」という用語の数式としての定義は人によって少し違う事もあるので、2つ述べておきます。意味するものは、どちらも大体同じです。

「不定積分」の表し方①・・原始関数全体

まず1つの表し方は、ある関数の原始関数全体を「不定積分」と呼ぶものです。
つまり、何か適当な原始関数 F(x) と、それに任意定数 C を加えたものを不定積分と呼び、次の記号で表します。
$$関数 f(x) の「不定積分」\hspace{10pt}\int f(x)dx=F(x)+C$$
記号としては、定積分の「区間を表す部分」を取り去った記号を使います。
(確かに、原始関数という観点からは、具体的な積分区間については形式的なものであり、明記する意味がそれほどないのも事実かもしれません。)
このサイトでは、特に理由が無い場合は不定積分と言ったらこちらの意味で使わせていただきます。

この不定積分の表記を用いて微積分学の基本定理を表現する事もできます。
F(x)+C を微分すれば f(x) ですから、同じ意味の数式を表せます。
$$不定積分を用いた「微積分学の基本定理」\hspace{10pt}\frac{d}{dx}\int f(x)dx=f(x)$$

「不定積分」の表し方②・・積分で表された原始関数の1つ

他方で、微積分学の基本定理\(\frac{d}{dx}\int_c^xf(t)dt=f(x)\)で用いられている、
\(\int_c^xf(t)dt\)の事を「不定積分」と呼ぶ場合もあります。
この場合は、不定積分とはあくまで、f(x)の「原始関数の1つ」という位置付けになります。また、積分区間に変数を含まない定積分が何らかの「定数」であるのに対して、不定積分は「x の関数」である事が、この後者の表現では明確になるという指摘もできます。
どちらを「不定積分」と呼んでも、他の理論にはそれほど影響はないと思われます。
※この後者のほうの表現は、これを不定積分と呼ぶか呼ばないかに関わらず微積分の理論でよく使用します。

定積分の公式・・置換積分と部分積分

定積分に関しての公式で、大学数学や物理でも知っておくと便利なのは3つほどに厳選できるかと思います。その他、符号や積分区間に関する定積分の基本的な規則などについても合わせてこの表でまとめておきます。

知っておくと便利な公式の1つは、前述の微積分学の基本定理です(不定積分の公式としても表せます)。
2つ目は置換積分の公式で、これは合成関数の微分に関係する積分公式です。
3つ目は部分積分という公式で、こちらは積の微分公式に関係します(これも、不定積分版の公式があります)。
つまり、これらの公式はいずれも微分とつながっています。

定積分の公式 公式の内容 証明・導出法の概略
置換積分 \(x=x(u), a=x(p), b=x(q)の時、\)
\({\large\int_a^b f(x) dx=\int_p^q f(u) \frac{dx}{du}du}\)
合成関数の微分をもとに示します。詳細
部分積分 \({\large\int_a^b f^{\prime}g dx=[fg]_a^b-\int_a^b fg^{\prime}dx}\)
※不定積分として、次のようにも書けます:
\({\large\int f^{\prime}g dx=fg-\int fg^{\prime}dx}\)
積の微分公式を変形して示します。詳細
積分区間の合成 \({\large\int_a^bf(x)dx+\int_b^cf(x)dx=\int_a^cf(x)dx}\) これらは、定積分の定義から分かります。
定積分と面積の関係から、図で理解してもよいと思います。
積分する方向と
定積分の符号
\({\large\int_a^bf(x)dx=-\int_b^af(x)dx}\)
1点だけの区間
の定積分は0
\({\large\int_a^af(x)dx=0}\)
定積分の線形性
(定数倍など)
\(c を定数とすると {\large\int_a^b(cf(x))dx=c\int_a^bf(x) dx}\)

\({\large\int_a^b(f(x)+g(x))dx=\int_a^bf(x) dx + \int_a^bg(x) dx}\)
微積分学の基本定理 \({\large\frac{d}{dx}\int_c^xf(t)dt=f(x)}\)
※不定積分として、次のようにも書けます:
\({\large\frac{d}{dx}\int f(t)dt=f(x)}\)
積分の定義から、
S(x+h) = S(x) + S(h) となる事を使い、微分の定義式に当てはめます。詳細

置換積分は、例えば直交座標上で表された関数を「極座標」で表して積分したい時に使います。 例えば、x = cosθ と変換して積分も行う場合です。この時、次の2点を忘れないようにしないと、積分の結果が変になるので注意が必要です。

  • 変換した変数での微分:\(\frac{dx}{d\theta}=\frac{d}{d\theta}\cos \theta =-\sin \theta\)
  • 積分区間の端点の変換:例えば x について [0, 1] で積分するなら、θ については\(\left[\frac{\pi}{2}, 0\right]\)で積分
    ※一見積分する区間が変になるようですが、この区間での積分で正しい結果が出るのです。

部分積分は、原始関数が分かりにくい関数について適用します。
例えば、ln x の原始関数は、微分の公式集を見ると見当たりません。(※このページの前半の「積の微分公式」のところに記載があります。)
そこで、ln x に「『1次の単項式 x の微分(=1)』が隠された形で掛けられている」・・と見て、部分積分を適用すると、うまく積分ができるのです。
$$\int \ln x dx= \int (x)^{\prime}\ln x dx=x\ln x – \int x(\ln x)^{\prime}dx=x\ln x – \int x\frac{1}{x}^{\prime}dx=x\ln x – \int 1 dx=x\ln x – x + C$$
また物理では、無限遠(じゅうぶん遠くと見なせる範囲)で関数がゼロになるときに、部分積分を利用した式変形を行う時があります。その場合は、原始関数を知りたいわけではなくて利用しやすいように式の形を変える事に利用しているわけです。

不定積分と原始関数の一覧表

次に、主要な初等関数の不定積分、原始関数の一覧の表を記します。もちろん、積分区間の端点の値を代入する事で、これらは全て定積分に使う事もできます。
基本的には「微分の逆演算」をやるだけですので、微分と別途に「積分の公式」を覚える必要は、それほどない・・とは、思います。一応、頻繁に使うものに関しては色をつけてあります。

微分の公式と比べると、一見簡単な関数の原始関数がやたらと複雑になる場合がある事にも、注意してみてください。

対象の関数 原始関数(不定積分の計算) 証明・導出法の概略
①定数(定数関数) \(\int c dx=cx+C\) 単項式の1次関数の微分より
②-1 単項式\(x^a\)【a≠-1】 \(\int x^a dx=\frac{x^{a+1}}{a+1}+C\) 微分公式と係数を消すために分母調整
次に記すように1/xの時だけは注意
②-2 \(\frac{1}{x}=x^{-1}\) \(\int\frac{1}{x}dx=\int x^{-1}dx=\ln |x|+C\) 自然対数関数の微分公式より。
絶対値がつくのは、x<0 の時でもln|x|の微分が1/x になるため
③ e の指数関数\(e^x\) \(\int e^xdx=e^x+C\) \(\frac{d}{dx}e^x=e^x\)によります。
④-1 自然対数関数 \(\int \ln x dx=x\ln x -x+C\) 積の微分公式から逆算するか、部分積分により。
④-2 対数関数系\(\frac{\ln x}{x}\)
\(a^x\ln a\)など
\(\int \frac{\ln x}{x}dx=\frac{1}{2}(\ln x)^2+C\)
\(\int a^x\ln a=a^x + C\)
合成関数の微分公式により、\(\frac{d}{dx}\frac{1}{2}(\ln x)^2=\frac{1}{2}(2\ln x)\frac{1}{x}=\frac{\ln x}{x}\)
後者は指数関数の微分公式より。
⑤-1 三角関数
(正弦、余弦、正接)
\(\int \sin xdx=-\cos x+C\)
\(\int \cos xdx=\sin x+C\)
\(\int \tan xdx=-\ln|\cos x|+C\)
正弦と余弦の微分公式より。
正接は、合成関数の微分公式より、
\(\frac{d}{dx}(-\ln |\cos x|)=-\frac{(\cos x)^{\prime}}{\cos x}=\frac{\sin x}{\cos x}\)
⑤-2 三角関数
(その他系)
\(\int \cot xdx=\ln|\sin x|+C\)
\(\int \mathrm{cosec}^2 xdx=
-\ln|\cot x|+C\)
\(\int \sec^2 xdx=\ln|\tan x|+C\)
\(\int \sec xdx
=\ln|\sec x +\tan x|+C\)
\(\cot x=\frac{\cos x}{\sin x}\hspace{10pt}\sec x=\frac{1}{\cos x}\)
\(\mathrm{cosec}x=\frac{1}{\sin x}\)
微分により「分母」を作るために、対数関数を利用しています。
⑤-3 三角関数
(合成関数)
\(\sin (nx),\hspace{10pt}\sin^2x\)等
\(\int \sin (nx)dx=-\frac{1}{n}\cos (nx)+C\)
\(\int \sin^2 xdx=\frac{2x-\sin (2x)}{4}+C\)
\(\int \sin x\cos xdx=\frac{-\cos(2x)}{4}+C\)
sin(nx)は合成関数の微分、
\(\sin^2x\)は加法定理でcos(2x)の形に直して考えます。
⑥ \(\frac{1}{\sqrt{1-x^2}}系\)
(結果に逆三角関数が現れる事があるタイプ)
\(\int \frac{1}{1+x^2}dx=\arctan x+C\)
|x|<1の時、
\(\int \frac{1}{\sqrt{1-x^2}}dx=\arcsin x+C\)
|x|>1の時、
\(\int \frac{1}{\sqrt{x^2-1}}dx=\ln |x+\sqrt{x^2-1}| +C\)
\(\int \frac{1}{\sqrt{1+x^2}}dx=\ln |x+\sqrt{x^2+1}| +C\)
逆正接と逆正弦関数については、微分公式から。
残りのものは、合成関数の微分を丁寧に適用すると確かに原始関数となります。
⑦ \(\sqrt{1-x^2}系\) \(\int \sqrt{1+x^2}dx\)
\(
=\frac{x\sqrt{1+x^2}+\ln |x+\sqrt{1+x^2}|}{2}+C\)
|x|<1の時、
\(\int \sqrt{1-x^2}dx\)
\(=\frac{x\sqrt{1-x^2}+\arcsin x}{2}+C\)

|x|>1の時、
\(\int \sqrt{x^2-1}dx\)
\(=\frac{x\sqrt{x^2-1}-
\ln |x+\sqrt{x^2-1}|}{2}+C\)

とても面倒くさい(でも一応表せる)・・という事だけ分かればいいと思います。
もちろん、関数を微分する事で確かに原始関数である事を確かめる事ができます。
部分積分 \({\large\int f^{\prime}g dx=fg-\int fg^{\prime}dx}\) 定積分の公式としても上記に記してあります。
証明は、積の微分公式から。詳細

定積分に関する公式の証明

微積分学の基本定理、置換積分の公式、部分積分の公式についての証明をここでは述べます。

(証明)定積分の公式

(証明)微積分学の基本定理

閉区間 [a,x] 上の変数を含んだ形の定積分\(\int_a^xf(t) dt\) を x の関数 S(x) として考え、和の形の定義で表したものについて、微分の定義を当てはめます。
[x,x+h]の閉区間の長さは h で、これをゼロに近づける時は[x,x+h]の分割はこの区間自体だけでじゅうぶんである事に注意すると、
$$\lim_{h \to 0}\frac{S(x+h)-S(x)}{h}=\lim_{h \to 0}\frac{S(x)+S(h)-S(x)}{h}=\lim_{h \to 0}\frac{S(h)}{h}=\lim_{h \to 0}\frac{hf(k)}{h}=\lim_{h \to 0} f(k)=f(x)$$
【最後の所は、x < k < x+h なので、\(\lim_{h \to 0}k=x\)】(証明終)

(証明)置換積分の公式

x=x(u),f(x)=f(x(u)) だとします。【例えば x = sin u, f(u)=\(\sin^2u=x^2\)】
x についての積分区間 [a,b] に対応する u についての積分区間は [p,q] であるとし,
a = x(p), b = x(q)であるとします。
$$F(x)=\int_a^x f(t)dt=\int_{x(p)}^{x(u)} f(g(s))ds$$
$$合成関数の微分により、\frac{d}{du}F(x(u))=\frac{F(x)}{dx}\frac{dx(u)}{du}=f(x)\frac{dx(u)}{du}【∵F(x) は f(x) の原始関数】$$
・・ということは、変数 u に関して F(x) は\(f(x)\frac{dx(u)}{du}=f(x(u))\frac{dx(u)}{du}\)の原始関数のひとつなので、
(※ F(x(u)) を u で微分したら \(f(x(u))\frac{dx(u)}{du}\) になったわけですから。)
$$\int_p^q f(x(u))\frac{dx(u)}{du}du=\left[F(x(u))\right]_p^q=F(x(q))-F(x(p))=F(b)-F(a)=F(b)=\int_a^b f(x)dx $$
(証明終)
【※\(F(b)=\int_a^b f(t)dt,\hspace{10pt}F(a)=\int_a^a f(t)dt=0\)に注意】

(証明)部分積分の公式

積の形の関数に対する微分公式より、
$$(fg)^{\prime}=f^{\prime}g+fg^{\prime} \Leftrightarrow f^{\prime}g=(fg)^{\prime}-fg^{\prime}$$
ということは、f'(x)g(x) の形の関数の不定積分と定積分は
$$不定積分:\int f^{\prime}g dx=\int (fg)^{\prime} dx-\int fg^{\prime}dx=fg-\int fg^{\prime}dx$$
$$定積分:\int_a^b f^{\prime}g dx=\int_a^b (fg)^{\prime}dx-\int_a^b fg^{\prime}dx=[fg]_a^b – \int_a^b fg^{\prime}dx (証明終)$$

※部分積分の証明に関する注:

  • 不定積分のほうについては、右辺に不定積分が残る形なので、任意定数 C は残った不定積分に含めると考えて書いていないわけです。
  • 上記の微積分学の基本定理と原始関数の箇所でも触れていますが、
    \(\int F^{\prime}(x)dx=F(x) + C\) が成立します。

参考:特殊な定積分について

「微分と積分は逆演算」という観点からは計算しにくい定積分の例をいくつか参考として、ここでも挙げておきます。原始関数が初等関数の形で簡単に計算できないものは、じつは多いのです。

そのような場合、定積分を主に面積的に捉えてコンピューターによる「数値計算」を行う事は有用な手段の一つですが、積分区間を「無限大」にする時(そのような種類の積分を「広義積分」と言います)には、敢えて重積分や複素積分を考える事により定積分(の極限値)が簡単な値として導出できる場合があります。そのような例の中には、物理の理論で用いられるものもあります。

  • \({\large\int_{-\infty}^{+\infty} e^{-a^2x^2} dx=\frac{\sqrt{\pi}}{a}} \)
    証明には敢えて「重積分を使用」します。量子力学などでたまに使う積分です。
  • \({\large\int_{-\infty}^{+\infty} e^{-a^2x^2+bx} dx=\frac{\sqrt{\pi}}{a}e^{\frac{b^2}{4a^2}} }\)
    同じく、量子力学で使う事がある系の積分です。
  • \({\large\int_0^{+\infty}\frac{\sin x}{x} dx=\frac{\pi}{2}}\)
    こちらは、敢えて「複素積分」を考える事で、実数範囲の積分(の極限値)が計算できるという例です。この手のものは、結構多くあります。
  • \({\large\int_0^{+\infty} \frac{1}{1+x^4} dx=\frac{\pi}{2\sqrt{2}}}\)
    これも、敢えて複素関数の範囲で考えるとうまく行く例です。

このページでは述べていない公式や、まだしていない考察も大学数学の微積分学には多く含まれます。このページで述べている基本事項をもとにして、ぜひそれらについても探求してみましょう。必要があれば、このページにも戻ってきてみてください。

参考文献 ・学習に役立つサイトなど

微積分の基本的な公式につきましては高校の教科書などにももちろん載っていますし、大学の微積分の教科書にも載っています。また、多くの外部サイトでも微積分の基本を述べているものは多いので、必要に応じて参照していただければよいと思います。

参考サイト(外部リンク)

マイナス×マイナスがプラスになる理由【負の数の掛け算】

「マイナスとマイナスをかけるとプラスになる」事の理由と意味について説明します。
(この記事内では「証明」と言わずに「説明」という語を使っています。)

負の数の乗法

負の数を含む掛け算(積、乗法)の符号の決まり方は次の通りです。

  • (+1)×(-1)=-1
  • (-1)×(+1)=-1
  • (-1)×(-1)=+1

尚、正の数同士の掛け算はもちろん(+1)×(+1)=+1 です。

簡単な引き算による説明

マイナス2かけるマイナス2は、プラス4になります。
これはなぜかというと、「『そのようになるように』計算を定義しているから」なのですが、
なぜそのように定義しているのかを考えてみましょう。

2つの数の引き算を考えます。
5ひく3は、2です。
5-3=2という、小学校で教わるか、あるいは教わらなくても説明されればすぐに分かる計算ですね。

ここで、3という数を2プラス1と考えて、
5から「2プラス1」を引いても、もちろん2という同じ計算結果になります。

■ 5-(2+1)=2 
-(2+1)の部分は(-1)×(2+1)=-2-1=-3
文字式であれば -(A+B)= -A-B の計算です。

では、3という数を「4マイナス1」と考えた場合はどうなるでしょう。
その時には
5-3=5-(4-1)と考える事ができます。
ここで-(4-1)の部分を、-(2+1)と同じ計算の仕方で「展開」するとすると、
-(4-1)=(-1)×(4-1)
-4+(-1)×(-1)という「負の数同士の掛け算」が現れるわけです。

マイナス同士の掛け算②

じつは、5から「4マイナス1」を引くという計算をした時に、
「5ひく3」と同じ結果を得るために必要なのが、「マイナス同士をかけるとプラスになる」という計算の定義です。

5から4を引いたら1ですから、5から3を引いた場合よりも「1だけ多く引き過ぎ」なのです。正しい計算結果に補正するために、5から4を引いて1を加えると、5引く3と同じ結果です。

この補正のために加えている分が、マイナス同士のかけ算でプラスになる部分です。

マイナス同士の掛け算③

★ 5-3=2ですから、5-3=5-(4-1)=2です。
ここで、負の数を含んだカッコ内を上記の考えで『展開』できるとすると、
5-(4-1)= 5-4+(-1)×(-1)=1+ (-1)×(-1) ですから、
1+(-1)×(-1) =2 ⇔(-1)×(-1) =1 となるわけです。
別の例でやってみると、
例えば6-2=4
6-(4-2)=4
2+(-1)×(-2)=4
(-1)×(-2)=+2 
のようになります。

あるいは、次のような図で考えてみる事もできるでしょう。
考え方は1つではありません。

例として7-(5-2)の計算を考える時、仮に7から5を引いたら結果は2ですが、これはもちろん7-3と比較したら「引き過ぎ」ですね。では、多く引き過ぎている部分はどこかというと、マイナス3に対して、「マイナス2が余分」であるわけです。

したがって、7-5は7-3に対して「2を多く引き過ぎている」のですから、「2を加えてあげれば」、7-3と同じ結果になるわけです。式で書くなら、7-5+2=7-3で、左辺が意味するものは「7-(5-2)」であるという解釈もできるでしょう。これはつまり、「-(5-2)=-5+2と考えるべきである」、すなわち、マイナスとマイナスの掛け算はプラスになるべきという説明になります。

★ A-(A-B)=B ⇔ A-A+(-1)×(-1)×B=B
⇔ (-1)×(-1)×B=B ⇔ (-1)×(-1)=+1 のように考える事もできます。
これは、全体Aから何かを引いたらBになる時、その「何か」とは当然「AーB」であるという考え方ですね。
具体的には例えば7-(7-5)=5といった「当然の計算結果」です。

物理から考えてみる説明

高校数学等で学ぶベクトルは、マイナス符号をつけると(つまりマイナス1を掛け算すると)「逆向き」になるという規則があります。

では、もし「逆向きのさらに逆向き」を考えるとどうなるでしょうか?
それはもちろん、もとの向きに戻るのです。
ですから、その事が「マイナスとマイナスを掛けるとプラスになる」という計算規則と調和するのです。

このように負の数の乗法は物理などでの応用でも意味を持っています。

その考え方のもとでは、マイナス同士の掛け算は次のように説明する事もできます。

まず、1+(-1)=0です。

次に、この両辺に「-(-1)」を加えると考えましょう。
(あるいは両辺から「-1」を引く)

すると、
1+(-1)-(-1)=-(-1)で、
(-1)-(-1)=0と考えるなら、
1=-(-1) 

このようにして、「マイナス1にマイナス符号をつけるとプラス1である」と説明する事もできます。

ベクトルで書くなら次のような形です。

$$-(-\overrightarrow{a})=\overrightarrow{a}$$

一般的に物理や工学では、マイナスの符号は「逆向き」の意味で使われます。
マイナス1をかける事によって、速度、力、電流などの向きが、特定の方向とは逆向きである事が表現されるのです。

※この場合には基本的に数学的な考え方が最初にあって物理に当てはめていると考える事ができます。しかし、もし物理法則を説明するために既存の数学体系では不足するものがあった場合には、必要な数学的規則を新たに考えてもよいとも言えます。それは滅多に無い事ではありますが、強調されてよい事であるとも思われます。

マイナス同士の掛け算⑤
南北や東西など、逆向きの方向である事を数式で表す時にマイナスの符号を使えます。
電流の場合。電子の流れと考えてもよいですが、発生する磁場の向きによって電流の向きを考える事もできます。
これらの応用でマイナス符号を使う時も、マイナス同士の掛け算はプラスになるという計算規則をそのまま使う事ができます。

あるいは、温度計などで、冬場に「気温はマイナス3度」といった表現は聞いた事があると思います。そのように、基準点であるゼロを突き抜けて下がる量がある時にもマイナスの考え方は便利です。ただしこのような使い方の場合はマイナスの「掛け算」はあまり使いませんね。用途や使用目的に応じて特定の計算を使うか使わないかは変わってきます。

デジタルでの使い方

デジタルで絵を描いたり、ゲームを作ったりという時にもプログラムのレベルにおいて(-1)×(-1)の演算が使われる事があります。一般的なプログラミング言語では乗法の演算として(-1)×(-1)=+1という通常の数学での実数の演算と同じ規則が採用されています。【多くの場合、プログラミングでは乗法の演算の記号としては *(アスタリスク)が使われます。】

普通、デジタルで画像を画面に表示させる時には座標の指定が行われています。この時に画像の表示位置画像の倍率指定においてマイナス符号を「反転」の意味を表すように紐づける事が可能で、さらに負の数同士の乗法も上手に活用する事ができます。

例えば倍率に対しては(-1)を1回乗じると向きの反転が行われ、もう一度(-1)を乗じると元の向きに戻るという演算として使えるわけです。+1を乗じた時には数値が変化しない事から、「何も変化なし」を意味します。

座標の反転に関しては、x座標だけでなくy座標も同時に符号を反転させれば「原点に対して対称」である位置への移動を考える事ができます。
倍率の指定での使い方に関しては、例えば「-2」を乗じる事で「反転して2倍に拡大する」といったように反転と大きさの倍率を統一的に扱う事ができます。

市販されているソフトウェアを使う時には数学的な演算を自分でやらなくてもよい(やらなくてもよいように設計されている)事は多いですが、自分でもプログラミングをやる場合は知っておくと便利です。また、自分ではプログラミングをやらなくても教養的な知識として知っておいてもよい事ではないかと思います。

考え方としてはベクトルに対しての応用と全く同じで、(-1)×(-1)=+1を上手に使っているわけです。

写真素材:pixabay.com より

より数学的な考察と数学教育上の問題

最初の例のように
5-(4-1)=5-4+(-1) × (-1) という計算が
5-(4-1)=3に等しいと考える説明は、
もう少し詳しい数学の用語で言うと「分配則(あるいは分配法則)が成立する」という条件での説明を述べています。分配則は式の展開のような計算規則を指します。

ち a(b+c) = ab + ac が成立するというのが分配則の内容です。それが負の数に対しても成立すると考える(そのような集合を考える)事によって負の数同士の乗法も考える事になります。

言い換えると、もし「負の数に対する分配則」を認めない(認めない集合を考える)のであればその時点で「負の数同士の乗法」に対して理由の説明も証明も何も無い事になるとも言えるわけです。

これは前述の具体例での説明での7-(5-3)のような計算で「マイナスの数についても式の展開を考えるなら」という点を強調している理由でもあります。
もしもその分配側を使った計算自体があり得ないと考えるのであれば、マイナス同士の掛け算という計算自体があり得ないためです。

であるから、もし中学生の人が「マイナスに対して掛け算を考える事自体がそもそもおかしい!認めない」と言うなら、必ずしも誤りとは言えません。考えている対象の数学的集合が異なれば、そういった話の食い違いが生じます。

従って当該反対意見には「それはもっともな事であるが、ここではそのような性質を持つような数学的集合を定義して、考えてみよう」と言うのが正しい回答(「解答」ではありません)かもしれません。

さらに言えば「優先して学ぶべき数学的対象は何か」という意味ではさらに説明が必要となるとも言えます。

同じ「計算を多く行う」学問でも例えば商学(簿記や会計などを扱う学問)であれば負の数同士の乗法や除法はあまり重要ではないし、それ以前に実数に対する深い考察自体がそれほど重要ではないと言えます。
しかし対象の学問が理学・工学系であると話が変わってくるわけです。

純粋数学の研究を特に行うわけではない中学や高校の授業や講義では、やはり「数学はどのように使われるのか」という事まで含めて考えるべきなのかもしれません。負の数を考えなくてもよい場面もあるし、前述のように逆に考えたほうがよい場面も存在するからです。その事まで含めて説明をする必要がある可能性は大いにあるのではないでしょうか。

負の数同士の乗法で非常に特徴的な利点としては何かの向きを変えた時に、さらにもう一度向きを反転させると「もとの向きに戻る」という事の表現に使える事であると言えます。

これは数学の応用という観点からだけでなく、純粋数学的に数学の考察をしていくうえでももちろん重要な事項となります。例えば三角関数の微分を繰り返すともとの関数に戻りますが、これは(-1)×(-1)=+1の演算がなければ成立しません。当該演算は、微積分も含めて実数や複素数とその関数を数学的に調べていくうえでも重要な基礎となっている関係式であると言えます。

■動画の声優御担当:ステ♪ 様 http://sute.tabigeinin.com/
BGM:音楽の卵

ベクトル解析と勾配・回転・発散・・grad, rot, div

このページでは、電磁気学などで使われる「ベクトル解析」という数学の分野について説明します。
その中でも特に、勾配・発散・回転と呼ばれるものについての説明を行います。

これは「ベクトルの微積分・力学での応用」の延長線上にある理論です。純粋数学よりも、応用数学の色彩の濃い微積分学の分野になります。(もちろん、純粋数学的・解析学的に考察する事も可能です。)

スカラー関数の変数が特に位置座標である事を強調する場合には「スカラー場」と言う事もあります。このページではスカラー場という名称を使います。

はじめに:「場」という考え方とベクトル解析

勾配(grad)、発散(div)、回転(rot)は「スカラー場」や「ベクトル場」というものに対して考えます。それらはいずれもスカラーやベクトルの仲間なのですが、特にどのようなスカラーやベクトルをそのように呼ぶのかを最初に述べておきます。

ベクトル場
スカラー場
電磁気学でのベクトル場とスカラー場の例 

ベクトル場

てきとうな電荷があって、まわりに別の電荷を持ってくると、電荷同士に力が働きます。この時に、後から持ってきたほうの電荷を置く場所によって働く力が変わってきます。これは数式で表すと、電荷が受ける力が座標上の点ごとに異なると考える事もできて、力を座標変数の関数で表されたベクトルで表せます。このように表されるベクトルを、「ベクトル場」と呼びます。ベクトル場の各成分は、座標成分による多変数関数になっています。(必要に応じて時間変化もするとして時間成分も加えます。)

このようなベクトル場の微積分を扱う数学の分野をベクトル解析と呼んだりします。後述するスカラー場の微積分も合わせて考えます(スカラーをベクトルに変換する操作などが含まれます) 。

★ ベクトル場の事を「ベクトル界」と言う事もあります。ベクトル界という呼び方は工学系で使われる事が多いとも言われます。
どちらが正しいかの基準はありませんが、このサイトでは、「ベクトル場」の呼び方を使用します。
「場(field)」という語は、「遠隔力」という考え方に対する概念として物理学で単独でも使う事があります。他方、『界』という語は単独では普通は使わない事が多いので、用語としては「場」という語でこのサイトでは統一します。

「ベクトル場」の意味

x, y, z の直交座標上で、
次のように各成分が x, y, z の関数として表される空間ベクトルを「ベクトル場」と呼びます: $$\overrightarrow {F}(x,y,z)=(\hspace{3pt}F_1(x,y,z),F_2(x,y,z),F_3(x,y,z)\hspace{3pt})$$ $$ベクトルの各成分\hspace{3pt}F_1(x,y,z)などは、x,y,z の多変数関数(スカラー関数)$$ 平面ベクトルで考えたとしても、成分が1つ減るだけで同様にベクトル場を考える事ができます。4成分以上の場合も理論的には考える事は可能ですが、普通はあまり考えません。ここでは基本的に3成分の空間ベクトルのベクトル場を考えます。

ベクトル場自体は多変数関数を成分とする「ベクトル」とも言えるので、上記の形が「ベクトル場の『定義』」であるというよりは、ベクトルのうち「このような形で表されるものを特にベクトル場と呼ぶ」という感じだと言えます。

物体の軌道をベクトルで表す時に、物体の位置座標を「時間の関数」として表す方法があったわけですが、それとの違いは、成分となる関数の変数に「座標成分が含まれている」という事です。

$$\overrightarrow {X}(t)=(x(t),y(t),z(t)) といったベクトルとは少し区別されるのです。$$

2つの電荷プラス同士であれば反発し、プラスとマイナスであれば引き合います。
向きは2つの電荷を結ぶ直線に沿い、遠くに離れるほど力の大きさは弱くなります。
「電荷に働く力を「場」として見る場合は「電場」と呼びます。

スカラー場

もう1つ、ベクトル解析では「スカラー場」というものも考えて、ベクトル場との使い分けを上手に行う事が理解のポイントになっていきます。

スカラー場とは、数式的には座標成分 x, y, z を変数とする多変数関数の事です。意味としては何ら難しくないのですが、電磁気学等の理論ではベクトル場と入り乱れる形で使われるので、物理の理論の中では慣れないと少し難しく感じると思います。

「スカラー場」の意味

x, y, z の直交座標上で、
次のように x, y, z の関数として表される多変数関数を「スカラー場」と呼びます: $$\phi= \phi (x,y,z)$$ 記号はここでは「\(\phi\)ファイ」を用いていますが、別に何でも構いません。 これは数学的に見れば通常の多変数関数であって、これをスカラー場と呼ぶのは基本的には x, y, z が空間上の直交座標の成分である事が明確であって物理等で用いられる場合、特にベクトル場と区別する場合です。

電磁気学でのベクトル場とスカラー場の例

+1[C] の電荷をある場所に置いたときに、その電荷が受ける力ベクトルを位置座標の関数で表したものはベクトル場であり、特に電場と呼びます。電気だけでなく磁気についても同じ考え方ができます。磁気の場合は単独の「磁荷」は存在しないと言われていますが、仮想的に単独の「磁荷」を考えて、磁荷が受ける力のベクトル場の事を磁場と呼びます。

電磁気学では、これを総称して電磁場と呼んだりもします。磁場は電流によって作られ、電流を生じさせる電圧(起電力)は磁場の変化によって作られるという関係が知られています。電磁気学は、観測によって得られたそれらの関係を定量的に表せるように数式で整理する物理学の分野です。

ベクトル場の具体例として、+1[C] の電荷のまわりの電場は次のように表せます(その付近に、別の+1[C] の電荷を持ってくると考えます。k は比例定数です。 ):

$$\overrightarrow {E}(x,y,z)=\left(\frac{kx}{r^3}, \frac{ky}{r^3}, \frac{kz}{r^3} \right)= \left (\frac{kx}{(x^2+y^2+z^2)^{\frac{3}{2}}}, \frac{ky}{(x^2+y^2+z^2)^{\frac{3}{2}}}, \frac{kz}{(x^2+y^2+z^2)^{\frac{3}{2}}} \right )$$

$$r= \sqrt{x^2+y^2+z^2} = (x^2+y^2+z^2)^{\frac{1}{2}}の関係で処理しています。 \frac{kx}{r^3} =\frac{k}{r^2}\cdot \frac{x}{r}という事です。 $$

$$詳細は別途に記しますが、ここでの電場の「大きさ」は| \overrightarrow {E} |=\frac{k}{r^2}になります。$$

ただし、このように具体的な座標成分で記すと計算が面倒なので、大枠となる理論ではベクトル場という事だけ踏まえて数式的な処理を加えていく事が行われます。個々の具体的な事例の考察では具体的な関数にして考えたりします。

このようなベクトル場である電場に対して、ある位置での+1[C]の電荷が持つ事になる位置エネルギー(または「ポテンシャル」)を電位と言います。これは日常でもよく耳にすると思われる電圧と本質的には同じものです。電位は、ベクトルでは無く、スカラー場になります。つまり、x, y, z という3つの変数によって決まる1つの値が決まるという3変数関数になります。

$$「電位」V(x,y,z) はべクトル場ではなく、スカラー場です。$$

これらのベクトル場やスカラー場の微積分を考えられる時に使われるのが、次に記す「勾配」「発散」「回転」というものです。

ベクトル場の発散(div)と回転(rot)、スカラー場の勾配(grad)

ではここで、ベクトル解析で重要な 勾配、発散、回転 と呼ばれるものの説明をします。

div, rot, grad ・・定義と考え方
図形的にはどのような意味を持つ?

※ここでの「発散」は、「無限大に発散」という意味ではなく、また別のものです。少々分かりにくいかもしれませんが、同じ用語を使う習慣があります。
※「回転」は「循環」と呼ばれる場合もあります。

勾配、発散、回転の定義には偏微分を用います。
ベクトル場、スカラー場ともに多変数関数である事が直接的に関わっています。

div, rot, grad ・・定義と考え方

あるベクトル場 \(\overrightarrow {F}\) があったとき、それに対する発散、回転を考える事になります。(成分が x, y, z の関数になっていない通常の「ベクトル」に対しては基本的に考えないので注意。)

他方、勾配についてはスカラー場に対して定義します。

$$ベクトル場\overrightarrow {F}(x,y,z)に対して、発散:\mathrm{div} \overrightarrow {F},\hspace{10pt} 回転:\mathrm{rot} \overrightarrow {F},\hspace{10pt} を定義します。$$

$$また、スカラー場\phi (x,y,z)に対して、 勾配:\mathrm{grad} \phi ,\hspace{10pt} を定義します。$$

定義
勾配(gradient)【グレディエント】
  • スカラー場 \(\phi (x,y,z)\)に対して次のベクトル(関数)を勾配(勾配ベクトル)と呼びます。
    $$\mathrm{grad} \phi=\left(\frac{\partial \phi}{\partial x},\frac{\partial \phi}{\partial y},\frac{\partial \phi}{\partial z}\right)$$
  • \(\mathrm{grad}\phiの代わりに\nabla \phi とも書きます。\)
発散(divergence)【ダイヴァージェンス】
  • ベクトル場 \(\overrightarrow {F}(x,y,z)=(F_1,F_2,F_3)\) に対する次のスカラー(関数)を発散と呼びます。
    $$\mathrm{div} \overrightarrow {F}=\frac{\partial F_1}{\partial x}+\frac{\partial F_2}{\partial y}+\frac{\partial F_3}{\partial z}$$
  • \(\mathrm{div}\overrightarrow {A}の代わりに\nabla \cdot \overrightarrow {A} とも書きます。\)
    \((F_1,F_2,F_3)=(F_1(x,y,z),F_2(x,y,z),F_3(x,y,z))\) です。
回転(rotation,curl)【ローテイション、カール】
  • ベクトル場 \(\overrightarrow {F}(x,y,z)=(F_1,F_2,F_3)\) に対する次のベクトル(関数)を回転と呼びます。$$\mathrm{rot} \overrightarrow {A}=\left(\frac{\partial F_3}{\partial y}-\frac{\partial F_2}{\partial z}, \frac{\partial F_1}{\partial z}-\frac{\partial F_3}{\partial x}, \frac{\partial F_2}{\partial x}-\frac{\partial F_1}{\partial y}\right)$$
  • \(\mathrm{rot}\overrightarrow {A}の代わりに\mathrm{curl}\overrightarrow {A}、あるいは\nabla × \overrightarrow {A} とも書きます。\)

★ 見ての通り、いずれも偏微分を用いて定義されます。
偏微分とは、1つの変数だけに着目し、他の変数は定数扱いにして微分操作を行う演算です。
★ \(\nabla \cdot \overrightarrow {A},\nabla × \overrightarrow {A}\) という表記について:これらの定義による式の形が、ベクトルの内積や外積の計算規則と似ている事からそのようにも書く習慣があります。この逆三角形の記号∇は「ナブラ」と呼ばれます。
★ 勾配・発散・回転自体も x, y, z を変数とするベクトルや実関数ですからベクトル場とスカラー場という事になりますが、勾配・発散・回転自体に対してはあまり「場」とは言わない事が多いです。

このように定義した時、
勾配と回転はベクトルであり、発散はスカラーである事に、少し注意してみてください。

同時に、勾配を考える対象はスカラー場であり、
発散と回転を考える対象はベクトル場であるわけです。少し整理しましょう。

対象の関数 勾配・発散・回転 ベクトル・スカラーの区別
スカラー場\(\phi (x,y,z)\) \(\mathrm{grad}\phi \) 勾配:ベクトル(成分は関数)
ベクトル場 \(\overrightarrow {F}(x,y,z)\) \(\mathrm{div}\overrightarrow {F}\) 発散:スカラー(関数)
ベクトル場 \(\overrightarrow {F}(x,y,z)\) \(\mathrm{rot}\overrightarrow {F}\) 回転:ベクトル(成分は関数)

★ 尚、発散と回転については、上記で定義した数式を「積分した形」を発散および回転と呼ぶ場合もありますが、このサイトでは一貫して上記の形の定義を用いる事にします。

図形的にはどのような意味を持つ?

こういった色々見慣れない記号をなぜ考えるのか?という話にもなるかと思いますが、これらに関しては基本的に「3次元の空間」の中のベクトルの理論ですので、図形的を持っている事が理解の1つのポイントです。

まず勾配については、偏微分を考えている事に注目すると、あるスカラー場が x方向、y方向、z方向に対して、その向きだけの変化率をベクトルで表したものになります。

次に、ベクトル場の発散についてです。これは位置が微小変化した時に、特定の量が全体として「周りからどれだけ出入りするか」の変化率を表します。単位体積から出入りする流量(※1)を表すとも言えます。
ベクトル場の発散に体積要素(dv = dxdydz)を掛け算すると、微小な領域に出入りする流量を表します。発散を面積分と重積分(※2) を結びつける公式(発散定理、ガウスの定理)もあり、それも物理で重要です。

(※1)もう少し詳しく言いますと、電磁気学の理論の一部は、流体力学の理論とのアナロジー(類似性)から類推して組み立てられています。「流量」とは流体力学で使われる用語であり、ある断面を1秒間あたりに通過する流体の体積を表します。
(※2)この場合、dv = dxdydz を考えるので体積積分とも言います)

回転については、定義式からは少し分かり辛いと思いますが、じつはこれを積分(「法線面積分」という種類の積分)をした時に文字通りの意味を表します。公式(「ストークスの定理」)を用いる事で、あるベクトル場の回転の面積分は、そのベクトル場に対して閉曲線を1周するように接線線積分したものに等しくなるのです。ベクトル場の回転は流体力学では「渦」を表現するのに使い、電磁気学などの領域でも使用します。

これらの図形的な意味を捉える時は、積分を考える必要がある場合もあります。

勾配・発散・回転に関するいくつかの公式

最後に、いくつかの公式について紹介をしておきましょう。

勾配・発散・回転の公式①:色々な組み合わせによる関係式
勾配・発散・回転の公式②:積分を含む公式 

勾配・発散・回転の公式①:色々な組み合わせによる関係式

ベクトル場の勾配・発散・回転を使ってどういう理論が展開されるのかを軽く見るために、いくつかの公式を挙げてみます。これらは、一般的には暗記するほど重要ではないと思いますが、簡単なものや特徴的なものは知っておくと物理学全般を学ぶ時に便利です。

勾配・発散・回転のいくつかの公式

\(\phi\) などはスカラー場、\(\overrightarrow {F}\) などはベクトル場であるとします。

  1. \(\mathrm{grad}(\phi_1\phi_2)=\phi_1(\mathrm{grad}\phi_2)+\phi_2(\mathrm{grad}\phi_1)\)
  2. \(\mathrm{div}(\phi\overrightarrow {F})=\mathrm{div}(\overrightarrow {F}\cdot \mathrm{grad}\phi)+\phi\mathrm{div}\overrightarrow {F}\)
  3. \(\mathrm{rot}(\mathrm{grad}\phi)=0\)
  4. \(\mathrm{div}(\mathrm{rot}\overrightarrow {F})=0\)
  5. \(\mathrm{rot}(\mathrm{rot}\overrightarrow {F})=\mathrm{grad}(\mathrm{div}\overrightarrow {F})-\left(\frac{\partial ^2F_1}{\partial x^2}+\frac{\partial^2 F_2}{\partial y^2}+\frac{\partial^2 F_3}{\partial z^2}\right)\)

\(\phi_1\phi_2\) は2つのスカラー場の積(普通の掛け算)であり、\(\phi\overrightarrow {F}\) はベクトル場の各成分に(同一の)スカラー場を掛け算したものです。\(\overrightarrow {F}\cdot \mathrm{grad}\phi\) は、内積です。
電磁気学の理論では、3番目と4番目の関係は特に重要です。
5番目の形の式は、回転はベクトル場から別のベクトル(場)を作る操作であるために考える事ができる点に注意。(勾配や発散では同じような事はできません。)

これらの公式の証明は、基本的には定義に直接当てはめて、積の微分公式などの基本公式を使って丁寧に計算する事で得られます。例えば、1番目の公式は各成分ごとに積の微分公式を使うだけです。
(偏微分の場合も通常の微分の場合と同じ形の積の微分公式が成立します。)

$$\mathrm{grad}(\phi_1\phi_2)=\left(\frac{\partial (\phi_1\phi_2) }{\partial x},\frac{\partial (\phi_1\phi_2) }{\partial y},\frac{\partial \ (\phi_1\phi_2) }{\partial z}\right)$$

$$= \left( \phi_1 \frac{\partial \phi_2}{\partial x}+ \phi_2 \frac{\partial \phi_1}{\partial x} , \phi_1 \frac{\partial \phi_2}{\partial y}+ \phi_2 \frac{\partial \phi_1 }{\partial y} , \phi_1 \frac{\partial \phi_2 }{\partial z}+ \phi_2 \frac{\partial \phi_1 }{\partial z} \right) $$

$$= \left( \phi_1 \frac{\partial \phi_2}{\partial x} , \phi_1 \frac{\partial \phi_2}{\partial y} , \phi_1 \frac{\partial \phi_2 }{\partial z}\right) + \left(\phi_2 \frac{\partial \phi_1}{\partial x} , \phi_2 \frac{\partial \phi_1 }{\partial y}, \phi_2 \frac{\partial \phi_1 }{\partial z} \right) $$

$$=\phi_1(\mathrm{grad}\phi_2)+\phi_2(\mathrm{grad}\phi_1)【1番目の公式の証明終り】$$

2番目の公式も、積の微分公式を用いるだけです。

$$\mathrm{div}(\phi\overrightarrow {F})=\frac{\partial (\phi F_1)}{\partial x}+\frac{\partial (\phi F_2)}{\partial y}+\frac{\partial (\phi F_3)}{\partial z} $$

$$ = \left( \phi \frac{\partial F_1}{\partial x}+ F_1 \frac{\partial \phi }{\partial x} \right) + \left( \phi \frac{\partial F_2}{\partial y}+ F_2 \frac{\partial \phi }{\partial y} \right) + \left( \phi \frac{\partial F_3}{\partial z} +F_3 \frac{\partial \phi }{\partial z} \right) $$

$$ = \phi \left( \frac{\partial F_1}{\partial x}+\frac{\partial F_2}{\partial y}+ \frac{\partial F_3}{\partial z}\right) + F_1 \frac{\partial \phi }{\partial x} + F_2 \frac{\partial \phi }{\partial y} + F_3 \frac{\partial \phi }{\partial z} $$

$$= \phi \mathrm{div} \overrightarrow {F}+ \overrightarrow {F} \cdot \mathrm{grad}\phi 【2番目の公式の証明終り】 $$

3番目と4番目の式は、2つの変数で続けて偏微分を行う時には偏微分の順番は関係なく同じ結果になる(※)という事を使って示します。【※解析学的に厳密に言うと条件がありますが、通常の連続関数であれば基本的に問題ありません。】

3成分のそれぞれについて0になる事を示す必要がありますが、変数が入れ替わるだけで同じ形・同じ計算ですので、第1成分(x成分)についてのみ記します。

$$\mathrm{rot}(\mathrm{grad}\phi)の第1成分=\frac{\partial}{\partial y} \left(\frac{\partial \phi}{\partial z}\right)- \frac{\partial}{\partial z} \left (\frac{\partial \phi}{\partial y} \right) = \frac{\partial^2 \phi}{\partial z \partial y }- \frac{\partial^2 \phi}{\partial y \partial z }=0 $$

$$【3番目の公式(第1成分)証明終り】 $$

$$\mathrm{div}(\mathrm{rot}\overrightarrow {F})の第1成分= \mathrm{div} \left(\frac{\partial F_3}{\partial y}-\frac{\partial F_2}{\partial z},
\frac{\partial F_1}{\partial z}-\frac{\partial F_3}{\partial x},
\frac{\partial F_2}{\partial x}-\frac{\partial F_1}{\partial y}\right)$$

$$= \frac{\partial}{\partial x} \left(\frac{\partial F_3}{\partial y}-\frac{\partial F_2}{\partial z} \right) + \frac{\partial}{\partial y} \left( \frac{\partial F_1}{\partial z}-\frac{\partial F_3}{\partial x} \right) + \frac{\partial}{\partial z} \left( \frac{\partial F_2}{\partial x}-\frac{\partial F_1}{\partial y}\right) $$

$$= \left( \frac{\partial^2 F_3 }{\partial x \partial y }- \frac{\partial^2 F_3 }{\partial y \partial x } \right) + \left( \frac{\partial^2 F_1 }{\partial y \partial z }- \frac{\partial^2 F_1 }{\partial z \partial y } \right) + \left( \frac{\partial^2 F_2 }{\partial z \partial x }- \frac{\partial^2 F_2 }{\partial x \partial z } \right) =0 $$

$$【4番目の公式(第1成分)証明終り】(最後の式では消える項ごとにまとめました。) $$

5番目の公式に関しては少々計算が面倒ですが、定義に当てはめて丁寧に計算する事で結果が得られます。特別な定理や計算技巧は必要ありません。

この他にも、勾配・発散・回転の組み合わせによる色々な公式が存在します。

勾配・発散・回転の公式②:積分を含む公式

勾配・発散・回転のいずれも微分(偏微分)を使って定義されるものであるわけですが、発散と回転に関してはそれらに対する積分を考える事で独特な形の公式が成立します。しかも、それらは物理の理論の中でも重要です。

2つの公式を、ごく簡単にですが挙げておきます。上記でも少し触れた「発散定理(ガウスの定理)」と「ストークスの定理」です。これらは積分を含む公式であり、通常の積分ではなく「法線面積分」「接線線積分」「体積積分」という種類の積分が含まれます。

$$発散定理:\int_V \mathrm{div}\overrightarrow{F} dv = \int_S \overrightarrow{F}\cdot d\overrightarrow{s}$$ $$ストークスの定理:\int_S \mathrm{rot}\overrightarrow{A}\cdot d\overrightarrow{s} = \int_C \overrightarrow{A}\cdot d\overrightarrow{r}$$

ここでは、C:閉曲線、S:閉曲面の表面、V:閉曲面内の領域 を表しています。

接線線積分については力学でも使う考え方ですが、法線面積分については初歩的な運動の解析にはあまり使わないかもしれません。基本的な考え方は共通していて、微小な領域において内積の計算をしてから積分をする(合計する)というものです。

体積積分は重積分で表す事もでき、法線面積分も内積の処理をした後に重積分として表す事もできます。(しかも、その事が証明で重要です。)

閉曲線上の接線線積分の積分方向は、xy平面などの平面上で考える場合には反時計回り(曲線の内部が左側に来る向きであり、閉曲線の「正方向」とも言います)として考えます。
空間上に閉曲線がある場合には、閉曲線を外周とする曲面の表側を決めたうえで、接線線積分の積分方向を定めます。

このベクトル解析の領域は、物理の電磁気学や流体力学と合わせて学んでみる事がおすすめです。数学的に詳しい考察が必要な部分と、応用で重要になる部分との関連がよく分かるようになると思います。

特性方程式による微分方程式の解法

今回は「特性方程式」という多項方程式を解く事で、
特定の種類の微分方程式の解を得る手法について述べます。

この方法で解けるのは「定数係数」で「線型」の「常微分」の微分方程式です。
「1階微分=ゼロ」「2階微分」=ゼロ」といった簡単に解ける微分方程式はその仲間です。それらの解法の延長線上・発展事項として今回の内容があります。n階の定数係数の線型常微分方程式の数学的な一般的解法を、この記事では詳しく見ていく事になります。

式が少し込み入る計算も含みますが、今回の内容で必要な公式は微積分の基本公式だけです。一部、複素関数論や代数学の話も含まれますが、そこは参考までに眺めるだけでも差し支えない箇所です。

「定数係数の線型常微分方程式」・・というのは名称が長いので、今回の記事の内容に限っては「常微分」であることや「線型」である事は前提として、単に「微分方程式」と記す事もあります。

今回扱うのは、一般のn階の「定数係数」の「線型」常微分方程式です。 (その中でもさらに「斉次」 のものです。ただし、非斉次のものも変形して斉次として扱える場合があります。)

「特性方程式」とは?

n階の定数係数の線型常微分方程式について、それぞれの階数の微分の部分に定数係数がくっついているわけですが、この時に次の対応を考えます:

$$n階微分の項に対する定数係数c_n \hspace{10pt} → \hspace{10pt} c_nx^n【定数項はそのまま定数項に対応】$$

この対応で作る多項方程式を、 定数係数の線型常微分方程式の特性方程式と言います。

具体的な3次の例で見てみますと、次のようになります。

$$微分方程式:y^{\prime \prime \prime }+3y^{ \prime \prime }-2y^{\prime }+1=0$$

$$対応する特性方程式:x^3+3x^2-2x+1=0$$

一般のn次の特性方程式は次のようになります。

n次の特性方程式

次のような
$$\frac{d^n}{dx^n}f(x)+c_{n-1}\frac{d^{n-1}}{dx^{n-1}}f(x)+\cdots+c_2\frac{d^2}{dx^2}f(x)+c_1\frac{d}{dx}f(x)+c_0f(x)=0$$
というn階の定数係数の線形常微分方程式に対して、
微分方程式で使われている定数係数\(c_1,c_2,\cdots\)を用いたn次方程式

$$x^n+c_{n-1}x^{n-1}+c_{n-2}x^{n-2}+\cdots+c_3x^3+c_2x^2+c_1x+c_0=0$$
の事を、その微分方程式に対する特性方程式(characteristic equation)と言います。
特性方程式の解の事を「特性根」と言う事もあります。

このように具体例で見たほうが分かりやすいかもしれませんね。

このように、作り方自体は簡単です。じつは特性方程式の「解」が、微分方程式のほうの解に直接関係します。根底にあるのは、自然対数の底 e の指数関数の微分演算です。微分して得る導関数が元の関数と同じであり、合成関数の微分を利用すると「元の関数×定数倍」という形を作れます。このパーツを上手に利用する事で、一般的には特性方程式とその解を計算すればよい、という理論になるのです。

用いる微積分の基本公式は、自然対数の底 e の指数関数と合成関数の微分公式です。それと積の微分公式も使用します。

対象の関数微分公式微分方程式の解法での役割
自然対数の底 e の指数関数\({\large \frac{d}{dx}e^x=e^x}\)微分すると元の関数に戻る
合成関数の微分\({\large \frac{df(y)}{dx}=\frac{df(y)}{dy}\frac{dy(x)}{dx}}\)微分方程式内の定数倍などを調整
積の形の微分\({\large \frac{d}{dx}(fg)=\frac{df}{dx}g+\frac{dg}{dx}f\frac{dy(x)}{dx}}\)このページで解説する証明で使ったりします。
  • 微分してない、もとの関数:\(e^{\alpha x}\)
  • 微分1回目:\(\frac{d}{dx}e^{\alpha x}=\alpha e^{\alpha x}\)
  • 微分2回目:\(\frac{d^2}{dx^2}e^{\alpha x}=\alpha^2 e^{\alpha x}\)

2階の場合の定数係数の微分方程式と、2次の特性方程式の関係が一般のn次の場合の解法の基本になりますので次に詳しく解法を見ます。

これは2次の特性方程式(多項方程式としては2次方程式)が異なる2つの実数解を持つ場合ですね。ただし、特性方程式が重解や複素数解を持つ場合でも、e の指数関数が重要である点には変わりありません。

2次の特性方程式が複素数解を持つ場合

2次の特性方程式が「異なる2つの実解」を持つ場合は、自然対数の底 e の指数関数を用いればよい事を、
以前の記事で詳しく述べてあります。

「じゃあ、そうでない場合はどうするのですか。」

まず、解が複素数解(虚数単位 i を含む解)である場合を述べます。この場合のほうがじつは比較的簡単です。解の表現としては虚数単位 i を含む形と、含まない形の両方で表現可能です。任意定数として複素数も許容されるとする事によって、定数をてきとうに調整すれば両者は同等になります。2つの形を両方記しておきましょう。

2次の特性方程式が複素数解である場合の微分方程式の解 2次の特性方程式の解が \(x=A+Bi\) である時、
対応する微分方程式の解 y は次のように表されます: $$①虚数単位iを含む形で表す場合:y=C_1e^{\alpha x}+C_2e^{\beta x}$$ $$②実数でのみで表す場合:y=C_1e^{Ax}\cos (Bx)+C_2e^{Ax}\sin (Bx)$$ $$C_1とC_2は任意定数【特に①の場合、複素数も含めた任意定数です。】$$

①の形は、特性方程式の解が異なる2つの実数解である場合と同じ形です。①と②の2つの形が同等である事の詳細は後述しますが、複素数も含めた任意定数を上手に調整する事で示します。実数のみで表す事も可能である事から、物理の古典力学の範囲でも普通に意味を持つ事が見えるかと思います。

複素数を r(cosθ+i sinθ) という「極形式」で表したうえで、 r(cos(θx)+i sin(θx)) という関数を考えてみます 。【このように複素数を含んだ関数を、数学上は複素関数とも言います。】

この形の関数は、じつは微分した時に、e の指数関数と同じ性質を持っています。
r と θ は定数としたうえで、試しにxで微分してみると:

$$\frac{d}{dx} r(\cos( \theta x)+i \sin( \theta x)) = r\theta (-\sin ( \theta x) +i\hspace{5pt}\cos ( \theta x) )=i \theta r (\cos( \theta x)+i \sin( \theta x)) $$

$$微分した後の式変形では、i^2=-1という関係を使っています。$$

【r等も変数ならxで偏微分という事になりますが、ここではr等は定数としてxでの「常微分」です。】

この結果を注意して見ていただくと、 xについてのもとの関数を「iθ 倍」したものと同じです。これは e の指数関数と同じ性質であり、指数関数の変数として複素数も考えるとするとじつは次のように書けます:

ポイントとなる1つの関係式

$$re^{i\theta x}= r(\cos( \theta x)+i \sin( \theta x)) $$ $$(おおもとの形:e^{i\theta}=\cos \theta +i\sin \theta)$$

この関係式は、ある条件(※)をつける事によって、変数が複素数範囲の場合は本質的にこの形として表してよいというものです。【(※):複素関数が「正則関数」であるという条件です。】

形式的には、e の指数関数のマクローリン展開(x=0でのテイラー展開)に、xの代わりに「 ix を代入してみて」、そこに正弦と余弦のマクローリン展開を「代入」する事で複素数の「指数関数表示」を得ます。ただし、より正確には複素数変数の指数関数を新たに定義するか、正則関数としての指数関数の複素数領域への拡張はただ1通りしかないという論法で指数関数表示を考察します。

この事を踏まえて、微分方程式 y”+ay’+by = 0 の解を考察します。
ここで、特性方程式の複素数解について、極形式ではなくて A + Bi の形のほうを考える事がポイントです。その形を、指数関数に適用してみましょう。

$$e^{\alpha x}=e^{(A+Bi)x}=e^{Ax}e^{Bi}x$$

これを、xで微分してみましょう。

$$\frac{d}{dx} e^{\alpha x}= \frac{d}{dx} ( e^{Ax}e^{iBx})=Ae^{Ax} e^{iBx} +iB e^{Ax} e^{iBx} =(A+Bi) e^{Ax} e^{iBx} = (A+Bi) e^{\alpha x}=\alpha e^{\alpha x} $$

このように、積の微分公式を使って丁寧に計算すると、微分の演算は実数係数の場合と全く同じ形になる事が分かります。 これは結局のところ、指数関数の部分が係数が乗じられる以外には形が変化しない事に起因しています。

と、なると解が異なる2つの実数ではなくて複素数であったとしても、

$$解は y=C_1e^{\alpha x}+C_2 e^{\beta x}の形で表せるという事です。 $$

微分方程式のほうの解を実数だけで表す方法

さて、前述のようにじつはこれを実数だけで表す事も可能です。

$$さきほどのe^{\alpha x}=e^{(A+Bi)x}=e^{Ax}e^{Bi}xという関係を使いましょう。ここで\beta=A-Biである事は重要です。$$

$$y= C_1 e^{Ax}e^{Bi}x +C_2 e^{Ax}e^{-Bi}x = C_1 e^{Ax} (\cos (Bx)+i\sin (Bx))+ C_2 e^{Ax} (\cos (Bx)-i\sin (Bx)) $$

$$= (C_1+C_2) e^{Ax} \cos (Bx) +i e^{Ax}\sin(Bx)(C_1-C_2)$$

$$C_1+C_2=C_3, C_1-C_2=iC_4 とすると、【そのようにおいてもよい事に注意】$$

$$y= C_3 e^{Ax} \cos (Bx) +C_4e^{Ax}\sin(Bx) $$

このように、任意定数も複素数であってよい事から「i を消せる」のです。特性方程式の2つの解が(必ず)共役複素数である事により、このように計算できます。
ここで、新しく作った2つの任意定数も複素数範囲で成立しますが、その中で実数に限定すれば実数範囲の任意定数による一般解として表せるわけです。

特性方程式の解(特性根)が異なる実数解の場合と複素数解の場合とでは、同じ形として微分方程式のほうの解を表す事が可能です。

2次の特性方程式が重解を持つ場合

次に、2次の特性方程式が重解(必ず実数)を持つ場合です。
証明に関してはこの場合がじつは一番面倒で、一般解は次のようになります。

2次の特性方程式が重根を持つ場合

特性方程式の解(重解)を \(\alpha\) とすると
微分方程式 \(y^{\prime\prime}+Ay^{\prime}+By=0\) の解は次のようになります:

$$y=C_1e^{\alpha x}+C_2xe^{\alpha x}=e^{\alpha x}(C_1+C_2x)$$ 「x が指数関数に乗じられる」という形の項が、オマケでくっついてくるわけです。
\(e^{\alpha x} \) にxの1次関数が乗じられていると考える事もできます。

この解は、実際に微分してみると確かに微分方程式を満たす事は割と簡単に分かりますが、パっと見では2番目の項も含まれる事は、なかなか気づかないと思います。そこで、この解の詳しい導出について見ておきましょう。

$$演算子として\hat{D}=\left(\frac{d}{dx}-\alpha\right) を定義しておきます。 \hat{D} y= \frac{dy}{dx}-\alpha yです。$$

$$ \hat{D}^2=\hat{D} (\hat{D}) と定義すると \hat{D}^2= \left(\frac{d^2}{dx^2}-2\alpha \frac{d}{dx} +\alpha ^2\right) です。$$

$$\hat{D}^2y= \frac{d^2y}{dx^2}-2\alpha \frac{dy}{dx} +\alpha ^2y $$

この記号は別に定義しなくても証明はできますが、計算が結構煩雑なので過程を詳しく見るのに役立ちます。これはあくまで、ここでの計算だけに適用する便宜上の記号です。
(「演算子」という言葉と考え方自体は、物理でも良く使います。特に量子力学などにおいてです。)

特性方程式が重解を持つという設定ですから

$$x^2+Ax+B=(x-\alpha)^2= x^2-2\alpha x +\alpha^2より、 A=-2\alpha,B=\alpha^2$$

$$よって、y^{\prime\prime}+Ay^{\prime}+By= y^{\prime\prime} -2\alpha y^{\prime}+ \alpha^2 y= \hat{D}^2y$$

$$特性方程式が重解を持つならば、 y^{\prime\prime}+Ay^{\prime}+By=0 \Leftrightarrow \hat{D}^2y =0 という事です。$$

$$ここで、\hspace{5pt}e^{-\alpha x}y \hspace{5pt} という関数を考えると話がうまく進みます。$$

これの1階微分は、単純に積の微分公式を用いて計算を進められます。

$$\frac{d}{dx}(e^{-\alpha x}y)=-\alpha e^{-\alpha x}y+e^{-\alpha x}(y^{\prime})=e^{-\alpha x} \left (\frac{d}{dx}-\alpha \right)y$$

2階微分も積の微分公式を用いて計算を進められます。

$$\frac{d^2}{dx^2}(e^{-\alpha x}y)=\frac{d}{dx}\left\{e^{-\alpha x}\left(\frac{d}{dx}-\alpha \right )y\right\}=-\alpha e^{-\alpha x} \left (\frac{d}{dx}-\alpha \right )y+e^{-\alpha x}\frac{d}{dx}{\left(\frac{d}{dx}-\alpha\right)y}$$

$$= e^{-\alpha x} \left \{ -\alpha (\hat{D}y) + \frac{d}{dx}(\hat{D}y)\right \}= e^{-\alpha x} \left\{\left(\frac{d}{dx}-\alpha \right ) (\hat{D}y)\right\} = e^{-\alpha x} \hat{D}^2y $$

$$※ \left(\frac{d}{dx}-\alpha \frac{d}{dx} \right )y=\hat{D}y が1つの塊であり、 e^{-\alpha x} とのつながりは「通常の掛け算」である事に注意。$$

$$すると、 \hat{D}^2y =0 ならば e^{-\alpha x} \hat{D}^2y つまり \frac{d^2}{dx^2}(e^{-\alpha x}y)=0です。$$

$$ \frac{d^2}{dx^2}(e^{-\alpha x}y)=0 という形は、「2階微分=0」という形の微分方程式です。$$

「2階微分=0」という形の微分方程式の解は1次関数です。
つまり、次の事が言えるわけです:

$$「特性方程式が重解を持つ」 \Rightarrow y^{\prime\prime}+Ay^{\prime}+By=0 \Leftrightarrow \hat{D}^2y =0 \Rightarrow \frac{d^2}{dx^2}(e^{-\alpha x}y)=0 $$

$$ \Rightarrow e^{-\alpha x}y =C_1x+C_2 \Leftrightarrow y= e^{\alpha x}(C_1x+C_2)[証明終り]$$

最後の式変形は、両辺に\(e^{\alpha x}\)を掛けただけです。
2次の特性方程式が重解を持つという条件があると、必然的に指数関数に「1次式」を乗じた形の関数が解になってしまうという事です。

n階の定数係数の線型常微分方程式の解法

さて、以上で2階の場合の考察を見てみましたが、3階以上の場合も基本的な考え方は同じです。ただし、3次以上の場合の特性方程式は実数解と複素数解が両方含まれている事もあり、実数解の場合は重解かそうでないかにも分かれます。

特性方程式が「解けた」という前提のもとで話を進めるとすると、その解を用いて微分方程式のほうの係数を表せます。表記を簡単にするため、4階のものを例に考えます。上記で、特性方程式の解が重解の場合に用いたような演算をここでも行います。

$$\frac{d^4y}{dx^4}+A_3 \frac{d^3y}{dx^3} +A_2 \frac{d^2y}{dx^2} +A_1 \frac{dy}{dx} + A_0y=\left(\frac{d}{dx}-\alpha_1\right) \left(\frac{d}{dx}-\alpha_2\right) \left(\frac{d}{dx}-\alpha_3\right) \left(\frac{d}{dx}-\alpha_4\right)y $$

$$A_3=\alpha_1+\alpha_2+\alpha_3+\alpha_4, A_0=\alpha_1 \alpha_2 \alpha_3 \alpha_4 等が成り立っています。 $$

1つ1つの解が「異なる実数解」や複素数解であれば2階の時と考え方は全く同じで、それらの解と e の指数関数を組み合わせ、任意定数とも合わせて加え合わせる(これを「線型結合」と呼びます)事を考えればよいのです。

$$つまり、C_1e^{\alpha_1 x}+ C_2e^{\alpha_2 x} + C_3e^{\alpha_3 x} + C_4e^{\alpha_4 x} などが解になります。$$

複素数解の部分は、2階の時と同じく実数だけで表す事もできます。共役になってる2解を用いて、指数関数と三角関数の積で表せます。(n次方程式の場合も、複素数解がある場合は必ず共役なもの同士が2つ1組になっています。)

$$例えば\alpha_1 と\alpha_2が共役な複素数解なら、\alpha_1=A+Bi, \alpha_2=A-Bi として$$

$$C_1e^{\alpha_1 x}+ C_2e^{\alpha_2 x}の部分をe^{Ax}(C_a\cos (Bx)+C_b\sin (Bx) )に変えても同じです。$$

「では、重解が含まれていたらどうなるのですか?」

n階の場合も、面倒なのは重解を持つ場合です。この場合、3重解4重解・・などを持つ事もあり得るので、考え方は2階の時と似ていますが別の補題を証明する必要があります。

補題 $$任意の自然数nに対して、 \frac{d^n}{dx^n}(e^{\alpha x}y)=e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}$$ $$ここで、\left(\frac{d}{dx}+\alpha\right)^nは\left(\frac{d}{dx}+\alpha\right)^2=\left(\frac{d}{dx}+\alpha\right)\left(\frac{d}{dx}+\alpha\right)=\left(\frac{d^2}{dx^2}+2\frac{d}{dx}\alpha+\alpha^2\right) 等の事。$$

これは、数学的帰納法を用いて丁寧に計算すると証明できます。

まず、n=1の場合は積の微分公式を用いてるだけで、これは成立します。

あるnで成立するとして、n+1の場合を考えます。

$$\frac{d^{n+1}}{dx^{n+1}}(e^{\alpha x}y)=\frac{d}{dx}\left\{\frac{d^n}{dx^n}(e^{\alpha x}y)\right\}= \frac{d}{dx}\left[ e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}\right]$$

$$=\alpha e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\} + e^{\alpha x} \frac{d}{dx}\left[ \left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}\right] $$

$$= e^{\alpha x} \left( \frac{d}{dx} +\alpha\right) \left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\} = e^{\alpha x} \left\{\left(\frac{d}{dx}+\alpha\right)^{n+1}y\right\} $$

よって、n+1の時も成立しますので任意の自然数nで成立します。【補題の証明終り】
式が少々ごちゃごちゃしますが、使っているのは積の微分公式だけです。

さて、この補題を使ってどのように微分方程式のほうの解を考えるかと言いますと、次のようになります:

$$例えば N 重解になる部分について微分方程式を \left(\frac{d}{dx}-\alpha\right)^ny=0 と表せますから、 $$

$$ \left(\frac{d}{dx}-\alpha\right)^ny=0 \Rightarrow e^{-\alpha x} \left(\frac{d}{dx}-\alpha\right)^ny=0 \Rightarrow \frac{d^n}{dx^n}( e^{-\alpha x}y)=0$$

【※プラスマイナスの符号が上記補題と入れ替わるので注意してください。\(\alpha\) を \(-\alpha\) に置き換えます。】

$$つまり「e^{-\alpha x}yという関数をn回微分すると0になる」という式になります。$$

1回微分して0になる関数は定数関数、2回微分して0になる関数は1次関数であるわけですが、n回微分して0になる関数は(n-1)次関数です。

$$よって、 e^{-\alpha x}y =x^{n-1}+C_{n-2}x^{n-2}+\cdots+C_2x^2+C_1x+C_0$$

$$\Leftrightarrow y= e^{\alpha x}( x^{n-1}+C_{n-2}x^{n-2}+\cdots+C_2x^2+C_1x+C_0 )という事になります。$$

指数関数に(n-1)次関数を乗じた形の解になります。2次の特性方程式が重解を持つ時には指数関数に1次式を乗じた形の解であったわけですが、それもこのn次の場合の解の形に含まれるわけです。

$$特性方程式の解が3重根であれば、微分方程式のほうの解はy= e^{\alpha x}( C_2x^2+C_1x+C_0 ) になります。$$

この特性方程式の重解の部分に対する微分方程式のほうの解を、異なる実数解や複素数解に対応する微分方程式の解に加え合わせて、全体の一般解になるわけです。

参考:n次方程式について

複素数係数のn次方程式は、m重解の部分をm個の解と数えると約束するうえで、n個の複素数解(実数解を含めて)を必ず持ちます。これは代数学の基本定理と呼ばれます。(代数学の「基本」となる定理なのかは別問題ですが・・。)
また、2次方程式には「解の公式」がありますが、多項方程式の係数の加減乗除とベキ根(2乗根、3乗根など)の組み合わせで解を一般的に表せるのは4次方程式までで、5次方程式以降は一般的にはその手法では解けない事が知られています。つまり、5次方程式以降は、解は確かに存在するけれど、2次方程式同様の「解の公式」によって手計算で一般的に解く事はできないという事です。(係数のベキ根によって解けるものもありますが、解けないものもあるという事です。)
しかしそうなると、定数係数の線型常微分方程式についても、n次方程式が解ければ微分方程式の解も分かるわけですが、肝心のn次方程式の解のほうが、高次の場合には手計算では一般的には解けない事になるのです。・・そのため、この微分方程式の理論は、ちょっと肝心なところが抜けているという感もあるかもしれません。あくまで、理論的にはこのように言えるという事を踏まえる必要があるかと思います。
代数学の基本定理は代数学の手法で証明する事もできますが、解析学的に証明する方法もあります。ベキ根による「解の公式」の存在(可解性などと言います)については、より代数学的な話なります。

特性方程式による、常微分方程式の解法についての考察

以前考察した簡単な微分方程式の解法について、特性方程式の観点からまとめと考察をしてみます。

解法のまとめと一覧表 ■ 解法の考察(特性方程式の観点から)

解法のまとめ・・一覧表

1階と2階の定数係数の線型常微分方程式を例にして、5つのタイプの微分方程式をまとめてみます。

微分方程式 使用する微分公式
① \(y^{\prime}=0\)  \(f(x)=C\) 定数関数の微分
② \(y^{\prime\prime}=0\) \(f(x)=bx+C\) 単項式の微分
③ \(y^{\prime\prime}-b=0\) \(f(x)=\frac{b}{2}x^2+Ax+C\) 単項式の微分
④ \(y^{\prime\prime}+b^2y=0\) \(f(x)=A\cos (bx+C)\) 三角関数と合成関数の微分
⑤ \(y^{\prime\prime}+by^{\prime}+cy=0\) 1.特性根\(\alpha,\beta\)が重解でない:
\(f(x)=Ae^{\alpha x}+Be^{\beta x}\)
2.特性根\(\alpha\)が重解である:
\(f(x)=e^{\alpha x}(Ax+B)\)
これがこのページで特に扱った内容です。特性根が重解で無い場合は、実数解と複素数解の場合をまとめています。

特性根」とは、「特性方程式の解」の事です。

解法の考察・・特性方程式の観点から見ると?

上記の5つの種類の解は、5番目のタイプで「特性方程式の解」が重解である場合と複素数解である場合を含めると、③タイプを除いて「数学的にまとめる」事も可能なのです。

どういう事かと言いますと、まず④の三角関数タイプは、じつは特性方程式の観点から言うと「特性根として複素数解」を持つ場合なのです。その場合、e の指数関数は複素数と三角関数の関係により表され、任意定数(複素数も可)を上手に選ぶと「実数範囲の三角関数」を解として得る事ができます。特性方程式が複素数解を持つ場合には、解を複素数でも実数でも表せる事を上記で述べましたが、その事です。

①②の、定数関数と1次関数が解のパターンは、ちょっと意外かもしれませんが、特性方程式の観点からは、じつは「特性根が重解」パターンの仲間なのです。(上記では最も面倒だったパターンですね。)ただ、「2階微分=0」のような場合には特性方程式の重解は 0 ですので、指数関数部分は1となって見えなくなるので、定数の場合も含めて1次関数の部分だけが残ります。そのような見方も数学的には可能という事です。

上の表の中でじつは仲間外れなのは③の2次関数タイプで、定数係数の常微分方程式の中で、これだけが「非斉次」タイプで、残り①②④⑤は「斉次」タイプなのです。このページで扱った内容(表の中では⑤)は、全て「斉次」のものです。そのために、③の解だけは⑤の枠組みとは少し違ったものになっている、という見方もできるわけです。(※ただし、非斉次であっても一工夫して斉次の形に変形をしたうえで解く事は可能です。)

重積分の理論と計算

重積分の定義と計算法、累次積分、変数変換と関数行列式について説明します。
微積分の中では、微分方程式無限級数偏微分の理論と並んで、応用数学でも重要です。

高校数学での1変数の積分の定義と公式は別途に詳しく説明しています。

重積分の物理学での応用としては、例えば電磁気学等で使うガウスの発散定理があります。

重積分とは「多変数関数に対する積分」

重積分とは、多変数関数に対する積分です。定積分・不定積分の両方があります。2変数の時を2重積分、3変数の時を3重積分、n変数の時をn重積分(あるいは「多重積分」)・・と、言う事もあります。

重積分の定義と表記方法
積分領域が長方形ではない場合の考え方と処理
重積分の簡単な計算:累次積分による例
重積分と面積・体積との関係 

重積分の定義と表記方法

多変数関数F(x,y,z,・・)をx、y、z、・・のそれぞれで積分する計算を重積分と言います。
単純化のため、ここでは2変数関数F(x,y) を例にします。

計算の仕方の結論を先に言ってしまいますと、まずxだけで積分の計算を行い、その後でyについて積分の計算を行います。yの積分を先に行ってからxで積分しても同じ結果になります。

  1. まず最初は、yなどの変数は定数とみなしてxで積分計算。
  2. xに関して定積分の値を代入したら、今度はyで積分計算。
重積分の表記と計算 $$\int_{y1}^{y2} \int_{x1}^{x2}F(x,y)dxdy=\int_{y1}^{y2}\left(\int_{x1}^{x2}F(x,y)dx\right) dy$$

このような計算の仕方を「累次積分」とも言います。
xの次にyと、続けて逐次的に計算するという意味合いです。
1つの積分変数に着目して積分計算する時は、他の変数は定数扱いにします。
不定積分として表記するなら次のような形になります。

$$\int\int F(x,y)dxdy$$ この時に、後述するように積分領域が長方形ではない場合には、積分区間として定数ではなく関数を代入する場合があります。

変数を増やした場合でも表記方法は2変数の場合に準じます。
例えば3変数なら次のようになります。

$$ 定積分:\int_{z1}^{z2} \int_{y1}^{y2}\int_{x1}^{x2}F(x,y,z)dxdydz \hspace{10pt}不定積分\int \int\int F(x,y,z)dxdydz$$

積分領域が長方形ではない場合の考え方と処理

◆積分区間について、積分を行うxy平面の領域が「長方形」であれば積分区間は
定数を端とする閉区間になります。(例えば [0,1])
他方、領域が座標軸に対して斜めになっていたり、曲がっていたりする場合には次のようにします。

まず、いずれかの変数をもう1つの変数の関数として表して、それを区間とします。
つまり、xとyの2変数で重積分をする時に、まずxで積分をするとすれば領域の端を構成する曲線をyの関数x=x(y)、x=x(y)として区間としておきます。

次に、yを定数とみなして原始関数を式で表せたとします。
その式のxの部分に、通常の定積分計算のようにx=x(y)とx=x(y)を代入をして引き算します。
【例えばx=2yであるとかx=yであるといった形を直接代入します。】
その計算の結果、変数xは全て消えてyだけの関数になります。

最後に残った変数については、定数の区間の定積分を実行します。

3変数以上の場合でも考え方は同じで、変数をx、y、zとして積分する場合には、最初に積分をする変数の区間は2変数関数として表され、2番目に積分する変数は区間が1変数関数で表され、最後に残った変数は区間が定数という形になります。

長方形でない領域の重積分の例
yから先に積分する場合には、yをxの関数で表して先に計算します。

例えば、x=yとx=2yで囲まれる領域を積分範囲を考えたとしましょう。この時に、yに関しては閉区間 [0,2]を考えるとします。その領域上でてきとうな2変数関数F(x,y)があったとして、まずxで積分をする前提であるなら重積分は次のように計算します。

$$\int_{y1}^{y2}\int_{x1}^{x2}F(x,y)dxdy=\int_0^2\int_{\large{y^2}}^{\large{2y}}F(x,y)dxdy$$

一度そのように具体的な関数を区間に代入して表した場合には、積分の順番はx→yのようにきちんと決めて計算を行います。

$$つまり、\int_0^2\left(\int_{\large{y^2}}^{\large{2y}}F(x,y)dx\right)dyのような形で計算を行います。$$

重積分の簡単な計算:累次積分による例

もう少し簡単な例として、てきとうな2変数関数としてF(x, y) = xy というものを考えて、重積分してみましょう。

この時、定積分の場合は x の範囲と y の範囲の両方が指定される必要があります。ここでは、例として x の積分区間は [0, 1]、y の積分区間は [4, 5] という範囲であるとします。【つまり積分する領域が長方形である場合です。】
【★数学では、この2つの範囲を表記する為に [0, 1] × [4, 5] と書く場合があります。この場合の「×」記号は、掛け算ではなくて「直積集合」を表すための記号です。】

では、その設定で重積分してみます。

$$ \int_{4}^{5}\int_{0}^{1} F(x, y) dxdy= \int_{4}^{5}\int_{1}^{2} xy dxdy = \int_{4}^{5} \left[\frac{yx^2}{2}\right]_0^1dy= \int_{4}^{5} \frac{y}{2}dy=\left[\frac{y^2}{4}\right]_4^5=\frac{9}{4} $$

まずyを定数とみなして計算を進める事がポイントです。
1変数の積分の計算さえできれば、計算の考え方としては難しくないはずです。

重積分と面積・体積との関係

1変数の関数の積分には、グラフで表した関数の「面積」という意味がありました。

では多変数の重積分には何の意味があるかというと、2変数関数の重積分には「体積」としての意味があります。この時、積分変数の側のdxdyを面積要素と呼ぶ事があり、物理などで用いる場合はdSと書く場合もあります。(S は surface の頭文字です。)
◆参考:ベクトル解析における法線面積分の考え方

xとyが直交座標の変数であるとき、dxdyは(微小な)長方形の面積というわけです。累次積分によって重積分を計算する場合は、1回目にxで積分することで、各dyに対する非常に薄い板のような立体ができあがり、それをyで積分して全体の体積になるというイメージです。

他方、3変数関数の重積分の場合は、空間上に分布する何らかの値を、特定の領域全体に渡って合計したものという意味があります。この場合、dxdydzを体積要素と呼ぶ事があり、物理などではdvで表記する事もあります。(vは volume の頭文字。)

1変数の積分にも言える事ですが、多変数の重積分においても、不定積分がうまく導出できない場合があります。しかし、積分は「和」の極限値であり、近似できるという考え方によって、コンピュータ(プログラミング)による「数値計算」で積分値を計算する事が可能です。

変数が増えても、物理的な意味付けができる場合には dX1dX2dX3dX4・・・といった積分変数の積を考えて重積分を行う場合もあります。

重積分の変数変換論

重積分の積分変数の変換は、偏微分の理論と深い関係があります。

変数変換の公式と、基本的な考え方:曲線に沿った積分
変数変換の理論と関数行列式:2変数の場合
3変数以上の場合の重積分の変数変換 

変数変換の公式と、基本的な考え方:曲線に沿った積分

通常の重積分を累次積分で計算する時には、まずx軸に沿って関数の積分値を、各yの値に対して計算し、次にy軸に沿って積分をするわけです。

そこで、x=2u+v, y= u+3v のような変数変換をするとします。この時、xとyではなくてuとvで積分する事を考えてみます。

この場合、 じつはxy平面上の「u曲線」と「v曲線」に沿って積分を行う事になります。上記のように変数変換がuとvの1次式である場合は曲線ではなく直線になりますから斜交座標のようなります。

物理などで使われる変換の代表的なものは、極座標変換です。この場合、x=rcosθ, y=rsinθ という変換を行いますが、rとθで積分をする場合には θ 曲線(rが一定:つまり同心円)とr曲線(θが一定:つまり原点から伸びる放射状の直線)に沿って重積分を行うというわけです。

ただし、変換の式を直接代入するだけではじつは不十分で、次に述べますように「関数行列式」と呼ばれるものを掛け算しないと、計算がうまく行かないのです。

変数変換の理論と関数行列式:2変数の場合

1変数の積分での x=x(t) という変数変換では、積分時に(dx/dt)というオマケが必ずついてきました。では、多変数の重積分の場合は、このオマケの部分はどうなるのでしょうか?

この場合は、x=x(u、v), y=y(u, v)である時の長方形の面積 dudvと、それに対応するxy平面での領域の面積比が、積分計算の時に必ず乗じられるのです。この計算を行うには、偏微分を用います。

平面の領域にてきとうにたくさんの点を打って結び合わせる事で、領域を小さな三角形の集まりに近似できます。(もちろん数学的には、正確な領域の面積との差を無限に小さくできるという事です。)

今、それらの点がxy平面上のu曲線、v曲線上に打たれていると考えます。 u曲線とv曲線を、非常に細かい「折れ線」であると考えます。
ここでのポイントは、1つ1つの微小な線分を「偏微分係数」であると考える事です。duに対してx方向には (∂x/∂u)du 、y方向には(∂y/∂u)duの変化があるベクトルが伸びるわけです。【具体的な点では偏導関数の変数に値を代入。】これは図で考えたほうが分かりやすいと思います。

重積分の変数変換と関数行列式
三角形(あるいは平行四辺形)の面積については次のように考えます:
底辺×高さの計算で、高さは「1つのベクトルの長さ×正弦(sinθ)」で表せます。
これについて 成分計算を行うと、ベクトルの成分を用いて簡単に表せるのです。

すると、各点から始まる微小三角形の面積は、平面ベクトルの公式(ベクトルによる平行四辺形の面積公式)により、次のように表せる事が分かります:

微小三角形の面積比 $$dS=\frac{1}{2}\left(du\frac{\partial x}{\partial u}dv\frac{\partial y}{\partial v}-dv\frac{\partial x}{\partial v}du\frac{\partial y}{\partial u}\right)=\frac{1}{2}dudv\left(\frac{\partial x}{\partial u}\frac{\partial y}{\partial v}-\frac{\partial x}{\partial v}\frac{\partial y}{\partial u}\right)$$ これはuv平面の三角形領域(1/2)dudvの面積と、それに1対1に対応するxy平面上の(三角形)面積の関係を表しています。
うしろにくっついてくる偏微分で表される部分が面積比であり、
この形は行列に対する「行列式」の形になっているので「関数行列式」とも言います。
「関数行列式」の定義(2変数関数の場合)

x=x(u、v), y=y(u, v)である時、 $$\frac{\partial x}{\partial u}\frac{\partial y}{\partial v}-\frac{\partial x}{\partial v}\frac{\partial y}{\partial u}\hspace{5pt}を「関数行列式」と呼び、$$ $$\left|\frac{\partial (x,y)}{\partial (u,v)} \right|\hspace{5pt}と表記します。$$

この関数行列式は、某学者のイニシャルをとってJで表記する事もあります。

行列式の定義については、2変数は簡単ですが3変数以上は多少込み入った考え方をします。ただし、そのように定義する事によって、いくつかの行列式の公式が成立したりします。

十分小さな微小三角形の面積と、その領域上のある関数の値を掛け合わせて全て加え合わせたものが定積分の値であり、その値は積分を微分の逆演算と考えて計算した値と等しくなるという事は、1変数の積分と全く同じです。まとめると、2変数の場合の重積分の変数変換の公式は次のようになります:

2変数の場合の重積分の変数変換の公式

x=x(u、v), y=y(u, v)である時、 $$\int_{y1}^{y2}\int_{x1}^{x2} F(x,y)dxdy= \int_{v1}^{v2}\int_{u1}^{u2} \left|\frac{\partial (x,y)}{\partial (u,v)} \right|F(x,y)dxdy$$ 具体的な定積分を行う時には、関数行列式の計算を忘れない事と、
xy平面の領域と、uv平面の領域を1対1にきちんと対応させる事が重要になります。

尚、証明はやや複雑になりますが、三角形ではなく「平行四辺形」で考える事も可能です。

3変数以上の場合の重積分の変数変換

さて、では3変数の時に x=x(u, v, w), y=y (u, v, w) , z= (u, v, w ) という変換をする場合や、4変数、5変数になった場合はどうなるのでしょうか。

この場合、式自体は変数が増えるごとにどんどん複雑になっていって手計算では手に負えなくなりますが、じつは一応規則性はあるのです。結論を言いますと、「n変数→別のn変数」の変換に対しては、n次の関数行列式を乗じればいいのです。2変数の場合は2次の関数行列式というわけです。

n変数の場合の重積分の変数変換の公式

n変数に対して別のn変数に変換する時、つまり $$X_1=X_1(u_1,u_2,u_3,\cdots,u_n),X_2=X_2(u_1,u_2,u_3,\cdots,u_n),\cdots,X_n=X_n(u_1,u_2,u_3,\cdots,u_n)の時$$ $$\int_{x11}^{x12}\int_{x21}^{x22}\cdots\int_{xn1}^{xn2} F(X_1,X_2,\cdots,X_n)dX_1dX_2dX_3\cdots dX_n$$ $$= \int_{u11}^{u12}\int_{u21}^{u22}\cdots\int_{un1}^{un2} \left|\frac{\partial (X_1,X_2,\cdots,X_n)}{\partial (u_1,u_2,u_3,\cdots,u_n)} \right|F(X_1,X_2,\cdots,X_n)du_1du_2du_3\cdots du_n$$ が成立します。
一般のn変数の場合だと式が少々込み入りますが、要するに変換の式を代入して関数行列式を掛けてから積分の計算を行えばいい、という意味です。

この場合の関数行列式の作り方は、行列の行の部分にx、y、z、・・を対応させ、列の部分に対して偏微分する変数u、v、w、・・を対応させ、行列式を作るという形になります。
3変数の場合は、次の形の行列式を考える事になります:

$$\left|\frac{\partial (x,y,z)}{\partial (u,v,w)} \right|=\Large{\left| \begin{array}{ccc} \frac{\partial x}{\partial u}&\frac{\partial x}{\partial v}&\frac{\partial x}{\partial w}\\ \frac{\partial y}{\partial u}&\frac{\partial y}{\partial v}&\frac{\partial y}{\partial w}\\ \frac{\partial z}{\partial u}&\frac{\partial z}{\partial v}&\frac{\partial z}{\partial w}\end{array}\right| }$$

3変数の場合には空間上の4点を結ぶ事で4面体の集まりとして近似する事が(必ず)できますが、じつは3次元空間での「平行6面体の体積」が行列式の形でうまく表現できるという命題があります。
そこで、dudvdwという「立方体」の体積と、対応するxyz空間上の領域の体積比がうまい具合に関数行列式で表せるというわけです。4変数以上の場合は図にはうまく描けなくなりますが、考え方としては同じで、dudvdwdtといった量と、対応する領域の量の比を考えるわけです。

ただし、これは数学的な理論としてはそうなるという事であり、実際問題として4次以上の重積分の変数変換を「手計算」でひたすらやるという作業は、応用上も純粋数学上もほとんどないと言ってよいかと思います。他方で、関数行列式を展開せずにそのままの形で数学的な議論を進める場合や、数値計算を行う場合にはn変数の重積分の変数変換が使われる事もあります。

物理では重積分はどう使われる?

物理で重積分を累次積分で計算する時は、変数変換してから計算する事が比較的多いかもしれません。ただし、変換の仕方は、基本的には極座標や円柱座標などの分かりやすいものが多いです。
(※理論を複雑にしてしまうと応用上の変数変換のメリットがないので、基本的に、式と計算を簡単にするために変数変換を行います。)

また、具体的な定積分の数値の計算はせずに種々の公式や命題を用いて延々と式変形を進めて、最終的には積分の計算が必要なくなる式を理論的に得てから、計算をするという事もよくあります。

例えば、電磁気学では重積分の形の式が非常に多く用いられますが、直接的に重積分を計算するというよりは、モデルの作り方を工夫 する (例えば領域を球面に選ぶなど)事によって、場面に応じて使える公式を得る目的で用いられます。
コンデンサーやソレノイドに対して成立する式などは平易なものですが、おおもとの形には多変数の微分や積分が含まれており、特別な場合をうまく考える事によって式を簡単にしているのです。

全微分の考え方とその応用

今回は、全微分という、少し聞きなれないかもしれない考え方について説明します。これは、前回の偏微分の理論と直接的に関係するものです。全微分の考え方を述べた後に、物理の熱力学での応用について述べます。

英名では、全微分は exact differential あるいは total differential と言います。

★ このページでは、「関数」と言ったら全て(偏)微分可能な関数の事を指す事にします。そのため、「連続な」「偏微分可能な」といった表現は基本的に省略いたします。解析学的に見る場合は、それらの考察も重要になります。

「全微分」とは何か?定義と考え方・偏微分との関係

初めに、数学的な定義と考え方です。本質的に、偏微分と深い関わりがあります。

全微分の定義 単独で表れるdF、dx、・・
全微分と「合成関数に対する偏微分の公式」との関係
1変数の場合の dF や dx の元々の数学的意味は? 

このように、dF/dxといった通常の微分演算(により得られる導関数)ではなく、dF といった単独の表記で表されるものが全微分と呼ばれるものです。

全微分の定義 単独で表れるdF、dx、・・

全微分とは多変数関数について定義されます。多変数関数に関しては偏微分を考える事ができますが、この偏微分による偏導関数を用いて全微分は定義されます。

定義:(多変数関数の)「全微分」

多変数関数 F(x,y,z,・・) の全微分とは、次のように定義します。 $$dF=\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy+\frac{\partial F}{\partial z}dz+\cdots$$ このように、単独でdFというものを定義し、別の単独のdxやdyを偏微分(偏導関数)と組み合わせて定義するものが全微分です。(※単に「微分」と呼ぶ事もありますが、当サイトでは避けます。)
物理では、良く使われます。意味については後述していきましょう。

この「dF」が単独で表現される事に違和感を覚えるかもしれません。実際、このままでは具体的な関数の微分計算はできません。例えば、具体的な関数 \(F(x) =e^x\) に対して dF というものを考えたとしても、それは \(dF=d(e^x)\) とだけしか表現のしようのない物でそれ以上計算はできません。導関数として計算できるのは、あくまでdF/dxです。

では、上記定義で表される「全微分」とは何の意味があるのでしょう?この定義の計算としての意味は、じつは合成関数に対する偏微分の公式です。

全微分と「合成関数に対する偏微分の公式」との関係

全微分の定義には偏微分が含まれていますが、本質的に、偏微分について成立する公式と直接的な対応を持っています。合成関数に対する偏微分の公式は、x、y、z・・の各変数が、別の1つだけの変数の関数である場合は次のようになります。

合成関数に対する偏微分の公式

多変数関数 F(x,y,z,・・) の各変数が別の変数t(のみ)の関数である時: $$\frac{dF}{dt}=\frac{\partial F}{\partial x}\frac{dx}{dt}+\frac{\partial F}{\partial y}\frac{dy}{dt}+\frac{\partial F}{\partial z}\frac{dz}{dt}+\cdots$$ x、y、z、・・が、t、u、v、・・などの多変数関数になる場合は、
ここでのdF/dt、dx/dtなどは偏微分∂F/∂t、∂x/∂tなどになります。

さて、これを全微分の定義の式と見比べてみましょう。
すると、形式的には「全微分の定義」の式について「両辺をdtで割った」形を考えてみるとぴったりと偏微分の公式に一致する事が分かるでしょうか?
じつは全微分の定義にはこのような「意味」があるわけなのです。

!ちょっとだけ注意

★ これは形式的に対応するという事であり、数学的に厳密にはdxをdtで「割って(除算して)」dx/dtにするという演算は行わない事に注意してください。後述もしますが、dx/dtと書いた場合はあくまで「導関数」を指し、極限値として得られる関数です。
ですから、全微分の定義式は偏微分のほうの公式から「導出・証明されるもの」ではなく、あくまで定義になります。

多変数関数が常に合成関数として扱えるという保証はないわけですが、具体的な計算を考える時に意味を持つのは合成関数に対する偏微分の公式のほうです。

それを踏まえたうえで、多変数関数に対する全微分を考える事は割と多くあり、特に物理では使用する事が多いです。

1変数の場合の dF や dx の元々の数学的意味は?

物理などの応用で使う場合は、dF や dx という表記を単独で用いる場合は「微小量」を表す事が多いです。ただし、じつは数学の解析学的にもきちんと意味があります。

上記のように 多変数関数F(x,y,・・)に対する「全微分」dFが定義されるわけですが、じつは1変数関数F(x)に対しても同様にdFという単独の表記にも解析学での定義があります。

解析学的には、dFやdxというのは、
じつは本来は、ある点を新しい原点として設定した時の座標軸の変数です。

その新しい原点での、関数F(x)に対する接線の傾きをAとして、
dF=A(dx)
という1次式を考えます。この1次式は、近似1次式とも呼ばれます。
解析学的に厳密には、この時のdFの事を1変数関数におけるF(x)の微分と言うのです。
この意味では、接線の傾きは「割り算」によって「A=(dF)/(dx)」という事になります。

ただし、導関数として dF/dxと書く時は、あくまで極限値としての導関数として、
dF/dx という表記全体で1つの意味を持つ事にしています。
(導関数に具体的な値を代入したものを微分係数と呼ばれます。)
こういった事が、決め事として少々分かりにくいところかもしれません。

★ 数学において、特に解析学・微分積分学においてdF/dxの事を「導関数」と呼ぶ事にこだわって、慣習的な俗称である「微分」という言葉で呼ぶ事を極力避けようとする傾向があるのはこういう理由があると言えます。本来、数学の用語として区別する事に決めているものであるためです。
ただし応用ではその区別があまり重要でないため(近似的にほぼ同じものとみなせるという解釈を前提におくため)、慣習的に導関数と言わずに「微分」と言ってしまう事が多いわけです。

じつは全微分の定義とは、この意味で用いられているものなのです。すなわち、多変数関数に対しても同様に、dF=A(dx)+B(dy)+C(dz)+・・を考えるという意味です。2変数関数の場合は、3次元座標での「接平面」を考えている事になります。
★ 上記でも触れましたが、多変数の場合でも「微分」と言ってしまう場合もあります。しかしこのサイトでは、基本的に多変数の場合は「全微分」と呼ぶ事にします。

平面と3次元空間の場合の接線と接平面の考え方は、変数の数が増えても同様に使えます。

この時に、1変数関数の場合には接線の傾きと考えていたものについて、多変数関数の場合は各変数に沿った傾きとするわけです。座標上の具体的な点においては、偏導関数に特定の値を代入した偏微分係数が各傾きになります。
すなわち上の式で、A=∂F/∂x、B=∂F/∂y、C=∂F/∂z、・・という事です。
意味としては、こういう事なのです。

重要公式:積の形の関数に対する全微分

2つの多変数関数F(x,y,z,・・)と G(x,y,z,・・)の積【掛け算】FGに対する全微分d(FG)を考えてみます。結論を先に言うと、1変数の微分の時の積の微分の時と同じ形の式が成立します。これも、物理での応用で使われます。

積の形の関数に対する全微分の公式
証明に必要な事: 積の形の関数に対する偏微分
積の形の全微分の式の証明 

これに関する理屈はごく簡単ですが、物理などでの応用では重要になります。

積の形の関数に対する全微分の公式

積の形の関数に対する全微分については、通常の1変数関数の場合の、積に関する微分公式同様の式が成立します。
これは数学の解析学ではそれほど重要な式ではありませんが、物理では使う事があるので述べておきましょう。

積の形の関数に対する全微分 2つの多変数関数 F(x,y,z,・・)と G(x,y,z,・・)の積 FG に対する全微分です
次のように、2つの項の和の形で表されます。 $$d(FG)=(dF)G+(dG)F$$ $$=\left(\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy+ \frac{\partial F}{\partial z}dz+\cdots\right)G+\left(\frac{\partial G}{\partial x}dx+\frac{\partial G}{\partial y}dy+\frac{\partial G}{\partial z}dz+\cdots \right)F$$ これは全微分の定義から導出もできますし、積の形の合成関数の偏微分公式に対応させても可です。

この公式が成立する事を示すには、「積の形の関数に対する偏微分」がどのように表されるかという事が問題になります。ただ、この問題はじつは難しくなくて、1変数の時と同じように考える事が出来ます。

証明に必要な事: 積の形の関数に対する偏微分

偏微分に関して、積の形に対する計算は通常の微分の場合と同じく次式が成立します。

$$\frac{\partial }{\partial x}(FG)= \frac{\partial F }{\partial x} G+ \frac{\partial G } {\partial x} F$$

これに対する証明は、(合成関数の場合とは違って)1変数の場合の積に対する微分公式と全く同じです。プラスマイナスでゼロになる2つの項を加える事で証明できます。式の形を見ると、本質的に1変数の時と同じである事が分かります。
2変数の場合を記しますが、何変数でも同じです。

$$ \frac{\partial }{\partial x}(F(x,y)G(x,y))= \lim_{h\to 0}\frac{F(x+h,y,)G(x+h,y)-F(x,y)G(x,y)}{h}$$

$$= \lim_{h\to 0} \frac{F(x+h,y)G(x+h,y)-F(x,y)G(x+h,y)+\{ F(x,y)G(x+h,y)- F(x,y)G(x,y)\}}{h} $$

$$= \lim_{h\to 0} G(x+h,y) \frac {F(x+h,y) – F(x,y)}{h}+ \lim_{h\to 0} F(x,y) \frac {G(x+h,y) – G(x,y)}{h}$$

$$= \frac{\partial F }{\partial x} G(x,y)+ \frac{\partial G }{\partial x} F(x,y)【証明終り】 $$

このように、1変数の時と同じです。

★ 合成関数の時に通常の微分と偏微分とで追う式の形が変わるのは、1つの変数tなどに対してx、y、z、・・の全ての変数に関して x+h, y+h, z+h,・・を考える必要があり、プラスマイナスゼロになる項を複数加える必要があるからです。

積の形の全微分の式の証明

では、関数が積の形の場合の全微分の式の「証明」について見てみましょう。
こういう場合、上記の定義のFの部分に(FG)という積の形をそのまま入れて、計算が可能であれば進めていって公式を得るという方法をとります。すると、よく見ると積の部分は偏微分の計算さえできればよい事が分かります。

積の形になっている部分の偏微分を、1変数の時と同じ要領で計算していきましょう。すると・・・・。

$$d(FG)=\frac {\partial (FG) }{\partial x}dx+ \frac {\partial (FG) }{\partial y}dy$$

$$= \left(\frac{\partial F }{\partial x} G+ \frac{\partial G }{\partial x} F\right) dx+ \left(\frac{\partial F }{\partial y} G+ \frac{\partial G }{\partial y} F\right) dy$$

$$ = \left(\frac{\partial F }{\partial x}dx + \frac{\partial F }{\partial y}dy \right)G+ \left(\frac{\partial G }{\partial x}dx + \frac{\partial G }{\partial y}dy \right)F=(dF)G+(dG)F 【証明終り】$$

このように、偏微分に関して積の計算をした後、上手にFとGに関してまとめると、dFとdGの定義の形が出てくるので d(FG)=(dF)G+(dG)F という形にまとまるわけです。

つまり、結果として、多変数関数に対する全微分も、積の形の関数に対しては
1変数関数や偏微分の場合と同じ形になる、という事です。

じつは、合成関数の偏微分に対して積の形の場合を計算して対応させると考えても同じ結果を得ます。
その場合の計算も記しておきましょう。
(上記と同じく、x,y はtだけの関数とします。つまり∂x/∂t=dx/dtです。)

$$\frac{d(FG)}{dt}=\frac {\partial (FG) }{\partial x}\frac{dx}{dt}+ \frac {\partial (FG) }{\partial y}dy$$

$$= \left(\frac{\partial F }{\partial x} G+ \frac{\partial G }{\partial x} F\right) \frac{dx}{dt} + \left(\frac{\partial F }{\partial y} G+ \frac{\partial G }{\partial y} F\right) \frac{dy}{dt} $$

$$= \left(\frac{\partial F }{\partial x} \frac{dx}{dt} + \frac{\partial F }{\partial y} \frac{dy}{dt} \right)G+ \left(\frac{\partial G }{\partial x} \frac{dx}{dt} + \frac{\partial G }{\partial y} \frac{dy}{dt} \right)F= \frac{dF}{dt} G+ \frac{dG}{dt} F $$

得られた式から形式的にdtの部分を除くと、積の形に対する全微分の式にちょうど対応します。

物理での使い方:熱力学での例

全微分の形で議論を進める分野の1つの例として、初歩的な熱力学の理論について述べます。

熱力学での色々な変数
内部エネルギー変化dUの計算 全微分と偏微分の関係の利用
エンタルピーHの変化量dH と積に対する全微分の式 

熱力学の理論における、全微分の使用例を見てみましょう。
この理論はさらに、化学反応に対する物理化学的な考察に使われたりします。

熱力学での色々な変数

熱力学とは、通常の力学や電磁気学とは少し性質が異なり、どちらかというと物理化学などの分野と相性がよい領域です。熱力学では、ある「系」(例えば容器に入った気体)について、まず次の量を考えます。

  • 体積V
  • 圧力P
  • 温度T【これは、いわゆる絶対温度で、0[℃]を298[K]とします。】
  • 内部エネルギーU

また、これらを組み合わせた量や、系に出入りする「熱」(温度とは別)も考えます。

  • 熱 q
  • 仕事 w【本質的には力学での仕事と同じものです。】
  • エンタルピー H=U+PV【主に発熱・吸熱として観測できる量です。】
  • エントロピーS ・・dS = Δq /T なるSとして定義

これらの変化量を dV 、dP などの全微分の形で表記して議論を進めます。物理でこれらを考える場合には時間という変数で微分・積分が可能と考えられますからdv/dtなどを考えても同じ事ですが、導関数ではなくて全微分の形で話を進めてしまう事が普通です。

上記の量のうち、「エントロピー」(記号S)というものだけが妙な定義のされ方をされているように見えるかと思いますが、これで計算を行うという理論になります。意味としては、系の「乱雑さ」の度合いを表す量です。

$$積分によりS=\int_{T1}^{T2 } \frac{Δq}{T} dTとも表せます。【このページでは、あまり関係ありません。】$$

「エンタルピー」という量(記号H)も少し分かりにくいかもしれませんが、定圧条件(dP=0)で dH=Δq となり、発熱・吸熱として比較的観測しやすい量なので敢えて定義されるものになります。

参考:系の「状態量」であるものは体積・圧力・温度・内部エネルギー・エントロピーであり、熱や仕事は「非状態量」です。「非状態量」という語には、系にされる仕事と形に出入りする熱の比は条件によっていくらでも変えれるので系自体の状態の量を表さない・・という意味合いが含まれています。熱力学では重要な考え方です。微小量を考える時、状態量については全微分としてdVなどで表し、非状態量についてはΔqなどと書いて区別する事が多いです。

内部エネルギー変化dUの計算 全微分と偏微分の関係の利用

まず、内部エネルギーの「変化」を考えます。つまり、Uに対してdUを考えるわけです。このdUは、全微分です。しかし最初は、上記の全微分の定義は直接的には使わずに少しだけ計算を進めます。いくらか変形した後で適用する箇所があります。

物理的な考察から、dU=Δq + Δw  と書いておきます。※dw、dqと書いてもよいのですが、非状態量である事を強調して区別する事が多いです。

意味としては、外部からの圧力で仕事がされた、外部から熱が入ってきたという状況です。(あるいは膨張などで外部に仕事をした・熱が外に出て行ったなど。)

ここで、まずΔw=- (dV)P の関係があります。
これは、等圧(dp=0)の条件下で、次の仮定でのモデルを考える事によります:

  • 系が外部に仕事をした時は体積が増える。
  • その分、内部エネルギーは減る。(温度は下がる。)

逆に、逆に外部から仕事をされた場合は体積は減りますが内部エネルギーは増えます。

また、熱の変化Δqに関しては、
dS=Δq/T ⇔ Δq=(dS)T
の関係からエントロピーでの表記に直します。

組み合わせて、dU=(dS)T -(dV)P という関係式を作っておきます。

数学的な全微分の定義の式を直接使って考察をするのはここからです。

ここで、Uが多変数関数U(S,V,・・)であるとして、
さらに「等圧条件」dP=0と「等温条件」dT=0という場合を考えます。
(このように所定の条件を加えて考察する事が多いです。)
すると、全微分としては次のようにります。

$$dU=\frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV+\frac{\partial U}{\partial T}dT+\cdots= \frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV $$

普通に全微分を考える際にはdP、dTを含めた項も含まれますが、dP=0、dT=0【圧力、温度の変化は無し】という条件を設けるので式が簡単になるわけです。

成立する2式を並べて書くと次のようになります。

得られる2式 $$ dU=T(dS) -P(dV)  かつ$$ $$ dU = \frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV $$

この事から何が言えるでしょう?
結論を言いますと、Uに対するS,Vの偏導関数がそれぞれT、Pであると解釈がなされるのです。

得られる解釈$$すなわち、等温・等圧条件のもとでは\hspace{10pt}\frac{\partial U}{\partial S} =T,\hspace{10pt} \frac{\partial U}{\partial V}=-P\hspace{10pt}という解釈がなされます。 $$

ここから先も計算による考察が続くのですが、このページではここで止めておきます。

エンタルピーHの変化量dH と積に対する全微分の式

次の例として、エンタルピーHの変化量dHを考えてみましょう。
これに対しては、積に対する全微分の式を用いるのです。

「エンタルピー」Hの定義は、H=U+PV です。も考えておきます。

次に、Hの変化量(全微分)を考えます。
これは dH=dU+d(PV) になります。

ここで上記の「積の形に対する全微分」の公式を適用しましょう。
PVという、圧力と体積の積になっている部分に対して適用します。すると、
dH=dU+d(PV) = dU+(dP)V+(dV)P
という形になるわけです。

参考:等圧条件dP=0の時、dH= dU+(dP)V+(dV)P = dU+(dV)Pになります。
他方、dU=Δq+Δw=Δq-(dV)Pなので、dU+ (dV)P=Δq
つまり、dP=0 ⇒ dH=Δq という事であり、
等圧条件下ではエンタルピーの変化は熱の変化(系への出入り)として表される
・・という解釈が、理論的に成立するというわけです。

前述でも触れましたように、この部分の計算は1変数関数の積に対する微分公式と同じ形になるので「通常の微分(変数は時間)」と捉えて計算しても結果的に差し支えない箇所です。
ただし、本質的にこれらのP、V、U、Sなどは多変数関数である事に注意も必要です。そのため、一応多変数関数の全微分と捉えたほうがよいとは思います。

この他に、A=U-TS、G=H-TSといった量を考えます。(いずれもエネルギーとして考えられます。)dAやdGも、dHと同じく積に関する全微分の式を考えて変形を行う事ができます。

熱力学というのは決して分かりやすい分野ではなく、この他にも色々な面倒な計算の理論があったりします。しかし、数学の偏微分や全微分の理論を踏まえておくと、初歩的な部分に関しては大分分かりやすくなるのではないかと思います。

参考文献・参考資料

■ 参考文献のリンクは、外部リンクになります。

偏微分とは?【定義・計算・公式】

この記事では、偏微分について説明します。

★ 英名は、「偏微分」の演算の事を partial differentiation、
偏微分によって得る「偏導関数」を partial derivative と言います。

この偏微分の考え方は、解析学・微分積分学的にも重要ですが、特に物理での応用で重要です。大学の物理学では割と初歩的な理論の中でも偏微分を普通に使いますので、ぜひ知っておきましょう。まずは記号に慣れていただく事が大事かと思います。
合成関数に対して成立する偏微分の公式も、
物理学の種々の分野の要所で用いられる重要公式です。

偏微分の定義と使い方

では、まず偏微分の定義と簡単な計算方法、物理等での基本的な使い方を見てみましょう。「偏『微分』」という名の通り、微分の仲間です。

偏微分の定義 ■ 偏微分の簡単な計算例 ■ 物理での偏微分の使われ方の例 

2つ以上の変数を含む関数について、「1つの変数だけで微分の計算」を行うのが「偏微分」です。
偏微分に対して、通常の微分を「常微分」とも言います。

偏微分の定義

偏微分の定義自体は非常に簡単で、要するに、多変数の関数において、「1つの変数だけに着目し、他の変数は定数とみなして微分の計算をする事」です。

偏微分の定義

多変数関数F(x,y,z,・・)【てきとうな例:F(x,y,z)= xy + z】に対して、
を1つの変数に着目して、
演算「xでの偏微分」を次のように定義し、偏微分によって新しくできた関数を偏導関数と呼びます。
変数yやzに対しても同じように定義します。 $$ \large \frac{\partial}{\partial x}F(x,y,z,\cdots)=\lim_{h\to 0}\frac{F(x+h,y,z,\cdots)-F(x,y,z,\cdots)}{h}$$ $$記号「\partial」は、「ラウンド・ディー」という名で呼ばれます。$$ 通常の微分の時と同じく、偏微分によりできた偏導関数の事を単に「偏微分」と 呼んでしまう事も多くあります。また、∂/∂xなど、基本的には通常の微分と同じく種々の表記方法が認められています。

偏導関数に特定の値を代入した「偏微分係数」は
$$\large \frac{\partial F}{\partial x}(a,b,c)\hspace{5pt}や\hspace{5pt}\partial xF(a,b,c)$$のように書きます。

偏微分の簡単な計算例

例として、てきとうな関数 F(x,y,z)= xy + z をxで偏微分してみましょう。この時、yとzは定数扱いにしてxだけで「微分」すればよいのです。

$$\frac{\partial}{\partial x}F(x,y,z)=\frac{\partial}{\partial x} (xy + z) =y $$

この場合、xy の部分はxでの偏微分ではxの部分だけ微分してyは定数係数扱いです。
z項の部分はxに関しては定数と考えて、
zをxで偏微分すると0になるわけです。(∂/∂x)z=0 という事です。
基本的な考え方は簡単ではないでしょうか?

★ zがxに対する「独立した」変数である場合にこのような計算になります。もし、zがxの関数であったら、後述する合成関数の偏微分公式を使う必要があります。いくつかの変数が互いに「独立」であるか「従属」であるかは、場合によっては結構重要になります。

もう1つ例として、極座標の形で表した関数の偏微分を考えてみます。F(r,θ)=rcos θ とします。これに対するrの偏微分と、θの偏微分を考えてみましょう。

$$ \frac{\partial}{\partial r}F(r,\theta)= \frac{\partial}{\partial r} (r\cos \theta)= \cos \theta $$

$$ \frac{\partial}{\partial \theta}F(r,\theta)= \frac{\partial}{\partial \theta} (r\cos \theta)= -r\sin \theta $$

偏微分のラウンドディーの記号に慣れてないと難しく見えるかもしれませんが、やってる事は通常の微分と計算と同じなので、じつは単純なのです。

物理での偏微分の使われ方の例

物理では、関数が座標成分と時間の両方の関数である場合に、「時間だけの変化率」を考えたい時に時間による偏微分を行います。

例えば電磁誘導は磁場の変化(時間微分)によって起電力が発生するというものですが、
電場は時間以外に位置座標 x, y , z の関数でもあるので「時間変化」という事を明確にするために時間による偏微分で表現します。

$$電磁誘導の式:\mathrm{rot}\overrightarrow{E}=-\frac{\partial \overrightarrow{B}}{\partial t}\hspace{10pt} \overrightarrow{E} :電場  \overrightarrow{B}:磁場【あるいは磁束密度】 $$

時間ではなくて位置座標による変化という事を明確にするのであれば、位置座標による偏微分を考えます。
例えば、磁場に関しては次の式が必ず成立します。 「単独で存在する磁荷」は無い事を表現します。

$$ \large \frac{ \partial B_X}{\partial x}+ \frac{ \partial B_Y}{\partial y} + \frac{ \partial B_Z}{\partial z} =0 \hspace{10pt} \overrightarrow{B}=(B_X,B_Y,B_Z) $$

このように、意味としては「どの変数に着目してるのか?」それを明示しているのが偏微分というものです。使われ方としては、基本的には単純なのです。
(※微分方程式の解き方も含めて、計算は面倒になる場合も確かにありますが、偏微分そのものが複雑な演算というわけではないという事です。)

工学の場合は、分野によってはそれほど偏微分の理論を使わずに通常の微分で大体足りるものも中にはありますが、物理では力学などの基礎的な部分も含めて、偏微分の考え方は非常に多く用います。

重要公式:合成関数に対する偏微分

合成関数を考える場合、じつは合成関数に対する偏微分の公式は、通常の1変数の時の合成関数の微分公式と形が異なります。この点を誤解すると物理などの理論で混乱を招くので、公式の形が変わるという点は偏微分の基礎理論の重要ポイントの1つです。

多変数関数の合成関数の考え方 ■ 合成関数に対する偏微分の公式 ■ 公式の証明 

1変数の時とは形が異なるので注意しましょう。
偏微分の時の形の特別な場合が常微分の場合の合成関数に対する微分公式であるとも言えます。

多変数関数の合成関数の考え方

1変数の場合、例えば F(x) に対して x = G(t) であれば F(G(t)) という合成関数になります。

これに対して、多変数の場合は、例えば F(x,y) について、xとyのそれぞれについて、別の多変数 u, v を用いて x = X(u, v) , y = Y(u, v) で表し、
F(x,y) = F( X(u, v) , Y(u, v) ) となるという考え方をします。これは、慣れないと少し分かりにくいかもしれません。

考え方としては、3変数を2変数による合成関数として考えたり、2変数を3変数による合成関数と考える事もできます。

これは、例えば位置座標 x, y, z で表される関数を3次元の極座標で表すために r, θ, φ という別の3つの変数を用いた合成関数として表す事が可能です。(計算は、一般的に結構面倒くさくなります。)

合成関数に対する偏微分の公式

公式は、次の通りです。変数を1つだけと考えると、通常の合成関数の微分公式になります。

公式:合成関数に対する偏微分

多変数関数F(x,y,z,・・)に対して、x, y, z, ・・・のそれぞれが u, v, w, ・・の多変数関数である時、
つまり x = X(u,v,w,・・), y = Y(u,v,w,・・), z = Z(u,v,w,・・),・・の時、
F(x,y,z,・・) に対して u, v, w, ・・のそれぞれで偏微分して得る偏導関数は次のようになります: $$\frac{\partial}{\partial u}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial u}+\cdots$$ $$\frac{\partial}{\partial v}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial v}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial v}+\cdots$$ $$\frac{\partial}{\partial w}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial w}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial w}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial w}+\cdots$$ $$\cdots$$ $$★これらの式において、\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}は、2つの偏導関数の掛け算です。$$ u, v, w, ・・のそれぞれでの偏微分について、このような和の形になります。

何変数でも同じ事ですが、例えば2変数に対して2変数による合成関数を考える時、つまり F(x,y) に対して x = X(u,v), y = Y(u,v) の時に、F に対して u, v で偏微分する時は次のようになります。

$$\frac{\partial}{\partial u}F(x,y)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u}$$

$$\frac{\partial}{\partial v}F(x,y)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial v}$$

1変数に対して別の1変数の合成関数であれば、次のように、通常の1変数の合成関数の公式と一致します。

$$1変数の場合は \frac{\partial}{\partial t}F(x)= \frac{\partial F}{\partial x}\frac{\partial x}{\partial t}=\frac{dF}{dx} \frac{dx}{dt} $$

公式の証明

合成関数に対して偏微分を考える場合、なぜ和が出てくるのか?という話ですね。基本的の証明の方法は、1変数の場合の、積や商の微分公式の証明と似ています。プラスとマイナスがゼロになって「隠れている」項があるわけです。

証明は、偏微分の定義の式に戻って計算を進めます。1つの変数 u で偏微分する時は、v, w,・・等は計算に影響しないので、ここでの証明では v, w 等の記載を省かせていただきます。本質的には、それらの変数もあると思ってください。

$$F(X(u+h),Y(u+h),Z(u+h))-F(X(u),Y(u),Z(u))に対して、$$

$$F(X(u),Y(u+h),Z(u+h))- F(X(u),Y(u+h),Z(u+h)) および$$

$$F(X(u),Y(u),Z(u+h))- F(X(u),Y(u),Z(u+h)) を加えます。 $$

すると、Fに対する u の偏導関数は次の和の形になります。
途中で平均値の定理を用いていて、xに対して特定の値を代入している部分があります。

$$ \large \frac{\partial}{\partial u}F(x,y,z) $$

$$= \large \lim_{h\to 0}\frac{F(X(u+h),Y(u+h),Z(u+h))-F(X(u,v),Y(u,v),Z(u,v))}{h} $$

$$ \large =\lim_{h\to 0} \frac{F(X(u+h),Y(u+h),Z(u+h))- F(X(u),Y(u+h),Z(u+h))}{h} $$

$$ \large + \lim_{h\to 0} \frac {F(X(u),Y(u+h),Z(u+h))- F(X(u),Y(u),Z(u+h))}{h} $$

$$ \large + \lim_{h\to 0} \frac{F(X(u),Y(u),Z(u+h))- F(X(u),Y(u),Z(u))}{h} $$

$$ \large =\lim_{h\to 0} \frac {\{X(u+h)-X(u)\} \partial x F(\phi_X,Y(u+h),Z(u+h))}{h} 【平均値の定理】$$

$$ \large +\lim_{h\to 0} \frac {\{Y(u+h)-Y(u)\}\partial y F(X(u),\phi_Y,Z(u+h))}{h}$$

$$ \large +\lim_{h\to 0} \frac {\{Z(u+h)-Z(u)\} \partial z F(X(u),Y(u), \phi_Z) }{h}$$

$$ \large =\lim_{h\to 0} \left\{\frac {X(u+h)-X(u)}{h} \partial x F(\phi_X,Y(u+h),Z(u+h))\right\} $$

$$ \large +\lim_{h\to 0} \left\{\frac {Y(u+h)-Y(u)}{h} \partial x F(X(u),\phi_Y,Z(u+h))\right\} $$

$$ \large +\lim_{h\to 0} \left\{\frac {Z(u+h)-Z(u)}{h} \partial x F(X(u),Y(u),\phi_Z)\right\} $$

$$ \large = \frac{\partial x}{\partial u} \frac{\partial F}{\partial x} + \frac{\partial y}{\partial u} \frac{\partial F}{\partial y} + \frac{\partial z}{\partial u} \frac{\partial F}{\partial z}= \frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u} + \frac{\partial F}{\partial z}\frac{\partial z}{\partial u} 【証明終り】$$

一番最後のところは掛け算の順番を入れ替えて書き直しただけです。

$$ \large \partial x F(\phi_x,Y(u+h),Z(u+h))などは、y=Y(u+h),z=Z(u+h)に値を固定して$$ $$ \large xで偏微分し、x=\phi_x を代入したものです。\phi_x \in [X(u),X(u+h)]$$ $$ \large また、\lim_{h\to 0}\phi_X =X(u) であり、\phi_Y,\phi_Zについても同様です。$$ ここではX(u,v,w,・・)を略記してX(u)と書いているので、 $$ \large \lim_{h\to 0}\frac {X(u+h)-X(u)}{h} の部分は偏微分 \frac{\partial X(u,v,w,,\cdots)}{\partial u} =\frac{\partial x}{\partial u} です。$$ 平均値の定理は使用しなくても別にいいのですが、hの処理を見やすくするために使用しました。

1変数の場合は上記のようにプラスマイナス0を利用した項の付け加えが必要なかったので、和の形ではなく1項だけになります。

★ x,y,z,・・の側の変数がn個の場合も、同様の形のn個の和として表せます。
例として、4変数の場合を考えてみましょう。つまり、F(x,y,z,t) に対して、x,y,z,s が u, v,・・・の関数である場合です。
この場合、次のものを加えて定義の極限を考えればいいのです。 $$F(X(u),Y(u+h),Z(u+h),T(u+h))- F(X(u),Y(u+h),Z(u+h),T(u+h)) $$ $$+F(X(u),Y(u),Z(u+h),T(u+h))- F(X(u),Y(u),Z(u+h),T(u+h))$$ $$+F(X(u),Y(u),Z(u),T(u+h))- F(X(u),Y(u),Z(u),T(u+h))$$ このような感じで、u と u+h の組について、1つずつずらしていく形で組み合わせれば、何変数であっても上記の証明と同じ手順で合成関数に対する偏微分の公式を証明できます。

n変数に関して同様に証明可能です。

合成関数の偏微分は物理の中では様々な箇所で用いられますが、例えば全微分というものとの関連で熱力学や流体力学の理論で用いたり、リーマン幾何学との関連で相対論で計算を考える時もあります。また、基本分野の古典力学の理論でも使用する事があります。得られた結果は電磁気学等でも使用します。

★ 関連記事:偏微分の応用の例:位置エネルギーと保存力の関係

高階微分の応用:テイラー展開とマクローリン展開

今回は、高階微分と、その応用として重要なテイラー展開、マクローリン展開と呼ばれる無限級数展開について説明します。大学で物理や工学を学ぶ場合などは、非常に重要となる項目です。

このページの中盤以降では、マクローリン展開の事は Mcl .展開と略記します

まず、高階微分について簡単に説明し、その応用としてテイラー展開とマクローリン展開について述べます。最後に、関数がテイラー展開可能である条件として、数学的には剰余項と呼ばれるものが収束する必要があるので、その問題について述べます【これは数学上の問題で、物理等にはあまり関係のない問題です】。

後半、数学的にかなり詳しく述べている部分もありますが、詳しい証明や導出を知りたい人向けです。
そうでない場合は参考までに眺めていただければじゅうぶんです。

幾何級数と無限級数の基礎については別の記事で述べましたが、
今回はテイラー展開とマクローリン展開です。高階微分を用いた無限級数展開です。

高階微分とは?

高階微分」=「1つの関数を何度も微分する事」です。意味としては簡単ですので具体例などを見てみましょう。記号で書かれるとややこしく見えるところにだけ注意しましょう。

2階微分とは?高階微分(2階微分、3階微分・・)について
極限としての2階微分(2階導関数)および高階導関数の定義

2階微分とは?高階微分(2階微分、3階微分・・)について

2階微分とは、「2回」微分操作をするという事です。 同じく、3回微分操作した場合を3階微分、n回微分したも場合をn階微分と言い、まとめて高階微分と呼びます。導関数については、「n階導関数」のように表現します。
※たまたま日本語では「2階」と「2回」が同じ読み方なのでどちらで表現してもほとんど誤解はないと思いますが、一応用語としては区別されています。

2回微分するから2階微分・・というのは、決して試験用の語呂合わせではなく、日本語の漢字の読み方の偶然です。

例えば sin x の通常の微分(1階微分)は cos x ですが、
2階微分は -sin x で、3階微分は -cos x 、4階微分は sin x です。

  1. sin x → cos x [1回目の微分(=通常の微分、1階微分)]
  2. cos x → -sin x [2回目の微分(=2階微分)]
  3. -sin x → -cos x [3回目の微分(=3階微分)]
  4. -cos x → sin x [4回目の微分(=4階微分)]※元の関数に戻るわけです。

\(x^2\)の通常の微分(1階微分)は 2x であるわけですが、
2階微分は 2 で、3階微分は 0 です。(4階以上の微分も、全て 0 です。)

  1. \(x^2 \rightarrow 2x\) [1階微分]
  2. 2x → 2 [2階微分]
  3. 2 → 0 [3階微分]※定数の微分ですから、0ですね。

\(e^x\)は、1回微分すると \(e^x\) で元の関数と同じなので、
それをさらに微分した2階導関数も3階導関数も、全ての高階導関数について同じ形で \(e^x\) です。

このように、続けて公式を適用していけばいいだけなので、計算としては特別難しいものではありません。

ただ、数式としての表記方法だけ見ると、慣れないと少し難しく「見える」かもしれません。 しかし、意味するものは通常の微分の延長にあるだけという事が分かると、なじみやすいかと思います。

極限としての2階微分(2階導関数)および高階導関数の定義

極限として2階微分を考えた時の定義は次のようになります。「通常の微分(導関数)」をさらに微分するわけですので、1階微分の定義の関数の部分に、1階導関数を当てはめれば2階微分により得る2階導関数になります。

定義と表記 $$2階微分の定義:f^{\prime\prime}(x)=\frac{d^2}{dx^2}f(x)=\frac{d}{dx}\left(\frac{d}{dx}f(x)\right)=(f^{\prime}(x))^{\prime}=\lim_{h \to 0}\frac{f^{\prime}(x+h)-f^{\prime}(x)}{h}$$

これが、2階微分(あるいは2階導関数)を定義で表した場合の式です。
初等関数に適用する場合などは、上記の例のように、公式により出されている1階の微分による導関数を単純に「もう1回」微分する事が行われるのが普通です。
3階、4階・・の微分についても、同様に考えます。例えば3階微分を定義式で(敢えて)表すのであれば次のような式になります。

$$3階微分の定義:f^{\prime\prime\prime}(x)=\frac{d^3}{dx^3}f(x)=\frac{d}{dx}\left(\frac{d^2}{dx^2}f(x)\right)=(f^{\prime\prime}(x))^{\prime}=\lim_{h \to 0}\frac{f^{\prime\prime}(x+h)-f^{\prime\prime}(x)}{h}$$
高階微分の表記方法

ある関数を2階微分している事を表す表記方法は、通常の1階微分にいくつもの表記方法があるように、同じく多くの表記方法があります。基本的には1階微分の表記方法に基づくものです。

$$2階微分の表記法:\frac{d^2y}{dx^2},\frac{d^2}{dx^2}f(x),\frac{d^2f}{dx^2},\frac{d^2f(x)}{dx^2},y^{\prime\prime},f^{\prime\prime}(x),f^{(2)}(x),d^2y/dx^2, \ddot{y}$$ 3階微分、n階微分の場合の表記方法は次の通りです。 $$3階微分の表記法:\frac{d^3y}{dx^3},\frac{d^3}{dx^3}f(x),\frac{d^3f}{dx^3},\frac{d^3f(x)}{dx^3},y^{\prime\prime\prime},f^{\prime\prime\prime}(x),f^{(3)}(x),d^3y/dx^3$$ $$n階微分の表記法:\frac{d^ny}{dx^n},\frac{d^n}{dx^n}f(x),\frac{d^nf}{dx^n},\frac{d^nf(x)}{dx^n},f^{(n)}(x),d^ny/dx^n$$

基本的には何階であっても表記の考え方は同じであるわけですが、階数が増えると、f(x) に「’ (プライム、ダッシュ)」をつける方法や、y の上に「・(ドット)」をつける方法は分かりにくいので、\(\frac{d^ny}{dx^n} や f^{(n)}(x)\)の表記が使われる事が多いのです。

高階導関数の表記方法を用いると、具体的な初等関数の2階微分やn階微分も、 $$\frac{d^2}{dx^2}\sin x=\frac{d}{dx}\cos x=-\sin x\hspace{10pt}\frac{d^n}{dx^n}e^x=e^x$$ ・・というふうに書けます。こういう書き方をすると難しく見えてしまうかもしれませんが、
重要なのは「決められた回数だけ微分操作を繰り返している」という事なのです。
もしとっつきにくいと感じた方も、そのように易しい形で理解していただければと思います。

高階微分って、何に「使う」の??

「2階以上の微分」というものは、一見すると何に使うのか分かりにくいかもしれません。
具体例を見てみるのが、最も分かりやすいと思います。
例えば、「2階微分」を用いる最も簡単な応用例は、物理の力学の「運動方程式」です。
物理では、時間を変数としたうえで、次の解釈が適用される事が重要です。

  • 速度は位置座標の1階の時間微分:\(v=\frac{dx}{dt}\)
  • 加速度は位置座標の2階微分(速度の1階微分):\(a=\frac{d^2x}{dt^2}=\frac{dv}{dt}\)
    ※ここでの a は、定数ではなくて、加速度(acceleration)です。
    ※細かい事を言いますとじつは物理では「ベクトルの微分」を考えるのですが、ここでは簡単のため1次元の速度と加速度を例として挙げています。

「運動方程式を解く」という事は、「2階の微分を含む『微分方程式』」を解くという事ですので、例えばそこで2階微分の考え方が用いられるわけです。

また、このページで次に述べるテイラー展開も物理や各種の工学などで重要です。これは1階および高階の微分を用いた無限級数による関数の表現方法になります。

テイラー展開とマクローリン展開

高階微分の応用として重要なテイラー展開とマクローリン展開について述べましょう。
数学的には、1段階前のテイラー公式というものがある事が重要です。

微分法はそもそも、関数のある点の近傍における近似1次式としての意味があります。そこで、1次式だけでなく、2次式、3次式の近似や、最終的には無限項の多項式で関数を近似しようという発想で、関数を多項式によって無限級数展開するのが、テイラー展開です。(平均値の定理の拡張と見る事もできます。)

テイラー展開とは? ■ マクローリン展開の一覧表 ■ テイラー公式の証明

関数の x = a における「テイラー展開」とは?

このテイラー展開では、通常の微分と、高階微分による微分係数(x = a におけるf'(a), f”(a)など)が用いられます。一見とっつきにくいかもしれませんが、具体的な初等関数のテイラー展開は、このページの前半でも述べた微分公式を使って係数を出していけばいいだけですので、決して難しいわけではありません。

テイラー展開 関数 f(x) のテイラー展開とは、次のような無限級数展開の事を言います。 $$f(x)=\sum_{n=0}^{\infty}\frac{(x-a)^n}{n!}f^{(n)}(a)={\small f(a)+(x-a)f^{\prime}(a)}+\frac{(x-a)^2}{2!}f^{\prime\prime}(a)+\frac{(x-a)^3}{3!}f^{\prime\prime\prime}(a)+\cdots$$

この形で表された無限級数展開を、x = a におけるテイラー展開と言います。
このようなテイラー展開を行う時、「x = a のまわりでテイラー展開する」という言い方もします。
これは、テイラー展開が x = 0, x = 1, x = 2, ・・など、任意の x の値における微分係数で表現できるという事です。

注意と参考:数学的には「剰余項」を含む段階の「テイラー公式」があります

解析学的においては、上記の形の式が n で終わる有限項の和に「剰余項」Hn(x)を加えたものをまず考えます(テイラー公式と呼ばれる事があります)。この剰余項が n→∞ でゼロになればテイラー展開の形になります。
$$テイラー公式:f(x)=\left(\sum_{j=0}^{n}\frac{(x-a)^j}{j!}f^{(j)}(a)\right)+H_n(x)$$ 初等関数では多くの場合に、この剰余項は n →∞ の極限で 0 になるので応用の面ではそこまで気にしなくてもいいのですが、収束する「xの範囲」が限定される場合もあります。
この剰余項の収束問題については、このページの後半で詳しく説明しましょう。

テイラー展開の式に \(a=0\)を代入したものがマクローリン展開と呼ばれる公式です。

マクローリン展開展開

x=0におけるテイラー展開がマクローリン展開です。
x=0における微分係数、高階微分係数を考えます。

$$f(x)=\sum_{n=0}^{\infty}\frac{x^n}{n!}f^{(n)}(0)=f(0)+xf^{\prime}(0)+\frac{x^2}{2!}f^{\prime\prime}(0)+\frac{x^3}{3!}f^{\prime\prime\prime}(0)+\frac{x^4}{4!}f^{\prime\prime\prime\prime}(0)+\cdots$$

以下、マクローリン展開の事は Mcl .展開と略記します

Mcl . 展開は、「テイラー展開の中でも、特によく用いられる形」・・という事になりますが、その理由は単純で、式の形が簡易になるためです。x = 0 という使いやすい場所での計算をしたいがため、物理などでも多く使われるのです。
物理等では、よほどの精度を求めない限り、3次や4次などの高階の部分は「ほとんど0」とみなせる場合をわざと考察する事も多いです。

指数関数や三角関数の Mcl .展開は、物理等への応用でも純粋数学的にも重要です。
例えば、ほんの1例ですが、自然対数の底 e の値が2.718・・である事や無理数・超越数である事の証明には Mcl .展開を用います。半端な変数における三角関数の具体的な値を知るのにも Mcl .展開を使えます。

$$e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots$$

$$\sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots$$

$$\cos x=1-\frac{x^2}{2}+\frac{x^4}{4!}-\frac{x^6}{6!}+\cdots$$

後述しますように、この形の無限級数展開を導出するには、部分積分を用いるやり方が比較的簡単です。部分積分は積の微分公式から導出される積分公式で、微分の関係をうまく使います。テイラー展開の各分母の階乗も、単項式の微分由来です。

参考までに、テイラー展開には、大学数学の解析学的には「一意性」がある事が重要です。どういう事かと言いますと、同じ「『多項式の形』の無限級数」(整級数と言います)で表される関数がある場合、同じ関数を表すのであれば、各\(x, x^2, x^3, \cdots\)の係数の表し方は「1通りしかない」という数学的事実があるのです。
(※微分以外の方法では決して表せないという事ではなくて、微分以外の方法で表せたとしても、じつは微分で表したテイラー展開に一致する、という意味です。)
これは、微分の範囲を複素数まで広げた場合などで、結構理論的には重要になります。

★参考

テイラー展開の一意性については、じつは\(f(x)=A_0+A_1(x-a)+A_2(x-a)^2+\cdots\) の形の無限級数を微分したうえでx→ a の極限を考えれば、かなり簡単に分かる事なのです。
そのように無限級数を直接微分する事を「項別微分」と言います。
しかし、じつはこの項別微分という計算は「できる場合とできない場」合があります。
\(f(x)=A_0+A_1(x-a)+A_2(x-a)^2+\cdots\) の形の無限級数(整級数と言います)は、「一様収束性」という性質があるので項別微分が可能なのです。これについては自明ではないので解析学的な証明が必要です。

\(\frac{1}{1-x}\)のテイラー展開と幾何級数展開は、本質的に同じもの?違うもの?

「高校でも教わる無限級数展開」として、幾何級数展開があります。「等比数列の和」という名前のほうが、多くの方にとって、もしかするとなじみがあるかもしれません。
例えば次の無限級数は、幾何級数の方法で出す事ができます。

$$|x| < 1 の時、\frac{1}{1-x}=1+x+x^2+x^3+x^4+\cdots$$ $$※導出:S_n=1+x+x^2+x^3+\cdots+x^n として S_n-xS_n=1-x^{n+1} となるので$$ $$|x|<1 の時、S_n(1-x)=1-x^{n+1}\Leftrightarrow S_n=\frac{1-x^{n+1}}{1-x}\rightarrow \frac{1}{1-x}\hspace{5pt}(n\rightarrow \infty)$$

このとき、じつは\(\frac{1}{1-x}\)をテイラー展開・Mcl.展開する事もできます。この時、結論を言いますと、幾何級数で表された無限級数は、Mcl.展開に一致するのです。
2つ以上の方法で整級数の形に表わせたとき(例えば幾何級数の方法とテイラー展開)であろうと、両者は本質的に同じである・・という事の具体例になります。

整級数の形に無限級数展開を行う時、何かしら「計算しやすい方法」で1つの形を導出してけば、それは本質的に1通りの正しい整級数の表式という事が、じつは保証される、という数学的事実があります。
テイラー展開等が特別扱いというわけではなく、\(\frac{1}{1-x}\)の場合であれば幾何級数によって考えるほうが簡単なので、そちらの考え方でもよいというわけなのです。

マクローリン展開の一覧表

物理等では重要なので、主要な初等関数の Mcl. 展開をいくつか表にまとめてあります。x = 0 での f(0) と、微分係数 f ‘ (0), f ‘ ‘ (0),・・を具体的に計算し、 Mcl. 展開の式に代入すれば公式が得られます。
表にある「収束半径」とは、無限級数が有限の値に収束する「変数 x の範囲」の事で、ここでのより具体的な意味としては剰余項が収束するかという事です。これについては、初等関数の中でも、あまり気にしなくてよいものと、気にしたほうがよいものがあります。

対象の関数Mcl.展開収束半径計算方法
e の指数関数\(e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\cdots\) 実数全域 \((e^x)^{\prime}=\frac{d^n}{dx^n}e^x=e^x\)
f(0) = f'(0) = f”(0) = 1
自然対数関数
ln(1+x)
\({\small\ln (1+x)}\)
\(=x-\frac{x^2}{2}+\frac{x^3}{3}-\frac{x^4}{4}+\cdots\)
※ln x だと、x = 0 で定義できず、微分不可能・Mcl.展開不可能
|x| < 1\({\small(\ln(1+x))^{\prime}}=\frac{1}{1+x}\)
\({\small(\ln(1+x))^{\prime\prime}}=\frac{-1}{(1+x)^2}\)
f(0)=0, f'(0)=1, f”(0)=-1
三角関数
(正弦)
\(\sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots\)実数全域 \({\small(\sin x)^{\prime}=\cos x }\)
\({\small(\sin x)^{\prime\prime}=-\sin x}\)
f(0)=0, f'(0)=1, f”(0)=0, f”(0)=-1
三角関数
(余弦)
\(\cos x=1-\frac{x^2}{2}+\frac{x^4}{4!}-\frac{x^6}{6!}+\cdots\)実数全域 \({\small(\cos x)^{\prime}=-\sin x}\)
\({\small(\cos x)^{\prime\prime}=-\cos x}\)
f(0)=1, f'(0)=0, f”(0)=-1, f”(0)=0
\(\frac{1}{1-x}\)
幾何級数
\(\frac{1}{1-x}\)
\(=1+x+x^2+x^3+x^4+\cdots\)
|x|<1 \(\left(\frac{1}{1-x}\right)^{\prime}=\frac{1}{(1-x)^2}\)
\(\left(\frac{1}{1-x}\right)^{\prime\prime}=\frac{2}{(1-x)^2}\)
※(-1)と(-1)がかけられ、
必ず+になります。
f(0)=1, f'(0)=1, f”(0)=1, f”(0)=1
\((1+x)^a\)
一般2項級数
\((1+x)^a=1+ax\)
\( +\frac{a(a-1)}{2}x^2+\frac{a(a-1)(a-2)}{3!}x^3+\cdots\)
|x|<1 \({\small((1+x)^a)^{\prime}=a(1+x)^{a-1}}\)
\({\small((1+x)^a)^{\prime\prime}=a(a-1)(1+x)^{a-2}}\)
f(0)=1, f'(0)=a, f”(0)=a(a-1)
f”'(0)=a(a-1)(a-2)

テイラー展開の式は、どのように導出する??

証明の方法はいくつかありますが、ここでは積分の公式である「部分積分」を使う方法を、述べます。(積分区間に変数を含んだ形の計算になるので注意してください。

ここで具体的に述べますのは、「剰余項」を含んだ「テイラー公式」の証明です。
そして個々の関数について、剰余項が n→∞ でゼロになる事を示して個々の関数についてのテイラー展開と Mcl. 展開が証明されるという流れです。剰余項の収束問題については後述します。

証明(テイラー公式)

まず、
\(f(x)-f(a)=\int_a^x f^{\prime}(t)dt \Leftrightarrow f(x)=f(a) + \int_a^x f^{\prime}(t)dt\)
【※これは「微積分学の基本定理」を用いています。唐突に t という別の変数が出てきてどういう事かと思われる方もいるかもしれませんが、これはあくまで積分での表記方法の約束です。】
次に、
\(f(x)=f(a) + \int_a^xf^{\prime}(t)dt\)
\( =f(a)-\int_a^x(x-t)^{\prime}f^{\prime}(t)dt \hspace{10pt}【∵\frac{d}{dt}(x-t)=-1】 \)
\( =f(a)-\left[(x-t)f^{\prime}(t)\right]_a^x +\int_a^x(x-t)f^{\prime}(t)dt \)

\( =f(a)+(x-a)f^{\prime}(a)-\int_a^x\left(\frac{d}{dt}\frac{(x-t)^2}{2}\right)f^{\prime}(t)dt \hspace{10pt}【∵\frac{d}{dt}(x-t)^2=-2(x-t)】 \)
\( =f(a)+(x-a)f^{\prime}(a)-\left[\frac{(x-t)^2}{2}f^{\prime}(t)\right]_a^x+\int_a^x\frac{(x-t)^2}{2}f^{\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)-\int_a^x\left(\frac{d}{dt}\frac{(x-t)^3}{3!}\right)f^{\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)-\left[\frac{(x-t)^3}{3!}f^{\prime\prime}(a)\right]+\int_a^x\left(\frac{d}{dt}\frac{(x-t)^3}{3!}\right)f^{\prime\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)+\frac{(x-a)^3}{3!}f^{\prime\prime}(a)+\int_a^x\frac{(x-t)^3}{3!}f^{\prime\prime\prime\prime}(t)dt\)
\(=\cdots\)
この操作を繰り返す事により、\(\int_a^x\frac{(x-t)^{n-1}}{(n-1)!}f^{(n)}(t)dt\)の形の剰余項(「積分型の剰余項」)を含んだ形の「テイラー公式」が成立します。【証明終り】

この剰余項は、主要な初等関数の場合は0に収束するのでテイラー展開が成立します。ただし、剰余項が収束する「x の範囲」が限定される場合もあるので、そこは注意が必要です。
e の指数関数や、三角関数については定義域の全域で剰余項は0に収束するので、定義域全域で「テイラー展開可能」です。

この他に、計算は結構面倒なのですが、逆三角関数の Mcl.展開はじつは数学的には特徴的な形になって、円周率を表す式の導出に使えたります。ただしこれは、物理等への応用ではあまり重要ではないです。

剰余項の収束問題

上記のような部分積分による方法でも他の方法でも、テイラー展開を導出すると最後のnを含んだオマケの項である「剰余項」がくっついてきます。

結論を言うと指数関数や三角関数などの初等関数においては剰余項はn→∞で0に収束するので、無限級数の形で問題なくテイラー展開・ Mcl.展開を、使う事ができます。ここでは、その事の証明を記しておきます。結構面倒な部分も含まれるので、参考までに見てください。

\(e^x,\sin x,\cos x\) の剰余項の収束問題 ■ 関数 \((1+x)^{\alpha}\) の剰余項の収束問題

\(e^x,\sin x,\cos x\) の剰余項の収束問題

上記で、理論的にはまずテイラー公式というものがあって、n→∞で剰余項が0に収束するものが「テイラー展開可能」という事でした。

e の指数関数や三角関数については、剰余項が収束する事を証明してみましょう。

証明のポイント

ポイントは、「nに関する極限」を考える事です。つまり、変数xについては極限操作としてはいじらないという事です。
極端な話、例えばx=0、x=100といった具体的な値を代入してみて、その時に剰余項がnに関してn→∞で0に収束すれば、「x=0、x=100でテイラー展開可能」という事です。
積分型の剰余項では積分区間にxが入ってますが、nに注目した場合は特定の積分区間での定積分のように考える事ができるのがポイントなのです。

前半でも触れましたように e の指数関数や三角関数はn階導関数を容易に表せます。これによってまず、剰余項のn階微分のところが具体的になります。
まず最初は、e の指数関数です。

$$e^x のテイラー公式の積分型の剰余項は:R_n(x)=\int_a^x\frac{x^{n-1}}{(n-1)!}e^tdt$$

$$注目すべきところはnに関する部分、つまり \frac{x^{n-1}}{(n-1)!}です。$$

具体的な関数の部分については各々の変数について「nに関しては定数」という扱いになり、積分も各々のxに対して有限の区間内の定積分とみなせますから、積分の中身がn→∞で0に収束すれば定積分も0に収束するのです。

$$よって、\lim_{n\to \infty}\frac{x^n}{n!}=0を示せばよく、 $$

$$それによりe^x は全実数の範囲でテイラー展開可能である事が示されます。 $$

nをじゅうぶん大きくすればおそらく0に収束する「だろう」事が予想されますが、具体的にそれを示しましょう。まずxが正の範囲の時に示します。xよりも大きいてきとうな自然数 Mを考えます。n=2Mを考えると、分母には、M+1、M+2、・・M+Mという、M個のMより大きい数が因数として含まれています。

他方、分子にあるのはMよりも小さいxという正の実数のM乗です。この時点でまず分子よりも分母が確実に大きい事が分かりますが、このn= 2Mよりもさらにnを大きくすると、nが1増えるごとに分子はxが1つ乗じられ、分母は2M+1、2M+2、・・などの数が乗じられます。つまり、nを大きくすれば、どのような小さい正の実数よりも \(\frac{x^n}{n!}\) を小さくできます。

$$x>0の時、任意の正の実数\epsilon に対し\frac{x^n}{n!}< \epsilon つまり \lim_{n\to \infty}\frac{x^n}{n!} =0 です。$$

xが負の場合も、絶対値は変わりませんから符号が入れ替わりながら0に収束します。x=0の場合は\(\frac{0^{n-1}}{(n-1)!}=0\) ですから、この場合も組み込む事ができます。

$$ よって、任意の実数xに対して\lim_{n\to \infty}\frac{x^n}{n!}=0であり、 \lim_{n\to \infty} R_n(x) =0【証明終り】 $$

三角関数の場合は、n階微分も三角関数の形ですから、絶対値は1よりも小さい事を用いて不等式を作ります。そして指数関数の時と同様の極限を考える事で剰余項がn→∞で0に収束する事になるのです。

関数 \((1+x)^{\alpha}\) の剰余項の収束問題

じつは剰余項の収束問題に関しては、e の指数関数や三角関数よりも\((1+x)^{\alpha}\)といった一見簡単な関数のほうが、証明が面倒です。
おそらく、このページの内容の中では問題としてはここが一番難しいです。
上手に不等式を使って値の大きさを評価しないと、なかなかうまくいきません。
ここでは、次の事を示します:

$$任意の実数\alpha に対して(1+x)^{\alpha} は、|x|<1ならば Mcl. 展開可能$$

「|x|<1 の範囲で、x=0のまわりでテイラー展開可能」と言っても同じです。
以下、x=0のまわりでのテイラー公式について考えます。Mcl.展開の形で「無限級数ではなく剰余項が残ったままの状態」と考えてもよいと思います。

$$ f(x)=(1+x)^{\alpha} の積分型の剰余項:R_n(x)=\int_0^x\frac{(x-t)^{n-1}}{(n-1)!}f^{(n)}(t)dt$$

$$f(x)=(1+x)^{\alpha}とすると、 f^{(n)}(t)=\alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) (1+t)^{\alpha -n} $$

積分変数(ここではt)に対する定数となる部分は、積分記号の前に持っていきましょう。

$$ R_n(x)= \frac{ \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) }{ (n-1)! } \int_a^x (x-t)^{n-1} (1+t)^{\alpha -n} dt $$

不等式をうまく使うために、2つほど、それほど難しくない関係式を示します。まず、1つ目です。

補題①

$$|x|<1 かつ 0<t<xまたは0>t>xならば\left|\frac{x-t}{1+t}\right|<|x|$$ ちょっと分かりにくいかと思いますが、xとtの正負の符号が一致して、尚かつ絶対値に関して|x|>|t| という関係のもとで成立する式です。これは、積分に関してうまく不等式を作るための式です。

★ 証明: $$0<t<xの時、\left|\frac{x-t}{1+t}\right|=\frac{x-t}{1+t}<\frac{x}{1+t}<x=|x|$$ $$0>t>xの時、\left|\frac{x-t}{1+t}\right|=\frac{-x+t}{1+t}<\frac{-x-xt}{1+t}=\frac{-x(1+t)}{1+t}=-x=|x|【証明終り】$$ 2番目のほうについては、x >-1 に―t(>0)を乗じた ―xt>tの関係を使っています。

これによって剰余項を次のように変形したうえで不等式で評価できます。

$$ R_n(x)= \frac{ \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) }{ (n-1)! } \int_a^x (x-t)^{n-1} (1+t)^{\alpha -n} dt$$

$$= \frac{ \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) }{ (n-1)! } \hspace{5pt}\int_a^x \left(\frac{x-t}{1+t}\right)^{n-1} (1+t)^{\alpha -1} dt $$

これに絶対値をつけます。不等式を作りやすくなるためです。
次の式の2段目から3段目への不等式を作るために上記の補題の結果を用いています。

$$ |R_n(x) |= \left | \frac{ \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)}{ (n-1)! } \hspace{5pt} \int_a^x \left(\frac{x-t}{1+t}\right)^{n-1} (1+t)^{\alpha -1} dt\right|$$

$$< \frac{ | \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) |}{ (n-1)! } \int_a^x \left| \frac{x-t}{1+t}\right|^{n-1} |1+t|^{\alpha -1}dt $$

$$< \frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)|}{ (n-1)! } \hspace{5pt} \int_a^x |x|^{n-1} |1+t|^{\alpha -1}dt $$

$$=\frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)|}{ (n-1)! } |x|^{n-1} \hspace{5pt} \int_a^x |1+t|^{\alpha -1}dt $$

この最後の式には積分の中身にはnが入っていませんから、nに関しては定数であると考えて(もちろん各々のxに対しては別々の値になります)、てきとうにCとおけます。絶対値を外せば積分の計算も直接できてしまいますが、ここでは「nに関して定数」である事が分かればじゅうぶんなのです。まとめると次のようになります。

$$|R_n(x)|< \frac{ |\alpha (\alpha -1)(\alpha -2)\cdots (\alpha -n+1) |}{ (n-1)! } |x|^{n-1} C$$

この不等式の右辺側をもう少し変形します。

$$\frac{ |\alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) |}{ (n-1)! } |x|^{n-1} C$$

$$=\frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) |}{ 1・2・3・4 \cdots (n-2)(n-1)} |x|^{n-1} C$$

$$< \frac{| \alpha (\alpha +1)(\alpha +2) \cdots (\alpha +n-1) |}{ 1・2・3・4 \cdots (n-2)(n-1)} |x|^{n-1} C $$

$$=|\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left (1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha |}{n-1} \right ) |x|^{n-1} C $$

ここで、先に進むにはもう1つ補題が必要です。

補題②

$$任意の実数\alpha に対して、0<r<1 ならば1+\frac{|\alpha|}{N}<\frac{1}{r} となる自然数Nが存在する$$ これは何の事かと言うと、要するに1と1よりも大きい数の間には1+εという別の数が必ずあり、大きい自然数Nで割る事でそのような小さい数εを作れる事を、式で表しただけです。

★ 証明: $$1<\frac{1}{r} であり、1<1+\epsilon <\frac{1}{r}を満たす正の実数\epsilon が必ず存在する。$$ $$任意の実数\alpha に対して0<\frac{|\alpha|}{N}<\epsilon となる(十分大きい)自然数Nは存在できる。$$ $$よって、 1+\frac{|\alpha|}{N}<1+\epsilon <\frac{1}{r}となる自然数Nが存在する。【証明終り】$$

これによって、さらに別の不等式で評価ができます。0<|x|<r<1を満たすてきとうな実数 r を想定します。

$$1+\frac{|\alpha|}{N}<\frac{1}{r} となる自然数Nが存在し、n≧N ならば 1+\frac{|\alpha|}{n}<\frac{1}{r}でもある。$$

$$n≧N の時、R_n(x)<|\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left (1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha |}{N} \right ) \cdots \left (1+\frac{| \alpha |}{n-1} \right ) |x|^{n-1} C$$

$$< |\alpha|\left(1+\frac{| \alpha |}{1} \right) \left (1+\frac{| \alpha |}{2} \right ) \left(1+\frac{| \alpha |}{3} \right) \cdots \left(1+\frac{| \alpha |}{N-1} \right) |x| ^{N-1} \left(\frac{ |x| }{r}\right)^{n-N-1} C $$

この不等式評価は、ある自然数Nについて、N-1までの項はそのままにして、N以降の項は1/rよりも小さいとしているのです。

ここで、N-1までの項の積は、nに関して定数である事に注意します。

$$つまり、 |\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left ( 1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha|}{N-1} \right ) |x| ^{N-1} =K(nに関して定数)とおけます。$$

$$よって、|R_n(x)|<KC \left(\frac{ |x| }{r}\right)^{n-N-1}で、 \frac{ |x| }{r}<1 ですから、$$

$$\lim_{n\to \infty} \left(\frac{ |x| }{r}\right)^{n-N-1} =0, 従って \lim_{n\to \infty} |R_n(x)| =0 $$

よって、n→∞で剰余項が0に収束するので |x|<1の時 、x=0においてテイラー展開可能(つまり Mcl. 展開可能)です。【証明終り】

\((1+x)^{\alpha}\) の剰余項が|x|≧1の範囲では収束しない事

★尚、x≧1の時は剰余項が収束しない事については、少し遠回りですが、次のように考えます。
|x|<1 の時にマクローリン展開が可能であるわけですが、このように整級数の形で無限級数展開できた場合、じつは収束半径を計算する公式を使う事ができるのです。 $$公式:\sum_{n=0}^{\infty}a_nx^nの収束半径を\rho とすると、\frac{1}{\rho}=\lim_{n\to \infty}\left|\frac{a_n}{a_{n-1}}\right|$$ 【ただし、公式を適用できる条件があり、この極限が収束するか+∞に発散する場合に限ります。】
その公式を使うと、収束半径は1であるという結果が出ます。 整級数は収束半径未満のxの範囲で収束します。従って、x≧1の範囲でMcl.展開できたとすると、その形の収束半径が1である事に矛盾してしまうので|x|≧1でn→∞において剰余項が0に収束する事はあり得ない、というわけです。
注意すべきは、であるからといって|x|<1で剰余項が0に収束する事が直ちに示されるか?というとそうではないという事です。 |x|<1で関数をMcl.展開の形の整級数で表せるかどうかは、面倒ですが例えば上記のような方法でその範囲で確かに剰余項が0に収束する事を証明する必要があるのです。

このように\((1+x)^{\alpha}\)の形の多項式に関するMcl.展開可能性の理論は、厳密に見ると意外に細かくて面倒ですが、これによって一般2項定理が成立する事が確かに分かります。
また、物理等でも平方根や分数の形を無限級数の形にして(多くの場合3次以降等の高次項は0とみなして)理論を分析する事がよくありますが、そこで使われるのがMcl.展開です。平方根は「1/2乗」、分数は「-1乗」でもあるので、そのような事ができるのです。

解析学での極限値の定義

今回は、極限について、より数学的に考えた場合にはどのような定義になるのかといった事を紹介します。じつはこのページで語られる内容が、大学の学部での一般的な解析学・微積分学で最初に教えられるものです。そのため、今回の内容は数学科で教わるような「解析学の初歩」をかなり分かりやすく説明した内容にもなっています。その内容を見てみましょう。

解析学的な極限の厳密な定義は?

数列の極限の定義とε-N論法  ■ 実数の性質 有理数にない性質は? ■ 有界性と上界 下界 上限 下限 

数列の極限の定義とε-N論法

解析学での極限の理論は、数列の極限が初歩的で基本的内容となるので、まずそれを述べましょう。
\(\frac{1}{n},\frac{1}{n^2}\)といった数列は、限りなく0に近づきます。
この事について、極限値である0を基準にして考えた時、0を含む任意の区間(普通、開区間を考えます)内にある番号以降の数列がおさまる事を意味するのです。

「任意の区間」とは、「任意の『小さな』区間」を想定しています。
例えば、( -0.001 , 0.001 ) のような開区間です。数列1/nであれば、n=1001以上であれば、全てこの小さな区間内に入るわけです。
数列の、ある番号以上の「全ての」要素を考える理由は、「振動」の可能性を除くためです。振動してしまう場合は、収束では無く発散の部類に区分します。

この時、別の ( -0.0001 , 0.0001 ) のような、さらに小さい開区間を考えると、n=10001 以上でなければ要件を満たしません。そのため、数学的には次のように考えます。

  • まず、値cを含む開区間 U を考え、ある番号以上では全てそこに含まれるとする
  • どんな小さな開区間 U を考えても、対応する番号 N が存在するとする(これを、「任意の開区間Uに対し、ある自然数Nが存在する」などと表現します)
  • そのような条件を満たす時、数列はn→∞で「極限値cを持つ」と呼ぶ事にする(定義する)
数学的な極限値の定義≪数列≫①

$$\lim_{n\to \infty}A_n=c $$ $$\Leftrightarrow c を含む任意の開区間 U に対してn ≧ N_0 ならば A_n\in U となる自然数 N_0 が存在する$$

★ この小さな開区間の事を、「近傍」(英:neighborhood)とも言います。

極限の定義
「どんなに小さい」という表現を、「任意の」という言葉で数学では表現します。極限の定義としては「小さい」という事が意味としては重要ですが、大きい区間であっても当てはまる事から、「小さい」という言葉を添えるのは補助的な説明のためです。「任意」と言う時点で、大きいものも小さいものも全て含まれます。
参考

日本語の場合、「どんな実数でも」という事を「任意の実数に対して」という、少々難しい言い回しで表現する習慣があります。これに対して、じつは英語の場合では、日常で使う言葉をそのまま使う習慣があります。
「任意の実数 R に対して」を英語で言うと、for all real numbers R となります。
every や each を使っても表現されます。for each real number R 等。意味するものは大体同じです。

多くの微積分学・解析学の教科書では、同じ内容を不等式で書く事も多いです。その場合、「任意の正の(小さい)実数」をギリシャ文字の「イプシロン」ε で表すのが通例です。

数学的な極限値の定義≪数列≫②

$$\lim_{n\to \infty}A_n=c $$ $$\Leftrightarrow 任意の正の実数\epsilon に対してn ≧ N_0 ならば |A_n – c| < \epsilon となる自然数 N_0 が存在する$$

★ これは、極限値と数列の差が「限りなく小さくなる」=「どんな小さい正の実数cよりも小さくできる」・・と、捉えているわけです。
この方法による定義を、慣習的に 「イプシロン・エヌ論法」と呼んだり、後述しますように関数の場合には別の正の実数デルタ δ を考える事から「イプシロン・デルタ論法」と呼んだりします。

これらの定義は、分かりにくい事で悪名高いものでもあります。(意味としては難しくないのですが。)
実際、物理などで関数等の極限を考える時は、これらの定義はあまり重要でない事も多いです。
例えば、1/n や 1/x などの数列や関数は、直感的に捉えても上記の定義を使っても結局「極限値は0」という結果は同じなのです。そのため、同じ結果を得るのであればよりシンプルな考え方をすべきだ・・とも、言えるわけです。

数学的に厳密に考える利点があるのは、収束するのか発散するのかすごく微妙で、直感的には判定しがたいという場合です。そのような場合は、物理や工学などでの応用よりも、純粋数学的な議論において多いと思われます。

実数の性質 有理数にない性質は?

次に、極限に関する基礎的な理論を下支えするものとして、実数が持つ性質が重要です。実数とは有理数に無理数を合わせたものですが、無理数とは「実数のうち有理数でないもの」・・などと説明されますから、これでは実数とは何なのか?という事の説明としては不足するものがあります。

結論を言うと、次の有理数の性質は、実数も共有するものです。

有理数が持つ性質
  • +-÷× の四則演算などが定義できる(より正確には「体」(field) であるという事)
  • 「順序構造」がある・・異なる2つの要素を選んだ時、p < q または p > q が必ず成立する。

★ これは、実数も備えている性質であるわけです。実数とは全ての有理数を含んだ集合ですから、有理数が持つ性質は実数も全て備えていなければならない、とも言えます。

では実数にしかない性質は何だろう?と考えると、次の「切断」(Schnitt これはドイツ語由来です)と呼ばれる、部分集合の分け方において成立する事が、じつは有理数と異なるのです。
「切断」とは、ごく簡単に言うと1箇所だけ境を決めて、1つの集合を2つの部分集合に分けるという操作です。例えば実数全体を「0以上」と「0未満」に分ける事は「切断」に該当します。(必ずしもその集合に属する「1点」で分けない場合も含みます。)

「切断」の定義

順序構造を持つ集合Mと、M のある要素 c について、次の条件を満たす部分集合AとBに分割する事を「Mのcにおける『切断』」と呼ぶ: $$①A\cup B=M\hspace{10pt}②A\cap B=\phi\hspace{10pt}③任意のa\in A,b\in Bに対してa<b $$

部分集合AとBの役割は入れ替えても同じです。
要するに、このような2つの部分集合を考えるという事を意味しています。

実数の「切断」に関する性質:(「完備性」)

\(\mathbb{R}\)のcにおける切断によってできる部分集合AとBにおいては次の事が必ず成立する: $$「Aの最大値」と「Bの最小値」のどちらかだけが存在し$$ $$「Aの最大値 と B の最小値も両方存在しない」という事は起こらない$$

★ 尚、どんな集合の切断でも「A の最大値と B の最小値も両方する」という事は起こりません。
これを仮定すると、矛盾が生じるためです。

有理数の場合、じつは有理数全体における「切断」を考えた時には、切断で作った部分集合AとBについて「A の最大値 と B の最小値も両方しない」という事が起こります。

これを見るには、例えば \(q^2<2\) と \(q^2>2\) を満たす2つの部分集合に有理数を分けます。これはじつはきちんと「切断」に該当するのです。ところが \(q^2=2\) を満たす有理数は存在しませんから、これらの部分集合に最大値も最小値も存在しないという事です。
それに対して、これが実数の切断であれば \(r^2=2\) を満たす \(r=\sqrt{2}\) が存在しますからどちらかの部分集合に最大値か最小値が存在できるわけです。

有界性と上界、下界、上限、下限

さて、次に実数の中の部分集合(具体的には数列や関数)に対する、極限に関連する用語で重要なものを見ていきます。
これらも、意味としては簡単です。
ただし、記号などでごちゃごちゃ書かれると分かりにくいですから、意味を理解する事が重要です。

定義:「有界」である事

実数の部分集合Aとその要素 a について、 Aが「上に有界である」事と「下に有界である」事を次のように定義します。

  • 上に有界である:
    \(任意のa\in A について a < c となる実数 c が存在する\)
  • 下に有界である:
    \(任意のa\in A について a > c となる実数 c が存在する\)

「上」「下」「有界」という語が入っていれば、多少の文章での使い方は変えてもよい習慣になっています。例えば「上に有界なので・・」のように使えます。
意味としては全く難しくなくて、例えば数列1/nは必ず0より大きいので「下に有界」です。また、nが自然数であれば最大値は1ですから「上にも有界」です。これが関数1/xでxが正の実数であれば、「下には有界」であるけれどx→0で無限大に発散するので「上には有界でない」事になります。

次に、上界と下界です。これらはそれぞれ、上に有界である集合、下に有界である集合について考えられます。要するに、数列や関数よりも「必ず大きくなる集合」と「必ず小さくなる」集合です。

定義:上界と下界

実数の部分集合が上または下に有界である時、
集合「上界」と「下界」を次のように定義します。

  • 上界:\(U={c|任意のa\in A について a ≦ c}\)
  • 下界:\(V={c|任意のa\in A について a ≧ c}\)

【{x|・・・}は、「・・・を満たすxから成る集合」の意味】
上界は「じょうかい」、下界は「かかい」と読みます。UとかVの記号は、何でも構いません。
数列1/nは0より大きい事によって下に有界であると言えるわけですが、-1よりも必ず大きいので下に有界であると言ってもよいのです。
そのような、必ず1/nより小さくなる実数の集合が1/nの下界であり、「0以下の全ての実数」という集合を指すわけです。

定義の説明としては最後に、上限と下限を見てみましょう。これらも意味としては簡単で、それぞれ「上界の最小値」「下界の最大値」という意味で使います。

定義:上限と下限

有界である実数の部分集合 A の上界 U と下界 V に対して、
上限(supremum)下限(infimum)を次のように定義します。

  • 上限:\(\sup A=\mathrm{min} U\)(Aの上界 U の最小値)
  • 下限:\(\inf A=\mathrm{Max} V\)(Aの上界 V の最小値)

上界または下界の要素は無限個ありますが、特にそれぞれの最小値と最大値に注目するわけです。対象となる集合が数列であれば、$$\sup A_n,\inf A_n といった表記もなされます。$$

さてここで、上界が存在するなら上限は必ず存在し、下界が存在するなら下限は必ず存在するという事実があります。特に名前はついていない定理ですが、重要なので述べておきましょう。

定理:上限と下限の存在

有界である実数の部分集合 A に対して、 上界 U と下界 V に対して、

  • A の上界Uが存在するならばAの上限:\(\sup A=\mathrm{min} U\)も存在する。
  • A の下界Vが存在するならばAの下限:\(\sup A=\mathrm{Max} V\)も存在する。

上界または下界の要素は無限個ありますが、特にそれぞれの最小値と最大値に注目するわけです。

上界と上限
下界と下限の関係なども同様です。
円周率や、自然対数の底 e はこの理屈によって、上限として「存在する」事が証明されます。
他方で、円周率が3.141・・である事や e = 2.718・・である事は、直接的に数列の値を計算したり、無限級数展開を利用したりして示す必要があります。

これは自明な事ではないので証明が一応必要です。実数の完備性を用いる事で確かに成立する事を示せます。参考までに、記しておきます。

証明:上界には最小値が存在し、下界には最大値が存在する

Aの上界Uと、実数のうちAの上界でない集合\(\bar{U}\)は実数全体の「切断」になっている事に注目します。
実数全体に対する切断なので、Uと\(\bar{U}\)のどちらか片方「だけ」に必ず最小値あるいは最大値が存在します。
しかし、上界の定義から、\(\bar{U}\) の任意の要素 c に対して、必ず c < a となるAの要素 a が存在します。【上界の定義の否定を考えるわけです。】
となると、そのような c と a の間には必ず別の実数が存在し、(例えば\(\frac{c+a}{2}\))、その実数は\(\bar{U}\) の要素です。これは、\(\bar{U}\) の任意の要素 \(c_1\) に対して、\(c_1<c_2\)となる別の要素 \(c_2\) が存在するという事なので、\(\bar{U}\) には最大値は存在しません。
よって、もうひとつのほうの「Uに最小値が存在する」事が真という事になるので、上界には必ず最小値・すなわち上限が存在します。【証明終り】
下界に対して下限が存在する事の証明も、全く同じ論法によります。

解析学の基本的な定理:有界な単調数列は収束列である

数列や関数が特定の極限において収束するのか発散するのかを調べて理論を形成する事が、解析学では行われます。その1つとして、「有界である単調数列は収束列である」という事実(「定理」)は重要ですので見ておきましょう。単調数列とは単調増加あるいは単調減少数列という事です。収束列とは、単純に「収束する数列」という意味です。この時、もちろん上に有界である数列が収束する条件(の1つ)は単調増加である事、という意味です。

円周率や自然対数の底といった重要な定数が極限値として存在する事の根拠は、この定理です。

証明の流れと概要 
定理の証明:上限あるいは下限が極限値となる事を示す 
具体的な「有界な単調数列」にはどんなものがある? 

証明の流れと概要

まず、証明の流れを見ておきましょう。有界には上に有界と下に有界である場合(あるいは両方)がありますから、それぞれの場合に分けます。

  • 上に有界である単調増加数列
  • 下に有界である単調減少数列

証明の方法は全く同じなので、片方だけ示せばもう片方も全く同じように証明できます。ここでは、上に有界な単調増加数列の場合を考えます。

  1. 数列が上に有界であるから、上限(最小の上界)が存在する事実を確認
  2. 上限を含む任意の(小さな)開区間\(U_{\epsilon}\)を考える
  3. 少なくとも1つ、数列の要素がその開区間内に含まれる事を示す
  4. 単調増加関数である条件を適用すると、数列の上限が極限値の定義を満たす事が分かるので、これが極限値であると判定。→ 証明完了

要するに、上に有界である場合は「上限」が必ず存在するわけですが、その上限が数列の極限値に(必ず)なる、という事です。その詳しい証明を次に見ましょう。これはそれほど難しい証明ではなく、事実関係や極限の定義を丁寧に整理すれば「確かにそうである」事が言えるというものです。

★ 尚、数列とは、厳密にはそれ自体は集合よりもむしろ関数として考えるべきもので、集合として考える時は「そのような関数の値からなる集合」を考える必要が本来はあります。そのような厳密な区分が重要である場合もあります。
しかし、それは表記として少々煩雑でもあるので、数列{\(A_n\)} における具体的な \(A_1, A_2 \) などをここでは「数列の要素」と記す事にします。

定理の証明:上限あるいは下限が極限値となる事を示す

まず、単調増加数列が上に有界である時、それがどんな数列であろうともn→∞で収束する事を証明しましょう。上に有界という条件ですから、まず無限大に発散はしない事は明らかですが、明確に「極限値」が存在するかどうかが曖昧なので明確にしようというわけです。

前述のように、上に有界であれば上限すなわち「上界の最小値」が必ず存在します。結論は、この上限が数列の極限値という事になります。

$$\sup A_n=c とおくと任意の自然数nに対してA_n<c$$

ここで、このページの最初のほうでも述べた、極限値の定義を考えましょう。この場合は、不等式も使ったほうが簡単です。任意の小さい正の実数εを考え、区間 \(U_\epsilon =( c -\epsilon ,\hspace{5pt}c ] \)を考えます。
【※c -ε 側は開区間、c側は閉区間という事です。(c -ε ,c + ε) を考えても別に構いません。ここでの場合は単純に、cより大きい範囲は考える必要はないというだけです。】

この時、区間 \(U_\epsilon =( c -\epsilon ,c ] \) 内に数列の要素が含まれないという事はあり得ないのです。なぜなら、もしそのような事が起こるなら任意の自然数nに対して \(A_n ≦ c -\epsilon\) という事になり\(c -\epsilon\)も上界の1つという事になりますが、cが「最小の」上界なのですからそれはあり得ない、という事です。
【ここの部分に関しては、そのように仮定すると矛盾するから、という背理法の論法でも同じです。】

すると、少なくともある1つのn=Nについて、 \(A_N\in U_\epsilon( c -\epsilon ,c ] \) という事は言えるわけです。
ここで、\(A_n\) は単調増加数列という条件であれば、
任意のn≧Nを満たす自然数について、 \(A_n\in U_\epsilon( c -\epsilon ,c ] \) という事になります。
【c は上界の1つですから、nをどれだけ大きくしてもcを超える事はありません。】

さて、これで一体何が言えたのかと言うと、
「cは\(A_n\) 極限値の定義の条件としてぴったり当てはまる」事が言えたのです。
つまり \(A_n\) はn→∞で極限値cを持つ事が証明された、という事になるのです。
【証明終り】

このように、定義や事実関係を丁寧に当てはめていく事でこの定理は証明されます。下に有界である単調減少数列も、全く同様に下限を極限値として持つ事を証明できます。

具体的な「有界な単調数列」にはどんなものがある?

では、有界な単調数列とは具体的にはどんなものがあるでしょう。抽象的には表せるけれども具体例が全く見つからない・・というのでは、純粋数学的にもあまり有意義とは言えません。具体的には、1/nなどのごく簡単な数列は下に有界で単調減少である数列の1つです。この他にも、有界な単調数列というのは少し考えれば具体的にたくさん見つかるのです。

問題はむしろ、特定の数列が「有界な単調数列」かどうかの判定が分かりにくい場合でしょう。

$$例えば、\left(1+\frac{1}{n}\right)^n \hspace{5pt}や \hspace{5pt} \sum_{j=1}^n\frac{1}{n}-\ln n \hspace{5pt} などの数列です。$$

これらは、見た目では有界なのかも単調数列なのかも、ちょっと分かりにくいですね。結論を言うとこれらはどちらも有界な単調数列であり、それぞれ極限値を持ち e(自然対数の底、ネピア定数), γ(ガンマ、オイラー定数) で表される事が普通です。

円周率も、特定の数列の極限値です。この場合、円に内接および外接する正n角形の周の長さを数列として表した時に有界な単調数列になります。半径が1の円の円周の長さが円周率の2倍になります。【極限値が存在する事が分かれば定数倍に関しては調整できるので、円周率に関してはそのように定義しておくという事です。】

実関数の場合の極限と連続の定義

最後に、変数が実数である一般の関数(実関数)の場合の極限の定義なども整理しておきます。数列の場合は、言わば「変数が自然数」であるわけです。変数が実数になる事で、極限の定義なども1つ2つ文言が増えますが、基本的な考え方は同じです。

関数の場合の極限の定義: ε-δ論法 ■ 関数が連続であることの定義 ■ 微分と関数の連続性の関係 

関数の場合の極限の定義: ε-δ論法

まず、極限値となる値を含む任意の開区間を考える点は、数列の時と全く同じです。異なるところは、数列の場合において「n≧Nとなる任意のnについて」の箇所で、これを関数の場合にはどうするかという事が、問題になります。これに対しては、変数を無限大にする時と、特定の値に近づける時とで2つ定義を設けます。(本質的な意味は同じです。)

  • 変数を無限大にする時の関数の極限:\(\lim_{x\to \infty}f(x)\)
  • 変数を有限の値に近づける時の関数の極限:\(\lim_{x\to a}f(x)\)

数列の場合はn=1が変数の最小値ですが、関数の場合は x → 0 の時の極限なども考える事ができる、という事です。

関数の極限の定義①:変数を無限大にする時

この場合は数列の極限と大体同じ考え方です。ある値を含む任意の(小さな)開区間に、ある値以上の任意の変数に対する関数の値が全て含まれる事を定義にします。 $$\lim_{x\to \infty}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x ≧\delta ならばf(x)\in U となる実数\delta が存在する$$ この場合、無限大∞は正の方向の無限大であり、それを明確にする場合は +∞ とも書きます。実関数の場合、変数をマイナスのほうの無限大にした時の極限も考えます。考え方は同じです。 $$\lim_{x\to -\infty}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x ≦\delta ならばf(x)\in U となる実数\delta が存在する$$ 数列の時と同様、「任意の開区間」の部分を(小さな)正の実数\(\epsilon\) を用いた不等式を使っても同じ事です。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow 任意の正の実数\epsilon に対しx ≧\delta ならば|f(x)-c|<\epsilon となる実数\delta が存在する$$

関数の極限の定義②:変数を有限の値に近づける時 この場合、極限値cと、変数を近づける対象の値 a の両方に対して小さな開区間を考えます。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x \in V_{\delta} ならば f(x)\in U となる a を含む開区間V_{\delta} が存在する$$ 不等式で記す場合は、関数側と変数側で2つの正の実数\(\epsilonと\delta\) を用意します。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow 任意の正の実数\epsilon に対し、「|x-a|<\delta ならば|f(x)-c|<\epsilon となる」正の実数\delta が存在する$$

特定の有限の値に変数を近づける場合、対象が変な関数だと変数を「a より大きい側から近づけた時」と「 a より小さい側から近づけた時」に、極限値が異なる場合があります。そのような事があるので、解析学で厳密な考察をする場合は両者の極限を区別し、両者が一致する場合にその極限での「極限値」が存在すると呼ぶ事にしています。

尚、もし「右極限」と「左極限」の値が異なる場合には上記の という条件は満たされないのです。

$$「c を含む任意の開区間 U に対して、x \in V_{\delta} ならば f(x)\in U となる a を含む開区間V_{\delta} が『存在できない』」$$

それは、a を含む開区間の中で a よりも「大きい側」と「小さい側」とで、関数が別々の \(c_1 と c_2\) という値を含む開区間に含まれる事になってしまうからです。
参考までに、右極限と左極限が存在するけれども異なる値になる場合は上記の関数の極限の定義に当てはまらず、「極限値が存在しない」判定になる事を、一応式でも記しておきましょう。

関数の「右極限」と「左極限」 $$①右極限:\lim_{x\to +a}f(x)=c_1$$ $$\Leftrightarrow c_1 を含む任意の開区間 U_1 に対して、x\in [a, a+\delta_1)ならばf(x)\in U_1となる正の実数\delta_1が存在する $$ $$②左極限:\lim_{x\to -a}f(x)=c_2$$ $$\Leftrightarrow c_2 を含む任意の開区間 U_2 に対して、x\in (a-\delta_2,a]ならばf(x)\in U_2となる正の実数\delta_2が存在する $$ $$\lim_{x\to +a}f(x)=\lim_{x\to -a}f(x)=cならば、cを含む任意の開区間Uに対して$$ $$x\in (a-\delta_2,a+\delta_1)ならばf(x)\in U となるので\lim_{x\to a}f(x)は存在する。$$ 逆に右極限と左極限が異なる値であれば、上記のような定義の意味での極限値は存在できないのです。
2つの開区間\(U_1とU_2\)が共通部分を持たないように区間の幅を小さく取った時、a を含む開区間をどのようにとっても\(x\in U_1\) になる部分と\(x\notin U_1\) となる部分に分かれてしまいます。

  • \(x\in U_1 になる部分:[a, a+\delta_1)\)
  • \(x\notin U_1 となる部分:(a-\delta_1,a]\)
$$よって、\lim_{x\to +a}f(x)≠\lim_{x\to -a}f(x)であれば、「\lim_{x\to a}f(x)が存在する要件を満たさない。」$$

関数が連続であることの定義

関数が連続である事の定義も、極限の定義の延長線上にあります。三角関数や指数関数などの初等関数は連続関数です。
連続性の厳密な数学的定義は、物理などへの数学の応用ではそれほど重要ではないと思います。ただし、数学の解析学・微積分学の中では重要な基礎理論になりますので、考え方だけは見ておきましょう。

関数が「連続」である事の定義

関数の定義域内の実数(の点) a において関数が連続であるとは、次の条件を満たす事を言います: $$f(a)=\lim_{x\to a}f(x)$$ これは、1次関数、2次関数、三角関数、指数関数・・などの初等関数を単独で考える場合は「当然」の事なので、それほど重要とは言えないかもしれません。
数学の理論上、多くの場合に問題となるのは、次のような変な関数です:

  • 例①:「\(x=0 のときf(x)=0,x≠0 の時 f(x)=\sqrt{|x|}\sin \frac{1}{x}\)」という f(x)
  • 例②:「\(x=0 のときf(x)=0,x≠0 の時 f(x)=\sin \frac{1}{x}\)」という f(x)
これらに関して、x=0 の連続性を考える時、じつは①は連続で、②は不連続(連続でない)なのです。
このように、初等関数での感覚で言う「つながっている」事が必ずしも不明確でない関数を考える場合には数学的な定義を決めておく事は重要にもなるのです。(こういった関数が物理などへの応用で使えるかどうかは、また別の問題になります。)

関数が連続であるかどうかという事は、関数自体の性質を探求する事以外に、微分の理論においても重要な位置付けにあります。ある点で微分可能であるかどうかと関数の連続性が深く関わるからです。

参考:定義域の完備性、関数の連続性と一様連続性

普通は、関数の定義域(変数が取り得る値の範囲)を、実数全体であるとか、特定の閉区間や開区間を想定します。このような定義域は、実数全体の性質と同じく、「完備性」を持っていると呼びます。上記の説明においても、それを前提にしています。
他方で、あくまで理論上の話ですが、定義域として「無理数全体」などという無茶苦茶なものを考える事も数学上は可能なのです。これは、数直線上で言うとボコボコの「穴だらけ」の定義域です。
しかし、そのような滅茶苦茶な定義域上の関数でも、適当な関数を用意すれば上記の連続性の定義に当てはめて「『定義域上の』任意の点で連続である」という判定になってしまう事が知られています。
例えば、次のような簡単な関数を考えればじつはじゅうぶんです。

  • x>0の時 f(x)=1
  • x<0の時 f(x)=0
  • 定義域は、無理数全体

事の本質は、じつのところ「本来は不連続点と言うべき点を、定義域から除外さえしてしまえば不連続な点はない事になる」・・というところにあります。
より簡単な例では、1/xという関数でx=0で不連続「のはず」ですが、そもそもx=0を定義域から除外しておけば「不連続点はない」という、おかしな事になるといったものです。
これを解消するためには、「一様連続」というものを定義します。一様連続性の定義は次のようなものです。 $$任意の正の実数\epsilon に対し、定義域内で|x-y|<\delta を満たす『任意の2点』x,y に対して$$ $$|f(x)-f(y)|<\epsilon となるような、正の実数\delta が存在する。$$ この一様連続性の考え方は、微積分の理論でも使用する事があります。

微分と関数の連続性の関係

さて、微分や積分も極限の一種です。ここでは、微分について考察してみましょう。初等関数の微分を考える時は、前述の厳密な極限の定義を考える事よりも、上手な式変形をして明らかに極限値が分かるようにする事のほうが重要である場合が多いです。

他方で、変な関数も含めた一般の関数を数学的に考える場合は、どのような場合に微分が可能で、どのような場合に微分が不可能なのか?といった事を明確にしておくことも、理論的な位置付けとして重要なのです。

結論を言うと、定義域内での特定の点での微分可能性と連続性については、次の関係があります:

  • ある点で微分可能ならば、連続でもある
  • ある点で連続であっても、微分不可能な場合がある

「連続であっても、微分不可能な場合」とはどういう事かと言いますと、一番簡単な例は f(x) = |x| という関数です。これは、グラフで見るとx=0の点で「尖っている」関数です。このように、ある点で必ずしも「なめらかでない」場合でも、つながっていれば「連続である」という判定になります。(もちろん厳密には上記の定義に当てはまるか、式を使って判定します。)

しかし、 f(x) = |x| のx=0における状況を見ると、微分係数とは「傾き」であったはずですが、x=0では傾き+1と-1のどちらを採用するのかという話になります。このような場合、その点では「微分不可能」という判定をするのです。そのため、「関数 f(x) = |x| はx=0 で連続であるが微分不可能である」という事です。尚、「x≠0の任意の点で、 関数 f(x) = |x| は『連続であり微分も可能』 」です。

連続である事と微分可能である事は密接に関係していますが、
全く同じ事ではないので注意が必要な事もあります。

前述の極限と連続性の定義から考えると、 f(x) = |x| の微分係数はx=0 において、

$$右極限\lim_{h\to +0}\frac{f(x+h)-f(x)}{h}と左極限 \lim_{h\to -0}\frac{f(x+h)-f(x)}{h} は共に存在するが値は異なる$$

というパターンに該当します。
\(右極限\lim_{h\to +0}\frac{f(x+h)-f(x)}{h}=+1, 左極限 \lim_{h\to -0}\frac{f(x+h)-f(x)}{h} =-1\) で、異なる値というわけです。
そのため、極限値として厳密に定義に当てはめた場合、極限値としての微分係数も存在しない、という判定になります。

$$ f(x) = |x| の時、極限値としてのx=0での微分係数\lim_{h\to 0}\frac{f(x+h)-f(x)}{h}は存在しない。 $$

つまり、直感的に考えて「傾きが一意的に定まらない」という事と、数学的に考えて極限値が存在しないという判定になる事は、一応調和しているわけです。

このような場合以外に、関数自体が無限大に発散する点においても、微分係数も無限大に発散し、微分不可能という判定にします。そのような点では、関数は「不連続かつ微分も不可能」という事になります。
尚、一応これは「微分可能ならば連続である」という事実の対偶命題を考える事により「不連続ならば微分不可能」と言う事もできます。不連続点では、どのような場合でも微分不可能というわけです。

今回お話した内容は、上記でも少し触れましたように、物理等への応用よりも、純粋数学的な内容の基礎事項という側面が強いです。ただし、有界な単調数列は収束列であるといった事は、円周率や自然対数の底といった重要な定数の極限値としての存在の根拠でもあり、これらの定数は物理や工学でも使用しますから、大まかな事は知っておいてよいのではないかと思います。

参考文献・参考資料


微分積分学〈1〉1変数の微分積分