特性方程式による微分方程式の解法

今回は「特性方程式」という多項方程式を解く事で、
特定の種類の微分方程式の解を得る手法について述べます。

★この記事は大学数学の微積分学入門の9回目です。

この方法で解けるのは「定数係数」で「線型」の「常微分」の微分方程式です。
「1階微分=ゼロ」「2階微分」=ゼロ」といった簡単に解ける微分方程式はその仲間です。それらの解法の延長線上・発展事項として今回の内容があります。n階の定数係数の線型常微分方程式の数学的な一般的解法を、この記事では詳しく見ていく事になります。

式が少し込み入る計算も含みますが、今回の内容で必要な公式は微積分の基本公式だけです。一部、複素関数論や代数学の話も含まれますが、そこは参考までに眺めるだけでも差し支えない箇所です。

「定数係数の線型常微分方程式」・・というのは名称が長いので、今回の記事の内容に限っては「常微分」であることや「線型」である事は前提として、単に「微分方程式」と記す事もあります。

今回扱うのは、一般のn階の「定数係数」の「線型」常微分方程式です。 (その中でもさらに「斉次」 のものです。ただし、非斉次のものも変形して斉次として扱える場合があります。)

「特性方程式」とは?

n階の定数係数の線型常微分方程式について、それぞれの階数の微分の部分に定数係数がくっついているわけですが、この時に次の対応を考えます:

$$n階微分の項に対する定数係数c_n \hspace{10pt} → \hspace{10pt} c_nx^n【定数項はそのまま定数項に対応】$$

この対応で作る多項方程式を、 定数係数の線型常微分方程式の特性方程式と言います。

具体的な3次の例で見てみますと、次のようになります。

$$微分方程式:y^{\prime \prime \prime }+3y^{ \prime \prime }-2y^{\prime }+1=0$$

$$対応する特性方程式:x^3+3x^2-2x+1=0$$

一般のn次の特性方程式は次のようになります。

n次の特性方程式

次のような
$$\frac{d^n}{dx^n}f(x)+c_{n-1}\frac{d^{n-1}}{dx^{n-1}}f(x)+\cdots+c_2\frac{d^2}{dx^2}f(x)+c_1\frac{d}{dx}f(x)+c_0f(x)=0$$
というn階の定数係数の線形常微分方程式に対して、
微分方程式で使われている定数係数\(c_1,c_2,\cdots\)を用いたn次方程式

$$x^n+c_{n-1}x^{n-1}+c_{n-2}x^{n-2}+\cdots+c_3x^3+c_2x^2+c_1x+c_0=0$$
の事を、その微分方程式に対する特性方程式(characteristic equation)と言います。
特性方程式の解の事を「特性根」と言う事もあります。

このように具体例で見たほうが分かりやすいかもしれませんね。

このように、作り方自体は簡単です。じつは特性方程式の「解」が、微分方程式のほうの解に直接関係します。根底にあるのは、自然対数の底 e の指数関数の微分演算です。微分して得る導関数が元の関数と同じであり、合成関数の微分を利用すると「元の関数×定数倍」という形を作れます。このパーツを上手に利用する事で、一般的には特性方程式とその解を計算すればよい、という理論になるのです。

用いる微積分の基本公式は、自然対数の底 e の指数関数と合成関数の微分公式です。それと積の微分公式も使用します。

対象の関数微分公式微分方程式の解法での役割
自然対数の底 e の指数関数\({\large \frac{d}{dx}e^x=e^x}\)微分すると元の関数に戻る
合成関数の微分\({\large \frac{df(y)}{dx}=\frac{df(y)}{dy}\frac{dy(x)}{dx}}\)微分方程式内の定数倍などを調整
積の形の微分\({\large \frac{d}{dx}(fg)=\frac{df}{dx}g+\frac{dg}{dx}f\frac{dy(x)}{dx}}\)このページで解説する証明で使ったりします。
  • 微分してない、もとの関数:\(e^{\alpha x}\)
  • 微分1回目:\(\frac{d}{dx}e^{\alpha x}=\alpha e^{\alpha x}\)
  • 微分2回目:\(\frac{d^2}{dx^2}e^{\alpha x}=\alpha^2 e^{\alpha x}\)

2階の場合の定数係数の微分方程式と、2次の特性方程式の関係が一般のn次の場合の解法の基本になりますので次に詳しく解法を見ます。

これは2次の特性方程式(多項方程式としては2次方程式)が異なる2つの実数解を持つ場合ですね。ただし、特性方程式が重解や複素数解を持つ場合でも、e の指数関数が重要である点には変わりありません。

2次の特性方程式が複素数解を持つ場合

2次の特性方程式が「異なる2つの実解」を持つ場合は、自然対数の底 e の指数関数を用いればよい事を、
以前の記事で詳しく述べてあります。

「じゃあ、そうでない場合はどうするのですか。」

まず、解が複素数解(虚数単位 i を含む解)である場合を述べます。この場合のほうがじつは比較的簡単です。解の表現としては虚数単位 i を含む形と、含まない形の両方で表現可能です。任意定数として複素数も許容されるとする事によって、定数をてきとうに調整すれば両者は同等になります。2つの形を両方記しておきましょう。

2次の特性方程式が複素数解である場合の微分方程式の解 2次の特性方程式の解が \(x=A+Bi\) である時、
対応する微分方程式の解 y は次のように表されます: $$①虚数単位iを含む形で表す場合:y=C_1e^{\alpha x}+C_2e^{\beta x}$$ $$②実数でのみで表す場合:y=C_1e^{Ax}\cos (Bx)+C_2e^{Ax}\sin (Bx)$$ $$C_1とC_2は任意定数【特に①の場合、複素数も含めた任意定数です。】$$

①の形は、特性方程式の解が異なる2つの実数解である場合と同じ形です。①と②の2つの形が同等である事の詳細は後述しますが、複素数も含めた任意定数を上手に調整する事で示します。実数のみで表す事も可能である事から、物理の古典力学の範囲でも普通に意味を持つ事が見えるかと思います。

複素数を r(cosθ+i sinθ) という「極形式」で表したうえで、 r(cos(θx)+i sin(θx)) という関数を考えてみます 。【このように複素数を含んだ関数を、数学上は複素関数とも言います。】

この形の関数は、じつは微分した時に、e の指数関数と同じ性質を持っています。
r と θ は定数としたうえで、試しにxで微分してみると:

$$\frac{d}{dx} r(\cos( \theta x)+i \sin( \theta x)) = r\theta (-\sin ( \theta x) +i\hspace{5pt}\cos ( \theta x) )=i \theta r (\cos( \theta x)+i \sin( \theta x)) $$

$$微分した後の式変形では、i^2=-1という関係を使っています。$$

【r等も変数ならxで偏微分という事になりますが、ここではr等は定数としてxでの「常微分」です。】

この結果を注意して見ていただくと、 xについてのもとの関数を「iθ 倍」したものと同じです。これは e の指数関数と同じ性質であり、指数関数の変数として複素数も考えるとするとじつは次のように書けます:

ポイントとなる1つの関係式

$$re^{i\theta x}= r(\cos( \theta x)+i \sin( \theta x)) $$ $$(おおもとの形:e^{i\theta}=\cos \theta +i\sin \theta)$$

この関係式は、ある条件(※)をつける事によって、変数が複素数範囲の場合は本質的にこの形として表してよいというものです。【(※):複素関数が「正則関数」であるという条件です。】

形式的には、e の指数関数のマクローリン展開(x=0でのテイラー展開)に、xの代わりに「 ix を代入してみて」、そこに正弦と余弦のマクローリン展開を「代入」する事で複素数の「指数関数表示」を得ます。ただし、より正確には複素数変数の指数関数を新たに定義するか、正則関数としての指数関数の複素数領域への拡張はただ1通りしかないという論法で指数関数表示を考察します。

この事を踏まえて、微分方程式 y”+ay’+by = 0 の解を考察します。
ここで、特性方程式の複素数解について、極形式ではなくて A + Bi の形のほうを考える事がポイントです。その形を、指数関数に適用してみましょう。

$$e^{\alpha x}=e^{(A+Bi)x}=e^{Ax}e^{Bi}x$$

これを、xで微分してみましょう。

$$\frac{d}{dx} e^{\alpha x}= \frac{d}{dx} ( e^{Ax}e^{iBx})=Ae^{Ax} e^{iBx} +iB e^{Ax} e^{iBx} =(A+Bi) e^{Ax} e^{iBx} = (A+Bi) e^{\alpha x}=\alpha e^{\alpha x} $$

このように、積の微分公式を使って丁寧に計算すると、微分の演算は実数係数の場合と全く同じ形になる事が分かります。 これは結局のところ、指数関数の部分が係数が乗じられる以外には形が変化しない事に起因しています。

と、なると解が異なる2つの実数ではなくて複素数であったとしても、

$$解は y=C_1e^{\alpha x}+C_2 e^{\beta x}の形で表せるという事です。 $$

微分方程式のほうの解を実数だけで表す方法

さて、前述のようにじつはこれを実数だけで表す事も可能です。

$$さきほどのe^{\alpha x}=e^{(A+Bi)x}=e^{Ax}e^{Bi}xという関係を使いましょう。ここで\beta=A-Biである事は重要です。$$

$$y= C_1 e^{Ax}e^{Bi}x +C_2 e^{Ax}e^{-Bi}x = C_1 e^{Ax} (\cos (Bx)+i\sin (Bx))+ C_2 e^{Ax} (\cos (Bx)-i\sin (Bx)) $$

$$= (C_1+C_2) e^{Ax} \cos (Bx) +i e^{Ax}\sin(Bx)(C_1-C_2)$$

$$C_1+C_2=C_3, C_1-C_2=iC_4 とすると、【そのようにおいてもよい事に注意】$$

$$y= C_3 e^{Ax} \cos (Bx) +C_4e^{Ax}\sin(Bx) $$

このように、任意定数も複素数であってよい事から「i を消せる」のです。特性方程式の2つの解が(必ず)共役複素数である事により、このように計算できます。
ここで、新しく作った2つの任意定数も複素数範囲で成立しますが、その中で実数に限定すれば実数範囲の任意定数による一般解として表せるわけです。

特性方程式の解(特性根)が異なる実数解の場合と複素数解の場合とでは、同じ形として微分方程式のほうの解を表す事が可能です。

2次の特性方程式が重解を持つ場合

次に、2次の特性方程式が重解(必ず実数)を持つ場合です。
証明に関してはこの場合がじつは一番面倒で、一般解は次のようになります。

2次の特性方程式が重根を持つ場合

特性方程式の解(重解)を \(\alpha\) とすると
微分方程式 \(y^{\prime\prime}+Ay^{\prime}+By=0\) の解は次のようになります:

$$y=C_1e^{\alpha x}+C_2xe^{\alpha x}=e^{\alpha x}(C_1+C_2x)$$ 「x が指数関数に乗じられる」という形の項が、オマケでくっついてくるわけです。
\(e^{\alpha x} \) にxの1次関数が乗じられていると考える事もできます。

この解は、実際に微分してみると確かに微分方程式を満たす事は割と簡単に分かりますが、パっと見では2番目の項も含まれる事は、なかなか気づかないと思います。そこで、この解の詳しい導出について見ておきましょう。

$$演算子として\hat{D}=\left(\frac{d}{dx}-\alpha\right) を定義しておきます。 \hat{D} y= \frac{dy}{dx}-\alpha yです。$$

$$ \hat{D}^2=\hat{D} (\hat{D}) と定義すると \hat{D}^2= \left(\frac{d^2}{dx^2}-2\alpha \frac{d}{dx} +\alpha ^2\right) です。$$

$$\hat{D}^2y= \frac{d^2y}{dx^2}-2\alpha \frac{dy}{dx} +\alpha ^2y $$

この記号は別に定義しなくても証明はできますが、計算が結構煩雑なので過程を詳しく見るのに役立ちます。これはあくまで、ここでの計算だけに適用する便宜上の記号です。
(「演算子」という言葉と考え方自体は、物理でも良く使います。特に量子力学などにおいてです。)

特性方程式が重解を持つという設定ですから

$$x^2+Ax+B=(x-\alpha)^2= x^2-2\alpha x +\alpha^2より、 A=-2\alpha,B=\alpha^2$$

$$よって、y^{\prime\prime}+Ay^{\prime}+By= y^{\prime\prime} -2\alpha y^{\prime}+ \alpha^2 y= \hat{D}^2y$$

$$特性方程式が重解を持つならば、 y^{\prime\prime}+Ay^{\prime}+By=0 \Leftrightarrow \hat{D}^2y =0 という事です。$$

$$ここで、\hspace{5pt}e^{-\alpha x}y \hspace{5pt} という関数を考えると話がうまく進みます。$$

これの1階微分は、単純に積の微分公式を用いて計算を進められます。

$$\frac{d}{dx}(e^{-\alpha x}y)=-\alpha e^{-\alpha x}y+e^{-\alpha x}(y^{\prime})=e^{-\alpha x} \left (\frac{d}{dx}-\alpha \right)y$$

2階微分も積の微分公式を用いて計算を進められます。

$$\frac{d^2}{dx^2}(e^{-\alpha x}y)=\frac{d}{dx}\left\{e^{-\alpha x}\left(\frac{d}{dx}-\alpha \right )y\right\}=-\alpha e^{-\alpha x} \left (\frac{d}{dx}-\alpha \right )y+e^{-\alpha x}\frac{d}{dx}{\left(\frac{d}{dx}-\alpha\right)y}$$

$$= e^{-\alpha x} \left \{ -\alpha (\hat{D}y) + \frac{d}{dx}(\hat{D}y)\right \}= e^{-\alpha x} \left\{\left(\frac{d}{dx}-\alpha \right ) (\hat{D}y)\right\} = e^{-\alpha x} \hat{D}^2y $$

$$※ \left(\frac{d}{dx}-\alpha \frac{d}{dx} \right )y=\hat{D}y が1つの塊であり、 e^{-\alpha x} とのつながりは「通常の掛け算」である事に注意。$$

$$すると、 \hat{D}^2y =0 ならば e^{-\alpha x} \hat{D}^2y つまり \frac{d^2}{dx^2}(e^{-\alpha x}y)=0です。$$

$$ \frac{d^2}{dx^2}(e^{-\alpha x}y)=0 という形は、「2階微分=0」という形の微分方程式です。$$

「2階微分=0」という形の微分方程式の解は1次関数です。
つまり、次の事が言えるわけです:

$$「特性方程式が重解を持つ」 \Rightarrow y^{\prime\prime}+Ay^{\prime}+By=0 \Leftrightarrow \hat{D}^2y =0 \Rightarrow \frac{d^2}{dx^2}(e^{-\alpha x}y)=0 $$

$$ \Rightarrow e^{-\alpha x}y =C_1x+C_2 \Leftrightarrow y= e^{\alpha x}(C_1x+C_2)[証明終り]$$

最後の式変形は、両辺に\(e^{\alpha x}\)を掛けただけです。
2次の特性方程式が重解を持つという条件があると、必然的に指数関数に「1次式」を乗じた形の関数が解になってしまうという事です。

n階の定数係数の線型常微分方程式の解法

さて、以上で2階の場合の考察を見てみましたが、3階以上の場合も基本的な考え方は同じです。ただし、3次以上の場合の特性方程式は実数解と複素数解が両方含まれている事もあり、実数解の場合は重解かそうでないかにも分かれます。

特性方程式が「解けた」という前提のもとで話を進めるとすると、その解を用いて微分方程式のほうの係数を表せます。表記を簡単にするため、4階のものを例に考えます。上記で、特性方程式の解が重解の場合に用いたような演算をここでも行います。

$$\frac{d^4y}{dx^4}+A_3 \frac{d^3y}{dx^3} +A_2 \frac{d^2y}{dx^2} +A_1 \frac{dy}{dx} + A_0y=\left(\frac{d}{dx}-\alpha_1\right) \left(\frac{d}{dx}-\alpha_2\right) \left(\frac{d}{dx}-\alpha_3\right) \left(\frac{d}{dx}-\alpha_4\right)y $$

$$A_3=\alpha_1+\alpha_2+\alpha_3+\alpha_4, A_0=\alpha_1 \alpha_2 \alpha_3 \alpha_4 等が成り立っています。 $$

1つ1つの解が「異なる実数解」や複素数解であれば2階の時と考え方は全く同じで、それらの解と e の指数関数を組み合わせ、任意定数とも合わせて加え合わせる(これを「線型結合」と呼びます)事を考えればよいのです。

$$つまり、C_1e^{\alpha_1 x}+ C_2e^{\alpha_2 x} + C_3e^{\alpha_3 x} + C_4e^{\alpha_4 x} などが解になります。$$

複素数解の部分は、2階の時と同じく実数だけで表す事もできます。共役になってる2解を用いて、指数関数と三角関数の積で表せます。(n次方程式の場合も、複素数解がある場合は必ず共役なもの同士が2つ1組になっています。)

$$例えば\alpha_1 と\alpha_2が共役な複素数解なら、\alpha_1=A+Bi, \alpha_2=A-Bi として$$

$$C_1e^{\alpha_1 x}+ C_2e^{\alpha_2 x}の部分をe^{Ax}(C_a\cos (Bx)+C_b\sin (Bx) )に変えても同じです。$$

「では、重解が含まれていたらどうなるのですか?」

n階の場合も、面倒なのは重解を持つ場合です。この場合、3重解4重解・・などを持つ事もあり得るので、考え方は2階の時と似ていますが別の補題を証明する必要があります。

補題 $$任意の自然数nに対して、 \frac{d^n}{dx^n}(e^{\alpha x}y)=e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}$$ $$ここで、\left(\frac{d}{dx}+\alpha\right)^nは\left(\frac{d}{dx}+\alpha\right)^2=\left(\frac{d}{dx}+\alpha\right)\left(\frac{d}{dx}+\alpha\right)=\left(\frac{d^2}{dx^2}+2\frac{d}{dx}\alpha+\alpha^2\right) 等の事。$$

これは、数学的帰納法を用いて丁寧に計算すると証明できます。

まず、n=1の場合は積の微分公式を用いてるだけで、これは成立します。

あるnで成立するとして、n+1の場合を考えます。

$$\frac{d^{n+1}}{dx^{n+1}}(e^{\alpha x}y)=\frac{d}{dx}\left\{\frac{d^n}{dx^n}(e^{\alpha x}y)\right\}= \frac{d}{dx}\left[ e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}\right]$$

$$=\alpha e^{\alpha x}\left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\} + e^{\alpha x} \frac{d}{dx}\left[ \left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\}\right] $$

$$= e^{\alpha x} \left( \frac{d}{dx} +\alpha\right) \left\{\left(\frac{d}{dx}+\alpha\right)^ny\right\} = e^{\alpha x} \left\{\left(\frac{d}{dx}+\alpha\right)^{n+1}y\right\} $$

よって、n+1の時も成立しますので任意の自然数nで成立します。【補題の証明終り】
式が少々ごちゃごちゃしますが、使っているのは積の微分公式だけです。

さて、この補題を使ってどのように微分方程式のほうの解を考えるかと言いますと、次のようになります:

$$例えば N 重解になる部分について微分方程式を \left(\frac{d}{dx}-\alpha\right)^ny=0 と表せますから、 $$

$$ \left(\frac{d}{dx}-\alpha\right)^ny=0 \Rightarrow e^{-\alpha x} \left(\frac{d}{dx}-\alpha\right)^ny=0 \Rightarrow \frac{d^n}{dx^n}( e^{-\alpha x}y)=0$$

【※プラスマイナスの符号が上記補題と入れ替わるので注意してください。\(\alpha\) を \(-\alpha\) に置き換えます。】

$$つまり「e^{-\alpha x}yという関数をn回微分すると0になる」という式になります。$$

1回微分して0になる関数は定数関数、2回微分して0になる関数は1次関数であるわけですが、n回微分して0になる関数は(n-1)次関数です。

$$よって、 e^{-\alpha x}y =x^{n-1}+C_{n-2}x^{n-2}+\cdots+C_2x^2+C_1x+C_0$$

$$\Leftrightarrow y= e^{\alpha x}( x^{n-1}+C_{n-2}x^{n-2}+\cdots+C_2x^2+C_1x+C_0 )という事になります。$$

指数関数に(n-1)次関数を乗じた形の解になります。2次の特性方程式が重解を持つ時には指数関数に1次式を乗じた形の解であったわけですが、それもこのn次の場合の解の形に含まれるわけです。

$$特性方程式の解が3重根であれば、微分方程式のほうの解はy= e^{\alpha x}( C_2x^2+C_1x+C_0 ) になります。$$

この特性方程式の重解の部分に対する微分方程式のほうの解を、異なる実数解や複素数解に対応する微分方程式の解に加え合わせて、全体の一般解になるわけです。

参考:n次方程式について

複素数係数のn次方程式は、m重解の部分をm個の解と数えると約束するうえで、n個の複素数解(実数解を含めて)を必ず持ちます。これは代数学の基本定理と呼ばれます。(代数学の「基本」となる定理なのかは別問題ですが・・。)
また、2次方程式には「解の公式」がありますが、多項方程式の係数の加減乗除とベキ根(2乗根、3乗根など)の組み合わせで解を一般的に表せるのは4次方程式までで、5次方程式以降は一般的にはその手法では解けない事が知られています。つまり、5次方程式以降は、解は確かに存在するけれど、2次方程式同様の「解の公式」によって手計算で一般的に解く事はできないという事です。(係数のベキ根によって解けるものもありますが、解けないものもあるという事です。)
しかしそうなると、定数係数の線型常微分方程式についても、n次方程式が解ければ微分方程式の解も分かるわけですが、肝心のn次方程式の解のほうが、高次の場合には手計算では一般的には解けない事になるのです。・・そのため、この微分方程式の理論は、ちょっと肝心なところが抜けているという感もあるかもしれません。あくまで、理論的にはこのように言えるという事を踏まえる必要があるかと思います。
代数学の基本定理は代数学の手法で証明する事もできますが、解析学的に証明する方法もあります。ベキ根による「解の公式」の存在(可解性などと言います)については、より代数学的な話なります。

特性方程式による、常微分方程式の解法についての考察

以前考察した簡単な微分方程式の解法について、特性方程式の観点からまとめと考察をしてみます。

解法のまとめと一覧表 ■ 解法の考察(特性方程式の観点から)

解法のまとめ・・一覧表

1階と2階の定数係数の線型常微分方程式を例にして、5つのタイプの微分方程式をまとめてみます。

微分方程式 使用する微分公式
① \(y^{\prime}=0\)  \(f(x)=C\) 定数関数の微分
② \(y^{\prime\prime}=0\) \(f(x)=bx+C\) 単項式の微分
③ \(y^{\prime\prime}-b=0\) \(f(x)=\frac{b}{2}x^2+Ax+C\) 単項式の微分
④ \(y^{\prime\prime}+b^2y=0\) \(f(x)=A\cos (bx+C)\) 三角関数と合成関数の微分
⑤ \(y^{\prime\prime}+by^{\prime}+cy=0\) 1.特性根\(\alpha,\beta\)が重解でない:
\(f(x)=Ae^{\alpha x}+Be^{\beta x}\)
2.特性根\(\alpha\)が重解である:
\(f(x)=e^{\alpha x}(Ax+B)\)
これがこのページで特に扱った内容です。特性根が重解で無い場合は、実数解と複素数解の場合をまとめています。

特性根」とは、「特性方程式の解」の事です。

解法の考察・・特性方程式の観点から見ると?

上記の5つの種類の解は、5番目のタイプで「特性方程式の解」が重解である場合と複素数解である場合を含めると、③タイプを除いて「数学的にまとめる」事も可能なのです。

どういう事かと言いますと、まず④の三角関数タイプは、じつは特性方程式の観点から言うと「特性根として複素数解」を持つ場合なのです。その場合、e の指数関数は複素数と三角関数の関係により表され、任意定数(複素数も可)を上手に選ぶと「実数範囲の三角関数」を解として得る事ができます。特性方程式が複素数解を持つ場合には、解を複素数でも実数でも表せる事を上記で述べましたが、その事です。

①②の、定数関数と1次関数が解のパターンは、ちょっと意外かもしれませんが、特性方程式の観点からは、じつは「特性根が重解」パターンの仲間なのです。(上記では最も面倒だったパターンですね。)ただ、「2階微分=0」のような場合には特性方程式の重解は 0 ですので、指数関数部分は1となって見えなくなるので、定数の場合も含めて1次関数の部分だけが残ります。そのような見方も数学的には可能という事です。

上の表の中でじつは仲間外れなのは③の2次関数タイプで、定数係数の常微分方程式の中で、これだけが「非斉次」タイプで、残り①②④⑤は「斉次」タイプなのです。このページで扱った内容(表の中では⑤)は、全て「斉次」のものです。そのために、③の解だけは⑤の枠組みとは少し違ったものになっている、という見方もできるわけです。(※ただし、非斉次であっても一工夫して斉次の形に変形をしたうえで解く事は可能です。)

 

参考文献・リンク


微分方程式の基礎 (数理科学ライブラリー)


講座 数学の考え方〈7〉常微分方程式論


常微分方程式 (理工系の数学入門コース)

重積分の理論と計算

重積分の定義と計算法、累次積分、変数変換と関数行列式について説明します。
微積分の中では、微分方程式無限級数偏微分の理論と並んで、応用数学でも重要です。

高校数学での1変数の積分の定義と公式は別途に詳しく説明しています。

重積分の物理学での応用としては、例えば電磁気学等で使うガウスの発散定理があります。

重積分とは「多変数関数に対する積分」

重積分とは、多変数関数に対する積分です。定積分・不定積分の両方があります。2変数の時を2重積分、3変数の時を3重積分、n変数の時をn重積分(あるいは「多重積分」)・・と、言う事もあります。

重積分の定義と表記方法
積分領域が長方形ではない場合の考え方と処理
重積分の簡単な計算:累次積分による例
重積分と面積・体積との関係 

重積分の定義と表記方法

多変数関数F(x,y,z,・・)をx、y、z、・・のそれぞれで積分する計算を重積分と言います。
単純化のため、ここでは2変数関数F(x,y) を例にします。

計算の仕方の結論を先に言ってしまいますと、まずxだけで積分の計算を行い、その後でyについて積分の計算を行います。yの積分を先に行ってからxで積分しても同じ結果になります。

  1. まず最初は、yなどの変数は定数とみなしてxで積分計算。
  2. xに関して定積分の値を代入したら、今度はyで積分計算。
重積分の表記と計算 $$\int_{y1}^{y2} \int_{x1}^{x2}F(x,y)dxdy=\int_{y1}^{y2}\left(\int_{x1}^{x2}F(x,y)dx\right) dy$$

このような計算の仕方を「累次積分」とも言います。
xの次にyと、続けて逐次的に計算するという意味合いです。
1つの積分変数に着目して積分計算する時は、他の変数は定数扱いにします。
不定積分として表記するなら次のような形になります。

$$\int\int F(x,y)dxdy$$ この時に、後述するように積分領域が長方形ではない場合には、積分区間として定数ではなく関数を代入する場合があります。

変数を増やした場合でも表記方法は2変数の場合に準じます。
例えば3変数なら次のようになります。

$$ 定積分:\int_{z1}^{z2} \int_{y1}^{y2}\int_{x1}^{x2}F(x,y,z)dxdydz \hspace{10pt}不定積分\int \int\int F(x,y,z)dxdydz$$

積分領域が長方形ではない場合の考え方と処理

◆積分区間について、積分を行うxy平面の領域が「長方形」であれば積分区間は
定数を端とする閉区間になります。(例えば [0,1])
他方、領域が座標軸に対して斜めになっていたり、曲がっていたりする場合には次のようにします。

まず、いずれかの変数をもう1つの変数の関数として表して、それを区間とします。
つまり、xとyの2変数で重積分をする時に、まずxで積分をするとすれば領域の端を構成する曲線をyの関数x=x(y)、x=x(y)として区間としておきます。

次に、yを定数とみなして原始関数を式で表せたとします。
その式のxの部分に、通常の定積分計算のようにx=x(y)とx=x(y)を代入をして引き算します。
【例えばx=2yであるとかx=yであるといった形を直接代入します。】
その計算の結果、変数xは全て消えてyだけの関数になります。

最後に残った変数については、定数の区間の定積分を実行します。

3変数以上の場合でも考え方は同じで、変数をx、y、zとして積分する場合には、最初に積分をする変数の区間は2変数関数として表され、2番目に積分する変数は区間が1変数関数で表され、最後に残った変数は区間が定数という形になります。

長方形でない領域の重積分の例
yから先に積分する場合には、yをxの関数で表して先に計算します。

例えば、x=yとx=2yで囲まれる領域を積分範囲を考えたとしましょう。この時に、yに関しては閉区間 [0,2]を考えるとします。その領域上でてきとうな2変数関数F(x,y)があったとして、まずxで積分をする前提であるなら重積分は次のように計算します。

$$\int_{y1}^{y2}\int_{x1}^{x2}F(x,y)dxdy=\int_0^2\int_{\large{y^2}}^{\large{2y}}F(x,y)dxdy$$

一度そのように具体的な関数を区間に代入して表した場合には、積分の順番はx→yのようにきちんと決めて計算を行います。

$$つまり、\int_0^2\left(\int_{\large{y^2}}^{\large{2y}}F(x,y)dx\right)dyのような形で計算を行います。$$

重積分の簡単な計算:累次積分による例

もう少し簡単な例として、てきとうな2変数関数としてF(x, y) = xy というものを考えて、重積分してみましょう。

この時、定積分の場合は x の範囲と y の範囲の両方が指定される必要があります。ここでは、例として x の積分区間は [0, 1]、y の積分区間は [4, 5] という範囲であるとします。【つまり積分する領域が長方形である場合です。】
【★数学では、この2つの範囲を表記する為に [0, 1] × [4, 5] と書く場合があります。この場合の「×」記号は、掛け算ではなくて「直積集合」を表すための記号です。】

では、その設定で重積分してみます。

$$ \int_{4}^{5}\int_{0}^{1} F(x, y) dxdy= \int_{4}^{5}\int_{1}^{2} xy dxdy = \int_{4}^{5} \left[\frac{yx^2}{2}\right]_0^1dy= \int_{4}^{5} \frac{y}{2}dy=\left[\frac{y^2}{4}\right]_4^5=\frac{9}{4} $$

まずyを定数とみなして計算を進める事がポイントです。
1変数の積分の計算さえできれば、計算の考え方としては難しくないはずです。

重積分と面積・体積との関係

1変数の関数の積分には、グラフで表した関数の「面積」という意味がありました。

では多変数の重積分には何の意味があるかというと、2変数関数の重積分には「体積」としての意味があります。この時、積分変数の側のdxdyを面積要素と呼ぶ事があり、物理などで用いる場合はdSと書く場合もあります。(S は surface の頭文字です。)
◆参考:ベクトル解析における法線面積分の考え方

xとyが直交座標の変数であるとき、dxdyは(微小な)長方形の面積というわけです。累次積分によって重積分を計算する場合は、1回目にxで積分することで、各dyに対する非常に薄い板のような立体ができあがり、それをyで積分して全体の体積になるというイメージです。

他方、3変数関数の重積分の場合は、空間上に分布する何らかの値を、特定の領域全体に渡って合計したものという意味があります。この場合、dxdydzを体積要素と呼ぶ事があり、物理などではdvで表記する事もあります。(vは volume の頭文字。)

1変数の積分にも言える事ですが、多変数の重積分においても、不定積分がうまく導出できない場合があります。しかし、積分は「和」の極限値であり、近似できるという考え方によって、コンピュータ(プログラミング)による「数値計算」で積分値を計算する事が可能です。

変数が増えても、物理的な意味付けができる場合には dX1dX2dX3dX4・・・といった積分変数の積を考えて重積分を行う場合もあります。

重積分の変数変換論

重積分の積分変数の変換は、偏微分の理論と深い関係があります。

変数変換の公式と、基本的な考え方:曲線に沿った積分
変数変換の理論と関数行列式:2変数の場合
3変数以上の場合の重積分の変数変換 

変数変換の公式と、基本的な考え方:曲線に沿った積分

通常の重積分を累次積分で計算する時には、まずx軸に沿って関数の積分値を、各yの値に対して計算し、次にy軸に沿って積分をするわけです。

そこで、x=2u+v, y= u+3v のような変数変換をするとします。この時、xとyではなくてuとvで積分する事を考えてみます。

この場合、 じつはxy平面上の「u曲線」と「v曲線」に沿って積分を行う事になります。上記のように変数変換がuとvの1次式である場合は曲線ではなく直線になりますから斜交座標のようなります。

物理などで使われる変換の代表的なものは、極座標変換です。この場合、x=rcosθ, y=rsinθ という変換を行いますが、rとθで積分をする場合には θ 曲線(rが一定:つまり同心円)とr曲線(θが一定:つまり原点から伸びる放射状の直線)に沿って重積分を行うというわけです。

ただし、変換の式を直接代入するだけではじつは不十分で、次に述べますように「関数行列式」と呼ばれるものを掛け算しないと、計算がうまく行かないのです。

変数変換の理論と関数行列式:2変数の場合

1変数の積分での x=x(t) という変数変換では、積分時に(dx/dt)というオマケが必ずついてきました。では、多変数の重積分の場合は、このオマケの部分はどうなるのでしょうか?

この場合は、x=x(u、v), y=y(u, v)である時の長方形の面積 dudvと、それに対応するxy平面での領域の面積比が、積分計算の時に必ず乗じられるのです。この計算を行うには、偏微分を用います。

平面の領域にてきとうにたくさんの点を打って結び合わせる事で、領域を小さな三角形の集まりに近似できます。(もちろん数学的には、正確な領域の面積との差を無限に小さくできるという事です。)

今、それらの点がxy平面上のu曲線、v曲線上に打たれていると考えます。 u曲線とv曲線を、非常に細かい「折れ線」であると考えます。
ここでのポイントは、1つ1つの微小な線分を「偏微分係数」であると考える事です。duに対してx方向には (∂x/∂u)du 、y方向には(∂y/∂u)duの変化があるベクトルが伸びるわけです。【具体的な点では偏導関数の変数に値を代入。】これは図で考えたほうが分かりやすいと思います。

重積分の変数変換と関数行列式
三角形(あるいは平行四辺形)の面積については次のように考えます:
底辺×高さの計算で、高さは「1つのベクトルの長さ×正弦(sinθ)」で表せます。
これについて 成分計算を行うと、ベクトルの成分を用いて簡単に表せるのです。

すると、各点から始まる微小三角形の面積は、平面ベクトルの公式(ベクトルによる平行四辺形の面積公式)により、次のように表せる事が分かります:

微小三角形の面積比 $$dS=\frac{1}{2}\left(du\frac{\partial x}{\partial u}dv\frac{\partial y}{\partial v}-dv\frac{\partial x}{\partial v}du\frac{\partial y}{\partial u}\right)=\frac{1}{2}dudv\left(\frac{\partial x}{\partial u}\frac{\partial y}{\partial v}-\frac{\partial x}{\partial v}\frac{\partial y}{\partial u}\right)$$ これはuv平面の三角形領域(1/2)dudvの面積と、それに1対1に対応するxy平面上の(三角形)面積の関係を表しています。
うしろにくっついてくる偏微分で表される部分が面積比であり、
この形は行列に対する「行列式」の形になっているので「関数行列式」とも言います。
「関数行列式」の定義(2変数関数の場合)

x=x(u、v), y=y(u, v)である時、 $$\frac{\partial x}{\partial u}\frac{\partial y}{\partial v}-\frac{\partial x}{\partial v}\frac{\partial y}{\partial u}\hspace{5pt}を「関数行列式」と呼び、$$ $$\left|\frac{\partial (x,y)}{\partial (u,v)} \right|\hspace{5pt}と表記します。$$

この関数行列式は、某学者のイニシャルをとってJで表記する事もあります。

行列式の定義については、2変数は簡単ですが3変数以上は多少込み入った考え方をします。ただし、そのように定義する事によって、いくつかの行列式の公式が成立したりします。

十分小さな微小三角形の面積と、その領域上のある関数の値を掛け合わせて全て加え合わせたものが定積分の値であり、その値は積分を微分の逆演算と考えて計算した値と等しくなるという事は、1変数の積分と全く同じです。まとめると、2変数の場合の重積分の変数変換の公式は次のようになります:

2変数の場合の重積分の変数変換の公式

x=x(u、v), y=y(u, v)である時、 $$\int_{y1}^{y2}\int_{x1}^{x2} F(x,y)dxdy= \int_{v1}^{v2}\int_{u1}^{u2} \left|\frac{\partial (x,y)}{\partial (u,v)} \right|F(x,y)dxdy$$ 具体的な定積分を行う時には、関数行列式の計算を忘れない事と、
xy平面の領域と、uv平面の領域を1対1にきちんと対応させる事が重要になります。

尚、証明はやや複雑になりますが、三角形ではなく「平行四辺形」で考える事も可能です。

3変数以上の場合の重積分の変数変換

さて、では3変数の時に x=x(u, v, w), y=y (u, v, w) , z= (u, v, w ) という変換をする場合や、4変数、5変数になった場合はどうなるのでしょうか。

この場合、式自体は変数が増えるごとにどんどん複雑になっていって手計算では手に負えなくなりますが、じつは一応規則性はあるのです。結論を言いますと、「n変数→別のn変数」の変換に対しては、n次の関数行列式を乗じればいいのです。2変数の場合は2次の関数行列式というわけです。

n変数の場合の重積分の変数変換の公式

n変数に対して別のn変数に変換する時、つまり $$X_1=X_1(u_1,u_2,u_3,\cdots,u_n),X_2=X_2(u_1,u_2,u_3,\cdots,u_n),\cdots,X_n=X_n(u_1,u_2,u_3,\cdots,u_n)の時$$ $$\int_{x11}^{x12}\int_{x21}^{x22}\cdots\int_{xn1}^{xn2} F(X_1,X_2,\cdots,X_n)dX_1dX_2dX_3\cdots dX_n$$ $$= \int_{u11}^{u12}\int_{u21}^{u22}\cdots\int_{un1}^{un2} \left|\frac{\partial (X_1,X_2,\cdots,X_n)}{\partial (u_1,u_2,u_3,\cdots,u_n)} \right|F(X_1,X_2,\cdots,X_n)du_1du_2du_3\cdots du_n$$ が成立します。
一般のn変数の場合だと式が少々込み入りますが、要するに変換の式を代入して関数行列式を掛けてから積分の計算を行えばいい、という意味です。

この場合の関数行列式の作り方は、行列の行の部分にx、y、z、・・を対応させ、列の部分に対して偏微分する変数u、v、w、・・を対応させ、行列式を作るという形になります。
3変数の場合は、次の形の行列式を考える事になります:

$$\left|\frac{\partial (x,y,z)}{\partial (u,v,w)} \right|=\Large{\left| \begin{array}{ccc} \frac{\partial x}{\partial u}&\frac{\partial x}{\partial v}&\frac{\partial x}{\partial w}\\ \frac{\partial y}{\partial u}&\frac{\partial y}{\partial v}&\frac{\partial y}{\partial w}\\ \frac{\partial z}{\partial u}&\frac{\partial z}{\partial v}&\frac{\partial z}{\partial w}\end{array}\right| }$$

3変数の場合には空間上の4点を結ぶ事で4面体の集まりとして近似する事が(必ず)できますが、じつは3次元空間での「平行6面体の体積」が行列式の形でうまく表現できるという命題があります。
そこで、dudvdwという「立方体」の体積と、対応するxyz空間上の領域の体積比がうまい具合に関数行列式で表せるというわけです。4変数以上の場合は図にはうまく描けなくなりますが、考え方としては同じで、dudvdwdtといった量と、対応する領域の量の比を考えるわけです。

ただし、これは数学的な理論としてはそうなるという事であり、実際問題として4次以上の重積分の変数変換を「手計算」でひたすらやるという作業は、応用上も純粋数学上もほとんどないと言ってよいかと思います。他方で、関数行列式を展開せずにそのままの形で数学的な議論を進める場合や、数値計算を行う場合にはn変数の重積分の変数変換が使われる事もあります。

物理では重積分はどう使われる?

物理で重積分を累次積分で計算する時は、変数変換してから計算する事が比較的多いかもしれません。ただし、変換の仕方は、基本的には極座標や円柱座標などの分かりやすいものが多いです。
(※理論を複雑にしてしまうと応用上の変数変換のメリットがないので、基本的に、式と計算を簡単にするために変数変換を行います。)

また、具体的な定積分の数値の計算はせずに種々の公式や命題を用いて延々と式変形を進めて、最終的には積分の計算が必要なくなる式を理論的に得てから、計算をするという事もよくあります。

例えば、電磁気学では重積分の形の式が非常に多く用いられますが、直接的に重積分を計算するというよりは、モデルの作り方を工夫 する (例えば領域を球面に選ぶなど)事によって、場面に応じて使える公式を得る目的で用いられます。
コンデンサーやソレノイドに対して成立する式などは平易なものですが、おおもとの形には多変数の微分や積分が含まれており、特別な場合をうまく考える事によって式を簡単にしているのです。

全微分の考え方とその応用

今回は、全微分という、少し聞きなれないかもしれない考え方について説明します。これは、前回の偏微分の理論と直接的に関係するものです。全微分の考え方を述べた後に、物理の熱力学での応用について述べます。

英名では、全微分は exact differential あるいは total differential と言います。

★ このページでは、「関数」と言ったら全て(偏)微分可能な関数の事を指す事にします。そのため、「連続な」「偏微分可能な」といった表現は基本的に省略いたします。解析学的に見る場合は、それらの考察も重要になります。

「全微分」とは何か?定義と考え方・偏微分との関係

初めに、数学的な定義と考え方です。本質的に、偏微分と深い関わりがあります。

全微分の定義 単独で表れるdF、dx、・・
全微分と「合成関数に対する偏微分の公式」との関係
1変数の場合の dF や dx の元々の数学的意味は? 

このように、dF/dxといった通常の微分演算(により得られる導関数)ではなく、dF といった単独の表記で表されるものが全微分と呼ばれるものです。

全微分の定義 単独で表れるdF、dx、・・

全微分とは多変数関数について定義されます。多変数関数に関しては偏微分を考える事ができますが、この偏微分による偏導関数を用いて全微分は定義されます。

定義:(多変数関数の)「全微分」

多変数関数 F(x,y,z,・・) の全微分とは、次のように定義します。 $$dF=\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy+\frac{\partial F}{\partial z}dz+\cdots$$ このように、単独でdFというものを定義し、別の単独のdxやdyを偏微分(偏導関数)と組み合わせて定義するものが全微分です。(※単に「微分」と呼ぶ事もありますが、当サイトでは避けます。)
物理では、良く使われます。意味については後述していきましょう。

この「dF」が単独で表現される事に違和感を覚えるかもしれません。実際、このままでは具体的な関数の微分計算はできません。例えば、具体的な関数 \(F(x) =e^x\) に対して dF というものを考えたとしても、それは \(dF=d(e^x)\) とだけしか表現のしようのない物でそれ以上計算はできません。導関数として計算できるのは、あくまでdF/dxです。

では、上記定義で表される「全微分」とは何の意味があるのでしょう?この定義の計算としての意味は、じつは合成関数に対する偏微分の公式です。

全微分と「合成関数に対する偏微分の公式」との関係

全微分の定義には偏微分が含まれていますが、本質的に、偏微分について成立する公式と直接的な対応を持っています。合成関数に対する偏微分の公式は、x、y、z・・の各変数が、別の1つだけの変数の関数である場合は次のようになります。

合成関数に対する偏微分の公式

多変数関数 F(x,y,z,・・) の各変数が別の変数t(のみ)の関数である時: $$\frac{dF}{dt}=\frac{\partial F}{\partial x}\frac{dx}{dt}+\frac{\partial F}{\partial y}\frac{dy}{dt}+\frac{\partial F}{\partial z}\frac{dz}{dt}+\cdots$$ x、y、z、・・が、t、u、v、・・などの多変数関数になる場合は、
ここでのdF/dt、dx/dtなどは偏微分∂F/∂t、∂x/∂tなどになります。

さて、これを全微分の定義の式と見比べてみましょう。
すると、形式的には「全微分の定義」の式について「両辺をdtで割った」形を考えてみるとぴったりと偏微分の公式に一致する事が分かるでしょうか?
じつは全微分の定義にはこのような「意味」があるわけなのです。

!ちょっとだけ注意

★ これは形式的に対応するという事であり、数学的に厳密にはdxをdtで「割って(除算して)」dx/dtにするという演算は行わない事に注意してください。後述もしますが、dx/dtと書いた場合はあくまで「導関数」を指し、極限値として得られる関数です。
ですから、全微分の定義式は偏微分のほうの公式から「導出・証明されるもの」ではなく、あくまで定義になります。

多変数関数が常に合成関数として扱えるという保証はないわけですが、具体的な計算を考える時に意味を持つのは合成関数に対する偏微分の公式のほうです。

それを踏まえたうえで、多変数関数に対する全微分を考える事は割と多くあり、特に物理では使用する事が多いです。

1変数の場合の dF や dx の元々の数学的意味は?

物理などの応用で使う場合は、dF や dx という表記を単独で用いる場合は「微小量」を表す事が多いです。ただし、じつは数学の解析学的にもきちんと意味があります。

上記のように 多変数関数F(x,y,・・)に対する「全微分」dFが定義されるわけですが、じつは1変数関数F(x)に対しても同様にdFという単独の表記にも解析学での定義があります。

解析学的には、dFやdxというのは、
じつは本来は、ある点を新しい原点として設定した時の座標軸の変数です。

その新しい原点での、関数F(x)に対する接線の傾きをAとして、
dF=A(dx)
という1次式を考えます。この1次式は、近似1次式とも呼ばれます。
解析学的に厳密には、この時のdFの事を1変数関数におけるF(x)の微分と言うのです。
この意味では、接線の傾きは「割り算」によって「A=(dF)/(dx)」という事になります。

ただし、導関数として dF/dxと書く時は、あくまで極限値としての導関数として、
dF/dx という表記全体で1つの意味を持つ事にしています。
(導関数に具体的な値を代入したものを微分係数と呼ばれます。)
こういった事が、決め事として少々分かりにくいところかもしれません。

★ 数学において、特に解析学・微分積分学においてdF/dxの事を「導関数」と呼ぶ事にこだわって、慣習的な俗称である「微分」という言葉で呼ぶ事を極力避けようとする傾向があるのはこういう理由があると言えます。本来、数学の用語として区別する事に決めているものであるためです。
ただし応用ではその区別があまり重要でないため(近似的にほぼ同じものとみなせるという解釈を前提におくため)、慣習的に導関数と言わずに「微分」と言ってしまう事が多いわけです。

じつは全微分の定義とは、この意味で用いられているものなのです。すなわち、多変数関数に対しても同様に、dF=A(dx)+B(dy)+C(dz)+・・を考えるという意味です。2変数関数の場合は、3次元座標での「接平面」を考えている事になります。
★ 上記でも触れましたが、多変数の場合でも「微分」と言ってしまう場合もあります。しかしこのサイトでは、基本的に多変数の場合は「全微分」と呼ぶ事にします。

平面と3次元空間の場合の接線と接平面の考え方は、変数の数が増えても同様に使えます。

この時に、1変数関数の場合には接線の傾きと考えていたものについて、多変数関数の場合は各変数に沿った傾きとするわけです。座標上の具体的な点においては、偏導関数に特定の値を代入した偏微分係数が各傾きになります。
すなわち上の式で、A=∂F/∂x、B=∂F/∂y、C=∂F/∂z、・・という事です。
意味としては、こういう事なのです。

重要公式:積の形の関数に対する全微分

2つの多変数関数F(x,y,z,・・)と G(x,y,z,・・)の積【掛け算】FGに対する全微分d(FG)を考えてみます。結論を先に言うと、1変数の微分の時の積の微分の時と同じ形の式が成立します。これも、物理での応用で使われます。

積の形の関数に対する全微分の公式
証明に必要な事: 積の形の関数に対する偏微分
積の形の全微分の式の証明 

これに関する理屈はごく簡単ですが、物理などでの応用では重要になります。

積の形の関数に対する全微分の公式

積の形の関数に対する全微分については、通常の1変数関数の場合の、積に関する微分公式同様の式が成立します。
これは数学の解析学ではそれほど重要な式ではありませんが、物理では使う事があるので述べておきましょう。

積の形の関数に対する全微分 2つの多変数関数 F(x,y,z,・・)と G(x,y,z,・・)の積 FG に対する全微分です
次のように、2つの項の和の形で表されます。 $$d(FG)=(dF)G+(dG)F$$ $$=\left(\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy+ \frac{\partial F}{\partial z}dz+\cdots\right)G+\left(\frac{\partial G}{\partial x}dx+\frac{\partial G}{\partial y}dy+\frac{\partial G}{\partial z}dz+\cdots \right)F$$ これは全微分の定義から導出もできますし、積の形の合成関数の偏微分公式に対応させても可です。

この公式が成立する事を示すには、「積の形の関数に対する偏微分」がどのように表されるかという事が問題になります。ただ、この問題はじつは難しくなくて、1変数の時と同じように考える事が出来ます。

証明に必要な事: 積の形の関数に対する偏微分

偏微分に関して、積の形に対する計算は通常の微分の場合と同じく次式が成立します。

$$\frac{\partial }{\partial x}(FG)= \frac{\partial F }{\partial x} G+ \frac{\partial G } {\partial x} F$$

これに対する証明は、(合成関数の場合とは違って)1変数の場合の積に対する微分公式と全く同じです。プラスマイナスでゼロになる2つの項を加える事で証明できます。式の形を見ると、本質的に1変数の時と同じである事が分かります。
2変数の場合を記しますが、何変数でも同じです。

$$ \frac{\partial }{\partial x}(F(x,y)G(x,y))= \lim_{h\to 0}\frac{F(x+h,y,)G(x+h,y)-F(x,y)G(x,y)}{h}$$

$$= \lim_{h\to 0} \frac{F(x+h,y)G(x+h,y)-F(x,y)G(x+h,y)+\{ F(x,y)G(x+h,y)- F(x,y)G(x,y)\}}{h} $$

$$= \lim_{h\to 0} G(x+h,y) \frac {F(x+h,y) – F(x,y)}{h}+ \lim_{h\to 0} F(x,y) \frac {G(x+h,y) – G(x,y)}{h}$$

$$= \frac{\partial F }{\partial x} G(x,y)+ \frac{\partial G }{\partial x} F(x,y)【証明終り】 $$

このように、1変数の時と同じです。

★ 合成関数の時に通常の微分と偏微分とで追う式の形が変わるのは、1つの変数tなどに対してx、y、z、・・の全ての変数に関して x+h, y+h, z+h,・・を考える必要があり、プラスマイナスゼロになる項を複数加える必要があるからです。

積の形の全微分の式の証明

では、関数が積の形の場合の全微分の式の「証明」について見てみましょう。
こういう場合、上記の定義のFの部分に(FG)という積の形をそのまま入れて、計算が可能であれば進めていって公式を得るという方法をとります。すると、よく見ると積の部分は偏微分の計算さえできればよい事が分かります。

積の形になっている部分の偏微分を、1変数の時と同じ要領で計算していきましょう。すると・・・・。

$$d(FG)=\frac {\partial (FG) }{\partial x}dx+ \frac {\partial (FG) }{\partial y}dy$$

$$= \left(\frac{\partial F }{\partial x} G+ \frac{\partial G }{\partial x} F\right) dx+ \left(\frac{\partial F }{\partial y} G+ \frac{\partial G }{\partial y} F\right) dy$$

$$ = \left(\frac{\partial F }{\partial x}dx + \frac{\partial F }{\partial y}dy \right)G+ \left(\frac{\partial G }{\partial x}dx + \frac{\partial G }{\partial y}dy \right)F=(dF)G+(dG)F 【証明終り】$$

このように、偏微分に関して積の計算をした後、上手にFとGに関してまとめると、dFとdGの定義の形が出てくるので d(FG)=(dF)G+(dG)F という形にまとまるわけです。

つまり、結果として、多変数関数に対する全微分も、積の形の関数に対しては
1変数関数や偏微分の場合と同じ形になる、という事です。

じつは、合成関数の偏微分に対して積の形の場合を計算して対応させると考えても同じ結果を得ます。
その場合の計算も記しておきましょう。
(上記と同じく、x,y はtだけの関数とします。つまり∂x/∂t=dx/dtです。)

$$\frac{d(FG)}{dt}=\frac {\partial (FG) }{\partial x}\frac{dx}{dt}+ \frac {\partial (FG) }{\partial y}dy$$

$$= \left(\frac{\partial F }{\partial x} G+ \frac{\partial G }{\partial x} F\right) \frac{dx}{dt} + \left(\frac{\partial F }{\partial y} G+ \frac{\partial G }{\partial y} F\right) \frac{dy}{dt} $$

$$= \left(\frac{\partial F }{\partial x} \frac{dx}{dt} + \frac{\partial F }{\partial y} \frac{dy}{dt} \right)G+ \left(\frac{\partial G }{\partial x} \frac{dx}{dt} + \frac{\partial G }{\partial y} \frac{dy}{dt} \right)F= \frac{dF}{dt} G+ \frac{dG}{dt} F $$

得られた式から形式的にdtの部分を除くと、積の形に対する全微分の式にちょうど対応します。

物理での使い方:熱力学での例

全微分の形で議論を進める分野の1つの例として、初歩的な熱力学の理論について述べます。

熱力学での色々な変数
内部エネルギー変化dUの計算 全微分と偏微分の関係の利用
エンタルピーHの変化量dH と積に対する全微分の式 

熱力学の理論における、全微分の使用例を見てみましょう。
この理論はさらに、化学反応に対する物理化学的な考察に使われたりします。

熱力学での色々な変数

熱力学とは、通常の力学や電磁気学とは少し性質が異なり、どちらかというと物理化学などの分野と相性がよい領域です。熱力学では、ある「系」(例えば容器に入った気体)について、まず次の量を考えます。

  • 体積V
  • 圧力P
  • 温度T【これは、いわゆる絶対温度で、0[℃]を298[K]とします。】
  • 内部エネルギーU

また、これらを組み合わせた量や、系に出入りする「熱」(温度とは別)も考えます。

  • 熱 q
  • 仕事 w【本質的には力学での仕事と同じものです。】
  • エンタルピー H=U+PV【主に発熱・吸熱として観測できる量です。】
  • エントロピーS ・・dS = Δq /T なるSとして定義

これらの変化量を dV 、dP などの全微分の形で表記して議論を進めます。物理でこれらを考える場合には時間という変数で微分・積分が可能と考えられますからdv/dtなどを考えても同じ事ですが、導関数ではなくて全微分の形で話を進めてしまう事が普通です。

上記の量のうち、「エントロピー」(記号S)というものだけが妙な定義のされ方をされているように見えるかと思いますが、これで計算を行うという理論になります。意味としては、系の「乱雑さ」の度合いを表す量です。

$$積分によりS=\int_{T1}^{T2 } \frac{Δq}{T} dTとも表せます。【このページでは、あまり関係ありません。】$$

「エンタルピー」という量(記号H)も少し分かりにくいかもしれませんが、定圧条件(dP=0)で dH=Δq となり、発熱・吸熱として比較的観測しやすい量なので敢えて定義されるものになります。

参考:系の「状態量」であるものは体積・圧力・温度・内部エネルギー・エントロピーであり、熱や仕事は「非状態量」です。「非状態量」という語には、系にされる仕事と形に出入りする熱の比は条件によっていくらでも変えれるので系自体の状態の量を表さない・・という意味合いが含まれています。熱力学では重要な考え方です。微小量を考える時、状態量については全微分としてdVなどで表し、非状態量についてはΔqなどと書いて区別する事が多いです。

内部エネルギー変化dUの計算 全微分と偏微分の関係の利用

まず、内部エネルギーの「変化」を考えます。つまり、Uに対してdUを考えるわけです。このdUは、全微分です。しかし最初は、上記の全微分の定義は直接的には使わずに少しだけ計算を進めます。いくらか変形した後で適用する箇所があります。

物理的な考察から、dU=Δq + Δw  と書いておきます。※dw、dqと書いてもよいのですが、非状態量である事を強調して区別する事が多いです。

意味としては、外部からの圧力で仕事がされた、外部から熱が入ってきたという状況です。(あるいは膨張などで外部に仕事をした・熱が外に出て行ったなど。)

ここで、まずΔw=- (dV)P の関係があります。
これは、等圧(dp=0)の条件下で、次の仮定でのモデルを考える事によります:

  • 系が外部に仕事をした時は体積が増える。
  • その分、内部エネルギーは減る。(温度は下がる。)

逆に、逆に外部から仕事をされた場合は体積は減りますが内部エネルギーは増えます。

また、熱の変化Δqに関しては、
dS=Δq/T ⇔ Δq=(dS)T
の関係からエントロピーでの表記に直します。

組み合わせて、dU=(dS)T -(dV)P という関係式を作っておきます。

数学的な全微分の定義の式を直接使って考察をするのはここからです。

ここで、Uが多変数関数U(S,V,・・)であるとして、
さらに「等圧条件」dP=0と「等温条件」dT=0という場合を考えます。
(このように所定の条件を加えて考察する事が多いです。)
すると、全微分としては次のようにります。

$$dU=\frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV+\frac{\partial U}{\partial T}dT+\cdots= \frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV $$

普通に全微分を考える際にはdP、dTを含めた項も含まれますが、dP=0、dT=0【圧力、温度の変化は無し】という条件を設けるので式が簡単になるわけです。

成立する2式を並べて書くと次のようになります。

得られる2式 $$ dU=T(dS) -P(dV)  かつ$$ $$ dU = \frac{\partial U}{\partial S}dS+\frac{\partial U}{\partial V}dV $$

この事から何が言えるでしょう?
結論を言いますと、Uに対するS,Vの偏導関数がそれぞれT、Pであると解釈がなされるのです。

得られる解釈$$すなわち、等温・等圧条件のもとでは\hspace{10pt}\frac{\partial U}{\partial S} =T,\hspace{10pt} \frac{\partial U}{\partial V}=-P\hspace{10pt}という解釈がなされます。 $$

ここから先も計算による考察が続くのですが、このページではここで止めておきます。

エンタルピーHの変化量dH と積に対する全微分の式

次の例として、エンタルピーHの変化量dHを考えてみましょう。
これに対しては、積に対する全微分の式を用いるのです。

「エンタルピー」Hの定義は、H=U+PV です。も考えておきます。

次に、Hの変化量(全微分)を考えます。
これは dH=dU+d(PV) になります。

ここで上記の「積の形に対する全微分」の公式を適用しましょう。
PVという、圧力と体積の積になっている部分に対して適用します。すると、
dH=dU+d(PV) = dU+(dP)V+(dV)P
という形になるわけです。

参考:等圧条件dP=0の時、dH= dU+(dP)V+(dV)P = dU+(dV)Pになります。
他方、dU=Δq+Δw=Δq-(dV)Pなので、dU+ (dV)P=Δq
つまり、dP=0 ⇒ dH=Δq という事であり、
等圧条件下ではエンタルピーの変化は熱の変化(系への出入り)として表される
・・という解釈が、理論的に成立するというわけです。

前述でも触れましたように、この部分の計算は1変数関数の積に対する微分公式と同じ形になるので「通常の微分(変数は時間)」と捉えて計算しても結果的に差し支えない箇所です。
ただし、本質的にこれらのP、V、U、Sなどは多変数関数である事に注意も必要です。そのため、一応多変数関数の全微分と捉えたほうがよいとは思います。

この他に、A=U-TS、G=H-TSといった量を考えます。(いずれもエネルギーとして考えられます。)dAやdGも、dHと同じく積に関する全微分の式を考えて変形を行う事ができます。

熱力学というのは決して分かりやすい分野ではなく、この他にも色々な面倒な計算の理論があったりします。しかし、数学の偏微分や全微分の理論を踏まえておくと、初歩的な部分に関しては大分分かりやすくなるのではないかと思います。

参考文献・参考資料

■ 参考文献のリンクは、外部リンクになります。

偏微分とは?【定義・計算・公式】

今回は、偏微分というものについて紹介します。

★ 英名は、「偏微分」の演算の事を partial differentiation、
偏微分によって得る「偏導関数」を partial derivative と言います。

この偏微分の考え方は、解析学・微分積分学的にも重要ですが、特に物理での応用で重要です。大学の物理学では割と初歩的な理論の中でも偏微分を普通に使いますので、ぜひ知っておきましょう。まずは記号に慣れていただく事が大事かと思います。
合成関数に対して成立する偏微分の公式も、
物理学の種々の分野の要所で用いられる重要公式です。

偏微分の定義と使い方

では、まず偏微分の定義と簡単な計算方法、物理等での基本的な使い方を見てみましょう。「偏『微分』」という名の通り、微分の仲間です。

偏微分の定義 ■ 偏微分の簡単な計算例 ■ 物理での偏微分の使われ方の例 

2つ以上の変数を含む関数について、「1つの変数だけで微分の計算」を行うのが「偏微分」です。
偏微分に対して、通常の微分を「常微分」とも言います。

偏微分の定義

偏微分の定義自体は非常に簡単で、要するに、多変数の関数において、「1つの変数だけに着目し、他の変数は定数とみなして微分の計算をする事」です。

偏微分の定義

多変数関数F(x,y,z,・・)【てきとうな例:F(x,y,z)= xy + z】に対して、
を1つの変数に着目して、
演算「xでの偏微分」を次のように定義し、偏微分によって新しくできた関数を偏導関数と呼びます。
変数yやzに対しても同じように定義します。 $$ \large \frac{\partial}{\partial x}F(x,y,z,\cdots)=\lim_{h\to 0}\frac{F(x+h,y,z,\cdots)-F(x,y,z,\cdots)}{h}$$ $$記号「\partial」は、「ラウンド・ディー」という名で呼ばれます。$$ 通常の微分の時と同じく、偏微分によりできた偏導関数の事を単に「偏微分」と 呼んでしまう事も多くあります。また、∂/∂xなど、基本的には通常の微分と同じく種々の表記方法が認められています。

偏導関数に特定の値を代入した「偏微分係数」は
$$\large \frac{\partial F}{\partial x}(a,b,c)\hspace{5pt}や\hspace{5pt}\partial xF(a,b,c)$$のように書きます。

偏微分の簡単な計算例

例として、てきとうな関数 F(x,y,z)= xy + z をxで偏微分してみましょう。この時、yとzは定数扱いにしてxだけで「微分」すればよいのです。

$$\frac{\partial}{\partial x}F(x,y,z)=\frac{\partial}{\partial x} (xy + z) =y $$

この場合、xy の部分はxでの偏微分ではxの部分だけ微分してyは定数係数扱いです。
z項の部分はxに関しては定数と考えて、
zをxで偏微分すると0になるわけです。(∂/∂x)z=0 という事です。
基本的な考え方は簡単ではないでしょうか?

★ zがxに対する「独立した」変数である場合にこのような計算になります。もし、zがxの関数であったら、後述する合成関数の偏微分公式を使う必要があります。いくつかの変数が互いに「独立」であるか「従属」であるかは、場合によっては結構重要になります。

もう1つ例として、極座標の形で表した関数の偏微分を考えてみます。F(r,θ)=rcos θ とします。これに対するrの偏微分と、θの偏微分を考えてみましょう。

$$ \frac{\partial}{\partial r}F(r,\theta)= \frac{\partial}{\partial r} (r\cos \theta)= \cos \theta $$

$$ \frac{\partial}{\partial \theta}F(r,\theta)= \frac{\partial}{\partial \theta} (r\cos \theta)= -r\sin \theta $$

偏微分のラウンドディーの記号に慣れてないと難しく見えるかもしれませんが、やってる事は通常の微分と計算と同じなので、じつは単純なのです。

物理での偏微分の使われ方の例

物理では、関数が座標成分と時間の両方の関数である場合に、「時間だけの変化率」を考えたい時に時間による偏微分を行います。

例えば電磁誘導は磁場の変化(時間微分)によって起電力が発生するというものですが、
電場は時間以外に位置座標 x, y , z の関数でもあるので「時間変化」という事を明確にするために時間による偏微分で表現します。

$$電磁誘導の式:\mathrm{rot}\overrightarrow{E}=-\frac{\partial \overrightarrow{B}}{\partial t}\hspace{10pt} \overrightarrow{E} :電場  \overrightarrow{B}:磁場【あるいは磁束密度】 $$

時間ではなくて位置座標による変化という事を明確にするのであれば、位置座標による偏微分を考えます。
例えば、磁場に関しては次の式が必ず成立します。 「単独で存在する磁荷」は無い事を表現します。

$$ \large \frac{ \partial B_X}{\partial x}+ \frac{ \partial B_Y}{\partial y} + \frac{ \partial B_Z}{\partial z} =0 \hspace{10pt} \overrightarrow{B}=(B_X,B_Y,B_Z) $$

このように、意味としては「どの変数に着目してるのか?」それを明示しているのが偏微分というものです。使われ方としては、基本的には単純なのです。
(※微分方程式の解き方も含めて、計算は面倒になる場合も確かにありますが、偏微分そのものが複雑な演算というわけではないという事です。)

工学の場合は、分野によってはそれほど偏微分の理論を使わずに通常の微分で大体足りるものも中にはありますが、物理では力学などの基礎的な部分も含めて、偏微分の考え方は非常に多く用います。

重要公式:合成関数に対する偏微分

合成関数を考える場合、じつは合成関数に対する偏微分の公式は、通常の1変数の時の合成関数の微分公式と形が異なります。この点を誤解すると物理などの理論で混乱を招くので、公式の形が変わるという点は偏微分の基礎理論の重要ポイントの1つです。

多変数関数の合成関数の考え方 ■ 合成関数に対する偏微分の公式 ■ 公式の証明 

1変数の時とは形が異なるので注意しましょう。
偏微分の時の形の特別な場合が常微分の場合の合成関数に対する微分公式であるとも言えます。

多変数関数の合成関数の考え方

1変数の場合、例えば F(x) に対して x = G(t) であれば F(G(t)) という合成関数になります。

これに対して、多変数の場合は、例えば F(x,y) について、xとyのそれぞれについて、別の多変数 u, v を用いて x = X(u, v) , y = Y(u, v) で表し、
F(x,y) = F( X(u, v) , Y(u, v) ) となるという考え方をします。これは、慣れないと少し分かりにくいかもしれません。

考え方としては、3変数を2変数による合成関数として考えたり、2変数を3変数による合成関数と考える事もできます。

これは、例えば位置座標 x, y, z で表される関数を3次元の極座標で表すために r, θ, φ という別の3つの変数を用いた合成関数として表す事が可能です。(計算は、一般的に結構面倒くさくなります。)

合成関数に対する偏微分の公式

公式は、次の通りです。変数を1つだけと考えると、通常の合成関数の微分公式になります。

公式:合成関数に対する偏微分

多変数関数F(x,y,z,・・)に対して、x, y, z, ・・・のそれぞれが u, v, w, ・・の多変数関数である時、
つまり x = X(u,v,w,・・), y = Y(u,v,w,・・), z = Z(u,v,w,・・),・・の時、
F(x,y,z,・・) に対して u, v, w, ・・のそれぞれで偏微分して得る偏導関数は次のようになります: $$\frac{\partial}{\partial u}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial u}+\cdots$$ $$\frac{\partial}{\partial v}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial v}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial v}+\cdots$$ $$\frac{\partial}{\partial w}F(x,y,z,\cdots)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial w}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial w}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial w}+\cdots$$ $$\cdots$$ $$★これらの式において、\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}は、2つの偏導関数の掛け算です。$$ u, v, w, ・・のそれぞれでの偏微分について、このような和の形になります。

何変数でも同じ事ですが、例えば2変数に対して2変数による合成関数を考える時、つまり F(x,y) に対して x = X(u,v), y = Y(u,v) の時に、F に対して u, v で偏微分する時は次のようになります。

$$\frac{\partial}{\partial u}F(x,y)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u}$$

$$\frac{\partial}{\partial v}F(x,y)=\frac{\partial F}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial v}$$

1変数に対して別の1変数の合成関数であれば、次のように、通常の1変数の合成関数の公式と一致します。

$$1変数の場合は \frac{\partial}{\partial t}F(x)= \frac{\partial F}{\partial x}\frac{\partial x}{\partial t}=\frac{dF}{dx} \frac{dx}{dt} $$

公式の証明

合成関数に対して偏微分を考える場合、なぜ和が出てくるのか?という話ですね。基本的の証明の方法は、1変数の場合の、積や商の微分公式の証明と似ています。プラスとマイナスがゼロになって「隠れている」項があるわけです。

証明は、偏微分の定義の式に戻って計算を進めます。1つの変数 u で偏微分する時は、v, w,・・等は計算に影響しないので、ここでの証明では v, w 等の記載を省かせていただきます。本質的には、それらの変数もあると思ってください。

$$F(X(u+h),Y(u+h),Z(u+h))-F(X(u),Y(u),Z(u))に対して、$$

$$F(X(u),Y(u+h),Z(u+h))- F(X(u),Y(u+h),Z(u+h)) および$$

$$F(X(u),Y(u),Z(u+h))- F(X(u),Y(u),Z(u+h)) を加えます。 $$

すると、Fに対する u の偏導関数は次の和の形になります。
途中で平均値の定理を用いていて、xに対して特定の値を代入している部分があります。

$$ \large \frac{\partial}{\partial u}F(x,y,z) $$

$$= \large \lim_{h\to 0}\frac{F(X(u+h),Y(u+h),Z(u+h))-F(X(u,v),Y(u,v),Z(u,v))}{h} $$

$$ \large =\lim_{h\to 0} \frac{F(X(u+h),Y(u+h),Z(u+h))- F(X(u),Y(u+h),Z(u+h))}{h} $$

$$ \large + \lim_{h\to 0} \frac {F(X(u),Y(u+h),Z(u+h))- F(X(u),Y(u),Z(u+h))}{h} $$

$$ \large + \lim_{h\to 0} \frac{F(X(u),Y(u),Z(u+h))- F(X(u),Y(u),Z(u))}{h} $$

$$ \large =\lim_{h\to 0} \frac {\{X(u+h)-X(u)\} \partial x F(\phi_X,Y(u+h),Z(u+h))}{h} 【平均値の定理】$$

$$ \large +\lim_{h\to 0} \frac {\{Y(u+h)-Y(u)\}\partial y F(X(u),\phi_Y,Z(u+h))}{h}$$

$$ \large +\lim_{h\to 0} \frac {\{Z(u+h)-Z(u)\} \partial z F(X(u),Y(u), \phi_Z) }{h}$$

$$ \large =\lim_{h\to 0} \left\{\frac {X(u+h)-X(u)}{h} \partial x F(\phi_X,Y(u+h),Z(u+h))\right\} $$

$$ \large +\lim_{h\to 0} \left\{\frac {Y(u+h)-Y(u)}{h} \partial x F(X(u),\phi_Y,Z(u+h))\right\} $$

$$ \large +\lim_{h\to 0} \left\{\frac {Z(u+h)-Z(u)}{h} \partial x F(X(u),Y(u),\phi_Z)\right\} $$

$$ \large = \frac{\partial x}{\partial u} \frac{\partial F}{\partial x} + \frac{\partial y}{\partial u} \frac{\partial F}{\partial y} + \frac{\partial z}{\partial u} \frac{\partial F}{\partial z}= \frac{\partial F}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial F}{\partial y}\frac{\partial y}{\partial u} + \frac{\partial F}{\partial z}\frac{\partial z}{\partial u} 【証明終り】$$

一番最後のところは掛け算の順番を入れ替えて書き直しただけです。

$$ \large \partial x F(\phi_x,Y(u+h),Z(u+h))などは、y=Y(u+h),z=Z(u+h)に値を固定して$$ $$ \large xで偏微分し、x=\phi_x を代入したものです。\phi_x \in [X(u),X(u+h)]$$ $$ \large また、\lim_{h\to 0}\phi_X =X(u) であり、\phi_Y,\phi_Zについても同様です。$$ ここではX(u,v,w,・・)を略記してX(u)と書いているので、 $$ \large \lim_{h\to 0}\frac {X(u+h)-X(u)}{h} の部分は偏微分 \frac{\partial X(u,v,w,,\cdots)}{\partial u} =\frac{\partial x}{\partial u} です。$$ 平均値の定理は使用しなくても別にいいのですが、hの処理を見やすくするために使用しました。

1変数の場合は上記のようにプラスマイナス0を利用した項の付け加えが必要なかったので、和の形ではなく1項だけになります。

★ x,y,z,・・の側の変数がn個の場合も、同様の形のn個の和として表せます。
例として、4変数の場合を考えてみましょう。つまり、F(x,y,z,t) に対して、x,y,z,s が u, v,・・・の関数である場合です。
この場合、次のものを加えて定義の極限を考えればいいのです。 $$F(X(u),Y(u+h),Z(u+h),T(u+h))- F(X(u),Y(u+h),Z(u+h),T(u+h)) $$ $$+F(X(u),Y(u),Z(u+h),T(u+h))- F(X(u),Y(u),Z(u+h),T(u+h))$$ $$+F(X(u),Y(u),Z(u),T(u+h))- F(X(u),Y(u),Z(u),T(u+h))$$ このような感じで、u と u+h の組について、1つずつずらしていく形で組み合わせれば、何変数であっても上記の証明と同じ手順で合成関数に対する偏微分の公式を証明できます。

n変数に関して同様に証明可能です。

合成関数の偏微分は物理の中では様々な箇所で用いられますが、例えば全微分というものとの関連で熱力学や流体力学の理論で用いたり、リーマン幾何学との関連で相対論で計算を考える時もあります。また、基本分野の古典力学の理論でも使用する事があります。得られた結果は電磁気学等でも使用します。

★ 関連記事:偏微分の応用の例:位置エネルギーと保存力の関係

高階微分の応用:テイラー展開とマクローリン展開

今回は、高階微分と、その応用として重要なテイラー展開、マクローリン展開と呼ばれる無限級数展開について説明します。大学で物理や工学を学ぶ場合などは、非常に重要となる項目です。

このページの中盤以降では、マクローリン展開の事は Mcl .展開と略記します

まず、高階微分について簡単に説明し、その応用としてテイラー展開とマクローリン展開について述べます。最後に、関数がテイラー展開可能である条件として、数学的には剰余項と呼ばれるものが収束する必要があるので、その問題について述べます【これは数学上の問題で、物理等にはあまり関係のない問題です】。

後半、数学的にかなり詳しく述べている部分もありますが、詳しい証明や導出を知りたい人向けです。
そうでない場合は参考までに眺めていただければじゅうぶんです。

幾何級数と無限級数の基礎については別の記事で述べましたが、
今回はテイラー展開とマクローリン展開です。高階微分を用いた無限級数展開です。

高階微分とは?

高階微分」=「1つの関数を何度も微分する事」です。意味としては簡単ですので具体例などを見てみましょう。記号で書かれるとややこしく見えるところにだけ注意しましょう。

2階微分とは?高階微分(2階微分、3階微分・・)について
極限としての2階微分(2階導関数)および高階導関数の定義

2階微分とは?高階微分(2階微分、3階微分・・)について

2階微分とは、「2回」微分操作をするという事です。 同じく、3回微分操作した場合を3階微分、n回微分したも場合をn階微分と言い、まとめて高階微分と呼びます。導関数については、「n階導関数」のように表現します。
※たまたま日本語では「2階」と「2回」が同じ読み方なのでどちらで表現してもほとんど誤解はないと思いますが、一応用語としては区別されています。

2回微分するから2階微分・・というのは、決して試験用の語呂合わせではなく、日本語の漢字の読み方の偶然です。

例えば sin x の通常の微分(1階微分)は cos x ですが、
2階微分は -sin x で、3階微分は -cos x 、4階微分は sin x です。

  1. sin x → cos x [1回目の微分(=通常の微分、1階微分)]
  2. cos x → -sin x [2回目の微分(=2階微分)]
  3. -sin x → -cos x [3回目の微分(=3階微分)]
  4. -cos x → sin x [4回目の微分(=4階微分)]※元の関数に戻るわけです。

\(x^2\)の通常の微分(1階微分)は 2x であるわけですが、
2階微分は 2 で、3階微分は 0 です。(4階以上の微分も、全て 0 です。)

  1. \(x^2 \rightarrow 2x\) [1階微分]
  2. 2x → 2 [2階微分]
  3. 2 → 0 [3階微分]※定数の微分ですから、0ですね。

\(e^x\)は、1回微分すると \(e^x\) で元の関数と同じなので、
それをさらに微分した2階導関数も3階導関数も、全ての高階導関数について同じ形で \(e^x\) です。

このように、続けて公式を適用していけばいいだけなので、計算としては特別難しいものではありません。

ただ、数式としての表記方法だけ見ると、慣れないと少し難しく「見える」かもしれません。 しかし、意味するものは通常の微分の延長にあるだけという事が分かると、なじみやすいかと思います。

極限としての2階微分(2階導関数)および高階導関数の定義

極限として2階微分を考えた時の定義は次のようになります。「通常の微分(導関数)」をさらに微分するわけですので、1階微分の定義の関数の部分に、1階導関数を当てはめれば2階微分により得る2階導関数になります。

定義と表記 $$2階微分の定義:f^{\prime\prime}(x)=\frac{d^2}{dx^2}f(x)=\frac{d}{dx}\left(\frac{d}{dx}f(x)\right)=(f^{\prime}(x))^{\prime}=\lim_{h \to 0}\frac{f^{\prime}(x+h)-f^{\prime}(x)}{h}$$

これが、2階微分(あるいは2階導関数)を定義で表した場合の式です。
初等関数に適用する場合などは、上記の例のように、公式により出されている1階の微分による導関数を単純に「もう1回」微分する事が行われるのが普通です。
3階、4階・・の微分についても、同様に考えます。例えば3階微分を定義式で(敢えて)表すのであれば次のような式になります。

$$3階微分の定義:f^{\prime\prime\prime}(x)=\frac{d^3}{dx^3}f(x)=\frac{d}{dx}\left(\frac{d^2}{dx^2}f(x)\right)=(f^{\prime\prime}(x))^{\prime}=\lim_{h \to 0}\frac{f^{\prime\prime}(x+h)-f^{\prime\prime}(x)}{h}$$
高階微分の表記方法

ある関数を2階微分している事を表す表記方法は、通常の1階微分にいくつもの表記方法があるように、同じく多くの表記方法があります。基本的には1階微分の表記方法に基づくものです。

$$2階微分の表記法:\frac{d^2y}{dx^2},\frac{d^2}{dx^2}f(x),\frac{d^2f}{dx^2},\frac{d^2f(x)}{dx^2},y^{\prime\prime},f^{\prime\prime}(x),f^{(2)}(x),d^2y/dx^2, \ddot{y}$$ 3階微分、n階微分の場合の表記方法は次の通りです。 $$3階微分の表記法:\frac{d^3y}{dx^3},\frac{d^3}{dx^3}f(x),\frac{d^3f}{dx^3},\frac{d^3f(x)}{dx^3},y^{\prime\prime\prime},f^{\prime\prime\prime}(x),f^{(3)}(x),d^3y/dx^3$$ $$n階微分の表記法:\frac{d^ny}{dx^n},\frac{d^n}{dx^n}f(x),\frac{d^nf}{dx^n},\frac{d^nf(x)}{dx^n},f^{(n)}(x),d^ny/dx^n$$

基本的には何階であっても表記の考え方は同じであるわけですが、階数が増えると、f(x) に「’ (プライム、ダッシュ)」をつける方法や、y の上に「・(ドット)」をつける方法は分かりにくいので、\(\frac{d^ny}{dx^n} や f^{(n)}(x)\)の表記が使われる事が多いのです。

高階導関数の表記方法を用いると、具体的な初等関数の2階微分やn階微分も、 $$\frac{d^2}{dx^2}\sin x=\frac{d}{dx}\cos x=-\sin x\hspace{10pt}\frac{d^n}{dx^n}e^x=e^x$$ ・・というふうに書けます。こういう書き方をすると難しく見えてしまうかもしれませんが、
重要なのは「決められた回数だけ微分操作を繰り返している」という事なのです。
もしとっつきにくいと感じた方も、そのように易しい形で理解していただければと思います。

高階微分って、何に「使う」の??

「2階以上の微分」というものは、一見すると何に使うのか分かりにくいかもしれません。
具体例を見てみるのが、最も分かりやすいと思います。
例えば、「2階微分」を用いる最も簡単な応用例は、物理の力学の「運動方程式」です。
物理では、時間を変数としたうえで、次の解釈が適用される事が重要です。

  • 速度は位置座標の1階の時間微分:\(v=\frac{dx}{dt}\)
  • 加速度は位置座標の2階微分(速度の1階微分):\(a=\frac{d^2x}{dt^2}=\frac{dv}{dt}\)
    ※ここでの a は、定数ではなくて、加速度(acceleration)です。
    ※細かい事を言いますとじつは物理では「ベクトルの微分」を考えるのですが、ここでは簡単のため1次元の速度と加速度を例として挙げています。

「運動方程式を解く」という事は、「2階の微分を含む『微分方程式』」を解くという事ですので、例えばそこで2階微分の考え方が用いられるわけです。

また、このページで次に述べるテイラー展開も物理や各種の工学などで重要です。これは1階および高階の微分を用いた無限級数による関数の表現方法になります。

テイラー展開とマクローリン展開

高階微分の応用として重要なテイラー展開とマクローリン展開について述べましょう。
数学的には、1段階前のテイラー公式というものがある事が重要です。

微分法はそもそも、関数のある点の近傍における近似1次式としての意味があります。そこで、1次式だけでなく、2次式、3次式の近似や、最終的には無限項の多項式で関数を近似しようという発想で、関数を多項式によって無限級数展開するのが、テイラー展開です。(平均値の定理の拡張と見る事もできます。)

テイラー展開とは? ■ マクローリン展開の一覧表 ■ テイラー公式の証明

関数の x = a における「テイラー展開」とは?

このテイラー展開では、通常の微分と、高階微分による微分係数(x = a におけるf'(a), f”(a)など)が用いられます。一見とっつきにくいかもしれませんが、具体的な初等関数のテイラー展開は、このページの前半でも述べた微分公式を使って係数を出していけばいいだけですので、決して難しいわけではありません。

テイラー展開 関数 f(x) のテイラー展開とは、次のような無限級数展開の事を言います。 $$f(x)=\sum_{n=0}^{\infty}\frac{(x-a)^n}{n!}f^{(n)}(a)={\small f(a)+(x-a)f^{\prime}(a)}+\frac{(x-a)^2}{2!}f^{\prime\prime}(a)+\frac{(x-a)^3}{3!}f^{\prime\prime\prime}(a)+\cdots$$

この形で表された無限級数展開を、x = a におけるテイラー展開と言います。
このようなテイラー展開を行う時、「x = a のまわりでテイラー展開する」という言い方もします。
これは、テイラー展開が x = 0, x = 1, x = 2, ・・など、任意の x の値における微分係数で表現できるという事です。

注意と参考:数学的には「剰余項」を含む段階の「テイラー公式」があります

解析学的においては、上記の形の式が n で終わる有限項の和に「剰余項」Hn(x)を加えたものをまず考えます(テイラー公式と呼ばれる事があります)。この剰余項が n→∞ でゼロになればテイラー展開の形になります。
$$テイラー公式:f(x)=\left(\sum_{j=0}^{n}\frac{(x-a)^j}{j!}f^{(j)}(a)\right)+H_n(x)$$ 初等関数では多くの場合に、この剰余項は n →∞ の極限で 0 になるので応用の面ではそこまで気にしなくてもいいのですが、収束する「xの範囲」が限定される場合もあります。
この剰余項の収束問題については、このページの後半で詳しく説明しましょう。

テイラー展開の式に \(a=0\)を代入したものがマクローリン展開と呼ばれる公式です。

マクローリン展開展開

x=0におけるテイラー展開がマクローリン展開です。
x=0における微分係数、高階微分係数を考えます。

$$f(x)=\sum_{n=0}^{\infty}\frac{x^n}{n!}f^{(n)}(0)=f(0)+xf^{\prime}(0)+\frac{x^2}{2!}f^{\prime\prime}(0)+\frac{x^3}{3!}f^{\prime\prime\prime}(0)+\frac{x^4}{4!}f^{\prime\prime\prime\prime}(0)+\cdots$$

以下、マクローリン展開の事は Mcl .展開と略記します

Mcl . 展開は、「テイラー展開の中でも、特によく用いられる形」・・という事になりますが、その理由は単純で、式の形が簡易になるためです。x = 0 という使いやすい場所での計算をしたいがため、物理などでも多く使われるのです。
物理等では、よほどの精度を求めない限り、3次や4次などの高階の部分は「ほとんど0」とみなせる場合をわざと考察する事も多いです。

指数関数や三角関数の Mcl .展開は、物理等への応用でも純粋数学的にも重要です。
例えば、ほんの1例ですが、自然対数の底 e の値が2.718・・である事や無理数・超越数である事の証明には Mcl .展開を用います。半端な変数における三角関数の具体的な値を知るのにも Mcl .展開を使えます。

$$e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots$$

$$\sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots$$

$$\cos x=1-\frac{x^2}{2}+\frac{x^4}{4!}-\frac{x^6}{6!}+\cdots$$

後述しますように、この形の無限級数展開を導出するには、部分積分を用いるやり方が比較的簡単です。部分積分は積の微分公式から導出される積分公式で、微分の関係をうまく使います。テイラー展開の各分母の階乗も、単項式の微分由来です。

参考までに、テイラー展開には、大学数学の解析学的には「一意性」がある事が重要です。どういう事かと言いますと、同じ「『多項式の形』の無限級数」(整級数と言います)で表される関数がある場合、同じ関数を表すのであれば、各\(x, x^2, x^3, \cdots\)の係数の表し方は「1通りしかない」という数学的事実があるのです。
(※微分以外の方法では決して表せないという事ではなくて、微分以外の方法で表せたとしても、じつは微分で表したテイラー展開に一致する、という意味です。)
これは、微分の範囲を複素数まで広げた場合などで、結構理論的には重要になります。

★参考

テイラー展開の一意性については、じつは\(f(x)=A_0+A_1(x-a)+A_2(x-a)^2+\cdots\) の形の無限級数を微分したうえでx→ a の極限を考えれば、かなり簡単に分かる事なのです。
そのように無限級数を直接微分する事を「項別微分」と言います。
しかし、じつはこの項別微分という計算は「できる場合とできない場」合があります。
\(f(x)=A_0+A_1(x-a)+A_2(x-a)^2+\cdots\) の形の無限級数(整級数と言います)は、「一様収束性」という性質があるので項別微分が可能なのです。これについては自明ではないので解析学的な証明が必要です。

\(\frac{1}{1-x}\)のテイラー展開と幾何級数展開は、本質的に同じもの?違うもの?

「高校でも教わる無限級数展開」として、幾何級数展開があります。「等比数列の和」という名前のほうが、多くの方にとって、もしかするとなじみがあるかもしれません。
例えば次の無限級数は、幾何級数の方法で出す事ができます。

$$|x| < 1 の時、\frac{1}{1-x}=1+x+x^2+x^3+x^4+\cdots$$ $$※導出:S_n=1+x+x^2+x^3+\cdots+x^n として S_n-xS_n=1-x^{n+1} となるので$$ $$|x|<1 の時、S_n(1-x)=1-x^{n+1}\Leftrightarrow S_n=\frac{1-x^{n+1}}{1-x}\rightarrow \frac{1}{1-x}\hspace{5pt}(n\rightarrow \infty)$$

このとき、じつは\(\frac{1}{1-x}\)をテイラー展開・Mcl.展開する事もできます。この時、結論を言いますと、幾何級数で表された無限級数は、Mcl.展開に一致するのです。
2つ以上の方法で整級数の形に表わせたとき(例えば幾何級数の方法とテイラー展開)であろうと、両者は本質的に同じである・・という事の具体例になります。

整級数の形に無限級数展開を行う時、何かしら「計算しやすい方法」で1つの形を導出してけば、それは本質的に1通りの正しい整級数の表式という事が、じつは保証される、という数学的事実があります。
テイラー展開等が特別扱いというわけではなく、\(\frac{1}{1-x}\)の場合であれば幾何級数によって考えるほうが簡単なので、そちらの考え方でもよいというわけなのです。

マクローリン展開の一覧表

物理等では重要なので、主要な初等関数の Mcl. 展開をいくつか表にまとめてあります。x = 0 での f(0) と、微分係数 f ‘ (0), f ‘ ‘ (0),・・を具体的に計算し、 Mcl. 展開の式に代入すれば公式が得られます。
表にある「収束半径」とは、無限級数が有限の値に収束する「変数 x の範囲」の事で、ここでのより具体的な意味としては剰余項が収束するかという事です。これについては、初等関数の中でも、あまり気にしなくてよいものと、気にしたほうがよいものがあります。

対象の関数Mcl.展開収束半径計算方法
e の指数関数\(e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\cdots\) 実数全域 \((e^x)^{\prime}=\frac{d^n}{dx^n}e^x=e^x\)
f(0) = f'(0) = f”(0) = 1
自然対数関数
ln(1+x)
\({\small\ln (1+x)}\)
\(=x-\frac{x^2}{2}+\frac{x^3}{3}-\frac{x^4}{4}+\cdots\)
※ln x だと、x = 0 で定義できず、微分不可能・Mcl.展開不可能
|x| < 1\({\small(\ln(1+x))^{\prime}}=\frac{1}{1+x}\)
\({\small(\ln(1+x))^{\prime\prime}}=\frac{-1}{(1+x)^2}\)
f(0)=0, f'(0)=1, f”(0)=-1
三角関数
(正弦)
\(\sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots\)実数全域 \({\small(\sin x)^{\prime}=\cos x }\)
\({\small(\sin x)^{\prime\prime}=-\sin x}\)
f(0)=0, f'(0)=1, f”(0)=0, f”(0)=-1
三角関数
(余弦)
\(\cos x=1-\frac{x^2}{2}+\frac{x^4}{4!}-\frac{x^6}{6!}+\cdots\)実数全域 \({\small(\cos x)^{\prime}=-\sin x}\)
\({\small(\cos x)^{\prime\prime}=-\cos x}\)
f(0)=1, f'(0)=0, f”(0)=-1, f”(0)=0
\(\frac{1}{1-x}\)
幾何級数
\(\frac{1}{1-x}\)
\(=1+x+x^2+x^3+x^4+\cdots\)
|x|<1 \(\left(\frac{1}{1-x}\right)^{\prime}=\frac{1}{(1-x)^2}\)
\(\left(\frac{1}{1-x}\right)^{\prime\prime}=\frac{2}{(1-x)^2}\)
※(-1)と(-1)がかけられ、
必ず+になります。
f(0)=1, f'(0)=1, f”(0)=1, f”(0)=1
\((1+x)^a\)
一般2項級数
\((1+x)^a=1+ax\)
\( +\frac{a(a-1)}{2}x^2+\frac{a(a-1)(a-2)}{3!}x^3+\cdots\)
|x|<1 \({\small((1+x)^a)^{\prime}=a(1+x)^{a-1}}\)
\({\small((1+x)^a)^{\prime\prime}=a(a-1)(1+x)^{a-2}}\)
f(0)=1, f'(0)=a, f”(0)=a(a-1)
f”'(0)=a(a-1)(a-2)

テイラー展開の式は、どのように導出する??

証明の方法はいくつかありますが、ここでは積分の公式である「部分積分」を使う方法を、述べます。(積分区間に変数を含んだ形の計算になるので注意してください。

ここで具体的に述べますのは、「剰余項」を含んだ「テイラー公式」の証明です。
そして個々の関数について、剰余項が n→∞ でゼロになる事を示して個々の関数についてのテイラー展開と Mcl. 展開が証明されるという流れです。剰余項の収束問題については後述します。

証明(テイラー公式)

まず、
\(f(x)-f(a)=\int_a^x f^{\prime}(t)dt \Leftrightarrow f(x)=f(a) + \int_a^x f^{\prime}(t)dt\)
【※これは「微積分学の基本定理」を用いています。唐突に t という別の変数が出てきてどういう事かと思われる方もいるかもしれませんが、これはあくまで積分での表記方法の約束です。】
次に、
\(f(x)=f(a) + \int_a^xf^{\prime}(t)dt\)
\( =f(a)-\int_a^x(x-t)^{\prime}f^{\prime}(t)dt \hspace{10pt}【∵\frac{d}{dt}(x-t)=-1】 \)
\( =f(a)-\left[(x-t)f^{\prime}(t)\right]_a^x +\int_a^x(x-t)f^{\prime}(t)dt \)

\( =f(a)+(x-a)f^{\prime}(a)-\int_a^x\left(\frac{d}{dt}\frac{(x-t)^2}{2}\right)f^{\prime}(t)dt \hspace{10pt}【∵\frac{d}{dt}(x-t)^2=-2(x-t)】 \)
\( =f(a)+(x-a)f^{\prime}(a)-\left[\frac{(x-t)^2}{2}f^{\prime}(t)\right]_a^x+\int_a^x\frac{(x-t)^2}{2}f^{\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)-\int_a^x\left(\frac{d}{dt}\frac{(x-t)^3}{3!}\right)f^{\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)-\left[\frac{(x-t)^3}{3!}f^{\prime\prime}(a)\right]+\int_a^x\left(\frac{d}{dt}\frac{(x-t)^3}{3!}\right)f^{\prime\prime\prime}(t)dt \)
\( =f(a)+(x-a)f^{\prime}(a)+\frac{(x-a)^2}{2}f^{\prime}(a)+\frac{(x-a)^3}{3!}f^{\prime\prime}(a)+\int_a^x\frac{(x-t)^3}{3!}f^{\prime\prime\prime\prime}(t)dt\)
\(=\cdots\)
この操作を繰り返す事により、\(\int_a^x\frac{(x-t)^{n-1}}{(n-1)!}f^{(n)}(t)dt\)の形の剰余項(「積分型の剰余項」)を含んだ形の「テイラー公式」が成立します。【証明終り】

この剰余項は、主要な初等関数の場合は0に収束するのでテイラー展開が成立します。ただし、剰余項が収束する「x の範囲」が限定される場合もあるので、そこは注意が必要です。
e の指数関数や、三角関数については定義域の全域で剰余項は0に収束するので、定義域全域で「テイラー展開可能」です。

この他に、計算は結構面倒なのですが、逆三角関数の Mcl.展開はじつは数学的には特徴的な形になって、円周率を表す式の導出に使えたります。ただしこれは、物理等への応用ではあまり重要ではないです。

剰余項の収束問題

上記のような部分積分による方法でも他の方法でも、テイラー展開を導出すると最後のnを含んだオマケの項である「剰余項」がくっついてきます。

結論を言うと指数関数や三角関数などの初等関数においては剰余項はn→∞で0に収束するので、無限級数の形で問題なくテイラー展開・ Mcl.展開を、使う事ができます。ここでは、その事の証明を記しておきます。結構面倒な部分も含まれるので、参考までに見てください。

\(e^x,\sin x,\cos x\) の剰余項の収束問題 ■ 関数 \((1+x)^{\alpha}\) の剰余項の収束問題

\(e^x,\sin x,\cos x\) の剰余項の収束問題

上記で、理論的にはまずテイラー公式というものがあって、n→∞で剰余項が0に収束するものが「テイラー展開可能」という事でした。

e の指数関数や三角関数については、剰余項が収束する事を証明してみましょう。

証明のポイント

ポイントは、「nに関する極限」を考える事です。つまり、変数xについては極限操作としてはいじらないという事です。
極端な話、例えばx=0、x=100といった具体的な値を代入してみて、その時に剰余項がnに関してn→∞で0に収束すれば、「x=0、x=100でテイラー展開可能」という事です。
積分型の剰余項では積分区間にxが入ってますが、nに注目した場合は特定の積分区間での定積分のように考える事ができるのがポイントなのです。

前半でも触れましたように e の指数関数や三角関数はn階導関数を容易に表せます。これによってまず、剰余項のn階微分のところが具体的になります。
まず最初は、e の指数関数です。

$$e^x のテイラー公式の積分型の剰余項は:R_n(x)=\int_a^x\frac{x^{n-1}}{(n-1)!}e^tdt$$

$$注目すべきところはnに関する部分、つまり \frac{x^{n-1}}{(n-1)!}です。$$

具体的な関数の部分については各々の変数について「nに関しては定数」という扱いになり、積分も各々のxに対して有限の区間内の定積分とみなせますから、積分の中身がn→∞で0に収束すれば定積分も0に収束するのです。

$$よって、\lim_{n\to \infty}\frac{x^n}{n!}=0を示せばよく、 $$

$$それによりe^x は全実数の範囲でテイラー展開可能である事が示されます。 $$

nをじゅうぶん大きくすればおそらく0に収束する「だろう」事が予想されますが、具体的にそれを示しましょう。まずxが正の範囲の時に示します。xよりも大きいてきとうな自然数 Mを考えます。n=2Mを考えると、分母には、M+1、M+2、・・M+Mという、M個のMより大きい数が因数として含まれています。

他方、分子にあるのはMよりも小さいxという正の実数のM乗です。この時点でまず分子よりも分母が確実に大きい事が分かりますが、このn= 2Mよりもさらにnを大きくすると、nが1増えるごとに分子はxが1つ乗じられ、分母は2M+1、2M+2、・・などの数が乗じられます。つまり、nを大きくすれば、どのような小さい正の実数よりも \(\frac{x^n}{n!}\) を小さくできます。

$$x>0の時、任意の正の実数\epsilon に対し\frac{x^n}{n!}< \epsilon つまり \lim_{n\to \infty}\frac{x^n}{n!} =0 です。$$

xが負の場合も、絶対値は変わりませんから符号が入れ替わりながら0に収束します。x=0の場合は\(\frac{0^{n-1}}{(n-1)!}=0\) ですから、この場合も組み込む事ができます。

$$ よって、任意の実数xに対して\lim_{n\to \infty}\frac{x^n}{n!}=0であり、 \lim_{n\to \infty} R_n(x) =0【証明終り】 $$

三角関数の場合は、n階微分も三角関数の形ですから、絶対値は1よりも小さい事を用いて不等式を作ります。そして指数関数の時と同様の極限を考える事で剰余項がn→∞で0に収束する事になるのです。

関数 \((1+x)^{\alpha}\) の剰余項の収束問題

じつは剰余項の収束問題に関しては、e の指数関数や三角関数よりも\((1+x)^{\alpha}\)といった一見簡単な関数のほうが、証明が面倒です。
おそらく、このページの内容の中では問題としてはここが一番難しいです。
上手に不等式を使って値の大きさを評価しないと、なかなかうまくいきません。
ここでは、次の事を示します:

$$任意の実数\alpha に対して(1+x)^{\alpha} は、|x|<1ならば Mcl. 展開可能$$

「|x|<1 の範囲で、x=0のまわりでテイラー展開可能」と言っても同じです。
以下、x=0のまわりでのテイラー公式について考えます。Mcl.展開の形で「無限級数ではなく剰余項が残ったままの状態」と考えてもよいと思います。

$$ f(x)=(1+x)^{\alpha} の積分型の剰余項:R_n(x)=\int_0^x\frac{(x-t)^{n-1}}{(n-1)!}f^{(n)}(t)dt$$

$$f(x)=(1+x)^{\alpha}とすると、 f^{(n)}(t)=\alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) (1+t)^{\alpha -n} $$

積分変数(ここではt)に対する定数となる部分は、積分記号の前に持っていきましょう。

$$ R_n(x)= \frac{ \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) }{ (n-1)! } \int_a^x (x-t)^{n-1} (1+t)^{\alpha -n} dt $$

不等式をうまく使うために、2つほど、それほど難しくない関係式を示します。まず、1つ目です。

補題①

$$|x|<1 かつ 0<t<xまたは0>t>xならば\left|\frac{x-t}{1+t}\right|<|x|$$ ちょっと分かりにくいかと思いますが、xとtの正負の符号が一致して、尚かつ絶対値に関して|x|>|t| という関係のもとで成立する式です。これは、積分に関してうまく不等式を作るための式です。

★ 証明: $$0<t<xの時、\left|\frac{x-t}{1+t}\right|=\frac{x-t}{1+t}<\frac{x}{1+t}<x=|x|$$ $$0>t>xの時、\left|\frac{x-t}{1+t}\right|=\frac{-x+t}{1+t}<\frac{-x-xt}{1+t}=\frac{-x(1+t)}{1+t}=-x=|x|【証明終り】$$ 2番目のほうについては、x >-1 に―t(>0)を乗じた ―xt>tの関係を使っています。

これによって剰余項を次のように変形したうえで不等式で評価できます。

$$ R_n(x)= \frac{ \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) }{ (n-1)! } \int_a^x (x-t)^{n-1} (1+t)^{\alpha -n} dt$$

$$= \frac{ \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) }{ (n-1)! } \hspace{5pt}\int_a^x \left(\frac{x-t}{1+t}\right)^{n-1} (1+t)^{\alpha -1} dt $$

これに絶対値をつけます。不等式を作りやすくなるためです。
次の式の2段目から3段目への不等式を作るために上記の補題の結果を用いています。

$$ |R_n(x) |= \left | \frac{ \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)}{ (n-1)! } \hspace{5pt} \int_a^x \left(\frac{x-t}{1+t}\right)^{n-1} (1+t)^{\alpha -1} dt\right|$$

$$< \frac{ | \alpha (\alpha -1)(\alpha -2)\cdots(\alpha -n+1) |}{ (n-1)! } \int_a^x \left| \frac{x-t}{1+t}\right|^{n-1} |1+t|^{\alpha -1}dt $$

$$< \frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)|}{ (n-1)! } \hspace{5pt} \int_a^x |x|^{n-1} |1+t|^{\alpha -1}dt $$

$$=\frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1)|}{ (n-1)! } |x|^{n-1} \hspace{5pt} \int_a^x |1+t|^{\alpha -1}dt $$

この最後の式には積分の中身にはnが入っていませんから、nに関しては定数であると考えて(もちろん各々のxに対しては別々の値になります)、てきとうにCとおけます。絶対値を外せば積分の計算も直接できてしまいますが、ここでは「nに関して定数」である事が分かればじゅうぶんなのです。まとめると次のようになります。

$$|R_n(x)|< \frac{ |\alpha (\alpha -1)(\alpha -2)\cdots (\alpha -n+1) |}{ (n-1)! } |x|^{n-1} C$$

この不等式の右辺側をもう少し変形します。

$$\frac{ |\alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) |}{ (n-1)! } |x|^{n-1} C$$

$$=\frac{| \alpha (\alpha -1)(\alpha -2) \cdots (\alpha -n+1) |}{ 1・2・3・4 \cdots (n-2)(n-1)} |x|^{n-1} C$$

$$< \frac{| \alpha (\alpha +1)(\alpha +2) \cdots (\alpha +n-1) |}{ 1・2・3・4 \cdots (n-2)(n-1)} |x|^{n-1} C $$

$$=|\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left (1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha |}{n-1} \right ) |x|^{n-1} C $$

ここで、先に進むにはもう1つ補題が必要です。

補題②

$$任意の実数\alpha に対して、0<r<1 ならば1+\frac{|\alpha|}{N}<\frac{1}{r} となる自然数Nが存在する$$ これは何の事かと言うと、要するに1と1よりも大きい数の間には1+εという別の数が必ずあり、大きい自然数Nで割る事でそのような小さい数εを作れる事を、式で表しただけです。

★ 証明: $$1<\frac{1}{r} であり、1<1+\epsilon <\frac{1}{r}を満たす正の実数\epsilon が必ず存在する。$$ $$任意の実数\alpha に対して0<\frac{|\alpha|}{N}<\epsilon となる(十分大きい)自然数Nは存在できる。$$ $$よって、 1+\frac{|\alpha|}{N}<1+\epsilon <\frac{1}{r}となる自然数Nが存在する。【証明終り】$$

これによって、さらに別の不等式で評価ができます。0<|x|<r<1を満たすてきとうな実数 r を想定します。

$$1+\frac{|\alpha|}{N}<\frac{1}{r} となる自然数Nが存在し、n≧N ならば 1+\frac{|\alpha|}{n}<\frac{1}{r}でもある。$$

$$n≧N の時、R_n(x)<|\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left (1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha |}{N} \right ) \cdots \left (1+\frac{| \alpha |}{n-1} \right ) |x|^{n-1} C$$

$$< |\alpha|\left(1+\frac{| \alpha |}{1} \right) \left (1+\frac{| \alpha |}{2} \right ) \left(1+\frac{| \alpha |}{3} \right) \cdots \left(1+\frac{| \alpha |}{N-1} \right) |x| ^{N-1} \left(\frac{ |x| }{r}\right)^{n-N-1} C $$

この不等式評価は、ある自然数Nについて、N-1までの項はそのままにして、N以降の項は1/rよりも小さいとしているのです。

ここで、N-1までの項の積は、nに関して定数である事に注意します。

$$つまり、 |\alpha|\left(1+\frac{| \alpha |}{1} \right ) \left ( 1+\frac{| \alpha |}{2} \right ) \left (1+\frac{| \alpha |}{3} \right ) \cdots \left (1+\frac{| \alpha|}{N-1} \right ) |x| ^{N-1} =K(nに関して定数)とおけます。$$

$$よって、|R_n(x)|<KC \left(\frac{ |x| }{r}\right)^{n-N-1}で、 \frac{ |x| }{r}<1 ですから、$$

$$\lim_{n\to \infty} \left(\frac{ |x| }{r}\right)^{n-N-1} =0, 従って \lim_{n\to \infty} |R_n(x)| =0 $$

よって、n→∞で剰余項が0に収束するので |x|<1の時 、x=0においてテイラー展開可能(つまり Mcl. 展開可能)です。【証明終り】

\((1+x)^{\alpha}\) の剰余項が|x|≧1の範囲では収束しない事

★尚、x≧1の時は剰余項が収束しない事については、少し遠回りですが、次のように考えます。
|x|<1 の時にマクローリン展開が可能であるわけですが、このように整級数の形で無限級数展開できた場合、じつは収束半径を計算する公式を使う事ができるのです。 $$公式:\sum_{n=0}^{\infty}a_nx^nの収束半径を\rho とすると、\frac{1}{\rho}=\lim_{n\to \infty}\left|\frac{a_n}{a_{n-1}}\right|$$ 【ただし、公式を適用できる条件があり、この極限が収束するか+∞に発散する場合に限ります。】
その公式を使うと、収束半径は1であるという結果が出ます。 整級数は収束半径未満のxの範囲で収束します。従って、x≧1の範囲でMcl.展開できたとすると、その形の収束半径が1である事に矛盾してしまうので|x|≧1でn→∞において剰余項が0に収束する事はあり得ない、というわけです。
注意すべきは、であるからといって|x|<1で剰余項が0に収束する事が直ちに示されるか?というとそうではないという事です。 |x|<1で関数をMcl.展開の形の整級数で表せるかどうかは、面倒ですが例えば上記のような方法でその範囲で確かに剰余項が0に収束する事を証明する必要があるのです。

このように\((1+x)^{\alpha}\)の形の多項式に関するMcl.展開可能性の理論は、厳密に見ると意外に細かくて面倒ですが、これによって一般2項定理が成立する事が確かに分かります。
また、物理等でも平方根や分数の形を無限級数の形にして(多くの場合3次以降等の高次項は0とみなして)理論を分析する事がよくありますが、そこで使われるのがMcl.展開です。平方根は「1/2乗」、分数は「-1乗」でもあるので、そのような事ができるのです。

解析学での極限値の定義

今回は、極限について、より数学的に考えた場合にはどのような定義になるのかといった事を紹介します。じつはこのページで語られる内容が、大学の学部での一般的な解析学・微積分学で最初に教えられるものです。そのため、今回の内容は数学科で教わるような「解析学の初歩」をかなり分かりやすく説明した内容にもなっています。その内容を見てみましょう。

解析学的な極限の厳密な定義は?

数列の極限の定義とε-N論法  ■ 実数の性質 有理数にない性質は? ■ 有界性と上界 下界 上限 下限 

数列の極限の定義とε-N論法

解析学での極限の理論は、数列の極限が初歩的で基本的内容となるので、まずそれを述べましょう。
\(\frac{1}{n},\frac{1}{n^2}\)といった数列は、限りなく0に近づきます。
この事について、極限値である0を基準にして考えた時、0を含む任意の区間(普通、開区間を考えます)内にある番号以降の数列がおさまる事を意味するのです。

「任意の区間」とは、「任意の『小さな』区間」を想定しています。
例えば、( -0.001 , 0.001 ) のような開区間です。数列1/nであれば、n=1001以上であれば、全てこの小さな区間内に入るわけです。
数列の、ある番号以上の「全ての」要素を考える理由は、「振動」の可能性を除くためです。振動してしまう場合は、収束では無く発散の部類に区分します。

この時、別の ( -0.0001 , 0.0001 ) のような、さらに小さい開区間を考えると、n=10001 以上でなければ要件を満たしません。そのため、数学的には次のように考えます。

  • まず、値cを含む開区間 U を考え、ある番号以上では全てそこに含まれるとする
  • どんな小さな開区間 U を考えても、対応する番号 N が存在するとする(これを、「任意の開区間Uに対し、ある自然数Nが存在する」などと表現します)
  • そのような条件を満たす時、数列はn→∞で「極限値cを持つ」と呼ぶ事にする(定義する)
数学的な極限値の定義≪数列≫①

$$\lim_{n\to \infty}A_n=c $$ $$\Leftrightarrow c を含む任意の開区間 U に対してn ≧ N_0 ならば A_n\in U となる自然数 N_0 が存在する$$

★ この小さな開区間の事を、「近傍」(英:neighborhood)とも言います。

極限の定義
「どんなに小さい」という表現を、「任意の」という言葉で数学では表現します。極限の定義としては「小さい」という事が意味としては重要ですが、大きい区間であっても当てはまる事から、「小さい」という言葉を添えるのは補助的な説明のためです。「任意」と言う時点で、大きいものも小さいものも全て含まれます。
参考

日本語の場合、「どんな実数でも」という事を「任意の実数に対して」という、少々難しい言い回しで表現する習慣があります。これに対して、じつは英語の場合では、日常で使う言葉をそのまま使う習慣があります。
「任意の実数 R に対して」を英語で言うと、for all real numbers R となります。
every や each を使っても表現されます。for each real number R 等。意味するものは大体同じです。

多くの微積分学・解析学の教科書では、同じ内容を不等式で書く事も多いです。その場合、「任意の正の(小さい)実数」をギリシャ文字の「イプシロン」ε で表すのが通例です。

数学的な極限値の定義≪数列≫②

$$\lim_{n\to \infty}A_n=c $$ $$\Leftrightarrow 任意の正の実数\epsilon に対してn ≧ N_0 ならば |A_n – c| < \epsilon となる自然数 N_0 が存在する$$

★ これは、極限値と数列の差が「限りなく小さくなる」=「どんな小さい正の実数cよりも小さくできる」・・と、捉えているわけです。
この方法による定義を、慣習的に 「イプシロン・エヌ論法」と呼んだり、後述しますように関数の場合には別の正の実数デルタ δ を考える事から「イプシロン・デルタ論法」と呼んだりします。

これらの定義は、分かりにくい事で悪名高いものでもあります。(意味としては難しくないのですが。)
実際、物理などで関数等の極限を考える時は、これらの定義はあまり重要でない事も多いです。
例えば、1/n や 1/x などの数列や関数は、直感的に捉えても上記の定義を使っても結局「極限値は0」という結果は同じなのです。そのため、同じ結果を得るのであればよりシンプルな考え方をすべきだ・・とも、言えるわけです。

数学的に厳密に考える利点があるのは、収束するのか発散するのかすごく微妙で、直感的には判定しがたいという場合です。そのような場合は、物理や工学などでの応用よりも、純粋数学的な議論において多いと思われます。

実数の性質 有理数にない性質は?

次に、極限に関する基礎的な理論を下支えするものとして、実数が持つ性質が重要です。実数とは有理数に無理数を合わせたものですが、無理数とは「実数のうち有理数でないもの」・・などと説明されますから、これでは実数とは何なのか?という事の説明としては不足するものがあります。

結論を言うと、次の有理数の性質は、実数も共有するものです。

有理数が持つ性質
  • +-÷× の四則演算などが定義できる(より正確には「体」(field) であるという事)
  • 「順序構造」がある・・異なる2つの要素を選んだ時、p < q または p > q が必ず成立する。

★ これは、実数も備えている性質であるわけです。実数とは全ての有理数を含んだ集合ですから、有理数が持つ性質は実数も全て備えていなければならない、とも言えます。

では実数にしかない性質は何だろう?と考えると、次の「切断」(Schnitt これはドイツ語由来です)と呼ばれる、部分集合の分け方において成立する事が、じつは有理数と異なるのです。
「切断」とは、ごく簡単に言うと1箇所だけ境を決めて、1つの集合を2つの部分集合に分けるという操作です。例えば実数全体を「0以上」と「0未満」に分ける事は「切断」に該当します。(必ずしもその集合に属する「1点」で分けない場合も含みます。)

「切断」の定義

順序構造を持つ集合Mと、M のある要素 c について、次の条件を満たす部分集合AとBに分割する事を「Mのcにおける『切断』」と呼ぶ: $$①A\cup B=M\hspace{10pt}②A\cap B=\phi\hspace{10pt}③任意のa\in A,b\in Bに対してa<b $$

部分集合AとBの役割は入れ替えても同じです。
要するに、このような2つの部分集合を考えるという事を意味しています。

実数の「切断」に関する性質:(「完備性」)

\(\mathbb{R}\)のcにおける切断によってできる部分集合AとBにおいては次の事が必ず成立する: $$「Aの最大値」と「Bの最小値」のどちらかだけが存在し$$ $$「Aの最大値 と B の最小値も両方存在しない」という事は起こらない$$

★ 尚、どんな集合の切断でも「A の最大値と B の最小値も両方する」という事は起こりません。
これを仮定すると、矛盾が生じるためです。

有理数の場合、じつは有理数全体における「切断」を考えた時には、切断で作った部分集合AとBについて「A の最大値 と B の最小値も両方しない」という事が起こります。

これを見るには、例えば \(q^2<2\) と \(q^2>2\) を満たす2つの部分集合に有理数を分けます。これはじつはきちんと「切断」に該当するのです。ところが \(q^2=2\) を満たす有理数は存在しませんから、これらの部分集合に最大値も最小値も存在しないという事です。
それに対して、これが実数の切断であれば \(r^2=2\) を満たす \(r=\sqrt{2}\) が存在しますからどちらかの部分集合に最大値か最小値が存在できるわけです。

有界性と上界、下界、上限、下限

さて、次に実数の中の部分集合(具体的には数列や関数)に対する、極限に関連する用語で重要なものを見ていきます。
これらも、意味としては簡単です。
ただし、記号などでごちゃごちゃ書かれると分かりにくいですから、意味を理解する事が重要です。

定義:「有界」である事

実数の部分集合Aとその要素 a について、 Aが「上に有界である」事と「下に有界である」事を次のように定義します。

  • 上に有界である:
    \(任意のa\in A について a < c となる実数 c が存在する\)
  • 下に有界である:
    \(任意のa\in A について a > c となる実数 c が存在する\)

「上」「下」「有界」という語が入っていれば、多少の文章での使い方は変えてもよい習慣になっています。例えば「上に有界なので・・」のように使えます。
意味としては全く難しくなくて、例えば数列1/nは必ず0より大きいので「下に有界」です。また、nが自然数であれば最大値は1ですから「上にも有界」です。これが関数1/xでxが正の実数であれば、「下には有界」であるけれどx→0で無限大に発散するので「上には有界でない」事になります。

次に、上界と下界です。これらはそれぞれ、上に有界である集合、下に有界である集合について考えられます。要するに、数列や関数よりも「必ず大きくなる集合」と「必ず小さくなる」集合です。

定義:上界と下界

実数の部分集合が上または下に有界である時、
集合「上界」と「下界」を次のように定義します。

  • 上界:\(U={c|任意のa\in A について a ≦ c}\)
  • 下界:\(V={c|任意のa\in A について a ≧ c}\)

【{x|・・・}は、「・・・を満たすxから成る集合」の意味】
上界は「じょうかい」、下界は「かかい」と読みます。UとかVの記号は、何でも構いません。
数列1/nは0より大きい事によって下に有界であると言えるわけですが、-1よりも必ず大きいので下に有界であると言ってもよいのです。
そのような、必ず1/nより小さくなる実数の集合が1/nの下界であり、「0以下の全ての実数」という集合を指すわけです。

定義の説明としては最後に、上限と下限を見てみましょう。これらも意味としては簡単で、それぞれ「上界の最小値」「下界の最大値」という意味で使います。

定義:上限と下限

有界である実数の部分集合 A の上界 U と下界 V に対して、
上限(supremum)下限(infimum)を次のように定義します。

  • 上限:\(\sup A=\mathrm{min} U\)(Aの上界 U の最小値)
  • 下限:\(\inf A=\mathrm{Max} V\)(Aの上界 V の最小値)

上界または下界の要素は無限個ありますが、特にそれぞれの最小値と最大値に注目するわけです。対象となる集合が数列であれば、$$\sup A_n,\inf A_n といった表記もなされます。$$

さてここで、上界が存在するなら上限は必ず存在し、下界が存在するなら下限は必ず存在するという事実があります。特に名前はついていない定理ですが、重要なので述べておきましょう。

定理:上限と下限の存在

有界である実数の部分集合 A に対して、 上界 U と下界 V に対して、

  • A の上界Uが存在するならばAの上限:\(\sup A=\mathrm{min} U\)も存在する。
  • A の下界Vが存在するならばAの下限:\(\sup A=\mathrm{Max} V\)も存在する。

上界または下界の要素は無限個ありますが、特にそれぞれの最小値と最大値に注目するわけです。

上界と上限
下界と下限の関係なども同様です。
円周率や、自然対数の底 e はこの理屈によって、上限として「存在する」事が証明されます。
他方で、円周率が3.141・・である事や e = 2.718・・である事は、直接的に数列の値を計算したり、無限級数展開を利用したりして示す必要があります。

これは自明な事ではないので証明が一応必要です。実数の完備性を用いる事で確かに成立する事を示せます。参考までに、記しておきます。

証明:上界には最小値が存在し、下界には最大値が存在する

Aの上界Uと、実数のうちAの上界でない集合\(\bar{U}\)は実数全体の「切断」になっている事に注目します。
実数全体に対する切断なので、Uと\(\bar{U}\)のどちらか片方「だけ」に必ず最小値あるいは最大値が存在します。
しかし、上界の定義から、\(\bar{U}\) の任意の要素 c に対して、必ず c < a となるAの要素 a が存在します。【上界の定義の否定を考えるわけです。】
となると、そのような c と a の間には必ず別の実数が存在し、(例えば\(\frac{c+a}{2}\))、その実数は\(\bar{U}\) の要素です。これは、\(\bar{U}\) の任意の要素 \(c_1\) に対して、\(c_1<c_2\)となる別の要素 \(c_2\) が存在するという事なので、\(\bar{U}\) には最大値は存在しません。
よって、もうひとつのほうの「Uに最小値が存在する」事が真という事になるので、上界には必ず最小値・すなわち上限が存在します。【証明終り】
下界に対して下限が存在する事の証明も、全く同じ論法によります。

解析学の基本的な定理:有界な単調数列は収束列である

数列や関数が特定の極限において収束するのか発散するのかを調べて理論を形成する事が、解析学では行われます。その1つとして、「有界である単調数列は収束列である」という事実(「定理」)は重要ですので見ておきましょう。単調数列とは単調増加あるいは単調減少数列という事です。収束列とは、単純に「収束する数列」という意味です。この時、もちろん上に有界である数列が収束する条件(の1つ)は単調増加である事、という意味です。

円周率や自然対数の底といった重要な定数が極限値として存在する事の根拠は、この定理です。

証明の流れと概要 
定理の証明:上限あるいは下限が極限値となる事を示す 
具体的な「有界な単調数列」にはどんなものがある? 

証明の流れと概要

まず、証明の流れを見ておきましょう。有界には上に有界と下に有界である場合(あるいは両方)がありますから、それぞれの場合に分けます。

  • 上に有界である単調増加数列
  • 下に有界である単調減少数列

証明の方法は全く同じなので、片方だけ示せばもう片方も全く同じように証明できます。ここでは、上に有界な単調増加数列の場合を考えます。

  1. 数列が上に有界であるから、上限(最小の上界)が存在する事実を確認
  2. 上限を含む任意の(小さな)開区間\(U_{\epsilon}\)を考える
  3. 少なくとも1つ、数列の要素がその開区間内に含まれる事を示す
  4. 単調増加関数である条件を適用すると、数列の上限が極限値の定義を満たす事が分かるので、これが極限値であると判定。→ 証明完了

要するに、上に有界である場合は「上限」が必ず存在するわけですが、その上限が数列の極限値に(必ず)なる、という事です。その詳しい証明を次に見ましょう。これはそれほど難しい証明ではなく、事実関係や極限の定義を丁寧に整理すれば「確かにそうである」事が言えるというものです。

★ 尚、数列とは、厳密にはそれ自体は集合よりもむしろ関数として考えるべきもので、集合として考える時は「そのような関数の値からなる集合」を考える必要が本来はあります。そのような厳密な区分が重要である場合もあります。
しかし、それは表記として少々煩雑でもあるので、数列{\(A_n\)} における具体的な \(A_1, A_2 \) などをここでは「数列の要素」と記す事にします。

定理の証明:上限あるいは下限が極限値となる事を示す

まず、単調増加数列が上に有界である時、それがどんな数列であろうともn→∞で収束する事を証明しましょう。上に有界という条件ですから、まず無限大に発散はしない事は明らかですが、明確に「極限値」が存在するかどうかが曖昧なので明確にしようというわけです。

前述のように、上に有界であれば上限すなわち「上界の最小値」が必ず存在します。結論は、この上限が数列の極限値という事になります。

$$\sup A_n=c とおくと任意の自然数nに対してA_n<c$$

ここで、このページの最初のほうでも述べた、極限値の定義を考えましょう。この場合は、不等式も使ったほうが簡単です。任意の小さい正の実数εを考え、区間 \(U_\epsilon =( c -\epsilon ,\hspace{5pt}c ] \)を考えます。
【※c -ε 側は開区間、c側は閉区間という事です。(c -ε ,c + ε) を考えても別に構いません。ここでの場合は単純に、cより大きい範囲は考える必要はないというだけです。】

この時、区間 \(U_\epsilon =( c -\epsilon ,c ] \) 内に数列の要素が含まれないという事はあり得ないのです。なぜなら、もしそのような事が起こるなら任意の自然数nに対して \(A_n ≦ c -\epsilon\) という事になり\(c -\epsilon\)も上界の1つという事になりますが、cが「最小の」上界なのですからそれはあり得ない、という事です。
【ここの部分に関しては、そのように仮定すると矛盾するから、という背理法の論法でも同じです。】

すると、少なくともある1つのn=Nについて、 \(A_N\in U_\epsilon( c -\epsilon ,c ] \) という事は言えるわけです。
ここで、\(A_n\) は単調増加数列という条件であれば、
任意のn≧Nを満たす自然数について、 \(A_n\in U_\epsilon( c -\epsilon ,c ] \) という事になります。
【c は上界の1つですから、nをどれだけ大きくしてもcを超える事はありません。】

さて、これで一体何が言えたのかと言うと、
「cは\(A_n\) 極限値の定義の条件としてぴったり当てはまる」事が言えたのです。
つまり \(A_n\) はn→∞で極限値cを持つ事が証明された、という事になるのです。
【証明終り】

このように、定義や事実関係を丁寧に当てはめていく事でこの定理は証明されます。下に有界である単調減少数列も、全く同様に下限を極限値として持つ事を証明できます。

具体的な「有界な単調数列」にはどんなものがある?

では、有界な単調数列とは具体的にはどんなものがあるでしょう。抽象的には表せるけれども具体例が全く見つからない・・というのでは、純粋数学的にもあまり有意義とは言えません。具体的には、1/nなどのごく簡単な数列は下に有界で単調減少である数列の1つです。この他にも、有界な単調数列というのは少し考えれば具体的にたくさん見つかるのです。

問題はむしろ、特定の数列が「有界な単調数列」かどうかの判定が分かりにくい場合でしょう。

$$例えば、\left(1+\frac{1}{n}\right)^n \hspace{5pt}や \hspace{5pt} \sum_{j=1}^n\frac{1}{n}-\ln n \hspace{5pt} などの数列です。$$

これらは、見た目では有界なのかも単調数列なのかも、ちょっと分かりにくいですね。結論を言うとこれらはどちらも有界な単調数列であり、それぞれ極限値を持ち e(自然対数の底、ネピア定数), γ(ガンマ、オイラー定数) で表される事が普通です。

円周率も、特定の数列の極限値です。この場合、円に内接および外接する正n角形の周の長さを数列として表した時に有界な単調数列になります。半径が1の円の円周の長さが円周率の2倍になります。【極限値が存在する事が分かれば定数倍に関しては調整できるので、円周率に関してはそのように定義しておくという事です。】

実関数の場合の極限と連続の定義

最後に、変数が実数である一般の関数(実関数)の場合の極限の定義なども整理しておきます。数列の場合は、言わば「変数が自然数」であるわけです。変数が実数になる事で、極限の定義なども1つ2つ文言が増えますが、基本的な考え方は同じです。

関数の場合の極限の定義: ε-δ論法 ■ 関数が連続であることの定義 ■ 微分と関数の連続性の関係 

関数の場合の極限の定義: ε-δ論法

まず、極限値となる値を含む任意の開区間を考える点は、数列の時と全く同じです。異なるところは、数列の場合において「n≧Nとなる任意のnについて」の箇所で、これを関数の場合にはどうするかという事が、問題になります。これに対しては、変数を無限大にする時と、特定の値に近づける時とで2つ定義を設けます。(本質的な意味は同じです。)

  • 変数を無限大にする時の関数の極限:\(\lim_{x\to \infty}f(x)\)
  • 変数を有限の値に近づける時の関数の極限:\(\lim_{x\to a}f(x)\)

数列の場合はn=1が変数の最小値ですが、関数の場合は x → 0 の時の極限なども考える事ができる、という事です。

関数の極限の定義①:変数を無限大にする時

この場合は数列の極限と大体同じ考え方です。ある値を含む任意の(小さな)開区間に、ある値以上の任意の変数に対する関数の値が全て含まれる事を定義にします。 $$\lim_{x\to \infty}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x ≧\delta ならばf(x)\in U となる実数\delta が存在する$$ この場合、無限大∞は正の方向の無限大であり、それを明確にする場合は +∞ とも書きます。実関数の場合、変数をマイナスのほうの無限大にした時の極限も考えます。考え方は同じです。 $$\lim_{x\to -\infty}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x ≦\delta ならばf(x)\in U となる実数\delta が存在する$$ 数列の時と同様、「任意の開区間」の部分を(小さな)正の実数\(\epsilon\) を用いた不等式を使っても同じ事です。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow 任意の正の実数\epsilon に対しx ≧\delta ならば|f(x)-c|<\epsilon となる実数\delta が存在する$$

関数の極限の定義②:変数を有限の値に近づける時 この場合、極限値cと、変数を近づける対象の値 a の両方に対して小さな開区間を考えます。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow c を含む任意の開区間 U に対して、x \in V_{\delta} ならば f(x)\in U となる a を含む開区間V_{\delta} が存在する$$ 不等式で記す場合は、関数側と変数側で2つの正の実数\(\epsilonと\delta\) を用意します。 $$\lim_{x\to a}f(x)=c$$ $$\Leftrightarrow 任意の正の実数\epsilon に対し、「|x-a|<\delta ならば|f(x)-c|<\epsilon となる」正の実数\delta が存在する$$

特定の有限の値に変数を近づける場合、対象が変な関数だと変数を「a より大きい側から近づけた時」と「 a より小さい側から近づけた時」に、極限値が異なる場合があります。そのような事があるので、解析学で厳密な考察をする場合は両者の極限を区別し、両者が一致する場合にその極限での「極限値」が存在すると呼ぶ事にしています。

尚、もし「右極限」と「左極限」の値が異なる場合には上記の という条件は満たされないのです。

$$「c を含む任意の開区間 U に対して、x \in V_{\delta} ならば f(x)\in U となる a を含む開区間V_{\delta} が『存在できない』」$$

それは、a を含む開区間の中で a よりも「大きい側」と「小さい側」とで、関数が別々の \(c_1 と c_2\) という値を含む開区間に含まれる事になってしまうからです。
参考までに、右極限と左極限が存在するけれども異なる値になる場合は上記の関数の極限の定義に当てはまらず、「極限値が存在しない」判定になる事を、一応式でも記しておきましょう。

関数の「右極限」と「左極限」 $$①右極限:\lim_{x\to +a}f(x)=c_1$$ $$\Leftrightarrow c_1 を含む任意の開区間 U_1 に対して、x\in [a, a+\delta_1)ならばf(x)\in U_1となる正の実数\delta_1が存在する $$ $$②左極限:\lim_{x\to -a}f(x)=c_2$$ $$\Leftrightarrow c_2 を含む任意の開区間 U_2 に対して、x\in (a-\delta_2,a]ならばf(x)\in U_2となる正の実数\delta_2が存在する $$ $$\lim_{x\to +a}f(x)=\lim_{x\to -a}f(x)=cならば、cを含む任意の開区間Uに対して$$ $$x\in (a-\delta_2,a+\delta_1)ならばf(x)\in U となるので\lim_{x\to a}f(x)は存在する。$$ 逆に右極限と左極限が異なる値であれば、上記のような定義の意味での極限値は存在できないのです。
2つの開区間\(U_1とU_2\)が共通部分を持たないように区間の幅を小さく取った時、a を含む開区間をどのようにとっても\(x\in U_1\) になる部分と\(x\notin U_1\) となる部分に分かれてしまいます。

  • \(x\in U_1 になる部分:[a, a+\delta_1)\)
  • \(x\notin U_1 となる部分:(a-\delta_1,a]\)
$$よって、\lim_{x\to +a}f(x)≠\lim_{x\to -a}f(x)であれば、「\lim_{x\to a}f(x)が存在する要件を満たさない。」$$

関数が連続であることの定義

関数が連続である事の定義も、極限の定義の延長線上にあります。三角関数や指数関数などの初等関数は連続関数です。
連続性の厳密な数学的定義は、物理などへの数学の応用ではそれほど重要ではないと思います。ただし、数学の解析学・微積分学の中では重要な基礎理論になりますので、考え方だけは見ておきましょう。

関数が「連続」である事の定義

関数の定義域内の実数(の点) a において関数が連続であるとは、次の条件を満たす事を言います: $$f(a)=\lim_{x\to a}f(x)$$ これは、1次関数、2次関数、三角関数、指数関数・・などの初等関数を単独で考える場合は「当然」の事なので、それほど重要とは言えないかもしれません。
数学の理論上、多くの場合に問題となるのは、次のような変な関数です:

  • 例①:「\(x=0 のときf(x)=0,x≠0 の時 f(x)=\sqrt{|x|}\sin \frac{1}{x}\)」という f(x)
  • 例②:「\(x=0 のときf(x)=0,x≠0 の時 f(x)=\sin \frac{1}{x}\)」という f(x)
これらに関して、x=0 の連続性を考える時、じつは①は連続で、②は不連続(連続でない)なのです。
このように、初等関数での感覚で言う「つながっている」事が必ずしも不明確でない関数を考える場合には数学的な定義を決めておく事は重要にもなるのです。(こういった関数が物理などへの応用で使えるかどうかは、また別の問題になります。)

関数が連続であるかどうかという事は、関数自体の性質を探求する事以外に、微分の理論においても重要な位置付けにあります。ある点で微分可能であるかどうかと関数の連続性が深く関わるからです。

参考:定義域の完備性、関数の連続性と一様連続性

普通は、関数の定義域(変数が取り得る値の範囲)を、実数全体であるとか、特定の閉区間や開区間を想定します。このような定義域は、実数全体の性質と同じく、「完備性」を持っていると呼びます。上記の説明においても、それを前提にしています。
他方で、あくまで理論上の話ですが、定義域として「無理数全体」などという無茶苦茶なものを考える事も数学上は可能なのです。これは、数直線上で言うとボコボコの「穴だらけ」の定義域です。
しかし、そのような滅茶苦茶な定義域上の関数でも、適当な関数を用意すれば上記の連続性の定義に当てはめて「『定義域上の』任意の点で連続である」という判定になってしまう事が知られています。
例えば、次のような簡単な関数を考えればじつはじゅうぶんです。

  • x>0の時 f(x)=1
  • x<0の時 f(x)=0
  • 定義域は、無理数全体

事の本質は、じつのところ「本来は不連続点と言うべき点を、定義域から除外さえしてしまえば不連続な点はない事になる」・・というところにあります。
より簡単な例では、1/xという関数でx=0で不連続「のはず」ですが、そもそもx=0を定義域から除外しておけば「不連続点はない」という、おかしな事になるといったものです。
これを解消するためには、「一様連続」というものを定義します。一様連続性の定義は次のようなものです。 $$任意の正の実数\epsilon に対し、定義域内で|x-y|<\delta を満たす『任意の2点』x,y に対して$$ $$|f(x)-f(y)|<\epsilon となるような、正の実数\delta が存在する。$$ この一様連続性の考え方は、微積分の理論でも使用する事があります。

微分と関数の連続性の関係

さて、微分や積分も極限の一種です。ここでは、微分について考察してみましょう。初等関数の微分を考える時は、前述の厳密な極限の定義を考える事よりも、上手な式変形をして明らかに極限値が分かるようにする事のほうが重要である場合が多いです。

他方で、変な関数も含めた一般の関数を数学的に考える場合は、どのような場合に微分が可能で、どのような場合に微分が不可能なのか?といった事を明確にしておくことも、理論的な位置付けとして重要なのです。

結論を言うと、定義域内での特定の点での微分可能性と連続性については、次の関係があります:

  • ある点で微分可能ならば、連続でもある
  • ある点で連続であっても、微分不可能な場合がある

「連続であっても、微分不可能な場合」とはどういう事かと言いますと、一番簡単な例は f(x) = |x| という関数です。これは、グラフで見るとx=0の点で「尖っている」関数です。このように、ある点で必ずしも「なめらかでない」場合でも、つながっていれば「連続である」という判定になります。(もちろん厳密には上記の定義に当てはまるか、式を使って判定します。)

しかし、 f(x) = |x| のx=0における状況を見ると、微分係数とは「傾き」であったはずですが、x=0では傾き+1と-1のどちらを採用するのかという話になります。このような場合、その点では「微分不可能」という判定をするのです。そのため、「関数 f(x) = |x| はx=0 で連続であるが微分不可能である」という事です。尚、「x≠0の任意の点で、 関数 f(x) = |x| は『連続であり微分も可能』 」です。

連続である事と微分可能である事は密接に関係していますが、
全く同じ事ではないので注意が必要な事もあります。

前述の極限と連続性の定義から考えると、 f(x) = |x| の微分係数はx=0 において、

$$右極限\lim_{h\to +0}\frac{f(x+h)-f(x)}{h}と左極限 \lim_{h\to -0}\frac{f(x+h)-f(x)}{h} は共に存在するが値は異なる$$

というパターンに該当します。
\(右極限\lim_{h\to +0}\frac{f(x+h)-f(x)}{h}=+1, 左極限 \lim_{h\to -0}\frac{f(x+h)-f(x)}{h} =-1\) で、異なる値というわけです。
そのため、極限値として厳密に定義に当てはめた場合、極限値としての微分係数も存在しない、という判定になります。

$$ f(x) = |x| の時、極限値としてのx=0での微分係数\lim_{h\to 0}\frac{f(x+h)-f(x)}{h}は存在しない。 $$

つまり、直感的に考えて「傾きが一意的に定まらない」という事と、数学的に考えて極限値が存在しないという判定になる事は、一応調和しているわけです。

このような場合以外に、関数自体が無限大に発散する点においても、微分係数も無限大に発散し、微分不可能という判定にします。そのような点では、関数は「不連続かつ微分も不可能」という事になります。
尚、一応これは「微分可能ならば連続である」という事実の対偶命題を考える事により「不連続ならば微分不可能」と言う事もできます。不連続点では、どのような場合でも微分不可能というわけです。

今回お話した内容は、上記でも少し触れましたように、物理等への応用よりも、純粋数学的な内容の基礎事項という側面が強いです。ただし、有界な単調数列は収束列であるといった事は、円周率や自然対数の底といった重要な定数の極限値としての存在の根拠でもあり、これらの定数は物理や工学でも使用しますから、大まかな事は知っておいてよいのではないかと思います。

参考文献・参考資料


微分積分学〈1〉1変数の微分積分

古典力学とベクトルの微積分

今回は、「ベクトルの微積分」について紹介します。これは物理への応用で重要になる考え方です。

ベクトルを「何のために学ぶのか」という事はよく言われますが、ここでは物理学で使用する観点から、
なぜ・どのように使われるのかを説明します。
ベクトル単独では無く、「ベクトルの微積分」の考え方が重要になります。

ベクトルの基本事項(高校数学)や、逆にこのページの内容の発展事項であるベクトル解析については別途に述べています。

物理で重要な事は、2つの方向への力同士の「合力」は、ベクトルの加算・減算によって計算すればうまく行く事が「実験で」確かめられているという事です。運動方程式により加速度は力に比例しますから、加速度の加算・減算もベクトルで行う事ができます。(また、速度に関しても同じようにベクトルで考えてよい事になります。)

ベクトルの微分と積分の定義

では、ベクトルの微分の定義を説明いたします。定義自体は、簡単です。
それぞれの成分を微分したものを考えるという、それだけです。

表記に慣れなかったりするかもしれませんが、「考え方はシンプルで簡単」という事が、このページで一番知っていただきたい事です。ベクトルの微分や積分は、要するに計算の方法としては「成分ごとに計算すると」いうものです。ですので、1つ1つ丁寧に整理して計算すれば済む話であるわけです。

位置座標を表すベクトルの各成分をある1つの変数で微分したものを、ベクトルの微分と呼び、ベクトルに対して微分操作の記号をつけた \(\frac{d}{dt}\overrightarrow{X}(t)\) という表記を行います。 \(\frac{d \overrightarrow{X}(t) }{dt}\) などと書いても同じです。

ベクトルの微分の定義(1つの共通変数による微分)

3次元の空間ベクトルの場合を記しますが、何次元ベクトルでも同じです。 $$\frac{d}{dt}\overrightarrow{X}(t)=\left(\frac{dx}{dt},\frac{dy}{dt},\frac{dz}{dt}\right)$$ $$x,y,z はtの関数:x=x(t), y=y(t), z=z(t)$$ この共通の変数の事を、数学的には「パラメータ」または「媒介変数」と言います。

ベクトルの微分などと言うと一見わけがわからないように思えるかもしれませんが、このように意味と定義を丁寧に見ると、それほど難しくはないのではないでしょうか?表記については確かに慣れないと扱いにくさを感じるかもしれませんが、少しずつ触れていけば慣れると思います。

ただし、何で微分するかには少しだけ注意すべきで、力学などで物体の「位置」と時間の関係を分析する場合は、時間tで微分します。この時、各成分は時間の関数で表すものとします。(そうでなければ、当然tでの微分はできません。)

Point

ベクトルの微積分を1つの変数tで行う時は、
ベクトル(x, y, z)の各成分 x, y, z が「tの関数」x(t), y(t), z(t) である場合を考えます。
例えば、\(x(t)=2t, y(t)=3t, z(t)=t^2\) などです。
この成分を持つベクトルをtで微分するのであれば、
それぞれの成分をtで微分すればそれでよいというわけです。

例えば、運動する物体の位置座標を(x, y , z)とした時、この座標が時間ごとに変化するので x, y, z は「時間tの関数で表せるはず」と考えるわけです。しかも、物体は連続的に動くはずなので、その時間変数 t で「微分も可能である」と考えるわけです。物体の位置座標を表すベクトルの時間微分を、物理では特に速度ベクトルと呼びます。

ベクトルの高階微分についても考え方は同じで、各成分を2階微分したものを、そのベクトルの2階微分として表記します。位置座標を表すベクトルの時間変数tによる2階微分は、加速度ベクトルと呼ばれます。

微分が可能であるという事は、積分も可能です。

ベクトルに対する積分も基本的に同じ考えであり、ベクトルの各成分を同じ変数で積分したものを、1つのベクトルに対する積分として表示します。

ベクトルの積分(1つの共通変数による積分)

不定積分で記しますが、定積分でも同じです。 $$\int \overrightarrow{X}(t)dt=\left(\int x(t)dt,\int y(t)dt,\int z(t)dt \right)$$ また、微分されたベクトルを積分すれば、「各成分の微分」の積分ですから、もとのベクトルに戻ります。つまり表記上、ベクトルに関しても「微積分学の基本定理」が成立します。 $$\int \frac{d}{dt}\overrightarrow{X}(t)dt=\left(\int \frac{d}{dt}x(t)dt,\int \frac{d}{dt}y(t)dt,\int \frac{d}{dt}z(t)dt \right) $$ $$=\left(x(t)+C_1,y(t)+C_2,z(t)+C_3 \right)= \left(x(t),y(t),z(t) \right)+(C_1,C_2,C_3)=\overrightarrow{X}(t)+\overrightarrow{C}$$ $$\overrightarrow{C}は定ベクトルで、\overrightarrow{C}=(C_1,C_2,C_3)$$

ベクトルの積分に関しては、後述しますように、「内積の計算をしてから積分する」というものもあります。これは接線線積分や面積分の考え方であり、物理への応用で重要な考え方になります。

応用例:ベクトルの微分による等速円運動の考察

さて、ではベクトルの微積分を物理で「どう使うのか」を、簡単な具体例を使って、見てまいりましょう。

力学の基本的な例の1つとして、等速円運動というものがあります。これは、その名の通り、同じ「速さ」で円運動を延々とぐるぐるしている運動を言います。

★ここで、「等速円運動」とは「速さ」が同じであって、「速度」は各位置ごとに異なる事に注意してください。
ベクトルで言うと、速度ベクトルの「大きさ」だけが一定で、向きは各位置ごとに常に変化するという運動である、という事です。

そのように物体が等速円運動をしている時、「いったいどのような力が物体に働けば、そのような運動が生じるだろう?」という問題があります。

これは、結論を先に言うと「円の中心に向かって同じ大きさの力が働けばよい」というのが答えです。これを数学的にどのように導出するのか?と言うと、まず運動方程式を考える必要があります。それと、べクトルを考える事がポイントです。以下、具体的に見ていきましょう。

三角関数は別名「円関数」とも言います。座標またはベクトルの考え方を用いれば、円運動の分析に用いる事もできるわけです。微分する時には、合成関数の微分法を用いる事にだけ注意しましょう。

空間上の運動に対して運動方程式を作る時は、ベクトルのそれぞれの成分に対して運動方程式を作ります。つまり、1つの運動に対して運動方程式は「3つ」できるのです。その3式を解く事で、運動の分析ができるというのが、初歩的な力学での一般論です。

運動方程式

$$\overrightarrow{F}=m\frac{d^2 \overrightarrow{X}}{dt^2}$$ $$\overrightarrow{F}=(F_x,F_y,F_z),\hspace{5pt}\overrightarrow{X}=(x(t),y(t),z(t))$$ つまり(最大で)3つの微分方程式ができます。 $$①F_x=m\frac{d^2x}{dt^2},\hspace{10pt}②F_y=m\frac{d^2y}{dt^2},\hspace{10pt}③F_z=m\frac{d^2z}{dt^2}$$ (初歩的な微分方程式の解き方については以前の記事で詳しく記しています。)

ただし、この等速円運動の分析の場合では、じつは式は「2つ」でよいのです。その理由は次の通りです。

同じ円運動といっても、空間上であらゆる角度に傾いた平面上の円運動が考えられます。しかし、物理ではこのような時、「座標系のほうを物体の運動に合わせてあげる」ということをやります。実際に物体が運動している平面に、xy平面を合わせてあげるのです。

すると、z軸方向には物体は運動しておらず、どんな時刻でも位置座標のz成分は0ですから、あってもなくても同じ事であって、考察の対象から除外します。こういう事は、物理でよくやります。

ですので、運動方程式をベクトルの各成分に対して作る時も、
z成分については\(F_z=m\cdot 0=0[N]\) 「力は一切働いてません」という、数式で考察するまでもない結果が出るだけなので、「考えなくてよい」とするわけです。

というわけで、平面ベクトルで表される運動として、分析をします。

この時、極座標を使うと話は単純になり、計算も楽です。等速でぐるぐる回っているという条件から、一定の角速度\(\omega\)[rad/s]【rad:ラジアン(これは省略する事もできます)s:秒】で運動していると捉えます。

すると、物体の位置座標はどのように表せるかというと、三角関数を用いればよいのです。円の半径をR[m] 【m:メートル】とすると、x座標は R cos(ω t)、y座標はR sin (ω t) になります。

ベクトルで書くなら、\(\overrightarrow{X}=(R \cos (\omega t),R \sin (\omega t))\)

この場合は、位置座標の成分が時間の関数として明確になっているので、これを時間tで2階微分して加速度にして、質量mを掛け算すれば「力」になります。ですから、ここでは微分方程式を解く必要はありません。

x = R cos(ω t) と y = R sin (ω t) を、tで2階微分しましょう。これは、合成関数の微分になっているので1回の微分ごとに ω が掛け算される事に注意する以外は、初歩的な微分計算ですので結果はすぐに出ます。結論は次の通りです。

$$\frac{d^2x}{dt^2}=-R\omega^2 \cos (ω t) ,\hspace{10pt} \frac{d^2y}{dt^2}=-R\omega^2 \sin (ω t) $$

$$ \overrightarrow{F} =m\frac{d^2 \overrightarrow{X}}{dt^2}=( -R\omega^2 \cos (ω t) , -R\omega^2 \sin (ω t) )=-mR\omega^2( \cos(ω t), \sin(ω t) )= -mR\omega^2 \overrightarrow{X} $$

この結果から、考察できる事はいくつかあります。

計算結果から考察できる事
  1. 力の「向き」は常に中心方向を向いている:
    結果を見ると、元の位置座標の定数倍で、しかもマイナスがついています。これは、物体から見ると、力のベクトルが原点を向いている事を意味するのです。
    (★位置座標のベクトルは原点から物体に向かう向きのベクトルである事に注意。)
  2. 力の大きさは、時間によらず定数:
    力の大きさは、「力ベクトルの『大きさ』」を計算すればよいのです。
    この時、\(\cos^2(ω t)+\sin^2(ω t)=1 \) である事に注意します。時間を含む部分は、1になって「消えてしまう」わけです。
    すると、\(|\overrightarrow{F}|=mR\omega^2\) となります。
  3. 力の大きさの計算から、
    力の大きさは質量、半径、「角速度の2乗」のそれぞれに比例する事が分かります。

等速円運動のように、力ベクトルが常に中心方向を向いているとき、
物理ではそのような力を「中心力」と呼びます。

この等速円運動の分析は、様々な運動のうち、「計算がかなり簡単で理論がうまく使えるもの」の1つの例です。どのような運動でもこのように計算が簡単に済むわけではなくて、むしろもっと面倒くさい分析が必要な運動のほうが多い事にも注意は必要です【※全てを容易に分析できるという意味での「万能」な手法ではないという事です】。しかしベクトルの微積分を物理で具体的にどのように使うのかを知るには、簡単でよい例かと思います。

ここでは、微積分学の入門としては、ベクトルの微積分や内積が「例えばこういう具合に応用される」という事だけ見て納得していただければじゅうぶんだと思います。

さらなる学習・ベクトル解析に向けて

今回はこれで終わりますが、ベクトルの微積分の話自体は、じつはまだ続きます。
今回主に扱ったのは、ベクトルの3つの成分が共通の変数の関数、時間tで表される場合でした。
これに対して、物理ではさらに、「位置によって力等が変化する」場合を考えます。 力の種類で言うと、重力や電磁力が該当します。
その場合、ベクトルの各成分が位置座標x、y、zの関数であると考えるのです。
このようなベクトルを「ベクトル場」と言い、それについての種々の微積分を考える領域を、「ベクトル解析」と言います。(このページで扱った内容や、ベクトルの初歩の内容も含めてベクトル解析と呼ぶ事もあります。)
このベクトル解析の考え方は、電磁気学や流体力学で使う他に、物理学一般でも使います。
このベクトル解析の領域は、初見だと多分かなり分かりづらいかと思います。しかし基本的には、今回のページで述べたような、ベクトルを成分ごとに分けて丁寧に考える事、内積の定義に従って丁寧な計算を進める事によって理解できるような体系になっています。

参考文献・参考資料

■参考文献のリンク先は、外部サイトです。

無限級数とは?

このページでは無限級数について説明します。数学での無限の意味についても考えてみましょう。
【※あくまで数学での計算での扱いという意味で、哲学的意味などは別問題です。】

こちらは、このページで説明に用いているイラスト・漫画等のスライドです。

無限級数とは?その形と取り扱い方

数学で扱う無限とは「上限等の制限」を設けないという意味に近いです。 物理では「十分大きい」等と言い換えられます。これが1つのポイントです。

「無限個の和」であっても、有限の範囲に「収束」すれば有限の数として扱える事が、数学でも物理でも1つの大きなポイントです。物理では、一度無限級数の形にしたうえで、計算結果に影響の少ない項を0とみなして少ない有限項の和に「近似」するという使い方も事も非常に重要です。

無限級数とは?無限個の項の和

まずは、「無限級数」(infinite series)というものの「形」を、見てみましょう。
数学や物理で、こういうものがあったら、それを無限級数と呼ぶ、という事です。
無限級数の事を、単に「級数」と呼ぶ事もあります。その場合でも、「無限個の項の和」を表します。

「無限級数」(infinite series) の意味

無限級数とは、無限和とも言い、「無限個」の項の和で表される値、数列、関数などを指します。
項の数が、10個、100個、1000個、1億個、それ以上と、限りなく「無限に多くある」という事です。(※用語の使い方として、単に「級数」と言っても、それは無限級数を表します。)

$$例①(値・数列):自然対数の底 e = 1+1+\frac{1}{2}+\frac{1}{3!}+\frac{1}{4!}+\frac{1}{5!}+\cdots$$ $$例②(値・数列):調和級数 1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\cdots$$ $$例③(関数):e^x のマクローリン展開\hspace{5pt} e^x= 1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots$$

これらの式の一番右にある「+・・・」というのが、「無限級数」である事を表します。
また、あくまで表記の違いですが、和を表す「シグマ記号」\(\Sigma\) と、「無限大」を表す\(\infty\) を用いて、無限級数は次のようにも書かれます。 $$無限級数で表した\hspace{5pt}e\hspace{5pt}のシグマ記号での表記:\sum_{n=0}^{\infty}\frac{1}{n!}=e$$ $$全く同じものを、\lim_{n \to \infty}\sum_{j=0}^n\frac{1}{j!}=e\hspace{5pt}とも書きます。$$

1+2+3+4+5+6+7+・・・なども無限級数です。無限に加えていきます。項数が多くても(例えば100万個)、有限の個数で止まるならそれはあくまで有限の和であり、数学では無限級数とは呼びません。(ただし、物理では。そのように「じゅうぶん大きい」数を「無限とみなす」事はよくあります。)びっくりマーク「!」は数学では「階乗」と言い、3!=3×2、4!=4×3×2、5!=5×4×3×2、・・などを表します。
このページの後半でも触れますが、いわゆる無限小数も無限級数の仲間です。

このような無限項の和で表される形の数式があったら、それは無限級数である、という事です。
数列の形 \(a_1+a_2+a_3+\cdots\) で書かれる事もあります。(シグマ記号を使えば \(\sum_{n=1}^{\infty}a_n\))

和(つまり合計、足し算、加算)を表すシグマ記号で無限級数を表す場合は、「始まりの数」については、n=0からでもn=1からでも、n=2からであっても、もっと大きいn=1000からであっても、終わりのほうが無限大であれば無限級数です。

! ちょっとだけ注意:点点点「・・・」の使い方

\(1+\frac{1}{2}+\frac{1}{3}+\cdots\) や、\(a_1+a_2+a_3+\cdots\) の「・・・」が、「無限」を表していると実質的に捉えてよいのですが、じつはこの「・・・」表記は、あくまで便宜的に使用しているようなところがあります。
「+・・・」が、式の一番右に書かれていたら、それは「無限」を表すと思ってほぼ間違いないです。
他方で、この「・・・」という記号が、「『有限の項数』の和の間に書かれている」場合は、「有限項の和の『省略記号』」という意味になります。この点は、少し注意してください。
例えば次に記してあるのは、ある数列の「『n = 1000』までの和」です。この式でも「+・・・+」と書かれていますが、じつはこれは単に「1000 項も書くのが嫌なので」途中を「・・・」などと書いて省略しているだけなのです。従って、そのような場合は「無限個」を表しているのではなく、「有限個の項の表記上の省略」を表すという事になります。 $$S_{1000}=1+2+3+4+\cdots+999+1000\hspace{10pt}この場合の\cdotsは途中の有限個の和の「記載省略」の意味$$

では次に、そもそも「無限」というものを数学ではどのように考えるのか、どのように扱うかについて考えてみましょう。これは、何のために無限級数を考えるのかという、学ぶ目的とも大いに関係します。

無限は必ずしも抽象論ではなく、有限との裏返しの関係

「無限」を、数学では「どういう取り扱い」をするのかという事に絞ってシンプルに要点をつかみましょう。考え方自体は、非常にシンプルです。そのシンプルな考え方から始まって、いろいろな考察をする事により、様々な数学的事実や物理での使い道を探求する事が可能になります。

自然数と整数の場合の「無限」の扱い

どれだけ多くの項数があっても、「あるところで止まる」ならそれは「無限ではない」=「有限である」という事です。数学的には、そこがポイントになります。

数学と言わず日常いつも使っている「数」には、上限を設けませんよね?
ポイントは、ものすごく大きい数・・例えば「100億」などを考えても、それが「最大の数?」かというと、例えば「それよりも1だけ大きい数」などを、考えてもよいわけです。1000000000 に対して、 1000000000 + 1 = 1000000001 を考えてよいわけです。つまり、1,2,3・・と数える自然数は「無限に」大きくなります。

数学で言う「無限」とは一体何か?

無限大とは何かを数学的に説明すると、次のようになります。

  • 無限に大きい」とは:
    どんな自然数(正の整数) N を選んでも、「それよりも大きい別の数 M 」が必ず存在する
  • マイナス符号がついた負の数が無限大に「小さい」場合も考える事ができます。
    どんな整数 N を選んでも、「それよりも小さい別の(負の)整数 M 」が必ず存在する

不等式で言いますと、自然数の場合、N1 に対して N1<N2 となる N2 があって、
さらに N2<N3 となる N3 があって、・・・・と、続いて、
N1<N2<N3<N3<N5<N6<N7<・・・
非常に大きい自然数 10000000 を考えても、10000000 < 10000001 という関係にある別の自然数 10000001 が、必ず存在する、という事です。

尚、あくまで文章表現の問題ですが、大学数学では、「どんな自然数 N を選んでも」という表現を、「任意の自然数Nに対して」と言う事が、よくあります。(このサイトでも使用します。)

自然数や整数の全体には、「最大の数」や「最小の数」が存在しません。いくらでも大きい数、マイナス方向にいくらでも小さい数が存在する「無限集合」です。

自然数や整数の場合、大きさを増やしていくと、いくらでも大きくなる・・つまり「無限大」になるわけです。
ここで、条件として「自然数や整数の場合」と、限定している事には意味があります。じつは、有理数や実数と、少し話は変わるからです。

有理数や実数だと、有限の区間の中などにも、「無限個の数(要素)がある」という事も起こるのです。その事について、説明いたしましょう。理屈は、至って平易です。何も難しくはありません。

有理数と実数の場合の無限の扱い・・有限区間の中の無限個の要素

有理数や実数の「全体」で考えると、正の範囲では無限に大きくなるのは自然数や整数と同じです。
しかし、有理数や実数の場合、Q1<Q2<Q3<Q4<Q5<・・ となって、尚かつ特定の数より必ず小さいという「集合」を、考える事ができるのです。

有理数とは、0.1, 0.2, 1/2, 1/3 などの、いわゆる「『整数の比による』分数で表せる数」です(自然数や整数を含めます)。
実数とは、有理数と \(\sqrt{2},\pi, e\) などを含めたものです。
実数の「異なる2つの」要素には、必ず「大小関係」があります。どちらが大きい・小さいを必ず言えるという事です。
例えば、\(-1 < 0 < 0.1 <\frac{1}{3}<\frac{1}{2}<1<1.4<\sqrt{2}<2<e<3<3.1<\pi<4<・・・ \)などの大小関係があります。

例えば、「0以上1以下」という、ごく限られた範囲の区間を、考えてみてください。この有限の区間の中にも、0.1, 0.2, 0.01, 0.001,・・等の、数えきれない、上限のない「無限個」の要素があるのです。
小数ではなくて分数で考えても同じ事で、1/2, 1/3 といった、「0より大きく1以下」 の分数 \(\frac{1}{n}\) は、無限個存在します。

[0,1] という閉区間(0と1を含む、0以上1以下の区間)の中には、n を自然数として、1/nで表される有理数が無限に多く存在します。それらの個数は無限に多いけれども、0<1/n≦1 という不等式を必ず満たします。大学数学の解析学では、このような時に数列 {1/n} は「有界」であると言います。

自然数が無限個あるので、自然数 n を用いた \(\frac{1}{n}\) も、無限個あるのです。
(※整数の範囲だと、 「0以上1以下」 の区間に属する要素は「0と1」というただ2つの要素だけです。)

Point:有限の中にも「無限」は存在する! 無限は必ずしも有限と根本的に違う世界にあるというわけではなく、むしろ隣り合わせにある事も多いのです。
  • 1つの量や個数の「無限個」への分割
  • 区間や領域の「無限個」の分割

後述しますように、区間や領域の無限個の分割は積分の考え方そのものですし、
幾何級数(等比級数)は、図形的に見ると有限の面積などを無限個に分割して加え合わせたものと見る事もできます。

このとき、\(\frac{1}{n}\) という形に限定した有理数の集合の要素は、nを増やすごとに小さくなっていきます。
つまり、\(\frac{1}{2}>\frac{1}{3}>\frac{1}{4}>\frac{1}{5}>\frac{1}{6}>\frac{1}{7}>\cdots\) という大小関係が、無限に続いていきます。しかし、これらは、どれほど小さくしても、「0よりは大きい」ですね。つまり、不等式で書くと次のようになります。 $$\frac{1}{2}>\frac{1}{3}>\frac{1}{4}>\frac{1}{5}>\frac{1}{6}>\frac{1}{7}>\cdots>0$$ これは、
「2つの異なる要素同士の大小関係」については無限に小さくなっていくけれども、必ず0よりは大きい
という事です。

$$q_1>q_2>q_3>q_4>\cdots という条件も確かに満たしますが、$$ $$同時にq_1>q_2>q_3>q_4>\cdots >0 でもある;「任意の k に対して q_k > q_{k+1} かつ q_k>0 」 $$

そして、このような事は、決して例外ではなく数多くあるという事が、1つの重要ポイントです。有限の実数の範囲の中に無限個の要素が存在するという事は、微積分の積分のほうの考え方に直結するものでもあります。

無限級数の収束と発散

さて、有理数や実数を考える場合、有限の区間の中にも無限個の数が含まれ得ると言う事を、お話しました。それと密接に関係する事として、無限個の項の和である無限級数も、有限の範囲におさまる場合があります。しかも、それは例外的にではなく、無限級数が有限の値になる事は多くあるのです。

無限級数が有限の値に確定する時、その無限級数は「収束」すると言います。
逆に、有限の値に確定しない場合を「発散」すると言います。特に、無限大の値になってしまう場合を「無限大に発散」すると言います。(有限の範囲内にはあるけれども極限値として一定の値に収束せず、「振動」する場合というのもあります。用語の使い方としては、「収束しない場合」の事を「発散」と呼びます。)

数学の理論においても、物理での応用でも、重要なのは「収束する」無限級数です。「発散」してしまうものは扱いにくいか、全く取り扱えないからです。

無限個加え合わせたら 無限大?じつは必ずしもそうではなくて、無限大にはならず、有限の値に収束する場合もあるのです。基本的に、加え合わせる項の値がどんどん小さくなっていくものが該当します。大学数学の解析学では、どのような無限級数が「収束」し、そのような無限級数が「発散」するかの判定の理論が考察されます。
~有限の中の無限~ より身近で具体的な物で考えてみよう

1という有限の数・・現実的に言えば1kgの物とか、1平方メートルの紙、1個の塊のケーキなど・・は、半分個に分割できます。\(\frac{1}{2}\) という数を、考えているという事ですね。
同じように、3分割 \(\frac{1}{3}\)、4分割 \(\frac{1}{4}\) を考える事も当然できるわけですが、
さらに大きい分割として「1万分の1」\(\frac{1}{10000}\) なども考えられます。
(※ケーキを1万分割する事はまずないでしょうが、1立方メートル \(\mathrm{m}^3\) などは1万分の1にすると1立法センチメートル\(\mathrm{cm}^3\) ですので、対象によっては現実離れした考えというわけでもないのです。)
要するに、「〇〇分の1」\(\frac{1}{n}\)という数は、限りなく小さくする事ができるわけです。
このように、少なくとも数学的には「有限の中にも無限がある!」という事は、意外と「それほど不自然な発想ではない」と、言えるかと思います。

収束する無限級数の例

「収束する」タイプの無限級数の例を、いくつか挙げます。

収束する無限級数とは?意外と多くある!

$$自然対数の底 e = 1+1+\frac{1}{2}+\frac{1}{3!}+\frac{1}{4!}+\frac{1}{5!}+\cdots = 2.718・・・$$ $$円周率(ライプニッツ級数) \pi = 1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}+\cdots = 3.141592・・・$$ $$幾何級数(等比級数) 2 = 1+\frac{1}{2}+\frac{1}{2^2}+\frac{1}{2^3}+\frac{1}{2^4}+\cdots$$ $$三角関数のマクローリン展開:任意の実数 x に対して \sin x = x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots$$ $$そのほかの色々な無限級数の1例: 1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\frac{1}{5^2}+\cdots$$

e = 2.718・・・は、無限小数なので小数点は無限に続きますが、値としては確かに有限の実数です。円周率を無限級数で表す公式もあり、しかも1つではなく、多くの種類があります。円周率の値は、もちろん3.14・・で、有限の値です。

このページでも後述しますが、幾何級数やテイラー展開、マクローリン展開なども、「収束」する無限級数の仲間です。(ただし、無制限に収束するわけではなく、収束する条件などがあります。大学数学での解析学の学習ポイントです。)

そのほかにも、\( 1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\frac{1}{5^2}+\cdots\) や、\( 1+\frac{1}{2^3}+\frac{1}{3^3}+\frac{1}{4^3}+\frac{1}{5^3}+\cdots\) なども、収束する無限級数です。このように、無限に加え合わせて「有限の値に収束する」ものは、決して例外的なものではなく、数学において意外と広く見られるものなのです。

無限大に発散する無限級数の例

他方で、無限個の項を加え合わせる事によって、普通に無限大に「発散」しまうものも、同じく多くあります。見た感じで明らかに発散するものと、判定が微妙なものがあります。

微妙な例としては「調和級数」と名のついた無限級数\( 1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\cdots\)があります。
調和(harmonic)などと名前がついていますが、じつはこの無限級数は、無限大に発散します。相当項数を増やさないと大きな値にはならないのですが、じゅうぶん項数を増やすと、確かにいくらでも大きくなってしまい、収束しない事が証明されます。(証明自体はそんなに難しくありません。不等式を使った簡単な計算になります。)

無限大に発散する無限級数の例 $$調和級数:1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}++\frac{1}{5}\cdots$$ $$明らかに無限大になる例:1+2+3+4+5+6+7+\cdots$$ $$見ただけでは分からない微妙な例:\sum_{n=1}^{\infty}\frac{1}{\ln n}$$

無限級数の収束・発散について、特定のタイプのものについては解析学でのいくつかの判定法(コーシーの判定法、ダランベールの判定法)によって、公式のようなものを使って判定する事が可能です。
ただし、それで全ての無限級数の収束・発散を例外なく判定できるわけではありません。そこが、大学数学の解析学の面倒な部分でもあり、考察対象によっては「興味深い」部分でもあるのです。

無限級数には「収束」するものと、「発散」するものがある
  • 項数が無限個ある和の形で表された値、数列、関数の事
  • 無限級数は、値としては(関数などの場合は1つ1つの値について)次の2つの場合がある:
    1. 有限の範囲に収まる(「収束する」)場合
    2. 収束せず「発散する」場合
      特に無限大になる場合、マイナス無限大も含めて「無限大に発散する」と言う
    → どちらになるか、判定の方法が理論的にも応用的にも重要

参考:微分と積分も「無限」の数学・・物理でも無限級数を使う理由

微分係数は、関数を曲線と考えた時の「接線」ですが、非常に小さい区間の2点を結んだ傾きと考える事もできます。(その極限値が接線です。)
無限級数が関わるのは積分のほうがより明確で、積分とはそもそも無限個の長方形(ただし細長くて面積の小さい)の和でした。これは、無限級数であることに他なりません。

$$微分は「無限に小さい区間」の関数の変化率:\frac{df(x)}{dx}=\lim_{h \to 0}\frac{f(x+h)-f(x)}{h}$$ $$積分は「無限大に多く分割した」面積の和:\int_a^bf(x)dx=\lim_{|\Delta| \to 0}\sum_{j=1}^{\infty}|\Delta x_j| f(k_j)$$

また、微積分学の基本定理により、微分可能な関数は、「微分して得られた導関数」を積分したものと解釈する事もできます。その意味では、微分の積分=無限級数として通常の関数を表現できる、とも言えるのです。
微分や積分は、物理に置いて非常に重要です。そして、微分や積分が無限級数に大きく関わるので、物理などへの応用にも無限級数は大いに関わるのです。
後述しますが、マクローリン展開は微分を利用した無限級数であり、フーリエ級数展開は、逆に積分を利用した無限級数展開です。
物理などでは、一度無限級数の形にしてから、高次の項をゼロに近似できるような範囲に絞って考え、実質的に有限の範囲で考えれるように工夫をする、という事もあります。これは、微分も積分も近似的には有限の範囲で数値計算的に扱う事が可能という事とも、大きく関わります。
そのような点にも注意してみてください。

積分も、意味としては無限級数のひとつです。

大学数学や物理を学んでいると、多分、唐突に「 f(x) を展開すると、・・」といった表現が使われるのを目にする事があると思います。これは、因数分解の逆の操作の「展開」の場合もありますが、割と多くの場合は「無限級数展開」を指しています。関数を「無限級数の形で表せますよ」という意味です。

具体的には、幾何級数(等比級数)展開、テイラー展開およびマクローリン展開、フーリエ級数展開などが無限級数展開の代表的なものです。

無限級数を扱う分野では微分を使って話を進める事も多いので分野としては微積分や解析学に含めて考える事が多いです。

無限級数展開にはテイラー展開(その特別な場合がマクローリン展開)、幾何級数展開、フーリエ級数展開などがあります。

極限値としての円周率の存在証明

円周率が極限値として存在する事は、同一円に対する内接正n角形と外接正n角形の周の長さのn→∞の時の極限値が存在する(両者は一致する)事によって証明します。

結論を言うと、証明の流れと発想自体は難しくないのですが、結構の計算などが一部結構面倒です。しかし省略せずに書いてるので適宜参照ください。

証明のステップ  ■ \(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) がともに存在する ■ \(\lim_{n_\to \infty}L_n=\lim_{n_\to \infty}R_n\) を示す 
3以上のどの自然数から始めても\(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) は同じ値に収束する 

より初歩的な流れと考え方は「円周率はなぜ3.14なの?」に動画付きで書いています。

声優担当:ステ♪ 様 http://sute.tabigeinin.com/

★この動画では円周率の値が3.14……である事のおおまかな流れを初歩的な部分から解説しています。

証明のステップ

これは少々手間がかかりますが、詳しく述べておきます。まず、次のように設定をします。

  • 内接正n角形の周の長さ:\(L_n\)
  • 外接正n角形の周の長さ:\(R_n\) 
  • 円の半径:1とする(一般のrでやっても同じ結果になります。)

$$L_nの2n等分: \frac{L_n}{2n}=a_n \hspace{15pt} R_nの2n等分: \frac{R_n}{2n}=A_n $$

そのうえで、次の手順により証明を行います。

  1. 任意の3以上の自然数に対して \(L_n<L_{2n}<R_{2n}<R_n\) を示す。
    これは\(L_nとR_n\)が有界な単調数列である事、
    つまり\(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) がともに存在する事を示す事になります。
    式で示してもよいし、図形的にも示せます。
  2. \(\lim_{n_\to \infty}L_n=\lim_{n_\to \infty}R_n\) を示す。
    これは、図形的考察から\(L_nとR_n\)に関する次の2公式(アルキメデスの公式とも)により示します。 $$R_{2n}=\large{\frac{2L_nR_n}{L_n+R_n}}$$ $$L_{2n}=\sqrt{L_nR_{2n}}$$
  3. 3以上のどの自然数から始めても\(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) は同じ値に収束する事を示す。
    これは、n、2n、4n・・という形の数列であるために補足的に示すもので、通常のn=1,2,3,・・の形の数列であれば必要のない考察です。
    図形的考察から、2以上の任意の自然数mに対して \(L_n<L_{mn}およびR_{mn}<R_n\) である事を示し、それにより証明します。

① \(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) がともに存在する

これは、次のステップで見るアルキメデスの公式を用いてもよいのですが、
図形的に三角不等式でも示せますから、まず図を見てみましょう。
上記でも触れましたようにnに対して2nを考える事で作図と計算が容易になります。
これに対して、nの次にn+1を考えると作図が非常に難しく、関係も複雑になってしまい非常に計算しにくくなってしまうのです。

この方法で作図した時、内接のほうに関しては、正n角形と正2n角形とで共有する点はありますが共有する辺はありません。
他方、外接のほうは、 正n角形と正2n角形とで 共有する点はありませんが部分的に共有する辺があります。

図を見ると(正6角形と正12角形の例ですが)、内接のほうは、正2n角形の2辺と正n角形の1辺からなる三角形に着目します。すると三角不等式によって\(L_n<L_{2n}\) が直ちに示されます。

外接のほうは、少し込み入るのですが、まず、図では次のように作図しています。

  1. 内接正n角形と内接正2n角形を、図の左側のように作図しておく
  2. 内接正n角形(正2n角形でもOK)の頂点での円の接線を引く。
  3. 接線同士をつなぎあわせてると、外接正n角形になる。
  4. 外接正n角形の各頂点から円の中心に向かって直線を引き、円との交点での接線を引く。
  5. 手順2と手順4で引いた接線を全て結び合わせると、 外接正2n角形になる。

この時、外接正n角形と外接正2n角形は共有する辺を持ちますが、共有しない部分もあります。その共有しない部分について三角不等式を適用すると、外接正2n角形の周の長さは、必ず外接正n角形の周の長さより小さい事になります。
よって、\(R_{2n}<R_n\) が示されます。

さらに、外接のほうの作図方法をよく見ると、内接正n角形の周の長さは外接正2n角形の周の長さよりも必ず短い事が分かります。(図形的に正確に言うと、相似な三角形の対応する辺同士になるので。)
よって、\(L_{n}<R_n\) です。
これは、任意の3以上の自然数で成立しますから、\(L_{2n}<R_{2n}\) でもあります。
すると、\(L_n<L_{2n}\) かつ \(L_{2n}<R_ {2n} \) より、\(L_n<L_{2n}<R_{2n}\) であり、
さらに \(R_{2n}<R_n\) でもあるのですから \(L_n<L_{2n}<R_{2n}<R_n\) が示されます。

よって、(解析学の基礎的な定理の証明は必要ですが、)次の事が示された事になります:

  • \(L_n\) は 単調増加数列で上に有界であり\(\lim_{n_\to \infty}L_n\) は収束し、従って存在する。
  • \(R_n\) は 単調減少数列で上に有界であり\(\lim_{n_\to \infty}R_n\) は収束し、従って存在する。

② \(\lim_{n_\to \infty}L_n=\lim_{n_\to \infty}R_n\) を示す。

さて、このようにして \(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) が収束する事が示されましたが、これだけだとじつは「同じ値に収束する」かは、分かりません。
別々の値に収束する可能性も否定できないのです。もしも、別々の値に収束するとすれば、一体どちらを正式な円周として採用すべきか、理論がぐちゃぐちゃになってしまいますね。
しかし実際は、両者は同じ値です。それを示します。

これを示すには、多少の手間はかかりますが \(L_nとR_n\)の関係を、図形的考察から強引に導出する方法が確実です。証明の中ではここが一番面倒くさいかもしれませんが、必要なのは平面幾何の基本知識だけです。

周の長さの2n等分\(\frac{L_n}{2n}=a_n と \frac{R_n}{2n}=A_n\) は、ここで使います。
また、導出のポイントとして重要なのが、
「内接正n角形の隣り合う2点の中点と円の中心との距離」で、これを\(p_n\) とします。
図で言うと\(OP=p_n,\hspace{5pt}OH_1=p_{2n}\) です。

まず最初のステップとして、次の2式が得られます。三平方の定理から

  • 内接正多角形で作られる三角形の相似から\(\frac{A_n}{a_n}=\frac{1}{p_n}\Leftrightarrow A_n=\frac{a_n}{p_n}\)
    また、これにより(または同様の考察により) \(A_{2n}=\frac{a_{2n}}{p_{2n}}\)
  • 単純に三平方の定理により、\(a_n^2+p_n^2=1^2 \Leftrightarrow p_n^2=1-a_n^2\)

次のステップとして、図の三角形OABに着目した2式を得る事を考えます。片方は、同一面積を2つの辺と高さで表して得る式です。もう片方は、少々トリッキーですが図の\(OH_2\)の長さを2通りの方法で表す事によって得ます。

  • 同一三角形の面積を2通りの方法で表す事により、\(a_{2n}p_{2n}=a_n\)
  • \(H_1 が AB の中点、H_3がBH_2 の中点\) である事により\(OH_3=p_n+\frac{1-p_n}{2}=\frac{1+p_n}{2}\)、
    三角形の相似により \(OH_3=p_n^2\) となるので\(p_n^2=\frac{1+p_n}{2}\)\(\)

以上の式をまとめると、

  • \(A_n=\frac{a_n}{p_n}\hspace{10pt}A_{2n}=\frac{a_{2n}}{p_{2n}}\hspace{10pt}p_n^2=1-a_n^2\)
  • \(a_{2n}p_{2n}=a_n\hspace{10pt}p_n^2=\frac{1+p_n}{2}\)

これらを組み合わせると次の関係式が得られます。ちょっとだけ、計算の工夫は必要です。

$$A_{2n}=\frac{a_{2n}}{p_{2n}}=\frac{ a_{2n} p_{2n} }{ p_{2n} ^2}= =\frac{ 2a_{2n} p_{2n} }{ 1+p_{n} }=\frac{a_n}{ 1+p_{n} } = \frac{A_np_n}{ 1+p_{n} } =\frac{a_n}{A_n}\frac{A_n}{1+\frac{a_n}{A_n}}=\frac{a_nA_n}{a_n+A_n} $$

$$また、4a_{2n}^2=4\frac{a_n^2}{4p_{2n}^2}=\frac{2a_n^2}{1+p_n}=2a_n\frac{A_np_n}{1+p_n}=2a_nA_{2n} ∴ 2a_{2n}=\sqrt{2 a_nA_{2n} }$$

まとめると、次の2式になります。

$$ A_{2n}= \frac{a_nA_n}{a_n+A_n} \hspace{10pt} 2a_{2n}=\sqrt{2 a_nA_{2n} } $$

ここで、\(L_n=2na_n,R_n=2nA_n\) でしたから、整理すると次のように、目的の公式が得られます。

$$ L_{2n}= \frac{2L_nR_n}{L_n+R_n} \hspace{10pt} L_{2n}=\sqrt{ L_nR_{2n} } $$

これらのうちどちらを用いてもよいのですが、平方根のほうを使ってみましょう。
\(\lim_{n_\to \infty}L_n=\alpha,\hspace{5pt}\lim_{n_\to \infty}R_n=\beta\) とします。(収束する事は示しているので、このようにおいてよいわけです。)

$$すると、\alpha=\sqrt{\alpha \beta} ですから、\alpha^2= \alpha \beta \Leftrightarrow \alpha(\alpha – \beta)=0 $$

$$\alpha>0 ですから、\alpha=\beta ∴\lim_{n_\to \infty}L_n=\lim_{n_\to \infty}R_n$$

④ 3以上のどの自然数から始めても\(\lim_{n_\to \infty}L_nと\lim_{n_\to \infty}R_n\) は同じ値に収束する

さて、これでもう「証明終り。円周率は2つの数列の同じ極限値として確かに存在する」・・でも構わないのですが(一般にはそうしてます)、もう少し考察をしてみましょう。上記で示したのは、例えば正6角形から始めて、12,24,48,96・・とした場合に極限値が確かに存在し、正5角形から始めた場合は10,20,40,80,・・とした場合に、やはり確かに極限値が存在するという事です。

では、それらは確かに一致するでしょうか?

上記の証明ではnに対して2nを考えましたが、
じつはこれはnに対して3nでも4nを考えてもよいのです。

外接のほうは、2倍の角数を考えた時と同じく、内接正多角形を基準にして作図を考えると多少分かり易いです。

実際は任意の自然数mを使ってnに対する内接・外接正(mn)角形を用いる事で、上記同様の極限値の存在の証明ができます。(内接・外接ごとの極限値の存在まででじゅうぶんです。)

図形的に考えてみて、三角不等式の組み合わせか、適切に区切って傾きによる線分の長さを比較します。
それによって、\(L_n<L_{mn}<R_{mn}<R_n \) となる事が分かります。
つまり、上記では\(L_n<L_{2n}<R_{2n}<R_n \) を証明したわけですが、
同様に \(L_n<L_{3n}<R_{3n}<R_n \), \(L_n<L_{4n}<R_{4n}<R_n \),・・も成立するという事です。

さて、すると、例えば5と7で始めた場合で、5からの場合は7倍の角数、7の場合は5倍の角数を考えてみましょう。
それぞれ\(L_5,L_{35},L_{245},\cdots\) \(L_7,L_{35},L_{165},\cdots\) のような数列になります。
ここで、\(L_{35}\) から始めた場合も同様に収束するわけで、c に収束するとします。

ここで、\(\lim_{n\to \infty}L_{35n}=c\) とは、cを中心としたどんな小さい開区間にも、あるn以上の値の\(L_{35n}\) は全て含まれる事を意味します。【極限値は、解析学的にはそのように定義します。】
ここでそのようなあるn以上の、35 の倍数の中には、\(L_{5}やL_{7}\) から始まったものも含まれています。これらの数列が全て単調増加数列である事に注意すると、結局、そのあるn以上の値では、\(L_{5n},L_{7n},L_{35n}\) は全てcを中心とした同じ開区間内に含まれる事になります。これは、これらが同じ極限値 c を持つ事を意味します。

つまり、どんな(3以上の)自然数 n,m から始まろうとも、極限値は nm で始めた時と同じであるわけです。さらに別の自然数 N から始まるものを考えても nmN から始めた時と同じ値に収束するわけですから、結局どの番号から始めても、内接、外接の場合ともそれぞれ同じ値に収束する事を意味します。

また、同じ自然数から始まって倍にする数を変えたとしても、同じ考え方によって同じ値に収束する事になります。今、2倍にしていく場合は、内接と外接とで極限値が一致する事は証明済です。

これによって、内接正多角形と外接正多角形は n→∞ にした時に、確かに1つの極限値に収束すると言えます。これは、半径1の円に対して言えたわけですが、半径がrの場合は、三角形の相似により、周の長さはr倍になりますから極限値は半径が1の時の円周のr倍になります。 ですので、半径1の円の円周の長さを何かの定数の記号でおくのです。
結論を言うとこの定数を\(2\pi\) とおき、半径1つまり直径が2の円の円周の長さは\(2\pi\)であるとします。半径がrの場合は\(2\pi r\) となり、これは直径と円周率の積と言う事もできるわけです。

★ 3.14という値は?

上記の極限値としての円周率の存在証明では、円周率の値が具体的にいくらかという話が全く出てきていません。

しかし、このページの最初の概要で触れましたように、具体的な内接正n角形の周の長さについて、n=6の場合はぴったり「直径×3」、n=12の場合は「直径×約3.1058」となり、内接の場合はn=96(外接の場合はn=48)で3.14までの値は確定します。 【手計算でやる場合は、具体的な三角関数の値を半角の公式・マクローリン展開等で出すか表を見るなどして計算します。値が細かいので、結構面倒です。】

3.14以降の円周率の小数点の計算は、具体的に周の長さを計算する方法だとかなり大変なので、果てしなく小数点を出すような場合は何らかの「円周率を直接記述する公式」(基本的に無限級数)を用いて、しかもコンピューターに計算をやらせる事になります。

それらの「公式」は、円の面積を使う場合や、三角関数や逆三角関数(の微積分)をもとに作られている事が多いです。公式の種類によって、小数点計算が速い・遅いなどの特徴があります。マチン型の公式と呼ばれるものは計算が速く、逆にライプニッツ級数は収束が遅くて小数点計算には不向きです。

最も簡単な微分方程式5つ

大学の微積分学の入門として、簡単に解ける微分方程式について説明します。

微分方程式の解き方の手短な説明

微分方程式とはその通り、微分(および高階微分)を含んだ方程式ですが、要はその方程式を満たす「関数」を探す事が、その方程式を解くという事です。このページで紹介する微分方程式は、パズル感覚で色々組み合わせるだけで解けます。

声優担当:ステ♪様 http://sute.tabigeinin.com/

つまり、微分の公式を微分方程式に当てはめてみて、確かに解になっていればよいわけです。微分の公式と言ってもたくさんあるわけですが、今回用いるのは6つで、三角関数に関しては正弦か余弦のどちらか片方あれば足りるので、実質「5つ」だけの公式を用います。それらは次の表にまとめてあります。これらを単独で使うか上手に組み合わせるかして、微分方程式を解いていけるのです。

合成関数も利用しながら、初等関数の「パーツ」を組み合わせ、具体的な微分方程式に当てはめてみます。このタイプの解法は、高校で教わる微分の知識を直接使えます。「2回微分すると〇○になる関数はどれですか」といった事について、公式の中から探して、組み合わせればよいのです。

使う公式は、この場で表にして記しておきましょう。

対象の関数微分公式微分方程式の解法での役割
①定数(定数関数)\({\large \frac{d}{dx}c=0}\)微分すると0になる
②単項式「x の a 乗」\({\large \frac{d}{dx}x^a=ax^{a-1}}\)微分するとx の指数が1下がる
③自然対数の底 e の指数関数\({\large \frac{d}{dx}e^x=e^x}\)微分すると元の関数に戻る
④-1 三角関数(正弦関数)\({\large \frac{d}{dx}\sin x=\cos x}\)微分2回で元の関数の符号±入替
④-2 三角関数(余弦関数)\({\large \frac{d}{dx}\cos x=-\sin x}\)微分2回で元の関数の符号±入替
⑤合成関数の微分\({\large \frac{df(y)}{dx}=\frac{df(y)}{dy}\frac{dy(x)}{dx}}\)微分方程式内の定数倍などを調整
基本は、通常の微分の公式を用いて、当てはまる関数を見つけるだけです。微分方程式特有の考え方としては、「全ての」解を表現するという意味では「微分すると0になって消える定数項」などがオマケとして解にくっついてくる事です。(最初のうちはあまりこだわらなくていいと思います。)
微分方程式論の中の位置付け

このページでは「具体的な微分公式を探して当てはめてみる」という見方をしますが、このやり方は、じつは「微分の逆演算つまり積分を行い『微分記号を消去する』事で、解となる関数を見つける」・・という見方と同等なのです。そのため、微分方程式論の枠組みの中では「求積法」と呼ばれます。

少し発展事項
~微分方程式の「解」は、基本的に1つではなく「複数」ある~

具体的な関数を微分方程式に当てはめてみて、それで確かに式が成り立てば、その関数は間違いなく「解」の1つです。他方で、数学的に少し面倒で時に厳密な論証が必要なのは、
「それで『全ての解』を表現できているか??」という点にあります。その事も念頭に置きながら、具体例を通して少しずつ理解していくと学習しやすいかと思います。

では具体的な微分方程式を見てみましょう。とても簡単に、解けます。

①一番簡単な微分方程式「1階微分=0」f ‘(x)=0

最初に見るのは、「1階微分(通常微分)がゼロになる」という微分方程式です。これは、即刻解けます。しかも、運動方程式において物理的な意味も持ちます。

①一番簡単なタイプの微分方程式

$$ \frac{d}{dx}f(x)=0$$ 「微分すると0になる」関数はなんだろう、という方程式です。 $$解: 定数関数\hspace{5pt}f(x)=C \hspace{10pt}(C:定数)$$

当てはまるような公式を探してみますと、

対象の関数微分公式微分方程式の解法での役割
①定数(定数関数)\({\large \frac{d}{dx}c=0}\)微分すると0になる

と、いうものがありますね。
定数は微分するとゼロですから、そのまま当てはまります。これで「解けた」という事になります。

1つだけ注意していただきたいのは、0や1や2などの「特定の定数」だけではなく、定数であればどんなものでもよいという事です。その事を表現するために、「任意の定数」という表現を用います。この表現は、他のタイプの微分方程式の解でも用います。
【f(0) = 1 などの具体的な x の値での関数値が条件としてあるなら、解は f(x) = 1 というただ1つの関数に定まります。そのような条件は「初期値条件」と呼ばれ、微分方程式論全体で重要です。】

物理の力学での運動方程式ではこのタイプの微分方程式は慣性の法則のうち等速運動である事を表現します。

② 2階微分=ゼロ f ”(x)=0 1次関数 

2階微分が0になるという微分方程式も、簡単に解けるタイプのものです。高階の微分が入っていると一見難しく見えるかもしれませんが、これもじつは非常に簡単なのです。
物理的には、力が働いていない物体は等速「直線」運動する事に関わります。

「2階微分=0」という微分方程式

$$ \frac{d^2}{dx^2}f(x)=0$$ 「『2回』微分すると0になる」関数はなんだろう?という方程式です。 $$解: 1次関数\hspace{5pt}f(x)=bx+c\hspace{10pt}(b,c:定数)$$

2階微分が入っているので、一見、どうすればよいのか迷うかもしれません。

しかし、要するに2回微分すると0ですから・・
1回だけの微分は『定数』」であるはず??・・という事に気付くと、解けます。
つまり「1回の微分で定数になる関数(もう1回微分で0)」→ 1次関数が解 というわけです。
使う公式としては、「1階微分=0」の時と同じ公式の組み合わせという事に、なります。

対象の関数微分公式微分方程式の解法での役割
①定数(定数関数)\({\large \frac{d}{dx}c=0}\)微分すると0になる
②単項式「x の a 乗」\({\large \frac{d}{dx}x^a=ax^{a-1}}\)
\({\large \frac{d}{dx}x=1\cdot x^{0}=1}\)
微分するとx の指数が1下がる
「x の 0 乗」は定数

実際に、解となるはずである1次関数を「2回」微分してみましょう。

  1. 微分1回目:\(\frac{d}{dx}(bx+c)=b\)(定数)
  2. 微分2回目:\(\frac{d}{dx}b=0\)(ゼロ)→ OK
  3. 合わせると:\(\frac{d^2}{dx^2}(bx+c)=0\hspace{10pt}\rightarrow \frac{d^2}{dx^2}f(x)=0\hspace{5pt}の解\)

というわけで、確かに1次関数 bx + c は、2階微分=0という微分方程式の解です。
尚、定数関数も何回微分してもゼロになるので解ですが、これは1次関数で b = 0 の場合と見なせるので、任意定数 b の値に制限を設けなければ1次関数に含める事ができます。

この解の導出過程では、「1階微分=(ゼロ以外の)定数」というタイプの微分方程式の解も、合わせて見つけている事になります。また、同じ論法を使うと、3階微分=0、4階微分=0といった微分方程式の解も同様に考える事が可能というわけです。
$$\frac{d^3}{dx^3}f(x)=0 の解は「2次関数」$$

$$\frac{d^n}{dx^n}f(x)=0 の解は「(n-1)次関数」$$といった感じになるのです。

それでは次に、物理的には放物運動(2次関数のグラフの形)を表す微分方程式を見てみましょう。これについては高校の物理でも多分扱われていると思いますが、微分方程式の観点から考察してみましょう。

③ \(y^{\prime\prime}-b=0\)・・2次関数

「2階微分が定数に等しい」という微分方程式です。(もちろん\(y^{\prime\prime}=b\)と書いても同じです。b = 0 の場合は2階微分=0のタイプですから、b≠0 と考えてください。)
物理的には運動方程式において地上で物を投げた時の運動としての意味があり、放物軌道の運動を表します。

数学的な解法 ■ 物理的な意味・・地上での水平投射の重力による運動(放物運動)

解法:1回微分すると1次関数→2回微分すると定数 と考えよう

「2階微分=もとの関数」という微分方程式

$$ \frac{d^2}{dx^2}f(x)-b=0$$ 「『2回』微分すると定数になる」関数はなんだろう?という方程式です。 $$解: 2次関数\hspace{5pt}f(x)=\frac{b}{2}x^2+Ax+C\hspace{10pt}(A,C:定数、b は微分方程式内で使われてる係数)$$

この3つ目のタイプの微分方程式の場合、2回微分すると定数・・という事ですから、「1回微分すると1次関数」を見つければよいのです。

対象の関数微分公式微分方程式の解法での役割
①定数(定数関数)\({\large \frac{d}{dx}c=0}\)微分すると0になる
②単項式「x の a 乗」\({\large \frac{d}{dx}x^a=ax^{a-1}}\)
\({\large \frac{d}{dx}x=1\cdot x^{0}=1}\) \({\large \frac{d}{dx}x^2=2x}\)
微分するとx の指数が1下がる
「x の 0 乗」は定数

単項式の微分公式を見ると、1回微分するごとに指数(xの「〇乗」の〇)が1下がりますから、2次関数を1回微分すると1次関数になりますね。

ですから、解となる関数は「2次関数」です。
最後に定数 b が残ってほしいのと、係数調整のために、
\(\frac{b}{2}x^2+Ax+C\)のような形のものを選びます。2次関数の中の Ax + C の部分は、2回の微分操作の過程で0になって消えてしまうので、A と C は任意定数という形になります。
2次式を微分するために\(\frac{1}{2}\)というオマケがくっつく事に注意する必要がある事を除けば、これも難しくないのではないと思います。

実際に微分して確かめてみよう

実際に微分をしてみて、確かめてみましょう。

  1. 微分1回目:
    \(\frac{d}{dx}\left(\frac{b}{2}x^2+Ax+C\right)=2\cdot \frac{b}{2}x+A=bx+A\) (1次関数)
  2. 微分2回目:
    \(\frac{d}{dx}(bx+A)=b\)(定数で、しかも b に一致)→ OK
  3. 合わせると:
    \(\frac{d^2}{dx^2}\left(\frac{b}{2}x^2+Ax+C\right)=b\hspace{10pt}\rightarrow 2次関数\frac{b}{2}x^2+Ax+C は、確かに\frac{d^2}{dx^2}f(x)-b=0\hspace{5pt}の解\)

物理的には、運動方程式においては「地上で物を投げた時」の運動を表します。座標同士の関係を表す軌道が2次関数の関係式になるので、放物線を描きます。

物理的意味:地上での水平投射 重力だけが働く場合は放物運動

ここでは、運動方程式で働く力が「重力」であるとします。これは、地球上では物体の質量が定まれば一意的に決まり、その大きさは mg (≒9.8m) である事が知られています。この時、水平に物を投げる(「投射する」)と、軌道は2次関数のグラフである放物線になる事を見ましょう。

■ ①考え方・・水平方向と垂直方向に分ける ■ ②設定をして、2方向の2本の運動方程式を作ろう
■ ③運動方程式の解から軌道の関係式を作ると、2次関数つまり「放物線」が得られる

① 考え方・・水平方向と垂直方向に力の働き方を分ける

水平に物を投げる(投射する)運動を考えます。投げた瞬間には力が働いているかもしれませんが、一旦手などを離れたら、水平方向には力は働かず、地面に向かう方向にのみ重力が働くと考えて数式を組み合わせるのです。

  • 地面に対して水平(平行)な向き:力は働かない
      → 等速で運動(射影して見れば直線運動でもある)
  • 地面に対して垂直(直角)な向き:重力 mg [N] が地面に向かう向きで働く
      → どういう挙動をするか?(運動方程式を立てて解くと「時間の2次関数」になる)

上記の「2階微分=0」の微分方程式の物理的意味の項目で、平面や空間の運動で運動方程式を考える場合は、力を分解して「座標成分ごとに運動方程式を立てる」という事を述べました。ここでも、同じ考え方をします。

この場合は、3次元で考えてもよいのですが、最初に物を放り投げた方向に向かって上手に1つの座標軸を合わせたと考えると、すなわち平面で考えても全く同じ運動を表せます。

空気抵抗力などがなく、ひたすら地面に向かって同じ大きさの重力 -mg が働くと仮定します。こういうボールみたいなものを投げる時、力学的には、「『回転』もないものとする」という仮定も、一応重要です。

(※働く力が重力だけであると想定するので、「水平方向には力は働かない」=「水平方向だけで見れば等速直線運動」という事が保障されるので、そのように考えてよいわけです。「直線」という事については、地面の真上から見れば「直線」になっているという事です。このような見方を「射影(しゃえい)」と言います。)

② 設定をして、2方向の2本の運動方程式を作る

このようにして考える時、どちら向きがプラスでどちら向きがマイナスかも含めて、座標軸の向きの設定を行ってから運動方程式を立てます。今、運動は平面で考える事にして、座標軸は x 軸と y 軸であるとします。

座標軸の設定
  • x 軸:地面に対し水平方向、物体が投射される平面内、進行方向が+プラス
  • y軸:地面に対して垂直、地面から空の向きが+プラス、空から地面への向きが-マイナス

そして、2本の運動方程式を立てましょう。※尚、この場合に仮に3本目を立てたとしても、その向きには働く力はゼロ、位置もゼロから動かないので 0 = 0 という式ができるだけです。

  1. x 軸成分: \(0=m\frac{d^2x(t)}{dt^2}\) → 「2階微分=0」なので、解は t の1次関数ですね
  2. y軸成分:\(-mg=m\frac{d^2y(t)}{dt^2}\hspace{5pt}\Leftrightarrow \hspace{5pt}-g=\frac{d^2y(t)}{dt^2} \) → 「2階微分=定数」の微分方程式で、
    解は t の2次関数というわけです。
    この場合、質量 m は上手い具合に両辺に入っているので、両辺で割って消せます。

y 軸成分の運動方程式で「力」の部分を – mg としているのは、空 → 地面方向は「マイナス」向きと設定したためです。地面方向に向かう「重力」の符号もマイナスにするのです。
(※では、もし「地面向き方向をプラスに設定したら + mg にするのか?」と言うと、その通りです。その場合は \(mg=m\frac{d^2y(t)}{dt^2} \)になります。符号が変わっても、解が2次関数という事自体は変わりません。)

② 運動方程式の解から軌道の関係式を作ると、2次関数つまり「放物線」が得られる

という事は、$$x(t)=bt+c,\hspace{5pt}y(t)=-\frac{g}{2}t^2+Bt+C $$という形の2式が、微分方程式である運動方程式の解として、出てくるわけです。
x(t) のほうが1次式ですから、これを t = ・・の形にして y(t) のほうの t に代入すると、$$y(x) = -Ax^2+Px+Q \hspace{5pt}(A > 0)$$ という、x に関する2次関数の形になる事が分かります。

これで、軌道が確かに「放物線」である事が表現されたわけですが、座標軸の正負の向きの設定などから、上記の各定数について b > 0 、A > 0 となるので、最後の結果で \(-Ax^2\)(例えば \(– 2x^2\))という形が出てくるという事は、きちんと「下に落ちていく」という事も表しています。
このような時に結果を考察すると何だか変な事になる場合は、符号の設定などを間違えているかの可能性があるわけです。

さて次は、三角関数が解になるタイプの微分方程式です。じつは、これは物理の力学で言うと「ばねの運動」なので、空間でも平面でもなく、「一次元(直線運動)」と考えてよいパターンです。ですから運動方程式は1つだけ作ればよいので、意外と考察しやすいかもしれません。

④ \(y^{\prime\prime}+b^2y=0\)・・調和振動(単振動)

このタイプの微分方程式は、2階微分と「元の関数」が入っていて、定数倍の関係にあるというものです。三角関数が関係し、物理的には抵抗力などが無い場合の「ばねの運動」(調和振動、単振動とも言います)を表します。
※\(b^2\) という「2乗」の形は、これ自体は「正の数」である事を言っています。
\(y^{\prime\prime}=-b^2y\) つまり「2階微分」=「負の定数」×「もとの関数」という事です。

数学的解法 ■ 物理的な意味:ばねの運動は三角関数(調和振動、単振動)

数学的解法:まず「2回微分すると元の関数の定数倍」になる関数は?

「2階微分=もとの関数の正の定数倍」という微分方程式

$$ \frac{d^2}{dx^2}f(x)+b^2f(x)=0$$ 「『2回』微分すると『もとの関数の負の定数倍』になる」関数はなんだろう?という方程式です。 $$解: 三角関数\hspace{5pt}f(x)=A\cos (bx+C)\hspace{10pt}(A,C:定数、b は微分方程式内で使われてる係数)$$

「2回微分するともとの関数の『マイナスの定数倍』」というものは、微分公式にあるでしょうか?三角関数は、これに似ています。実際、これをパーツとして使えるのです。この時、正弦でも余弦でも同じ事なので、ここでは余弦 cos x を、使います。

対象の関数微分公式微分方程式の解法での役割
④-1 三角関数(正弦関数)\({\large \frac{d}{dx}\sin x=\cos x}\)微分2回で元の関数の符号±入替
④-2 三角関数(余弦関数)\({\large \frac{d}{dx}\cos x=-\sin x}\)微分2回で元の関数の符号±入替
⑤合成関数の微分\({\large \frac{df(y)}{dx}=\frac{df(y)}{dy}\frac{dy(x)}{dx}}\)微分方程式内の定数倍などを調整

三角関数を2回微分すると、もとの関数の「マイナス倍」になります。
他方、解きたい微分方程式は、「『マイナスの定数』倍」となっています。
すると、符号はよいとして、微分した時だけ「定数倍」を新たに出すにはどうすればいいでしょう?

そのためには、じつは合成関数の微分公式を考えればよいのです。この考え方は、このページで紹介するタイプ以外の微分方程式でも有効な手段です。

例えば cos(2x) の微分を1階と2階について見ますと、$$1階微分:\frac{d}{dx}\cos (2x)=(2x)^{\prime}(-\sin (2x))=-2\sin (2x)$$ $$2階微分:\frac{d^2}{dx^2}\cos (2x)=\frac{d}{dx}(-2\sin (2x))=-4\cos (2x)$$ になります。y = 2x , cos(2x) = cos y と考える事ができるので、合成関数の微分公式が適用できるのです。係数として「2」というのが掛けられていますが、それが合成関数の微分由来で出てくる係数というわけです。

・・すると、この cos (2x) という関数は、2回微分するともとの関数 cos (2x) の – 4 倍になっているので、 「2回微分するともとの関数の『マイナスの定数倍』」 の条件を満たす関数の仲間である事が分かります。

という事は、定数倍として\(-b^2\)がほしいのであれば、
cos (bx) という関数を考えれば、2回微分すると合成関数の微分公式が2回適用されるので、\(-b^2\cos (bx)\)が得られます。これが解という事になりそうですね!

任意定数については、まず A を任意定数として、A cos(bx) という形でも解として成立するのです。また、別の任意定数 C を用いて Acos(bx+C) という形でも、じつはOKなのです。これは、合成関数の微分を行う時に、bx + C を x で微分すると b は生き残りますが C はゼロになって消えるためです。

実際に微分して確かめてみよう!

つまり、総合すると Acos (bx+C) という関数が、解になるという事です。正弦で考えても同様の形になります。実際に微分してみて、確かめてみましょう。

  1. 微分1回目:\(\frac{d}{dx}A\cos (bx+C)=-bA\sin(bx+C)\)(マイナスの正弦)
  2. 微分2回目:\(\frac{d}{dx}\{-bA\sin(bx+C)\}=-b^2A\cos (bx+C)\)
    (もとの関数の「マイナスbの2乗」倍)→ OK
  3. 合わせると:
    \(\frac{d^2}{dx^2}A\cos (bx+C)=-b^2A\cos (bx+C)\hspace{5pt}\Leftrightarrow\hspace{5pt}\frac{d^2}{dx^2}A\cos (bx+C)+b^2A\cos (bx+C)=0\)
    \(\rightarrow A\cos (bx+C)は、確かに\frac{d^2}{dx^2}f(x)+b^2f(x)=0\hspace{5pt}の解\)

物理的には、運動方程式を考えると、このタイプの微分方程式は「ばねの運動」を表します。ばねというと、いかにも人工的な響きがありますが、別に工学だけで用いるというものでもありません。例えば、ミクロの領域での分子の振動などを、ばねと同じタイプの振動(調和振動)と考えるモデルをもとにして考察する事が、量子力学や量子化学でもなされるのです。

物理的意味:ばねの運動は三角関数(調和振動、単振動)

運動方程式で、ばねにつながれた物体の運動を考えると、上記の「2階微分=負の定数×もとの関数」という微分方程式になります。ばねは、抵抗力が働かないなら伸びたり縮んだりを繰り返しますから、周期関数である三角関数が解であるという事はその事実と調和しているというわけです。

■ ①まずは設定をしよう・・一次元の運動として扱えます ■ ②解いてみて完成・・結果は三角関数です
① まずは設定をしよう

抵抗力がない状態で、ばねの伸び縮みの力だけで、ばねにつながれた物体が(振動)運動しているとします。この場合は、1次元の直線運動と考えてよいので、運動方程式を3つ・2つ立てる必要はなく、1つでよいのです。ですから、式さえ立てれば、結構分かりやすいと思います。

ばねの力の大きさは、ばねの「伸び」または「縮み」に比例します。(「フックの法則」と言います。)
これはつまり、ばねの平衡点(伸び縮みのない自然な状態のばねの先端の位置)から見て「位置座標」に比例するという力であるわけです。時間を変数とした場合、これは「もとの関数 x(t) 」に比例する力、というわけです。
比例するという事は比例定数もあって、「kx」という形の力が働くというわけです。この k を「ばね定数」という、そのまんまの名称で呼びます。(※物としてバネが対象ではなく、分子の振動などを調和振動モデルとして考える場合などは、「力の定数」という呼び方もします。)

ただ、プラスマイナスの符号にだけは注意しましょう。まず、ばね定数 k は正の値であるとします。次にばねの平衡点を原点 x = 0 として、座標の正負の向きを次のように設定します。

  • 原点から見て、ばねが伸びている方向:プラス方向
  • 原点から見て、ばねが伸びている方向:マイナス方向

この時、ばねによる力の向きを考えてみます。符号に注意してください。

  • ばねが伸びている時・・つまり位置座標が正の値の時:
    力は原点向き つまり負の方向(例えば x = 2 だったら、F = -2k )
  • ばねが縮んでいる時・・つまり位置座標が負の値の時:
    力は原点向き つまり正の方向(例えば x = -2 だったら、F = +2k )

これをまとめますと、「ばねの力は位置座標と常に逆の符号」という事です。 $$ばねの力:F = -kx(t)\hspace{10pt}(x(t):位置座標、ばね定数 k>0)$$ そうしますと運動方程式は次のようになるわけです。 $$-kx(t)=m\frac{d^2x(t)}{dt^2}\hspace{10pt}\Leftrightarrow \hspace{10pt}\frac{d^2x(t)}{dt^2}+\frac{k}{m}x(t)=0$$

物体の運動の様子を調べるにはこれを解けばよいわけですが、もう分かっているわけです!

② 解いてみて完成

ばねにつながれた物体に関する運動方程式\(\frac{d^2x(t)}{dt^2}+\frac{k}{m}x(t)=0\) は、
形としては「2階微分=負の定数×もとの関数」ですから、解は三角関数 Acos(bt+C) の形ですね。
(一応、\(\frac{k}{m}>0\)という符号にも注意してください。)

もう少し物理的に見通しをよくするために、
\(\frac{k}{m}=\omega^2\)(\(\omega\):「オメガ」)という置き換えが、よく行われます。
そのように置き換えると、運動方程式は\(\frac{d^2x(t)}{dt^2}+\omega^2 x(t)=0\) となりますから、
解は \(A\cos (\omega t+C)\) という形で書けるわけです。

このオメガ \(\omega\) という記号は、ばねの調和振動に限らず、回転運動などの周期的な運動における角速度角振動数角周波数(1秒間に何ラジアン回るか)を表します。ばねの場合は「振動」ですので、角振動数と言う場合が多いです。いずれにしても、ばねの運動を周期運動と見た場合に、角度の部分(「位相」)がどのように変化するかを表す値というわけです。

ここでは \(\frac{k}{m}=\omega^2\) と、おいただけでしたから、そのような角振動数は、物体の質量とばねの性質(ばね定数の大きさの違い)によって決まるという事も分かります。

さて、使用する実質5つの公式のうち、まだ使っていないのが 自然対数の底 e の指数関数の微分公式です。最後に紹介するタイプの微分方程式は、この e の指数関数の微分公式を用いて解けます。

⑤ \(y^{\prime\prime}+by^{\prime}+x=0\)・・粘性抵抗ありのばねの運動

5つ目の微分方程式として、\(y^{\prime\prime}+by^{\prime}+x=0\) で「『特性方程式』が異なる2つの実数解を持つ場合」を説明いたします。この、後のほうにくっついてる妙な条件は別になくてもきちんと微分方程式は解けるのですが(特性方程式を使った一般の場合の解法)、簡単なのがこの条件の場合ですので、この場合を述べます。
物理的には、粘性の強い流体の中でのばねの運動で、振動する事なく少し動いて止まってしまう・・という運動を表します。

数学的解法 ■ 物理的意味:粘性抵抗が「強い」場合のばねの挙動

数学的解法:e の指数関数の微分を使おう

これの説明は他のものと比べて少し長いですが、「公式を上手に当てはめれば解ける」という事には変わりありません。

\(y^{\prime\prime}+by^{\prime}+cy=0\)という形の微分方程式

$$ \frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0\hspace{10pt}x^2+bx+c=0が異なる「2つの『実数解』」を持つ場合$$ このような形の方程式で、何やら変な条件がくっついている場合の微分方程式です。 $$解: e の指数関数\hspace{5pt}f(x)=Ae^{\alpha x}+Be^{\beta x}$$ $$(A,B:定数、\alpha, \beta は x^2+bx+c=0 の解(異なる2つの実数解)$$

このタイプの微分方程式を解くには、e の指数関数の性質と、1つ前の微分方程式の例でも用いた
「合成関数の微分公式で『定数調節』」する手法を上手に組み合わせればよいのです。

対象の関数微分公式微分方程式の解法での役割
③自然対数の底 e の指数関数\({\large \frac{d}{dx}e^x=e^x}\)微分すると元の関数に戻る
⑤合成関数の微分\({\large \frac{df(y)}{dx}=\frac{df(y)}{dy}\frac{dy(x)}{dx}}\)微分方程式内の定数倍などを調整

考え方を簡単に述べましょう。三角関数で cos (bx) 等を考えた時は、
1階微分で b倍、2階微分で\(b^2\)倍という定数倍調整に利用できました。
同様に、指数関数についても、定数 \(\alpha\) を用いて \(e^{\alpha x}\) といった形の関数を考えると定数倍調整に使えます。

この \(e^{\alpha x}\) という関数を微分すると、

  • 微分してないもとの関数:\(e^{\alpha x}\)
  • 微分1回目:\(\frac{d}{dx}e^{\alpha x}=\alpha e^{\alpha x}\)
  • 微分2回目:\(\frac{d^2}{dx^2}e^{\alpha x}=\alpha^2 e^{\alpha x}\)

ポイントは、「これらを加え合わせてみる」という事です。
e の指数関数は微分しても元の関数になるだけという際立った性質があるため、何回微分したとしても\(e^{\alpha x}\) が必ず含まれる事に注意して、足し算してみましょう。すると・・ $$\frac{d^2}{dx^2}e^{\alpha x}+\frac{d}{dx}e^{\alpha x}+e^{\alpha x} =\alpha^2 e^{\alpha x}+\alpha e^{\alpha x}+e^{\alpha x} =e^{\alpha x}(\alpha^2+\alpha +1)$$ もし「これがゼロ」であるなら、指数関数はゼロになりませんので、
後ろにくっついている \(\alpha^2+\alpha +1\) がゼロという事です。
少し、2次関数、2次方程式との関係がありそうですね?

では今度は、定数倍も考えて、
\(\frac{d^2}{dx^2}e^{\alpha x}+b\frac{d}{dx}e^{\alpha x}+ce^{\alpha x}\) を考えてみましょうか。 $$\frac{d^2}{dx^2}e^{\alpha x}+b\frac{d}{dx}e^{\alpha x}+ce^{\alpha x} =\alpha^2 e^{\alpha x}+b\alpha e^{\alpha x}+ce^{\alpha x} =e^{\alpha x}(\alpha^2+b\alpha +c)$$ これがゼロになるには、先ほどと同じ論法で、
\(\alpha^2+b\alpha +c=0\)となる \(\alpha\) であればよい、という事です。

\(\alpha\) が \(\alpha^2+b\alpha +c=0\) となる事を、 全く同じ意味で、次のようにも言い換えられます。 $$「\alpha が x^2+bx +c=0 の解である」$$

そしてそのような場合、じつはまさしく上の微分方程式の形:
\(\frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0\)を満たしています。
ですから、まず次の事が言えます。

POINT

$$\alpha が x^2+bx +c=0 の解である時、e^{\alpha x}は$$ $$\frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0の解の1つ$$ また、任意定数を A として、\(Ae^{\alpha x}\) も解になります。
■ ここで解法のために考えている2次方程式を「特性方程式」と言います。n階の定数係数の線型の微分方程式に対する、同じ係数を用いたn次方程式を一般的に特性方程式と呼びます。

さて、\(\alpha が x^2+bx +c=0\) の「実数解」である時で、重解では無い時
同じく実数解となる \(\beta\) が存在するわけで、これを用いた
\(e^{\beta x}\) も、同じく\(\frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0\)の解なのです。
微分の基本的な性質として\(\frac{d}{dx}(bf(x)+cg(x))=b\frac{df(x)}{dx}+c\frac{dg(x)}{dx}\) というもの(線型性)があった事に注意しますと、
「特性方程式」が2つの異なる実数解を持つ時の上記の微分方程式の解は、任意定数も考慮すると次のように表せるわけです:

解:「特性方程式」が2つの異なる実数解を持つ場合 $$\alpha と\betaを x^2+bx +c=0 の異なる2つの解、A と B を任意定数として、$$ $$\frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0の解は$$ $$Ae^{\alpha x}+Be^{\beta x} で表されます。$$ ■ 特性方程式が重解を持つ場合と、実数解をもたない場合にも微分方程式を解く事はできますが、これは別の記事で詳しく述べましょう。指数関数の微分の性質が重要である点は同じです。

物理でも、運動方程式がこのタイプの微分方程式になる事があります。それについて、見てみましょう。

物理的意味:粘性抵抗が「強い」場合のばねの挙動

ばねにつながれた物体の運動を表す運動方程式には、位置座標(1次元・直線)の「2階微分」と、「もとの関数の定数(ばね定数)倍」という項が含まれています。粘性のある流体の中のばねの運動の場合、これに粘性抵抗力が加わり、
これは速度に比例する事が実験から分かっています。つまり、「1階微分」に比例する項が加わるという事です。
特性方程式が異なる2つ実数解を持つ場合は、粘性が結構強い場合になります。

設定をして運動方程式を解く ■ どういう運動かを考察してみよう 

設定をして運動方程式を解く

まず、座標の設定としては、抵抗力のないばね運動の時と同じで、一次元の運動と考えてよいのです。ばねの平衡点を原点として、伸びる方向をプラス方向、縮む方向をマイナスとします。

次に、力を整理しましょう。ばねの力と、粘性抵抗力の2つがあります。粘性抵抗力は、運動を妨げる方向に働きますので、マイナス符号をつけるのです。(この抵抗力の符号の考え方は、空気抵抗力や摩擦力に対しても同じです。)

この場合に働く2つの力
  1. ばねの力:\(-kx\) k:ばね定数(正の値)
  2. 粘性抵抗力:\(-\rho \frac{dx(t)}{dt}\) \(\rho\):てきとうな比例定数(正の値)

すると、運動方程式は次のようになります。 $$-kx-\rho \frac{dx(t)}{dt}=m\frac{d^2x(t)}{dt^2}$$ $$\Leftrightarrow \frac{d^2x(t)}{dt^2}+\frac{\rho}{m} \frac{dx(t)}{dt}+\frac{k}{m}x=0$$ $$\left(\Leftrightarrow \frac{d^2x(t)}{dt^2}+2\gamma \frac{dx(t)}{dt}+\omega^2x=0\hspace{10pt}\gamma=\frac{\rho}{2m},\omega^2=\frac{k}{m}\right)$$ 最後の形には別に変形しなくてもよいのですが、この形だと、解を出しやすいです。
いずれにしても、\(\frac{d^2}{dx^2}f(x)+b\frac{d}{dx}f(x)+cf(x)=0\) の形に確かになっています。

特性方程式が「異なる2つの実数解を持つ」という条件が満たされているとすると、上記の要領で解く事ができます。一応、特性方程式の解を出しておきましょう。(※2次方程式なので比較的容易に出せる事に注意してください。) $$特性方程式:X^2+2\gamma X+\omega^2X=0\Leftrightarrow (X+\gamma)^2-\gamma^2+\omega^2=0 $$ $$\Leftrightarrow (X+\gamma)^2=\gamma^2-\omega^2\Leftrightarrow X+\gamma=\pm \sqrt{\gamma^2-\omega^2}$$ $$\Leftrightarrow X=-\gamma \pm \sqrt{\gamma^2-\omega^2}$$ この2解(実数解という条件とします)を用いて、
微分方程式のほうの解は\(Ae^{(-\gamma +\sqrt{\gamma^2-\omega^2})t}+Be^{-\gamma -\sqrt{\gamma^2-\omega^2})t}\)
・・という事になります。

どういう運動かを考察してみよう

解が出ましたので「これで終わり」でもよいのですが、少し汚い形という事もあって、結局どういう運動になるのかが分かりにくいですね。そこで、もう少しだけ考察をしてみましょう。

特性方程式の2解の形をよく見ますと、 \(X=-\gamma \pm \sqrt{\gamma^2-\omega^2}\) は、これが実数解であるという前提で、
プラスマイナスのどちらの符号をとってもじつは「負の値」なのです。
平方根につくのがマイナス符号の場合は、最初の定数の取り方から X は必ず負の数ですし、
平方根につくのがプラス符号の場合でも \(\sqrt{\gamma^2-\omega^2}<\gamma\) ですから、これは負の数になります。
(※分かりにくい場合、2乗してみてください。)

という事は、特性方程式の2解を、「正の定数」\(p,\hspace{5pt}q\hspace{5pt}を用いて X=-p,-q\)と書くと、 微分方程式のほうの解は、 $$x(t)=Ae^{-pt}+Be^{-qt}$$ となります。これだと多少見やすくて、p と q を正の数だとしましたから、これらにマイナスがついたものが指数に来ているという事は、時間に関して「単調減少」の関数であり、しかも変数の値が大きくなるとゼロに近づいていく事が分かります。 また、普通の指数関数ですので、三角関数と違って「振動」もしません。

この考察をまとめると、例えば次のような事が言えるのです。

粘性抵抗が強い場合の考察
  1. 時間が経てば経つほど,位置座標の x(t) の値は小さくなり、
    じゅうぶんな時間経過後(t → ∞)は、原点x(t) = 0 (ばねの平衡点)に近づき、
    そこからほぼ動かなくなる。
  2. 位置座標 x(t) は通常の指数関数で表されているので、振動はしない。
    伸びた状態から始まるにしても縮んだ状態から始まるにしても、そこから平衡位置に戻って動かなくなり、運動が終了する。

特性方程式が2次方程式の場合、実数解を持つかは \(\sqrt{\gamma^2-\omega^2}\) の中身が正か負かで決まるわけですが、
\(\gamma =\frac{\rho}{2m}\) が粘性抵抗に由来する定数である事から、
粘性が強いほど特性方程式の解が実数解になりやすく、振動しない運動(過減衰)になりやすいという事です。
「では特性方程式が複素数解を持つ場合はどうなるのか?」と言いますと、結論は、
「振動しながら振幅が減衰し、時間が経つと原点(ばねの平衡点)に落ち着く」という運動になります。
ちなみに、特性方程式の解が重解の場合は、ぴったり合う事自体ほとんどないと考えられますが、減衰していく運動である事には変わりありません。

微積分学や物理の入門としては、まず「高校で教わった事を直接使える」ものについて、いくつか具体例を見ながら中に入っていけた事になります。同じように、まずは手持ちの知識を用いて入っていける部分から、少しずつ新規の知識も知っていくようにすると大学数学の内容に無理なく入っていけると思います。

このページで最も大事な事は、式や計算を暗記する事ではなくて、解き方や使われ方の概要をつかんでもらう事です。

参考文献・リンク


微分方程式の基礎 (数理科学ライブラリー)


講座 数学の考え方〈7〉常微分方程式論


常微分方程式 (理工系の数学入門コース)