ライプニッツ級数の導出【四分円を使う方法】

ライプニッツ級数とは「分子が1で分母を奇数とする分数を、プラスマイナスの符号を交互に変えて加えて行くと円周率の1/4に収束する」という無限級数を指します。

この無限級数の導出方法はいくつか存在し、ここでは図形的な考察をもとにした式変形と定積分の計算、それと幾何級数展開を使った導出方法を説明します。

ライプニッツ級数の導出方法はここで説明するものだけではなく、いくつか方法があります。例えば、逆正接関数のマクローリン展開から導出する方法や、連分数展開によって得る方法などがあります。

数学史的には、π/4=1ー1/3+1/5-1/7+・・・という式自体はライプニッツ以外の学者によっても独立に得られていた事が知られています。
また、この記事内でも後述しますが
「ライプニッツ級数1ー1/3+1/5-1/7+・・・がπ/4という値に収束する事」と
「ライプニッツ級数が収束するか否かの判定」は、実は別々に考察できます。
ライプニッツ級数は交代級数(交項級数)という種類の無限級数の1つです。 備考として、一般の交代級数が収束する十分条件を提示する命題は「ライプニッツの定理」と呼ばれる事があります。

ライプニッツ級数とは

まず、ライプニッツ級数の具体的な表式は次のようになります。

ライプニッツ級数

次の式で表される無限級数がライプニッツ級数です。\(\pi\) は円周率です。 $$\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\frac{1}{11}+\cdots$$ $$\left(≒0.785398\cdots\right)$$ この値は無理数になります。

無理数を「有理数で表せる」?

ライプニッツ級数の左辺は無理数ですが右辺は「各項が有理数である無限級数」となっています。

これについては、右辺が表す無限級数は「π/4という無理数に収束するという事」すなわち 「項数を増やせばπ/4という無理数との差をいくらでも小さくできる事」を意味しています。

ですので、ライプニッツ級数の式において「無理数≠有理数」という当然の関係式は崩れてはいません。どこか有限の項数で計算をやめたら、 その値はπ/4には一致しない事になります。しかし項数を増やせばπ/4との差はいくらでも縮まります。それが、ライプニッツ級数が数式的に表すものです。

ライプニッツ級数は特徴的な式の形をしているため、「奇数だけを用いて円周率を表せる」というキャッチ―な表現が使われる事があります。 その表現自体は誤っているわけではありませんが、「無限級数が収束する値として円周率を表せる」という事を踏まえておく必要があります。

ライプニッツ級数が「無限級数」でありπ/4が「極限値」である事を、より明確に表すのであれば次のようになります。 $$\frac{\pi}{4}=\lim_{n \to \infty}\sum_{k=0}^n\frac{(-1)^k}{2k+1}=\sum_{n=0}^{\infty}\frac{(-1)^n}{2n+1}$$ 但し、多くの場合はライプニッツ級数は「円周率と奇数」の関係を強調して
1-1/3+1/5-・・・の形で書かれます。

3.141592・・・をライプニッツ級数で出せる?

円周率の 3.141592・・・の値を計算する式としては、実はライプニッツ級数はあまり優れた式ではありません。無限級数の収束の速さが遅く、 項数を非常に多く増やさないと3.14・・・の値に近付いて行かないためです。(円周率の数値計算用として優れた式としては、 複数のマチン型の公式が知られています。逆三角関数の記事で解説。) 変更なし:

円周率の 3.141592・・・の値を計算する式としては、 実はライプニッツ級数はあまり優れた式ではありません。無限級数の収束の速さが遅く、項数を非常に多く増やさないと3.14・・・の値に近付いて行かないためです。 (円周率の数値計算用として優れた式としては、複数のマチン型の公式が知られています。逆三角関数の記事で解説。)

もし整数だけを準備して円周率計算が手計算で簡単にできるなら何とも便利そうですが、 式として興味深い形をしている事と色々な意味での実用性や有用性は残念な事に必ずしも重ならないという例になっています。

「奇数」が得られる根拠

ライプニッツ級数において、「奇数」以前に「整数」が得られるのはなぜでしょう。それは具体的には、単項式の微分法を根拠にしています。

の微分(「導関数」)は3xになります。積分を行う場合は逆の演算です。
の原始関数はx/3です。 この関係によって1/3,1/5,1/7といった「分母が整数である分数」が式中に発生します。

ライプニッツ級数に限らず、計算式中の「整数」の出所が微分法や積分法であるという場合は少なからずあります。

次に、ライプニッツ級数の各項において「偶数が欠けている」理由は幾何級数展開(等比級数展開)を使う時の公比の形に由来しています。

具体的には、-zという公比による幾何級数展開を考えて1ーz+z-z+・・・という式を得て、 さらにそれにzを乗じてzーz+z-z+・・・の形を作ります。 そして、その各項を積分(項別積分)する事でz/3ーz/5+z/7-z/9+・・・の形の式を得ます。 これがライプニッツ級数の形を作っているわけです。無限級数の項別積分を実行可能であるには条件がありますが、ここではそれを満たします。

具体的には、-zという公比による幾何級数展開を考えて1ーz+z-z+・・・という式を得て、 さらにそれにzを乗じてzーz+z-z+・・・の形を作ります。 そして、その各項を積分(項別積分)する事でz/3ーz/5+z/7-z/9+・・・の形の式を得ます。 これがライプニッツ級数の形を作っているわけです。無限級数の項別積分を実行可能であるには条件がありますが、ここではそれを満たします。

ライプニッツ級数において幾何級数展開が使われる部分は正確には「1/3」以降の項からであり、最初の「1」は出所が異なる事になります。

幾何級数展開の式を使用する事は「無限級数が得られる事」と「プラスとマイナスが交互に出てくる事」の根拠でもあります。 そのため、次に述べて行くライプニッツ級数の導出方法では微積分の基本計算と並んで幾何級数展開が非常に重要な要素となっています。但し、 この幾何級数展開を使用するには「公比の絶対値が1未満である」という条件があるので注意が必要です。

導出に使う式や考え方
  • 円とその接線の式、面積の関係などから得る式変形と変数変換(円周率は円の面積から)
  • 単項式(xなど)の積分計算(「奇数」が分母にある根拠)
  • 幾何級数展開(無限級数の形となる根拠)
ライプニッツ級数の「奇数」の出所
この図の式の積分区間は開区間(0,1)内の2つの値εとδを使った [ε,δ] として、 最後にε→0,δ→1の極限を考えるものとしています。その理由は、円の式の導関数の不連続点を除くためと、 幾何級数展開が可能な範囲内で式を考えるためです。厳密性にこだわらないなら、最初から積分区間を[0,1] として計算してもライプニッツ級数の導出は可能です。 (積分する関数は円の式なので、端点を含めたからといって面積としての定積分の値が発散する事はありません。)

証明と導出【四分円の面積を利用する方法】

全体の流れ

大きく分けて記すと次のようになります。

$$四分円y=\sqrt{2x-x^2}に対してy=\frac{dy}{dx}x+zという式変形を考えるとx=\frac{2z^2}{1+z^2}$$

$$|z|<1のもとで幾何級数展開により\frac{1}{1+z^2}=1-z^2+z^4-z^6+\cdots$$

$$部分積分と置換積分により\int \left(\frac{dy}{dx}x+z\right) dx=\frac{1}{2}\left(xy+zx-\int x dz\right)と変形できる。$$

その後、幾何級数展開した箇所について項別積分を行い積分区間の端点の極限を考慮したうえで計算を進め、 得られる無限級数の収束値が半径1の四分円の面積π/4に等しいという形でライプニッツ級数を導出できます。

$$\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=1-\lim_{\epsilon \to 0, \delta \to 1} \left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$これが半径1の四分円の面積\int _0^1y dx=\frac{\pi}{4}に等しい。$$

以下、各過程を詳しく見て行きます。

  1. 円の式と導関数
  2. 円の接線の式を利用して関係式を作る
  3. 積分においてyの形を変形する(面積変換定理)
  4. 幾何級数展開を適用
  5. 定積分の計算と極限の考察
  6. 参考:(アーベルの)連続性定理

①円の式と導関数

具体的な計算としては半径が1の四分円(半円のさらに半分)の面積を定積分で計算します。
しかし円を表す式を使って普通に定積分の計算をする (置換積分か逆三角関数を使用)と、π/4という値は出ますが1-1/3+1/5-・・・という無限級数の式は出てきません。

使う式:四分円(半円のさらに半分)

閉区間 [0, 1] およびy≧0の範囲における、中心座標(1,0)半径1の円の式を使います。 $$y^2 +(x-1)^2=1\hspace{3pt}$$ $$\Leftrightarrow y^2 +x^2 -2x=0$$ $$y≧0においては、y=\sqrt{2x-x^2}$$ $$y>0の時、\frac{dy}{dx}=\frac{1-x}{\sqrt{2x-x^2}}\left(=\frac{1-x}{y}\right)$$ 微分により得られる導関数dy/dxはこの後で積分計算に使用しますが、x=0の時に無限大になってしまう (図形的に接線はx軸に垂直でy軸に平行となる)ので、厳密にはx=0は積分区間に含める事ができず極限値を考える必要があります。導関数を考えないなら普通に原点を積分区間に含める事ができます。

微分の計算は次のようにしています。合成関数の微分法を使います。(ここでの場合は、後述する図形的考察でもこの導関数は導出可能です。)

$$\frac{dy}{dx}=\frac{d}{dx}\sqrt{2x-x^2}=\frac{d}{dx}\left(2x-x^2\right)^{\frac{1}{2}}=\frac{1}{2}\left(2x-x^2\right)^{-\frac{1}{2}}\cdot (2-2x)=\frac{1-x}{\sqrt{2x-x^2}}$$

半径1の円の面積は1×1×π=πです。その1/4である四分円の面積はπ/4です。この値が無限級数1ー1/3+1/5-1/7+・・・の収束値である事を積分を使って証明して行きます。

しかしy≧0における円の式をそのままxで定積分するとπ/4の値は得られますが無限級数の式は得られません。何か別の方法で円の面積を計算する必要があります。

四分円の式と導関数
ライプニッツ級数の導出に使う積分計算で「厳密には」積分区間からx=0を除いて考えるのは、計算に使う導関数の式がx=0 (この時にy=0)において無限大に発散してしまう事によります。

②円の接線の式を利用して関係式を作る

そこで、実は「円の接線の式」を利用すると通常とは異なる形で面積の積分計算ができます。

但し積分を行う対象の関数は円の式なので、接線上の点を考えるわけではなく「円周上の点(x,y)に対して成立する関係式」を接線の式を利用して作ります。

円周上の点(x,y)における接線の傾きはdy/dxで表される導関数です。そして、接線のy切片(接線とy軸の交点)をzとします。この時にy=(dy/dx)x+zが成立します。

この時にzはxの関数です。そのようなz=z(x)という関数がxの開区間(1,0)の範囲内において円周上の点(x,y)に対して必ず存在できます。 このzの値が存在できる事は図形的に見ても確認できますが、式でも確かに示せます。

$$y>0においてy=\frac{dy}{dx}x+zとすると、\frac{dy}{dx}=\frac{1-x}{y}であるので$$

$$y=\frac{x-x^2}{y}+z\Leftrightarrow zy=y^2-(x-x^2)=y^2-x+x^2$$

$$円の式y^2 +x^2 -2x=0より、zy=x$$

$$y>0であればz=\frac{x}{y}=\frac{x}{\sqrt{2x-x^2}}$$

ここで考えているy=(dy/dx)x+zという式は、 あくまで円周上の点(x,y)に対して成立する式です。接線自体の式として考える場合はxとyを接線上の点の座標として考えるわけですから、円周上の点を別の文字で例えば(a,b)として表し、 その点における微分係数f’(a)を使う必要があります。その時に接線の式はy=f’(a)x+z(a)であり、これは接線上の点(x,y)に対して成立する関係式です。

接線の式を利用した変換
y>0の範囲で円の接線のy切片をzとすると、円周上の点(x,y)に対してy=(dy/dx)x+zを満たすz=z(x)が存在します。

この時にxをzで表す事もでき、後の計算で重要です。

$$z=\frac{x}{\sqrt{2x-x^2}}=\sqrt{\frac{x}{2-x}}から、z^2(2-x)=x$$

$$\Leftrightarrow x=\frac{2z^2}{1+z^2}$$

この後の計算では、このzを変数として四分円の面積を積分計算する事を考えて行きます。xをzで表した式を見ると分母が1+z2となっており、これが幾何級数展開可能な式の形になっています。

後の計算で重要な関係式

0<z<1の範囲においてはzで表したxの式は、公比を-z2とした幾何級数展開が可能です。 $$x=\frac{2z^2}{1+z^2}=2z^2(1-z^2+z^4-z^6+\cdots)$$

(補足)図形的にy切片と導関数を計算する場合

上記の計算でzの具体的な形としてz=x/yが得られましたが、この関係は平面幾何的にも導出できます。ここで考えている円はy軸が原点における接線となっているので、「接線のy切片と接点と円の中心」で作られる三角形を考えて合同関係に着目すれば三平方の定理によってzとxおよびyとの関係式を作る事ができます。

接線のy切片(0,z)から接点(x,y)までの距離は三角形の合同関係からzです。また、接線のy切片からx軸方向にx進み、y軸方向にy-z進めば接点(x,y)にたどり着きます。

同じく図形的考察からy>0において接線の傾きは(yーz)/x=(yーx)/(xy)です。そしてyをxで表すと、微分により得る導関数と同じ式を得ます。

$$y>0の時、接線の傾きは\frac{y-z}{x}=\frac{y-\frac{x}{y}}{x}=\frac{y^2-x}{xy}$$

$$=\frac{2x-x^2-x}{x\sqrt{2x-x^2}}=\frac{x-x^2}{x\sqrt{2x-x^2}}=\frac{1-x}{\sqrt{2x-x^2}}\left(=\frac{dy}{dx}\right)$$

③積分においてyの形を変形する(面積変換定理)

次に四分円の面積を積分によって考えます。この時に、積分変数xでyを積分する計算において
y=(dy/dx)x+zの式変形をしてzを積分計算に持ち込みます。以下、まず積分区間に依存せずに不定積分で可能なところまで式変形の計算を進めて行きます。

$$\int ydx=\int\left(\frac{dy}{dx}x+z\right)dx$$

この段階では積分変数の変換を行ったわけではありません。
(dy/dx)x+z={(1-x)/y}・x+x/y
=(2x-x)/y
=y/y=y
という関係を使ってyを表しているだけとなります。

次に2つの項のそれぞれについて積分変数の変換を考えます。

まず(dy/dx)xの項については部分積分の公式を適用して変形をします。

$$\int\frac{dy}{dx}xdx=xy-\int y\left(\frac{d}{dx}x\right)dx=xy-\int ydx$$

この部分積分による式変形は、定積分で計算した時には長方形領域の面積を曲線で分割した時の関係を表す意味を持ちます。

置換積分を行ってから(d/dy)y=1が乗じられていると見て部分積分を行い、積分の項に対して再度置換積分を行って積分変数をxに戻す事でも同じ式を得ます。$$最初に置換積分を行うと、\int\frac{dy}{dx}xdx=\int xdy$$ $$次に積分変数yで部分積分を行うと\int x dy=\int x \left(\frac{d}{dy}y\right)dy=xy-\int\frac{dx}{dy}ydy$$ $$置換積分を再度適用してxy-\int\frac{dx}{dy}ydy=xy-\int y dx$$ 但し、定積分を行う時にはxでの積分であったかyでの積分であったか注意も必要です。(ここでの四分円に対する計算ではx=0の時y=0でx=1の時y=1なので結果的にそれほど問題は起こらない。)

積分の変形と面積の関係
置換積分を最初に行った場合、ここでの変数変換は相似な三角形の辺の比に対応しています。この図では原点を通る曲線に対して原点からの定積分を考えていますが、任意の積分区間で考えた場合も同様に面積を分割する図形的意味を持ちます。

同様の部分積分の適用の仕方でzの項についても式変形し、
さらに置換積分によって「積分変数zでxを積分する」形に変形します。

$$\int z dx=\int z \left(\frac{d}{dx}x\right)dx=zx-\int\frac{dz}{dx}xdx=zx-\int x dz$$

置換積分と部分積分の順序を入れ換えて、置換積分を先に実行して積分変数をxからzに変える 事もできます。定積分する時には積分変数に注意。 $$単純に置換積分を行った場合は、\int zdx=\int z\frac{dx}{dz}dz$$ $$=zx-\int\left(\frac{d}{dz}z\right)xdz=zx-\int xdz$$

式を整理すると、積分変数xによるyの積分の項が2つあるのでまとめる事ができます。

$$\int y dx=xy-\int y dx+zx-\int x dz$$

$$\Leftrightarrow 2\int y dx=xy+zx-\int x dz$$

$$\Leftrightarrow \int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)$$

ここで式中のxyととzxは積分変数をxとして考えた時の原始関数です。但し上記の補足説明のように積分変数をyやzで計算した場合はyやzの原始関数として端点の値を代入する必要があります。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)$$この関係式を定積分で考えたもの(あるいはzに関する計算をする前の段階のもの)はライプニッツの面積変換定理と呼ばれる事があり、円の式に限らず積分可能な一般の1変数関数に対して成立します。図形的な意味としては積分における面積計算の領域を2つに分けて、そのうちの1つを接線のy切片であるzによって積分計算しているものになります。
尚、この式の右辺をxで微分するとyに等しくなる「はず」ですが、
具体的にチェックをしてみると次のようになります。 $$zはxだけの関数で表せる事と、\int x dz=\int x\frac{dz}{dx}dxに注意して、$$ $$\frac{d}{dx}\frac{1}{2}\left(xy+zx-\int x dz\right)=\frac{1}{2}\left(y+x\frac{dy}{dx}+z+x\frac{dz}{dx}-x\frac{dz}{dx}\right)$$ $$=\frac{1}{2}\left(y+x\frac{dy}{dx}+z\right)=\frac{1}{2}\left(y+y\right)=y$$

④幾何級数展開を適用

「xを積分変数zで積分する」項について、0<x<1の時に0<z<1であるので1/(1+z)の部分に対して幾何級数展開を適用できます。公比は-zです。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)において、$$

$$\int x dz=\int \frac{2z^2}{1+z^2}dz=2\int z^2\cdot\frac{1}{1+z^2}dz$$

$$=2\int z^2(1-z^2+z^4-z^6+\cdots)dz=2\int(z^2-z^4+z^6-z^8+\cdots)dz$$

$$=2\left(\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right)$$

これを項別積分するには関数列が一様収束するという条件が必要ですが、ここではその条件は満たされています。(収束する整級数が一様収束する事の証明は、連続性定理の証明の一部として後述。級数変化法による計算と、コーシー列に関する考察を含みます。)

よって、次式が成立します。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)=\frac{1}{2}\left(xy+zx\right)-\left(\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right)+C$$

(この段階ではまだ不定積分で考えているので、積分定数Cを加えた形にしています。)

ここで行われた式変形を細かく表現すると
「0<x<1の範囲内で0<z<1であり、
その範囲の任意のzに対して公比を-zとして1/(1+z)を幾何級数展開できる」
という事になります。
幾何級数(等比級数)は公比の絶対値が1未満である時は公式を適用できます。 $$|r|<1の時、1+r+r^2+r^3+\cdots=\frac{1}{1-r}$$ (導出:第n項までの和をSとして、S-rS=(1-r)Sを計算して(1-r)で割り、n→∞)
逆に、|r|<1の時に1/(1ーr)の形の項は幾何級数の形に展開できます。1/(1+r)の形の場合は公比が-rになります。ここでは展開後の結果にzを乗じていますが、初項がzであるとしてz/(1+z)に対して幾何級数展開を適用しても最終的な計算結果は同じになります。

⑤定積分の計算と極限の考察

ライプニッツ級数は「四分円の面積π/4が無限級数1ー1/3+1/5-・・・に等しい」という式であり、四分円の面積は円の上半分の式\(y=\sqrt{2x-x^2}\)をx=0からx=1まで定積分すれば得られます。そのため本来は、上記で得られた積分の変形式でも積分変数xに対して積分区間を [0,1] としたいところです。簡易的な方法としてはそれでライプニッツ級数を導出可能です。

すなわち、x=0の時にy=z=0,x=1の時にy=z=1の関係から、得られている不定積分を定積分に変える事でライプニッツ級数を得ます。(積分中のxy,zxは共に積分変数をxとしている原始関数であり、例えばx=1を代入してyについてもその時にy=1なのでxy=1という計算。)

$$\frac{1}{2}\left([xy]_0^1+[zx]_0^1\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_0^1=\frac{1}{2}\left(1+1\right)-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$これが\int_0^1 y dx=\frac{\pi}{4}に等しいとすると\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

しかしここでは一応、積分区間にx=0とx=1を含める事はできないとした場合の計算も記します。

  • x=0を含めないのは、式変形で使用したdy/dxがx=0で無限大となるため
  • x=1を含めないのは、幾何級数展開時に|z|<1の条件が必要なため

0<ε<δ<1であるεとδを考え、積分区間を[ε,δ]と置きます。そして計算結果においてε→0,δ→1の極限を考えます。ε→0の時y→0およびz→0であり、δ→1の時y→1およびz→1です。

ライプニッツ級数自体がπ/4に収束する「無限級数」なので、積分区間の極限を考えた時にも等式は問題なく成立します。四分円を普通に定積分した時に積分区間[ε,δ]に対してε→0,δ→1とすればπ/4に収束するので、「2つの式の極限値が同じ値に収束する」という事でライプニッツ級数の等式が成立します。

$$\int_\epsilon^\delta y dx=\frac{1}{2}\left([xy]_\epsilon^\delta+[zx]_\epsilon^\delta\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$\lim_{\epsilon \to 0, \delta \to 1}[xy]_\epsilon^\delta=1\cdot1-0\cdot0=1,\hspace{7pt}\lim_{\epsilon \to 0, \delta \to 1}[xy]_\epsilon^\delta=1\cdot1-0\cdot0=1$$

幾何級数展開した部分についての極限については、何が問題なのかを整理しておきます。

  • 幾何級数が収束する事が保証されるのは|z|<1の範囲(0<x<1)であり、級数が収束しないなら項別積分もできない。
  • z=0(x=0)の時には幾何級数展開自体は可能で、1/(1+z)に対して初項1だけが残り、z=0を乗じて全体が0になる。従って、ε→0の時の全体の極限値も0。

つまり、考察が複雑になるのは積分区間の端点を1に近付けて行く場合です。より具体的には
/3ーz/5+z/7+・・・に「z=1を代入してみた場合の式」が収束するかどうかの判定が曖昧になっています。

この時にz/3ーz/5+z/7ー・・・の形の無限級数が収束するかどうかは、実は独立に確かめる方法があります。z=1を代入してみた時の形1/3ー1/5+1/7ー・・・は収束する事を確認できます。(但し、その方法では1ー1/3+1/5ー・・・がπ/4に収束するかどうかは判定できません。)

(交代級数に関する)ライプニッツの定理

数列{a}について
・数列{|a|}が単調減少 かつ
・n→∞でa→0ならば
交代級数aーa+aーa+・・・は収束する。
(但しこの逆は真ではなく、交代級数が収束しても上記2条件が満たされるとは限らない。)
※微分に関する同名の「ライプニッツの定理」も存在し、状況によっては使用を避けたほうが良い名称です。

この判定方法によれば、1/3ー1/5+1/7ー・・・は「収束する」事が分かります。

■参考:交代級数の収束性の検証(1/3ー1/5+1/7ー・・・の場合。逆三角関数によるライプニッツ級数の導出過程にて。)

このような時にz/3ーz/5+z/ー・・・はz→1の時に収束し、
その極限値は1/3ー1/5+1/7ー・・・の極限値に等しくなる事を保証する定理(連続性定理)がまた別に存在します。そのため、幾何級数展開した部分の極限は次のようになります。

$$\lim_{\epsilon \to 0, \delta \to 1}\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta=\left(\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots\right)-0$$

$$=\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots$$

$$よって、\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=\frac{1}{2}\left([xy]_\epsilon^\delta+[zx]_\epsilon^\delta\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$=\frac{1}{2}(1+1)-\left(\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots\right)=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$同時に、\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=\int_0^1 y dx=\frac{\pi}{4}であるから$$

$$\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

ライプニッツ級数の導出で使う式や計算をまとめるとこのようになります。置換積分と部分積分を行う箇所については順序を入れ換える事もできます。端点の極限を厳密に考える時には交代級数の収束性と連続性定理を考える必要があります。

■参考:(アーベルの)連続性定理

積分区間の端点の極限の考察で使用した連続性定理は次のようなものです。

連続性定理

x=0を中心とする整級数において収束半径がρ(>0)の時、 $$x=\rhoにおいて\sum_{n=0}^\infty a_nx^nが収束する\Rightarrow \lim_{x\to\rho -0}\sum_{n=0}^\infty a_nx^n=a_n\rho^n$$ $$\left(x=\rhoにおいて\sum_{n=0}^\infty a_nx^nが収束する\Rightarrow f(x)はx=\rho において左側連続\right)$$ xはρよりも小さい側からの極限を考えるものとしています。(「x→ρー0」の意味)
x=0を中心とする整級数(以下、単に「整級数」と呼びます)において収束円が(-ρ, ρ)であるという事は、|x|>|ρ|で収束しない事を意味します。
この時にもしx=ρにおいては整級数が収束する時に、その条件下で整級数が収束する範囲内でxを動かしてx→ρの極限を考えるとx=ρでの整級数(のnに関するxの極限関数)の連続性が保証されるというのが連続性定理の内容です。
この定理の表現方法はいくつか存在します。
例えば$$\sum_{n=0}^\infty a_nx^nが収束円の1つの端で収束する\Rightarrow\sum_{n=0}^\infty a_nx^nはその端において連続である$$と言っても同じ事です。
また、連続である事を表す極限については、例えば0以上1未満のtを使って\(\sum_{n=0}^\infty a_n(\rho t)^n\)に対してt→1の極限を考えても同じ事になります。
整級数の中には収束円の端点の片側だけで収束して、もう片方の端点では発散するというものが存在します。連続性定理もx=ρで整級数が収束する時にx=ρ側だけで連続性を保証し、
x=ーρの連続性は分からないものになります。

■連続性定理の証明

まず、各xでの整級数の極限関数がL(x)であるとします。
x=ρで収束するので $$\sum_{k=0}^{\infty}a_k\rho^k =L(\rho)として、$$ $$任意の\epsilon>0に対して、n>Nであれば\left|\sum_{k=0}^na_k\rho^k -L(\rho)\right|<\epsilonとなる自然数Nが存在$$ $$b_0=a_0-L(\rho),\hspace{5pt}n\neq0の時はb_n=a_nとするとn>Nであれば\left|\sum_{k=0}^nb_k\rho^k\right|<\epsilon$$ 次に|x|<|ρ|の任意のxに対しても、n>Nであれば一律に任意の同一のプラスの実数値以下(あるいは未満)にできるかを調べます。【εごとにxに依存しないで1つの値Nを決定できるかどうかを調べたい。】 $$n>M>Nに対して|S_n|=\left|\sum_{k=M+1}^nb_k\rho^k\right|=\left|\sum_{k=0}^nb_k\rho^k-\sum_{k=0}^Mb_k\rho^k\right|<2\epsilon\hspace{5pt}\cdots(*)$$ $$n> M+1の時S_n-S_{n-1}=b_n\rho^n\hspace{10pt}n=M+1の時、S_{M+1}=b_{M+1}\rho^{M+1}$$ $$x=\rho tとすると、\sum_{k=M+1}^nb_kx^k=\sum_{k=M+1}^nb_k\rho^kt^k=S_{M+1}t^{M+1}+\sum_{k=M+2}^n(S_k-S_{k-1})t^k$$ $$=S_{M+1}t^{M+1}+(S_{M+2}-S_{M+1})t^{M+2}+\cdots+(S_{n-1}-S_{n-2})t^{n-1}+(S_{n}-S_{n-1})t^n$$ $$=S_{M+1}(t^{M+1}-t^{M+2})+S_{M+2}(t^{M+2}-t^{M+3})+\cdots+S_{n-1}(t^{n-1}-t^n)+S_nt^n$$ |t|<1(すなわち|x|<|ρ|)の時はtk+1-tk>0であり、
削除: かつn>M>NであればSに関して上記(*)式が成立するので次の不等式が成立します。 $$\small{\left|\sum_{k=M+1}^nb_kx^k\right|≦|S_{M+1}|(t^{M+1}-t^{M+2})+|S_{M+2}|(t^{M+2}-t^{M+3})+\cdots+|S_{n-1}|(t^{n-1}-t^n)+|S_n|t^n}$$ $$<2\epsilon(t^{M+1}-t^{M+2})+2\epsilon(t^{M+2}-t^{M+3})+2\epsilon(t^{M+3}-t^{M+4})+\cdots$$ $$+2\epsilon(t^{n-2}-t^{n-1})+2\epsilon(t^{n-1}-t^n)+2\epsilon t^n$$ $$=2\epsilon t^{M+1}<2\epsilon$$ 【以上の不等式の組み立て方は級数変化法と呼ばれ、より一般的な形の命題が存在します。】
$$|x|<|\rho|である任意のxに対して、任意の2\epsilon>0を考えた時に$$ $$n>M(>N)であれば\left|\sum_{k=M+1}^nb_kx^k\right|=\left|\sum_{k=0}^nb_kx^k-\sum_{k=0}^Mb_kx^k\right|<2\epsilon$$ $$\left|\sum_{k=M+1}^nb_kx^k\right|=\left|\sum_{k=M+1}^na_kx^k\right|であるから【初項a_0,b_0がないので】、$$ $$n>M>Nであれば\left|\sum_{k=M+1}^na_kx^k\right|=\left|\sum_{k=0}^na_kx^k-\sum_{k=0}^Ma_kx^k\right|<2\epsilonでもある。\cdots(**)$$ 今、整級数を関数列{f}として見た時に、集合Fを{fn, fn+1, fn+2, ・・・}として考えて、
Fに対する上限と下限B=supFおよびA=infFを考えます。
各xに対してn>Nの時、
任意のδ>0に対してB-δ<fとなる自然数p>Nがあり【上限の定義から】、
2ε=ε>0に対して別の自然数q>Nを考えて上記(**)式でn=p,M=qとすると
|f-f|<εであり、-ε<f-f<ε
もしp<qならn=q,M=pとして考えて、成立する不等式は結果的に同じになります。
すると、B-δ<f<ε+fとなり、B-f<ε+δ
1つのqとεに対してδは0より大きい範囲で任意であるので、
B-f<εは成立し、B-f=εもあり得るけれども
B-f>εは成立しないので
B-f≦ε・・・(***)
下限については任意のδA>0に対してA+δA>fとなる自然数j>Nがあり【定義から】、
先ほどの(***)式はq=jの時でも成立し、B-f≦ε⇔f≧B-εとなるので
+δA>f≧B-εであり、
+δA>B-ε⇔B-A<δA+ε
δAは0より大きい範囲で任意なのでB-A≦ε
これはn→∞とした時にB→Aを意味して、閉区間 [B,A] は1つの点{c}に収束します。
さらに、n>Nの範囲でB≧c≧Aであるから、この時に任意のn>Nに対して|f-c|≦ε
(この範囲内でB=Aでなければ|f-c|<ε
よってcは整級数fの極限値でもあり、各xに対してc=L(x)であり、
n>Nであれば|x|<|ρ|の範囲内の任意のxについて一律に|f-L(x)|≦ε=2εとなります。
またx=ρの時はn>Nでε未満になるので、2ε以下という不等式も満たします。
【この事は整級数が|x|<|ρ|およびx=ρにおいて一様収束する事を表しています。
また、(**)式を示した後の証明はコーシー列に関する考察の一部です。整級数に限らず一般の数列に対して成立する事も含んでいます。】
次にx=ρでの連続性を見るためにx→ρの極限を連続性の定義の式から考えると、
三角不等式の考え方を利用して $$\small{\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^\infty a_k\rho^k \right|≦\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^na_kx^k \right|+\left|\sum_{k=0}^n a_kx^k-\sum_{k=0}^na_k\rho^k \right|+\left|\sum_{k=0}^n a_k\rho^k-\sum_{k=0}^\infty a_k\rho^k \right|}$$ 右辺の絶対値記号内の3項はnの値やxの範囲により、それぞれがε未満か2ε以下になります。
【特にnについて考える時に、上記で示したようにxの値に関わらずn>Nであれば一律に不等式が成立する事が重要です。】
①右辺第1項について、整級数の一様収束性よりn>Nの時。(Nの値はxに依存しない。)
②右辺第2項について、有限の次数の多項式はx=ρで連続なので、x=ρを含む十分小さな開区間U内の任意のxに対して。【この項はx→ρの極限で、nの値は任意で成立。】
③右辺第3項について、x=ρにおいても整級数は収束するのでn>Nの時。
そこで、nが①と③を満たすように十分大きく、
xが②を満たす開区間U内の範囲にあり、かつ|x|<|ρ|であれば $$\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^\infty a_k\rho^k \right|<2\epsilon+\epsilon+\epsilon=4\epsilon$$ $$\epsilonおよび4\epsilonは任意の小さな実数であるので、xの関数\sum_{k=0}^\infty a_kx^kはx=\rhoで左側連続。$$ ここでは(-ρ,ρ)の区間内でx=ρにおいて左側連続である事が示されています。もしマイナス側のx=-ρでも整級数が収束するなら、同様にx=-ρで右側連続である事を示せます。
【以上の証明は、いくつかの命題や補題に分けて説明される事もあります。】

光の二重スリット干渉実験【ヤングの実験】

ヤングによる実験をもとにしている二重スリットを使った光の干渉実験は光の波動性を確認できるとともに、可視光の波長の概算的な測定ができる実験です。
また、光の干渉を利用した種々の干渉計のもとになっているという意味での重要性も持ちます。
数式的には三角比も含めた平面幾何的な考察によって、光の異なる2つの経路の長さの差(光路差)を計算する事により波長を含んだ関係式を導出できます。

この実験では光のコヒーレンス可干渉性)の考え方も、重要な要素の1つとなっています。

模式図としては、分かりやすさのためにスリットの並びとスクリーン上の干渉縞が画面や紙面に対して縦方向に現れるように書かれる事が多くこの記事でもそうしていますが、実際の実験ではその方向が地面に対して平行であるようにする事がどちらかというと多いと思われます。

この記事では古典論での光の波動性を示す干渉実験について説明しています。
量子力学的な意味での二重スリット干渉実験もありますが、そちらでは粒子(とみなせる塊)を1つずつ、ある程度の時間の間隔をあけて二重スリットに向けて打ち出すという手法がとられます。ただしスリットのどちらかを狙い打ちするように打ち出すのではなく、スリットを通過する際に「どちらのスリットを通過したか不確定である」ようにします。そこがヤングによる干渉実験と異なる部分となります。量子力学的な二重スリット干渉実験は20世紀後半以降、電子や光子、一部の分子(比較的分子量が大きいものも含む)などについて行われています。

人の目に見える領域の光である「可視光線」の波長は実は非常に短く、
「ナノメートル」や「マイクロメートル」の単位のスケールでの長さとなります。
単位についてのメートルとの関係は次の通りです。
【nm】・・・「ナノメートル」 1【nm】=10-9【m】
【μm】・・・「マイクロメートル」 1【μm】=10-6【m】
【mm】・・・「ミリメートル」 1【μm】=10-3【m】
「センチメートル」【cm】は10-2【m】(百分の1メートル)になります。

■関連サイト内記事:

スリットとは【実験の概要】

スリット(slit)は物理の実験用に使われる板などに開けた非常に細い隙間の穴の事であり、
二重スリットあるいはダブルスリット(double slit, double-slit )は非常に近い間隔でスリットが2つある構造を指します。

slit とは英語において通常の語としても使われており、
「(刃物等による)切れ目」とか「切れ目を入れる」という意味で使われます。
「スリット」という言葉は実は現代日本語でも使われる時があり、パンや服、その他の色々なものに施された切れ目や溝、細い穴を指してスリットと言う事があります。

光の干渉(「かんしょう」)を調べる実験では、二重スリットにおけるそれぞれのスリットから光を出してスクリーン上に当てて波が強め合う位置(明るくなる)と弱め合う位置(光がなく暗く見える)が現れる事を見ます。それが縞模様のように見える事が多いので明暗のパターンの模様を干渉縞(「かんしょうじま」)と呼ぶ事もあります。
また、ある位置で2つ以上の光の重ね合わせの事を干渉光と呼ぶ事があります。

干渉は波動一般に対して起こる現象です。
ある位置で2つ以上の波の波形がぴったりと重なっていると合計として1つの大きな振幅の波となって強め合い、逆に波の最大値(プラスの値)と最小値(マイナスの値)が重なってしまうと波がつぶれて振幅が任意の時刻で0になってしまい弱め合います。
ここでは2つの光線の干渉を考えますが、3つ以上の光線の干渉を考える事もできます。

光には結論から言うと波動性がありますが、もし波動性が無くて「粒子(の集まり)としてだけ」振る舞うとしたらそのような縞模様ができる必然性がないので、干渉縞が現れる事が波動性を持つ事の根拠であるとして物理学的には解釈されているわけです。

実験用に使う二重スリットには色々なものがあり得ますが例としては、
1つのスリット自体の幅は0.1【mm】程度(光が回折するのに必要なおおよその細さ)、
2つのスリット間の距離は0.1~1.0【mm】程度のものがあります。
(スリットが開けられているスリット板の大きさは、例えば横10cm,縦5cm程度など。)

水面の波が平面波として進行しているような場合は位相が揃っている波が隙間に入ります。
基本的に、光の干渉を調べる時にも同じ状況を作る必要があります。
スリットから出た波が広い範囲に広がっていくようにするには波の回折の現象を利用します。
可視光線の干渉の場合、波が強め合う位置は明るい点や線となって見えて、波が弱め合う位置は明るさが無く暗く見えます。

1つ1つのスリットからは1方向だけに光線が出るのではなく、非常に広い範囲にたくさんの光線が広がって行く形になります。これは波の回折現象を利用しており、波動性がなければ干渉同様に発生しない現象でもあります。

そのためにスクリーン上の各点では2つのスリットから出た光線のあらゆる重ね合わせが連続的に映し出される事になり、その中で特に光が同位相で強め合う部分と、半波長だけずれて弱め合う部分が目立って見えて干渉縞が形成されるわけです。

光は非常に細いスリットを通過する事ができます。
ただし、二重スリットの実験においてはスリットは意図的に細いものを使います。それはスリットにおいて波の回折を起こさせるためです。
回折とは波が小さい隙間に入り込み、そこから出る時に同心円か同心球状に大きく広がっていく現象です。イメージとしては水面に何か物が落ちた時に波紋が広がっていくような事が波が隙間から出る時に起きる事を指します。しかし回折はどんな波に対してどのような隙間に対しても起こるわけではなくて、基本的には波の波長が短いほど短い隙間が必要になります。
そして結論から言うと可視光線(色として人に見える領域の光)の波長はおおよそ
400【nm】~700【nm】の範囲であり、標準的な音波と比較しても非常に短い波長です。
光の干渉に使うスリットに「細さ」が求められるのはそのためであり、基本的に可視光線のて回折を起こさせるためには0.1ミリメートル程度かそれ以下の細さのスリットを使う必要があると言われます。

模式図としては、分かりやすさのためにスリットの並びとスクリーン上の干渉縞が画面や紙面に対して縦方向に現れるように書かれる事が多くこの記事でもそうしていますが、実際の実験ではその方向が地面に対して平行であるようにする事も多いです。
光源としては広がりが十分狭い「点光源」とみなせるものを使う必要があります。
単色光に近い光の干渉縞の明線の間隔はほぼ一定値です。
ただし、スクリーンの原点部分から離れるにつれて光の強度は小さくなっていくので明線の明るさも少しずつ減っていきます。

波動が正弦波であるとすると、干渉の効果を式で表す事もできます。
2つの光路の大きさをそれぞれRとRとすると2つの波はそれぞれ y=Asin(kR-ωt),y=Asin(kR-ωt)で表され、それらの波の重ね合わせは三角関数の和積の公式または加法定理により次式で計算できます$$A\sin(kR_1-\omega t)+A\sin(kR_2-\omega t)$$ $$=2A\sin\left\{\frac{k(R_1+R_2)}{2}-\omega t\right\}\cos\frac{k(R_1-R_2)}{2}$$この式で余弦の部分は時間に依存しないのでRとRの値によって決まる「振幅」の一部だと見なせます。余弦の部分は時間に依存せず、光路差(の絶対値)| R-R|にのみ依存して干渉光が強め合ったり弱め合ったりする事を表します。

公式を使った後の余弦の部分は(A-B)/2の代わりに(B-A)/2を考えても余弦の値は同じになります。

光の波長と干渉縞に対して成立する関係式

スリット板の中央から垂直に線を引いて、
その線とスクリーンとの交点をここでは「スクリーン上の原点」と呼んでおきます。
スクリーンとスリット板は平行になるようにきちんと立てます。(片方だけ傾いていると結果がおかしくなります。)

光の干渉に関する二重スリットの実験の結果に使う数値は次の通りです。波長を除くと、使用する記号は他のものが使われる事もあります。

  • λ【m】光の波長(可視光ではおおよそ400【nm】~700【nm】の範囲)
  • L【m】スリット板中央からスクリーン原点までの距離(数十【cm】~3【m】の範囲等)
  • d【m】スリット板における2つのスリット間の距離(0.1~1.0【mm】程度)
  • y【m】スクリーン上における、原点部分からの距離。(スリット板に平行な方向。)
    (座標のようにプラスマイナスの値で考える事もあります。)
  • Δy【m】スクリーン上に現れる明線間の距離(数ミリメートル~数センチメートル程度)

その他に、整数nや奇数2n+1などを式中で使います。具体的な数値は色々な場合があり得ますが、光の波長の範囲を考えると特定の数値を極端に大きくしたり小さくし過ぎたりすると上手く測定ができない事につながります。
以下に示す関係式を使う時にはスリットとスクリーン間の距離Lは、yやdと比べて十分大きい値になっている必要がありますが、それについても、極端にLが大きすぎてもおかしくなります。

スリット間の距離については「d」の文字が使われる事が多いのでここでもそうしていますが、微分や微小量とは直接的に関係はありません。ただしそれなりに短い間隔ではあります。

光源としてはレーザー光線のように単色とみなせて位相が揃っている(コヒーレントである)ものを使うのが望ましく、
白色光を使う場合は小さい穴に通して点光源化し、色フィルタ等を置いて多くの波長の光を除外して単色に近くなるようにします。そこから回折により同じ位相の揃った単色に近い波が広がって進行し、二重スリットに至るようにします。

二重スリット実験での測定で光の波長を表す式

二重スリットによる光の干渉実験において、
上記の量と光の波長の関係式は次のように表されます。
■波長をL,d,Δyで表す式 $$\lambda = \frac{(\Delta y)d}{L}【波長を表す式】$$ $$\Leftrightarrow \Delta y=\frac{\lambda L}{d}【明線の間隔を表す式】$$ ■光路差が波長の整数倍になる事および明線の位置を表す式
(nは整数。n=0の時はスクリーン中央、n=1の時はΔyを使った式と同じです。) $$n\lambda=\frac{yd}{L}$$ $$\Leftrightarrow y=\frac{n\lambda L}{d}$$ ■y/L=tanθ を使った場合の表記
(θが小さい値の時に成立。)
$$n\lambda=d\tan\theta≒d\sin\theta≒d\theta$$

波が弱め合う条件を考える場合にはmを「奇数」としてmλ/2を考えて
yd/L≒mλ/2とするか、
あるいは「波長の整数倍に半波長が加わっている」と考えて
yd/L≒(n+1/2)λのようにします。
奇数mをm=2n+1と書けば
mλ/2=(n+1/2)λとなるので、上記2式は同じものです。

可視光の波長のおおよその範囲が
400【nm】~700【nm】=4×10-7【m】~4×10-7【m】なので、
上記の関係式Δy=λL/dから判断すると
Lやdの値によってはΔyの値が小さくなり過ぎて
「干渉縞がつぶれてしまって測定できない」という事もあり得る事が分かります。

仮にd=0.10【mm】=1.0×10-4【m】でL=1.0【m】であるとします。
この時にλ=500【nm】=5.0×10-7【m】の光を光源に使うとすると
Δy=λL/d=5.0×10-3【m】=5.0【mm】となり、
おそらく目視で干渉縞を確認できるだろうという計算になります。
(n=1~4くらいまではL がyに対して十分大きいという前提条件も確認できます。)

可視光の波長はいわゆる「色」(普通の赤、青、紫などの色)で特徴づけられます。白色に関しては色々な波長の光が混ざったものです。
(黄寄りの赤・紫寄りの青・緑の光を混ぜると大体白色になるとされます。)
また「物体の色」に関しては白色光等から特定の波長の光が吸収されて、
残りが反射される事で「補色」が見えているというのが一般的に言われる事です。

おおよその波長
特に光では幅がある
備考
紫色の光約400
~450【nm】付近
約380【nm】を下回ると紫外光
(基本的に人の目では見えない)
青色
水色の光
約450
~500【nm】付近
紫色・緑色との境界は曖昧
緑色の光約500
~550【nm】付近
水色・黄色との境界は曖昧
黄色
橙色の光
約550
~600【nm】付近
緑色・赤色との境界は曖昧
赤色の光約600
~700【nm】付近
約780【nm】を超えると赤外光
(基本的に人の目では見えない)
音波約1.715【m】空気中,20【℃】200【Hz】で
音速約343【m/s】の場合
空気中の音波に比べると可視光の波長は非常に短いという観測結果が得られています。
ただし光でも目に見えない領域では種類によっては波長が長く、
例えばラジオ波と呼ばれる領域だと波長が1【m】を超える事もあります。
逆に紫外線やX線の領域だと波長は可視光よりもさらに短くなります。

可視光のそれぞれの「色」にも幅があるわけで、例えば「紫色」は大体400【nm】付近の色と言う事はできても「ぴたりと397ナノメートルの色」のようにはなかなか言えません。しかし物理的には同じ紫色でも具体的な測定対象の光に対して「どのような紫色なのか」を波長によって定量的に表す事ができて(それに意味があるのか、活用の仕方は何かという事はまた別の議論として)、その測定方法の1つとして二重スリットによる干渉実験があるわけです。

関係式の導出(図形的考察)

スクリーン上の原点からy【m】の位置に向かう2つのスリットからの光線に着目して、
「1つの光線に対するスリットからスクリーン上の点までの距離(光路の長さ)」の差
である光路差を図から計算する事を考えます。
この計算はいくつかやり方があって、ここではそのうちの2つを説明します。

図の見た目は一見単純なのですが意外と結構くせもので、
スリット板~スクリーン間の距離Lがyやスリット間距離dに対して十分大きい」という条件から近似(角度や平行関係含む)を行わないと関係式の導出がうまくできないので注意が必要です。

三角比を使う場合

三角比を使う場合は式の構造は単純ですが、図において厳密に成立する関係と近似によってほぼ成立すると見てよいものを区別する必要がある事に注意が必要です。

まず厳密に成立する関係を見るために図の下側のスリットからの光線に注目して、
「スクリーン上の原点とスリット板中央を結ぶ直線」とのなす角をθとします。
(あるいはスリット板に垂直な任意の直線とのなす角と考えても同じです。)

ここではθθという2つの角度を考えて、それらが近似的にほぼ等しいとみなせるという形で関係式を導出しますが、最初から2つを同一視して話が進められる事も多いです。得られる結果は同じです。

次に図の下側のスリットからの光線に対して、上側のスリットから垂線を引きます
その垂線とスリット板とのなす角はθに等しくなります

ここでLが十分大きいとして近似を行います。まず、2つの光線は平行ではありませんが
「ほぼ平行」と考えて光路差はdsinθであると考えます

さらに2つの光線は平行とみなせるほどになす角が小さいとします
すると、スリット板中央から「スクリーン上の原点よりyの距離の位置」に対して引いた直線も2つの光線とほぼ平行と見なせます。

今、θを tanθ=y/Lを満たす角度とすると、上記の近似によりθ≒θとできるので、
光路差はdsinθdsinθと書く事ができます。θの値が小さい時にはさらにsinθ≒tanθの近似式も成立するのでdsinθ≒dtanθ=yd/Lの関係が近似的に成立します。
【cosθ≒0のもとでtanθ=(sinθ)/(cosθ)≒sinθ】

そこで、スクリーン上で波が強め合う条件としては光路差が「波長の整数倍」になっている事を考えればよいので、nを整数として次の関係式を導出できる事になります。

  • dsinθ≒nλ
  • dtanθ=yd/L≒nλ
  • y≒nλL/dにより、Δy=λL/d
    【Δy=(n+1)λL/d-nλL/d=λL/d】
    【単純にn=1の時を考えてΔy=λL/dとしても同じです。】
  • λ=Δyd/L

以上の方法は、近似を認めるなら非常にシンプルで分かりやすいとも言えますが、肝心の近似が本当に成立するのかが図だけからは分かりにくい(図では説明の都合上、拡大して描かれる事が多いので)という事も同時に言えるかもしれません。

上記の近似を本当にしてもよいのかという事に関する考察は平面幾何的に考える事も可能ですが、次に見て行く光路差の別の導出方法から計算される結果の一部を使って後述する事にします。

この図では2つの角度を分けて記していて、両者はスリット~スクリーン間の距離が十分大きい条件下で近似的には「ほぼ同じ」とみなせます。他方で、その近似を最初から行うと考える場合もあり、図でも2つの角度を同一視して説明がなされる事があります。

また、この時に sinθ≒θである事もよく強調されます。(θは弧度法での角度とします。)
これはマクローリン展開からsinθ=θ-θ/(3!)+θ/(5!)-・・・
と書けるので、θが0に近い値の時にはベキ乗の項は全て0に近似できるとするものです。
例えばθ=0.01であればθ/(3!)=0.000000166・・・となるので、
θ=0.01に対して「ほぼ無視できる
測定の結果にほぼ無影響と考えてよい)とするわけです。
あるいは、θ=0における正弦関数の微分係数は1であるので、θが0に近ければ
近似1次式として1・θ=θがsinθに非常に近い値になると考える事もできます。
また余弦に関してはcosθ=1-θ/(2!)+θ/(4!)-・・・が成立します。
ここで先ほどと同じように例えばθ=0.01の時には
cosθ≒1-0.000025+・・・≒0999975なので、
tanθ=(sinθ)/(cosθ) の関係から
θが小さい時のtanθ≒sinθの近似式も成立しているとみてよい事が分かります。

一般二項定理で平方根を展開する方法

光路差を計算方法としては、平方根を展開して直接計算するというものもあります。

まず近似のない状況下で三平方の定理によって2つの光路の大きさを計算しておきます。それは平方根を使って書けるわけです。

次に少し式を変形してから、
(1+P)1/2の形の式に対する一般二項定理による展開を使って光路の大きさを表す式を変形します。(マクローリン展開と考えても同じです。)

近似を使うのはそこからで、yやdに対してLが十分大きいという条件から展開式の第3項以降は0に近い数値であるとみなす事で、式が簡単になります。

それから光路差を丁寧に直接計算(単純な引き算)すると、光路差がほぼyd/L(≒tanθ)に等しいという事を導出できます。波が強め合う条件から波長を含んだ関係式を作るのは三角比を使った導出の時と同じになります。

具体的な計算は次のようになります。
2式の違いは、y-d/2を考えるかy+d/2を考えるかの所だけです。

図の上側のスリットからの光路の長さ\(\sqrt{L^2+\left(y-\frac{\Large d}{\Large 2}\right)^2}=L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y-\frac{\Large d}{\Large 2}\right)^2}\)
図の下側のスリットからの光路の長さ\(\sqrt{L^2+\left(y+\frac{\Large d}{\Large 2}\right)^2}=L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y+\frac{\Large d}{\Large 2}\right)^2}\)

これらを一般二項定理で展開します。(1/L) (y-d/2)=y/L-d/(2L)が0に近い値である条件のもとで 3項目以降はほぼ0と考えて、2項目まで残したものに近似すると次のようになります。

図の上側のスリットからの光路の長さ\(L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y-\frac{\Large d}{\Large 2}\right)^2}≒L+\frac{\Large 1}{\Large 2L} \left(y-\frac{\Large d}{\Large 2}\right)^2\)
図の下側のスリットからの光路の長さ\(L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y+\frac{\Large d}{\Large 2}\right)^2}≒L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2\)

光路差はマイナスの値になっても別に構わないのですが、分かりやすさのために下側の光路の長さから上側の光路の大きさを引く事で光路差を計算すると次のようになります。光路差が波長の整数倍であるとおけば光が強め合う位置での関係式が導出されます。

光路差
の近似式
\(\left\{L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2\right\}-\left\{L+\frac{\Large 1}{\Large 2L} \left(y-\frac{\Large d}{\Large 2}\right)^2\right\}\)
\(=\frac{\Large 1}{\Large 2L}\left(2\cdot\frac{\Large yd}{\Large 2}\right)-\frac{\Large 1}{\Large 2L}\left(2\cdot\frac{\Large -yd}{\Large 2}\right)=\frac{\Large yd}{\Large L}\)
波が強め合う
条件
\(\frac{\Large yd}{\Large L}=n\lambda\), \(\frac{\Large \Delta y d}{\Large L}=\lambda\)【三角比を使って導出した時と同じ】

この導出方法だと、途中計算が少し複雑に思える部分もあるかもしれませんが、yやdに比べてLが十分大きい時にどの項を0に近似しているかが比較的明確になるとも言えます。

計算でたくさん「2」が出てきてややこしいですが、丁寧に計算すると光路差について三角比を使った時と同じ近似式を導出できます。
一般二項定理とここでの使い方

(x+y)aに対する二項展開は指数が任意の実数値でも自然数の時と同じ形の式として書く事ができて次式のようになります。(一般的には無限級数です。)
■一般の式
【厳密には、a が自然数でない時には式が収束する事が保証されるのは(1+P)a の形で|P|<1の時なので、一般の場合には式変形をしてその形にする事が必要。】 $$(p+q)^a=p^a+ap^{a-1}q+\frac{a(a-1)}{2!}p^{a-2}q^2+\frac{a(a-1)(a-2)}{3!}p^{a-3}q^3+\cdots$$ ■上式で a =1/2とした場合は平方根の展開式の1つ $$\sqrt{p+q}=(p+q)^\frac{\large 1}{\large 2}$$ $$=p^{\frac{\large 1}{\large 2}}+\frac{1}{ 2}p^{-\frac{\large 1}{\large 2}}q+\frac{\frac{\large 1}{\large 2}\cdot\left(-\frac{\large 1}{\large 2}\right)}{2!}p^{-\frac{\large 3}{\large 2}}q^2+\frac{\frac{\large 1}{\large 2}\cdot\left(-\frac{\large 1}{\large 2}\right)\cdot\left(-\frac{\large 3}{\large 2}\right)}{3!}p^{-\frac{\large 5}{\large 2}}q^3-\cdots$$ $$=p^{\frac{\large 1}{\large 2}}+\frac{1}{ 2}p^{-\frac{\large 1}{\large 2}}q-\frac{1}{8}p^{-\frac{\large 3}{\large 2}}q^2+\frac{1}{16}p^{\frac{\large 5}{\large 2}}q^3-\cdots$$ ■特にp=1かつa =1/2の場合の式は次式です。 $$\sqrt{1+q}=(1+q)^\frac{\large 1}{\large 2}$$ $$=1+\frac{1}{ 2}q-\frac{1}{8}q^2+\frac{1}{16}q^3+\cdots$$ ■さらに、qが0に近い値なら次式に近似できます。 $$\sqrt{1+q}=(1+q)^\frac{\large 1}{\large 2}≒1+\frac{1}{ 2}q$$

■さらにq=\(\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)とした時
\(\sqrt{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2} =\left\{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2 \right\}^{\frac{\large 1}{\large 2}} \)
\(=1 +\frac{\Large 1}{\Large 2L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2- \frac{\Large 1}{\Large 8}\frac{\Large 1}{\Large L^4}\left(y\pm\frac{\Large d}{\Large 2}\right)^4 +\cdots【ここで3項目以降は0に近似可能】\)
\(≒1 +\frac{\Large 1}{\Large 2L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)
よって、\(L\sqrt{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2} ≒L+\frac{\Large 1}{\Large 2L}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)

上記では平方根を展開して第2項まで近似した状態で関係式を導出しましたが、
第2項もじゅうぶん0に近いとして近似すれば
斜辺の長さを底辺とほぼ同じ L として考える事もできます。
そこまで近似するとやり過ぎ感もあるかもしれませんが、実際のところは
それが「θが小さい値の時に tanθ≒sinθ」とする近似に他なりません。
【三角比の定義から考えてみてもb/a≒b/cつまり a≒cという近似です。】
上記の計算からは、考えている諸量(L,dなど)がどのような値の時にその近似をしてよいかがより具体的に分かるとも言えます。
斜辺を底辺とほぼ同じとみなす近似のもとで
前述の三角比による計算でのsinθを数式で書いてみると、$$\sin\theta_0 =\frac{y+\frac{\Large d}{\Large 2}}{L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2}≒\frac{y+\frac{\Large d}{\Large 2}}{\large L}$$ところで sinθ≒tanθ=y/Lですから、sinθ≒sinθ≒tanθ=y/Lの近似が成立するには
「yに対してd/2がじゅうぶん小さい時」
つまりy+d/2≒yと見なせる時
であると言えます。
実の所それは図で見てもそうであるわけですが、数式的に考えるのであれば例えばこのような方法もあるという事になります。
例えばd=1.0×10-4【m】,L=1.0【m】,λ=5.0×10-7【m】であれば、
三角比を使わない方法でもΔy≒λL/dの関係式は導出できた事にも注意して
Δy≒λL/d=5.0×10-3【m】なので
「n=1の時のy」(=Δy) とd/2は100倍の大きさの違いという事になります。
これもまた図形的にも見る事ができますが、n=2,3の時には
yの値は2倍,3倍になるのでyとd/2の倍率の違いはさらに大きくなる事が分かります。
以上の計算は考察の方法の1つであり、考え方は他にもあります。

干渉光の強度の式

干渉縞の明線の間隔Δyは一定値となりますが、yが大きくなると光の重ね合わせの「強度」は小さくなっていきます。それに対応する形で、明線の明るさはスクリーン中央で最大であり、中央から離れていく(yおよびnが大きくなっていく)ほどわずかに薄く弱い輝きになっていきます。

光を正弦波で表せると仮定した時、光の強度定量的に表すと次のようになります。

波が正弦波である時の干渉光の強度

正弦波の「強度」は定量的には「波の振幅の2乗」として定義されます。
【振幅の2乗に比例する量として考える事もありますがここではその比例係数を1とします。】
重ね合わさる前のもとの光の振幅がともに A【m】で、
強度もともに等しくA2=I0であるとすると
スクリーン上での2つの光の重ね合わせ(「干渉光」)の強度は次式で表されます。 $$I=4I_0\cos^2\left(\frac{\pi yd}{\lambda L}\right)$$ $$=4A^2\cos^2\left(\frac{\pi yd}{\lambda L}\right)$$yが増えて行くと余弦の値が小さくなり、強度も小さくなるという計算になります。 この式の余弦の中身は実験で使っている諸量に由来しますが、「余弦自体」は二重スリット実験における図形的な位置関係に由来するものではない事に少し注意が必要です。つまり、二重スリット干渉実験で波長を表す近似式で使っている三角比とは別物です。
強いて表すなら、近似式で使った三角比は強度を表す式の「余弦の中身」に入ります。 $$I=4I_0\cos^2\left(\frac{\pi yd}{\lambda L}\right)≒4I_0\cos^2\left(\frac{\pi d\sin\theta}{\lambda }\right)≒4I_0\cos^2\left(\frac{\pi d\tan\theta}{\lambda }\right)$$

光の波が正弦波であると仮定した時の干渉光の強度に関する式は、この記事内でも少し触れた加法定理による重ね合わせの式から導出できます。すなわち、正弦と余弦の積になった形の式において時間変動を含まない部分を余弦も含めて振幅とみなして2乗する事で上式が導出されます。整理してまとめると次のようになります。

スクリーン上の1つの点で
正弦波で表された2つの光
Asin(kR1-ωt)
Asin(kR2-ωt)
重ね合わせて加法定理
により得る干渉光の式
\(2A\sin\left\{\frac{\Large k(R_1+R_2)}{\Large 2}-\omega t\right\}\cos\frac{\Large k(R_1-R_2)}{\Large 2}\)
光路差を表す式\(R_1-R_2≒d\tan\theta=\frac{\Large y d}{\Large L}\)
波数の定義\(k=\frac{\Large 2\pi}{\Large \lambda}\)
干渉光の振幅
(時間変動を含まない部分)
\(2A\cos\frac{\Large k(R_1-R_2)}{\Large 2}=2A\cos\left(\frac{\Large \pi yd}{\Large \lambda L}\right)\)
干渉光の強度
(振幅の2乗)
\(4A^2\cos^2\left(\frac{\Large \pi yd}{\Large \lambda L}\right)=4I_0\cos^2\left(\frac{\Large \pi yd}{\Large \lambda L}\right)\)
この干渉光の強度についての式の導出においては、数式的には
波長λは波数の定義から式に入っている事になります。

同じように正弦波で表せる仮定のもと、波動を敢えて複素数で表す場合でも(指数関数表示・極形式による表示では三角関数を含む形になるので)同じ式を導出できます。
その場合には強度は複素数で表した波の絶対値の2乗として定義し、
波を重ね合わせた時の強度は形式的に余弦定理を使った形の式で表されます。
その式において2つの波の振幅は同じであるとして加法定理、半角の公式、倍角の公式のいずれかを適用する事で上記と同じ形の式が得られます。

光源に要求されるコヒーレンス(可干渉性)

ところで、光の二重スリット干渉実験では光源として使用する光の種類についての考察も重要な実験の要素の1つと言えます。

波の干渉を調べる場合、2つ以上の波が強め合うかつぶれて弱め合うかを解析して計算をするにはどこか最初の位置で「位相を同じ値にしておく」という制御が必要です。

その事は、二重スリットの部分においては波の回折を起こさせる事で実現しています。つまり元々位相がそろった波面の波を2つのスリットに進入させる事によって、その2点から進む「同時刻で同位相の2つの光」の光路の長さと波形のずれの関係を適切に計算できるわけです。

他方で、二重スリットに入る光のもとになっている光源の光の種類にも実は注意する必要があります。光の二重スリット干渉実験の光源としては結論としてはレーザー光を使うのが最も好ましいわけですが、逆にそれ以外の光ではだめなのかという話にもなります。

太陽光やいわゆる「白色光」には実は多くの波長の光が混ざっています。
そのため、そのような光をそのまま光源に使って直接的に二重スリットに通しても干渉縞が発生しないか、干渉縞が観測できても上手く測定ができないという事があるのです。

光の干渉実験に白色光を使う場合には
①光源からの光を小さい穴に通して回折を起こさせて位相を揃えた波を作る
②色フィルタ等をおいて単色光に近い光にする
という工夫が必要になります。
もし①だけ行って②を行わない場合、虹のようなたくさんの色の干渉縞が現れます。そのような干渉縞は、測定があまりしやすくない事があります。

光の二重スリット干渉実験にもとになっているのはイギリスの人ヤングによる実験(19世紀初め頃)で、当時は光源として太陽光を使って光の干渉を確かめる実験が行われたと言われます(当時はレーザー光は利用不可能)。その時に干渉縞はしっかりと確認されて、光の波動性が確認された最初の実験であるとされます。また、残っている講演の資料等によるとヤングは光の干渉を上手く起こすためのコヒーレンシーの考え方(用語自体ではなく)についても当時から指摘していたとされます。

それに対してレーザー光は単色とみなせるほどに波長の幅が小さい光であり、また位相もそろっている光です。レーザー光のように波動(主に光)の位相が揃っている事を指して可干渉性あるいはコヒーレンスと呼び、そのような性質を持った光をコヒーレント光あるいはコヒーレントな光であると分類する事があります。太陽光や白色光は一般的にコヒーレンスを備えていません。

レーザー光線は基本的に人工的に形成される光ですが、光の干渉を調べる時に使う光源としては最適です。重要な特徴を整理すると次のようになります。

  • 単色性:非常に近い値の波長の光だけで構成され、ほぼ単色とみなせる。
  • 可干渉性(コヒーレンス):位相がほぼそろっている光で構成されており、精度の高い干渉縞を観測可能。単に「干渉性」と言ったり、コヒーレンシーと呼ぶ場合もあります。
  • 指向性(収束性):長距離を光があまり広がる事がなく進行し、非常に狭い範囲に光を集める(収束させる)事が可能。
  • 高出力性および高輝度性:時間あたりに放出するエネルギーが非常に大きい光(材料加工などに使用)であり得る。光の干渉実験で使うレーザー光は、出力としては弱いものを使用します。

詳しく見ると、コヒーレンス(coherence)には波の位相の波数および位置座標を含む項に由来する「空間的なコヒーレンス」と、角周波数および時間を含む項に由来する「時間的なコヒーレンス」があります。レーザー光は空間的にも時間的にもコヒーレントな光ですが、それが特定の物質を通過して拡散する事で、時間的なコヒーレンスだけを備えた光になるという事もあり得ます。
coherent という語は少し聞き慣れない語かもしれませんが一応普通に使われる語でもあり、密着しているとか結合しているといった意味合いが元々あって、転じて「話や議論の筋が通っている、理路整然としている」 といった意味などとして使われます。

微分の定義と接線

微分の定義とイメージを、図形的な意味と数式の両方の観点から説明します。

微分は積分の逆演算でもありますが、ここでは「関数のグラフの接線の傾き」という図形的な意味に特に着目して説明をします。

■サイト内関連記事:各種の微分に関する公式の証明等です。

微分のイメージと接線

接線の傾き

例えばy=sinxを微分すると、その計算結果の公式としてy’=cosxが得られますが、
実はこれは定義域内のy=sinxのグラフ上の任意の点における接線の傾きを表す関数です。
y’=cosxにx=0を代入すると計算結果は1ですがそれは
「x=0におけるy=sinxのグラフの接線の傾き」に一致するのです。

微分のイメージは「曲線の接線の傾き」であり、
実際にその計算による値は関数を表すグラフ上の特定の点での接線の傾きに一致します。
正弦関数以外の三角関数やy=xやy=x等の関数、あるいは円を式で表した関数も微分する事が可能で、各点での接線の傾きを計算する事ができます。

微分を表す記号は、後述するようにy’ f’(x) dy/dxなどです。
ただしそれらは関数として統一的に考えている接線の傾きであり、
x=0での具体的な接線の傾きを知りたい場合にはx=0の値を代入する必要があります。

正弦関数y=sinxにおいてx=π/2の部分をグラフ上で見ると、
その部分の接線はx軸に平行で「傾きは0」なのではないかと予想ができます。そして実際にそれは正しくて、微分演算により得るy’=cosxにx=π/2を代入するとy’=0であり、それがx=π/2におけるy=sinxの接線の傾きです。

他方で円を座標上に描いたような時には左右に2箇所、接線がy軸に平行になる部分が存在します。そのような時には接線の傾きは∞(無限大)であるとみなす事もできますが、微分によっては傾きを数値として表せないと考える事が多いです。

微分演算(計算)・導関数・微分係数の関係と使い分け

微分を式で考える場合には、
少しややこしいようですが「微分という演算(計算)」と、
演算の結果として得られる「関数」(各点での接線の傾きを表現)と、
それに変数の値を代入した「数値」(具体的な接線の傾き)があります。

接線の傾きを表す関数は数学的には導関数(「どうかんすう」)と呼ばれ、
導関数に具体的な値を代入して得る値(=具体的な接線の傾き)は微分係数と呼ばれます。
微分係数は「x=0における微分係数」とか「x=1における微分係数」といった形で表現されます。

y=sinxに対して微分演算を行う
導関数y’=cosxを公式として得る事になり、
導関数y’=cosxにx=0を代入した時の
cos0=1がx=0における微分係数です。

関数導関数x=0における
微分係数
x=1における
微分係数
x=πにおける
微分係数
y=sinxy’=cosxcos1-1
y=xy’=2x2π
y=xy’=3x3π

「微分」という語の使われ方

ところで導関数の事を指して単に「微分」と呼ぶ事もあります。
例えば「y=sinxの微分はy’=cosxであるから・・・」などといった具合です。
ただしこれは数学よりもむしろ日本語の用法上の問題であるとも考えられて、
「微分する」事を「・・の微分」と言っているとも見れます。いずれにしても「微分」という言葉の使い方は数学上においてもそれほど厳密ではなく、多少緩く扱ってもよい事になっているのが実情と思われます。実質的には「微分」という語は演算を指す事を基本としながらも、便宜的に「導関数」と同義の語としても使われています。

しかし「導関数は関数」であり「微分係数は定数」であるため、
「導関数」と「微分係数」の2つの語の使い分けは必要であり重要であるとも言えます。

ところで接線の傾きが分かれば「接線を表す直線の式」も関数として分かる事になります。
x=aにおける微分係数をf'(a)と書くとするとその点での接線の式は
f(x)-f(a)=(x-a)f'(a)であり、
本来「微分」とはむしろそのような接線の式を指して呼ぶという考え方もあります。
この考え方のもとでは、
接線の式の左辺をdyと書き右辺のx-a の部分をdxと書く事があります。
すると接線の式はdy=dxf’ (a)のようになります。
つまり接線の式を指して微分と呼ぶ考え方は、接点を原点とした新たな1次式(直線の式)においてxの変化分dxに対するyの変化分dyを指して「微分」と呼んでいるわけです。
(この場合、置き換えをしているだけなのでdyやdxは必ずしも微小量とは限りません。)
この考え方のもとでは「割り算としてのdy/dx」は微分係数f'(a)に等しい事になり、物理等では微小量においての考察でこれにかなり近い考え方が使われる事があります。
ただしその考え方のもとでも「dy/dx」という記号は1つの塊として導関数f'(x)を指し、「微分する」と言えば微分演算の事を指します。
微小なxとyの変化分の割り算を考えて、極限をとる事で微分演算とする考え方は微分の定義式の1つでもあります。しかし、記号としては割り算を行う時にdyやdxを使う事はなるべく避けられて、代わりにΔy(「デルタy」)やΔxの記号が使用される事が多いです。

微分の定義式

微分の定義式は、次のように極限の形式になっています。
この定義式を使う事により、各種の微分公式を導出する事ができます。

微分の定義式(3パターン)

■2点間の変化率(傾き)の極限値としての微分の定義
【次式の極限値が存在する時、それが f(x) の導関数。】 $$f^{\prime}(x)=\lim_{a \to x}\frac{f(x)-f(a)}{x-a}$$ ■x-a=hとおいた表記
【各種の微分の公式を導出する時にはこれが便利です。】 $$f^{\prime}(x)=\lim_{h \to 0}\frac{f(x+h)-f(x)}{h}$$ ■x-a =Δxと書いて,f(x)-f(a)=Δyと書いた時の表記
【文章中で表記を簡易的に済ませたい時に便利な事もあります。】 $$f^{\prime}(x)=\lim_{\Delta x \to 0}\frac{\Delta y}{\Delta x}$$ ΔxとΔyを「増分」と呼ぶ事もありますが、マイナスの値の時もあります
特にΔyは、xの増加に対して減少して行く関数では普通にマイナスの値を取り得ます。
また、ΔxとΔyという記号は「微小な変化量」の意味で使われる事も多いです。

また、微分係数は導関数が存在する場合にxに具体的な値を当てはめる事でも計算できますが、上記の定義式とほぼ同じ形を使って書く事も一応可能です。
例えば関数y=f(x)のx=xにおける微分係数は次の式で書く事もできます。

$$x=x_1における微分係数:f^{\prime}(x_1)==\lim_{a \to x_1}\frac{f(x_1)-f(a)}{x_1-a}$$

微分の定義式の極限を考える対象の式は、一般的にはxy平面での座標上の任意の2点を通る直線の傾きを表す式です。その片方の点を、もう片方に一致する寸前まで限りなく近づけて行く事で接線の傾きを算出するというのが微分演算のイメージです。この図では微分を考えている点に向けて左側から近づけて行く形ですが、右側から近付けて考える事もできます。(ただし、対象の関数によってはどちら側から近付けるかで接線の傾きの値が変わってしまい「微分不可能」の判定になる事もあります。)

微分の定義式において、極限を考えている対象の式{f(x)-f(a)}/(x-a) を関数y=f(x)の「平均変化率」と呼ぶ事もあります。その観点からは微分は、平均変化率を限りなく短い区間で考えた極限値であると言う事もできます。

微分の表記方法

微分を表す記号は大きく分けて3種類が使われていて、
①関数を表す文字の右上に「 ’ 」の記号【プライムあるいはダッシュ】を付けるか、
微分演算子 \(\frac{\Large d}{\Large dx}\)(文章中での略記:d/dx)を関数に作用させるか、
③あるいは関数を表す文字の上に「・」【ドット】を付けるかで表します。

具体的にy=sinxやy=x+xといった関数や、より一般的にy=f(x)で表される関数に対する微分は次のような表記で書かれます。

微分の表記方法の例
関数表記の例(いずれも意味は同じ)備考
y=sinx\(y^{\prime}\) \((\sin x)^{\prime}\) \(\frac{\Large dy}{\Large dx}\) \(\frac{\Large d}{\Large dx}(\sin x)\) \(\dot{y}\)y’ 表記は「xによる微分」
である事が明確な時に使用。
+x\((x^2+x)^{\prime}\) \(\frac{\Large d}{\Large dx}(x^2+x)\)\((x^2)^{\prime}+x^{\prime}\)および
\(\frac{\large d}{\large dx}(x^2)+\frac{\large d}{\large dx}x\)に等しい
y=f(x)\(f^{\prime}(x)\) \(\frac{\Large df}{\Large dx}\) \(\frac{\Large df(x)}{\Large dx}\) \(\frac{\Large d}{\Large dx}f(x)\)f(x)に対するドット表記\(\dot{f}\)や\(\dot{f}(x)\)
は、あまり使われない。
微分演算子を使用する時の文章中の略記はdy/dxや(d/dx) (sinx)などです。

f’(x)は「fプライムx」「fダッシュx」のように読んだりします。
dy/dxなどの記号はそのまま「ディーワイディーエックス」などと読まれて、
\(\dot{y}\) は「ワイドット」のように読まれる事があります。
数学史的にはdy/dx型の表記はライプニッツが使っていたとされる表記で、
ドットによる表記はニュートンが使用していたというのが通説です。

導関数をy’ あるいはf’(x)で表す表記は「y=f(x)というxを変数とする関数があり、xで微分演算を行う」という事が明確である場合に便利な表記です。

微分演算子を使う表記では、変数がxではない場合には変数の部分の記号を変えて使用します。例えばtによる関数y=tを微分する時にはxではなくtで微分するのでdy/dt,d/dt(t)のように表記します。言い換えると、微分演算子による微分の表記は「何の変数で微分しているのか」を明確にできます。

ドットを使った表記は主に物理で使用されて、微分した後にさらに2乗するだとか、その他式が複雑になる時に表記上便利です。例えば導関数の2乗を使う式の場合、(dy/dx)といった表記を長い式の中で何度も繰り返すのは大変ですが、\(\dot{y}^2\) の表記なら比較的簡単に済む場合があります。

微分の表記としてドットを使う場合の使用例としては、サイト内記事で取り扱っている例としては少々複雑な計算ですが古典力学における運動方程式を極座標系の成分で書き直すための計算などがあります。その例では時間tを変数とした微分を考えています。

微分の四則演算

2つの関数f(x)とg(x)をそれぞれf,gと略記します。またcは定数であるとします。

定義式から、
f+g【関数の和】,f-g【関数の差】、cf【関数の定数倍】に対する微分は
それぞれ次のように計算できます。

  • (f+g) ‘=f’+g’
  • (f-g) ‘=f’-g’
  • (cf) ‘=cf’

あるいは、3式をまとめて
(cf±cg) ‘=cf’±cg’
のようにも表現できます。

これらの演算は、定義式に当てはめて丁寧に計算すると証明する事ができます。
(証明は比較的容易ですが、「自明」な事実では無い事に注意は必要です。)

具体的には、例えばx+x+1のような多項式の微分は
+x+1) ‘=(x) ‘+(x) ‘+(1) ‘=2x+1+0=2x+1
のように計算してよい事を意味します。
これは地味ですが微分を利用していくうえで非常に重要な公式であるとも言えます。

他方で、関数同士の積fgや商f/gに対する微分は少し妙な形の公式である
(fg) ‘=f’g+fg’ および (f/g) ‘=(f’g-fg’ )/(g)
が成立します。これら2式も微分の定義式から証明できます。

微分不可能な場合とは

微分の定義式を見ると極限の形になっています。その極限値が存在するなら導関数として扱えるという事であり、極限値が存在しない(収束しない)場合には導関数を表せません。
そのような時、関数は微分不可能であると言います。

また、極限の計算自体は一応できても導関数や微分係数が1つの形に定まらない場合も同様に微分不可能とみなす事が普通です。

逆に導関数が存在する時には微分可能である(もしくは可微分である)と言います。

定義域内のほとんどの点では微分可能であっても、ある特定の点でだけ微分不可能という場合もあります。そのような場合には「例えばx=0では微分不可能」といったようにその特定の点での微分係数を式で表現できない事を表します。

微分可能であるか微分不可能であるかどうかという事を指して微分可能性とも言います。用語としては「x=0における微分可能性を調べてみると、・・・」のように使います。

初等関数では定義域内のほとんどの点で微分可能であり、
一部の点が微分不可能になっている場合があります。

そもそも定義されていない点

関数y=1/xの「x=0の点」や、正接関数y=tanxの「x=π/2の点」のように、そもそも関数を定義できない点では図形的に接線を引く事もできず、数式的に微分をする事もできません。

それらの点に対して導関数の極限を考える事は可能ですが、反比例の関数や正接関数ではその極限も無限大に発散します。図形的には、そのような点に向かって接線は限りなくy軸に平行な直線に近付いていく事になります。

関数は定義できても導関数だと定義できなくなる領域

考えている点で関数が定義されていても微分できない点が存在する場合もあります。

そのような場合の1つは、もとの関数では定義が可能であっても導関数を計算すると不連続点が発生して微分係数が無限大に発散する場合です。図形的に見ると、大抵はその点での接線はx軸に垂直でy軸に平行になっています。つまり傾きで言うと「無限大」になっている状況です。

この状況を「微分係数が∞(無限大)である」と考える事はできなくは無いですが、基本的にはその時には微分の定義式で極限が収束せず無限大に発散するので微分係数は存在しないと考えます。

具体的には、円を座標上の関数として考えた場合や、xの平方根に対してそのような点が存在します。例えばxの平方根は、もとの関数ではx=0での関数値が存在します。しかし微分して得られる導関数はx=0で無限大になり定義できない事が分かります。

関数導関数微分可能性
\(y=\sqrt{x}\)
【定義域:x≧0】
\(y=\frac{\Large 1}{\Large 2\sqrt{x}}\)
【定義域:x>0】
x=0:微分不可能
x>0:微分可能
\(y=\sqrt{r^2-x^2}\)
【-r≦x≦r】
(原点が中心の半円)
\(y=-\frac{\Large x}{\Large \sqrt{r^2-x^2}}\)
【定義域:-r<x<r】
x=±r:微分不可能
-r<x<r:微分可能
円のほうの式の微分計算には合成関数の微分公式を使用しています。

同じ点で微分係数が2つの異なる値をとる場合

微分の定義式を計算すると極限値が有限の値として存在するけれども、詳しく見ると「値が2通り存在してしまい、1つの値に定まらない」という場合があります。このような場合にもその点では微分不可能であると考えるのが一般的です。

具体的にはy=|x|のような関数が該当します。
これはx≧0の時y=x,x<0の時y=-xという関数であり、
場合分けをして定義するような種類の関数です。
この関数は「x=0で微分不可能、その他の区間では微分可能」になります。

これは図形的に見れば直線を組み合わせた形をしているので微分の定義から計算をしなくても「接線」の傾きはそのまま直線の傾きになります。

そこでx=0での微分可能性を見てみると、「接線」は引く事ができてしかも有限の値であるけれども、傾きは+1と-1の両方があり得てしまう事が分かります。このような時には、x=0での微分係数は「値が1つに定まらない」という意味で微分不可能であると考える事が一般的なのです。

この事は、極限一般の観点から言うとh→0の極限は「hをプラスの値に保ったまま0に近付ける」時と「hをマイナスの値に保ったまま0に近付ける」時とで極限値が変わってしまう事がある場合に該当します。前者を右側極限と呼び、後者を左側極限と呼ぶ事もあります。

  • 右側極限:hをプラスの値に保ったまま0に近付ける。「h→+0」とも書く
  • 左側極限:hをマイナスの値に保ったまま0に近付ける。「h→-0」とも書く
  • y=|x| では、x=0における微分の計算で右側極限と左側極限の値が一致しない。

一般的に「微分可能である」という事は微分の定義式の極限において右側極限と左側極限の値が一致する場合のみ、という判定をします。y=|x|のような場合分けを含まない初等関数では、定義できない点がある場合は除外して考える限りにおいては、右側極限と左側極限の一致・不一致の問題は微分計算でそれほど気にする必要は無いと言えます。

y=|x| に対するx=0における微分については、右側極限と左側極限のそれぞれが無限大に発散するわけでは無い事を考慮して「右側微分可能」かつ「左側微分可能」であるけれども「微分は不可能」であると表現する事もあります。

波動の式と用語【正弦波】

波を表す具体的な形として最も基本的な「正弦波」は関数としては三角関数の正弦関数 sinθですが、波動を表す関数として考える時の変数としては位置座標と時間の両方を考えるのが普通です。

「振動」も波動に関連が特に深い物理現象であり、波動においても個々の位置では振動が起きているとみなせる事もあります。ただしここではバネの振動現象などは除いて、特に波動のほうに注目して見て行きます。

水面の波、あるいは数学では三角関数の sinθのグラフのイメージで上下方向の振動(グラフだとy方向)を特に「変位」と呼ぶ事あり、ここでもその言い方を使います。横に進んでいく方向(グラフだとx軸方向)を波が「進行」する方向と呼ぶ事にします。

物理的な「波」の種類

波動は基本的には何かの物質が個々の位置で時間変化により振動していて、その振動が周囲にも伝わっていく事を指します。その振動して波を構成する物質は媒質(「ばいしつ」)と呼ばれます。例えば海の潮の満ち引きの「波」の媒質は水であり、音の場合は基本的には媒質は空気で、水中やそれ以外の物質でも音は伝わるので色々な物質が媒質になり得ます。

他方で「媒質が無くても媒質による波と同じように振る舞うもの」は物理上、普通は「波」として扱われてそのようにも呼ばれる事が一般的です。例えば光(および電磁波)は、実は何かの媒質が直接的に振動しているわけでは無い事が知られています。
また同じく、一般的にミクロのスケールでの量子力学的な「波」は定量的には波動と同じように振る舞うという事を意味し、何かの媒質が直接的に振動しているわけではないという考え方がなされます。(光も、より詳しく見る場合には量子力学的に解析されます。)
他方で正弦波に近い形の電圧である交流電圧は、人工的に起電力をそのような形で発生させ続ける事によって波と同じ関数形として扱うという類のものです。
しかしいずれにしても、数式的に波の形として扱える物理量には、媒質の振動による波動の用語や考え方の多くを適用できます。特に光および電磁波に関しては普通に代表的な波動の現象の1つとして捉えられる事が一般的です。

実際に目で見える波の形や、物理量をグラフとして描いた時の形は波形と呼ばれます。
正弦波の波形はそのまま正弦関数のグラフの形ですが、波形は一般的には他の形状もあります。
例えばグラフ上で長方形状になる波形は
方形波あるいは矩形波【矩形:「くけい」長方形の事。矩とは直角の意味。】などと呼ばれます。
また、一般的に正弦波の波形が微妙に歪んでいたり台形状や三角形状の波形になっている波を総称してひずみ波と呼ぶ事もあり、矩形波等を含めてそのように呼ぶ事もあります。

数学的には、実は正弦波以外の波は周期関数でないものも含めて
「振動数が異なる複数の正弦波の合計(重ね合わせ)」として表現できます。
そのように解析した場合には波を構成する正弦波のうち振動数が最も小さいものを基本波と呼び、残りの物を高調波と呼ぶ事があります。

波動は進行方向に対する振動の向きの方向によっても分類され、一般的に横波と縦波の2つに大別されます。(ただし、数式的に「波として扱える」だけの場合はどちらにも含めない事もあります。)
正弦関数のグラフの形が実際の波の波形として観察できるようなものは「横波」のほうで、水面や弦を伝わる一般的なイメージの波や、光および電磁波は横波に相当します。
横波は、より詳しくは「各位置での振動が波の進行方向に対して垂直である波」を指します。

他方で、ばねを多数連結させた構造や、音波などは「縦波」です。これは、各位置での振動の向きが波の進行方向に対して平行(そして重なっている)である事を意味していて、媒質の密度が大きくなったり小さくなったりを繰り返すので「疎密波」とも呼ばれます。

数式的には縦波も横波と同様に扱う事ができます。
以下では、比較的イメージしやすい横波を想定して説明をしていきます。

また、まずは基本的な考え方となる「進行方向が1次元の波」を正弦波として扱います。(進行方向が1つの軸方向という意味で1次元であり、振動による「変位」も含めれば2次元です。)

波の進行が平面や空間で行われる場合には波の振動の変位が一定となっている波面を想定し、
波面が平面状である平面波や波面が球面状(球対象)である球面波をなどを考えます。
また、平面波において平面電磁波のように波(として扱える物理量)の変位の向きが平面の特定の方向であるものは偏波とも呼ばれます。(光の場合は特に「偏光」とも言います。)
偏波における波の振動の変位の方向が変化しないものは特に直線偏波と呼ばれ、
振動の変位の方向が平面内で変化する場合の偏波を回転偏波と呼ばれる事があります。
さらに細かく見ると回転偏波には特定の規則性を持った円偏波などがあります。

波を構成する物理量

規則的にうねる波を正弦関数で表す事を考える時に、
「波と言ってもどのような波なのか」を表す物理量として次のものがあります。
便宜上ここでは、1回転して元の状態に戻る事をさして「1サイクル」と表現しておきます。

  • 周期:何秒で正弦波が1サイクルするのか
  • 波長:波形で見た時に1サイクルが何メートルあるか(時刻は固定して見た時)
  • 振動数:1秒間で考えた時に何サイクルしているのか。周波数とも言います。
  • 速さ:波形が1秒当たり何メートル進行していくのか。(時間を進めながら位置も見る。)
  • 振幅:波の高さが0から最大値まで何メートルあるのか。

正弦関数 sinθの変数は「角度」です。しかし位置や時刻などの物理量は普通はπの倍数で表しませんから、それを補正して正弦関数に反映されるようにします。

  • 波数:考えている位置や距離が「波長の何倍か」を表す係数です。
  • 角周波数:「1秒当たり角度は何ラジアン進むのか」を表します。角振動数とも言います。回転運動等で使う「角速度」と数式的には同じです。
  • 位相:sinθのθの部分を合成関数になっている場合も含めて特に指す量。
    基本的に弧度法(2πを360°とする)で表します。「引数」と呼ばれる事もあります。
    位置座標や時刻は、波数や角周波数を乗じる事によって位相としての量に変換されます。
    「2つの波は位相がπずれている」などと言う場合には角度全体で言うと sinθとsin(θ+π)の関係である事を表します。普通は位相は0から2πまたは-2πから2πまでの値とします。

また、波のy座標方向の値をここでは「変位」と呼んでおきます。

これらに対して多く使われる記号や関係式を整理すると次のようになります。

波動を表す正弦波は A sin (kx―ωt) を基本形として表されます。【あるいはA sin (ωt―kx)】
A:振幅 k:波数 x:位置座標 ω:角周波数 t;時刻 kx―ωt:位相

波動を表す基本的な物理量
物理量記号関係式備考単位
周期TT=1/f=λ/vperiod, time period【s】秒
波長λλ=vT=v/fwave length【m】メートル
振動数ff=1/T=v/λfrequency 別名:周波数【Hz】ヘルツ
速さvv=λ/T=λfwave speed 波の進行の速さ【m/s】
振幅色々0からの最大値amplitude 【m】メートル
波数kk=2π/λwave number 1波長で2π【rad/m】
角周波数ωω=2πf=2π/T
ω=kv
angular frequency
別名:角振動数
【rad/s】
λ「ラムダ」 ω「オメガ」
単位については「ラジアン」の代わりに無単位とする事もあります。
v は速度(velocity) から。通常は速度ベクトルの大きさを「速さ」と呼びます。
振幅の記号は用途ごとに変えるのが普通です。(一般論ではAが多い。)
光に対しては振動数をν(ニュー)で表す事もあり、光の速さはcで表します。

波動を正弦波として考える時には基本的に角度を弧度法で扱います。すなわち円周率πの何倍であるかで正弦関数の変数を表して、2π で1サイクルして0の時と同じ関数の値に戻ると考えます。

物体の位置関係や傾き具合を三角比として表すような場合であれば、
物理現象を表す時でも「斜面に対して45°の傾きなので cos45°を乗じて・・」といった表現でも全く支障は無いと言えます。
しかし波動や振動においては周期関数としての三角関数を扱う必要がある事に加えて、
微分や積分を行う観点からも三角関数の位相部分を弧度法で扱っていく必要があります。
例えばy=A sin (kx―ωt)をxやωで偏微分すると
合成関数の微分(ここでは1変数の時と同じ)となるので
(∂y/∂x)=kA cos (kx―ωt)
(∂y/∂t)=-ωA cos (kx―ωt)
のような計算になりますが、
もし位相の部分を度数法で表していたら同じ計算にはなりません。
そのため物理学の中でも特に波動や振動を扱う時には、三角関数の角度は度数法ではなく弧度法で統一的に表す事が理論的にも重要であると言えるわけです。
合成関数に対する偏微分の一般式は、ここでは不要ですが項が1変数の時よりも増えます。

周期と振動数の関係

振動数の単位には普通【Hz】(「ヘルツ」)を使いますが、
これは無単位(正確には「1」)を秒で割った【/s】にも等しいものです。

周期と振動数の関係T=1/fについては、
例えば1秒間に50サイクルの振動を繰り返す場合には
1サイクルあたり0.02秒という事になり、
これは50【Hz】の振動数に対して
1/50=0.02【s】という計算をしているわけです。

T=1/fという事はTf=1が必ず成立する事を意味しますが、
Tは「1サイクルするのにT秒かかる」事を意味し、
fは「1秒間にfサイクルする」事を表すので
要するにTf=1は「T秒間で1サイクルする」という事を表します。
先ほどの具体例で言うと50【Hz】の振動数のもとでは1秒間に50サイクルですから、
1サイクルあたりの時間(=周期)は0.02【s】です。
その時間あたりに1サイクルするという関係式が
0.02【s】×50【/s】=1というわけです。

振動数は、波の速さと波長との関係f=v/λもあります。意味は「1秒間に進む距離は何波長分か」という事で、それは1秒間あたりに何サイクルしているかに等しくなるわけです。

周期は振動数の逆数なのでT=λ/vとなります。これは1サイクルの波長に対して何秒で進行できるかを表し、それは1サイクルに要する時間である周期に等いというわけです。

波の進行方向の速さvは、進行方向(x軸)に向かって同じ変位(y座標)の部分が進んでいく速さを表します。「y方向の変位の速さ」はまた別物となります。

また、後述する角周波数がω=2π/Tである事からT=2π/ωです。
その事はy=A sin(kx-ωt)の正弦波があった時に角周波数だけn倍したy=A sin(kx-nωt) は周期が1/n倍となっている事を意味します。

光や音波は一定の条件下で一定であるかほぼ一定とみなせるので、
その場合は振動数と波長は反比例の関係にあります。
光や音波の性質は振動数で大きく決まります。紫外線などの光や「高い音」は振動数が大きくて波長が短く、逆に赤外線などの光や「低い音」は振動数が小さくて波長が長い波動となっています。
可視光で言うと紫色の振動数が大きく、青、緑、黄色と小さくなって赤が振動数が一番小さい領域です。波長では逆に赤のほうが紫よりも大きくなります。
さらにより詳しく見ると一般的に振動数が高い波動ほどエネルギーが高く、紫外線などの振動数が高い光はエネルギーが高い光でもあります。

正弦波の波長

波の波長は基本的には時刻を固定した時の、
進行方向に対する「1周期分の波の長さ」を測ったものと言えます。

位置や距離を位相に換算する波数がk=2π/λで表され、
位置座標に由来する位相の部分はkxで表されます。
1周期分の距離(=波長)は2πに換算されます。
波長の1/2の「半波長」であればπに換算されるという計算です。

ただし時間を動かした時にも波長を考える計算はできます。
例えば波の進行の速さが200【m/s】である時、
1周期が0.1秒であるなら「1秒間に200メートル」は1秒が10周期分です。
つまりこの時、1周期分の0.1秒あたりは20メートルの進行があります。
さらに波の振動方向も見るとその間に1サイクルの振動が完了しているわけで、
進行方向の長さは波長です。
これは200【m/s】×0.1【s】=20【m】という計算です。

もし1周期が4秒だったら、波長は200【m/s】×4【s】=800【m】です。

これらの計算が「波長、速さ、周期の関係」を表すλ=vTの関係の意味です。
周期の代わりに振動数を使えばλ=v/fの関係になります。

もし光のように一定条件下で速さが常に一定であると考えられる場合にはλ=cTであり、波長と周期は比例関係にあります。(cは非常に大きい値なので短い周期でも波長は長くなり得ます。)

波の波長は、波同士を重ね合わせた時の波の干渉を分析する時に重要な量です。同じ物理量で表される2つの波が微妙に位相がずれた状態で重ね合わさると、波長の整数倍だけずれていると波は強め合い、波長の整数倍に半波長が加わると弱め合うという現象が起きます。
光が波動であるという実験的な根拠は、光に対して波の干渉が起きるという事(ヤングによる実験)です。(光は同時に粒子でもあります。その粒子が多数集まった時に波動性を表すようになります。ただし粒子同士が相互作用して波になっているという事では無く、より量子力学的な現象としてです。マクロなスケールでは光の波動性は電磁波としても扱われます。)

正弦波の速さ

波動が生じている時、
媒質は各位置で上下に振動しているだけだったとしても
見た目は波形が横に進行していくようにも見えます。

波の速さとは、そのような「波形が移動していく速さ」を指します。
波長および周期との関係式があり、λ=vTおよびλ=v/fが成立します。

そのため、質量を持った媒質の一部分に対して運動方程式を考えるような時には加速度はあくまで媒質の変位方向(波の進行方向に対して垂直方向など)を考える必要がある場合もあります。

時刻がt=0の時に波形がy=A sin(kx)で表されている正弦波が、
速さvでx軸方向に移動しているとすると
一般の時刻tではy=A sin{k(x―vt)}=A sin{2π(x/λ―vt/λ)}で表されます。
【sin(kx-vt)ではない事に注意。vtメートル進むのはx軸での距離です。】

しかし正弦波の基本形はy=A sin(kx―ωt)であったはずです。
すると速さを考える時にはそれとは違った形になってしまうのか?というと、実はそうでは無く
ω=2π/T=2πv/λによりωt=2πvt/λとなるので、
A sin{k(x―vt)}=A sin (kx―ωt)の関係があります。

もう少し詳しく見ると波動において進行方向の速さがvであるという事は、
1つの時刻を固定した時に(例えばt=tと指定)
xを変数とする2つの関数f(x)とg(x)があって、
f(x)=g(x+vt)が任意の位置xと時間tに対して成立する事を指します。
この関係式は「波がvt【m】進行した」という事を見やすい式です。
しかし、ではその時にy=g(x)はどのような関数形かというと、
x=X+vtとおくと、f(X)=g(X+vt)ですが
X=x-vtなのでf(x-vt)=g(x)であり、
y=f(x)をx軸方向にpだけ平行移動した関数y=g(x)はg(x)=f(x-p)で表される
という関数とグラフ上の平行移動についての一般的な関係式が得られます。
図形的にも物理的にも、y=Asin(kx)の波形全体がx軸のプラス方向に移動する時には
まず最初にx=0の位置においてyの値は小さくなっていきます。
関数は正弦関数ですから位相の値も0の状態からまず小さくなっていくわけで、
y=Asin(kxーωt)におけるーωtの項の意味を表しています。

ある正弦波y=A sin(kx―ωt)があってその進行方向を進行波として基準に考える時、同じ波形と物理量を持って「進行の向きだけが逆向き」の波はy=A sin(kx+ωt)で表され、反射波と呼ばれます。(物理的に見て、そのような波は多くの場合にどこかの端で反射して戻ってくるものなので。)

反射波のほうの式をvを使って書く事を考えると、
ここでは後述するω=kvの関係式を使う事にして
y=A sin(kx+ωt)=A sin(kx+vkt)=A sin {k(x+vt) } であり、
y=A sin(kx) の波形全体を「x軸のマイナス方向にvtだけ平行移動させた関数」に一致します。

角周波数

角周波数あるいは角振動数ωは、ωtの形で位相の時間部分を表す量です。

「角速度」(angular velocity)は回転運動を表すのに使う量ですが1秒間あたりの角度の変化量という意味では角周波数と同じであり、記号も同じωを使う事が多いです。
ただし角速度は波動以外の一般の運動に対して使う量ですから、波動における関係式は一般的には成立しません。

ω=2π/Tは、1周期分の時間で位相がπになるようにする換算の計算です。
例えばある時刻から0.5周期分だけの時間が経っているなら位相の変化(「位相差」)は
ωt=(2π/T)×0.5T=πとなる計算です。

ω=2πfの関係式も成立します。
例えば50【Hz】の振動数に対しては1秒間あたり100πの位相差が生じる事を意味します。
(※ただしその場合は100πは2πの整数倍ですから位置を固定すれば正弦関数の値は変化せず、実質の位相差は0と同じです。)
0.01秒間ではωt=2πft=100π×0.01=πの位相差が生じる計算になります。

基本となるA sin (kx―ωt)の形を見ると波数kと角周波数ωは一見全く別々の物理量かとも思えるわけですが、速さvによってkとωの関係式を作れます。
k=2π/λで、ω=2π/T=2πv/λなのでω=kvの関係が実はある事が分かります。

時刻を固定してから波の進行を考えてA sin (kx-ωt)の形を導出できるのと同様に、最初に位置を固定して時間による振動から考える事もできます。

t=0の時にx方向に関してはsin (kx)の波形があるとします。
この時に波がプラス方向に進行する時にはy方向の変位はx=0においてマイナス方向に現れ始めるので、敢えて「x=0でA sin (-ωt)の振動がある」と考えます。

プラスの値のxの位置で
「x=0の時と同じyの変位が現れる時刻」は波の速さを考慮してx/v秒後です。
よって、任意のxの位置における振動はω=kvの関係式も使って
y=A sin {-ω(t-x/v)}=A sin (-ωt+ωx/v)=A sin (kx―ωt)の形を得ます。

波数と平面や空間での波数ベクトル

波数はk=2π/λで表され、速さvを使うとk=2π/(vT)=ω/vとも表せます。

いずれにしても意味としては
「1波長分(1周期分)がいくつ含まれているかを位相に換算する量」という事になります。

平面や空間では、波の進行方向を表すベクトルとして波数ベクトルが使われる事があります。

波数ベクトルの表し方はいくつかありますが、
その1つは個々の位置での波の進行についての速度ベクトルを使う方法です。

速度ベクトルを(v,v,v)として、その大きさ(速さ)をvとします。
すると、速度ベクトルを「大きさが1である」単位ベクトルにした
(1/v) (v,v,v)というベクトルを考えると
これは各点において波の進行方向を向く単位ベクトルです。

それにkを乗じたものを波数ベクトルとして考える事ができます。
すなわち、\(\overrightarrow{k}\)=(k/v) (v,v,v)として考えます。
波数ベクトルの大きさは波数kに等しくなります。

特に平面波では同じ位相の平面が波を作っており
それらの平面間の距離によって位相差が決まるので、
原点から個々の点(x,y,z)から波の進行方向への射影を図形的に考えると距離の変化による位相の変化は波数ベクトルとベクトル(x,y,z)の内積で表す事ができます。
【原点を通る波面は必ず存在し、平面波においてその波面上での位相は等しいので統一的に波面と波面の位相差を「距離に波数kを乗じる」という式で表す事ができて、さらにそれは波数ベクトルを使うと内積により表現可能であるという事です。】

波数ベクトル

波の進行についての各点での速度ベクトルを\(\large{\overrightarrow{v}=(v_x,v_y,v_z)}\)として、
その大きさをvとすると 波数ベクトルは次式で表されます。 $$\overrightarrow{k}=k\frac{\overrightarrow{v}}{v}$$ $$\left|\overrightarrow{k}\right|=k=\frac{2\pi}{\lambda}$$ ■特に空間内の平面波において各点の変位 u(x,y,z,t) を正弦波で表せる場合には、
\(\large{\overrightarrow{r}=(x,y,z)}\)として次式が成立します。 $$u(x,y,z,t)=A\sin\left(\overrightarrow{k}\cdot\overrightarrow{r}-\omega t\right)$$ ωtの部分は進行方向が1次元の場合と同じです。
また、平面波であれば実は正弦波でなくても
より一般的に \(u(x,y,z,t)=f\left(\overrightarrow{k}\cdot\overrightarrow{r}-\omega t\right)\)と表す事が可能です。

波を正弦ではなく余弦で表す事と「位相のずれ」の関係

ところで正弦波を通常の三角関数として考えた時に、正弦ではなくて余弦で表してもよいのではないか?と思われるかもしれませんが、実際その通りで正弦波で表される波は余弦関数で表しても何ら支障はありません。

つまりy=A cos (kx―ωt)として波を表してもよいわけです。

ただし同じ物理量の波を正弦波で表した場合との関係には注意するべきで、
y=A cos (kx―ωt)=A sin (kx―ωt+π/2)の関係があります。
y=A sin (kx―ωt)とy=A cos (kx―ωt)との間には位相差があって、2つの関数を同時に使う時は正弦と余弦の関係からも分かるように同一の関数ではありません。

また同様に、正弦波をy=A sin (kx―ωt)ではなくy=A sin (ωt―kx)で表したとしてもそれ自体は波動の現象を考察するうえで基本的に問題は無いわけですが、やはり同じくy=A sin (kx―ωt)の波とは位相のずれがあり、
y=A sin (ωt―kx)=A sin (kx―ωt+π)=の関係があります。
今度は位相のずれはπになっているわけです。
【+πを-πとしても同じです。三角関数は2πを周期とするためです。
y=A sin (ωt―kx)=―A sin (kx―ωt)に等しいと見る事もできます。】

y=A sin (kx―ωt)は、より正確には定数θを使って
y=A sin (kx―ωt+θ)の正弦波でθ=0としたものです。
【通常はそれで問題は起きません。】
x=0,t=0の時の値がy=A sinθとなります。
そしてそのθは必要があればπ/2でもπでもよいわけで、
そのような場合には波はy=A sin (kx―ωt+θ)は
A cos (kx―ωt)やA sin (ωt―kx)に直接的に変形できます。
言い換えるとx=0,t=0の時のy=A sinθの値の設定次第で、
あるいは現に存在する波に対して
「進行方向のどこを原点にとっていつを時刻t=0に設定するか」により
A sin (kx―ωt),A cos (kx―ωt),A sin (ωt―kx)の形は実は自由に選べるわけです。

このグラフ上で正弦で表した式の位相にπ/2を加えると、
k=2π/λなのでkx-ωt+π/2=k(x+λ/4)-ωtとなり、
x軸のマイナス方向にλ/4【波長の1/4】だけもとの波形を平行移動させた形になっています。
正弦波の位相にπを加えた時は、同様にして
x軸のマイナス方向にλ/2だけもとの波形を平行移動させた形になっています。

正弦波の位相の表し方の整理

正弦波y=A sin (kx―ωt)において位相の形kx―ωtを見ると、位置座標と時刻の両方が変数になっています。つまり、同じ位置で時間による変動を見てもよいし、時刻を固定して波形の様子を見る事もできるようになっています。

つまり、いずれにしても位相に対する正弦関数の値として統一的に波の様子を表現できるようになっているわけです。

この事は、時刻を固定してx軸とy軸の関係でグラフを正弦関数として描けるだけでなく、位置xを固定して時刻tとy軸の関係におけるグラフも同じく正弦関数として描ける事を意味します。なぜならばどちらを変数としても、もう片方を固定すればy=A sin θの形の関数になっているためです。

正弦波の位相部分に対してはk=2π/λ,ω=2π/Tの関係を使って
y=A sin (kx―ωt)=A sin {2π(x/λ―t/T)}のように書く事もできます。
これは関係式を使って書き直しただけと言う事もできますが、
「位置や距離が波長の何倍か」「時刻や時間が周期の何倍か」で位相の変化を考えている事をより明確にするならこのようになるという事です。
もちろん、同じ意味をより簡潔に記せばy=A sin (kx―ωt)であるわけです。

さらに振動数fなどを使って書く事もできて、整理すると次のようになります。

使用する物理量の例正弦波の位相備考
k,ωkx―ωt基本形【ωt-kxでも可】
λ,T2π(x/λ―t/T)位置は波長の何倍か、
時間は周期の何倍かで位相を見る
λ,f2π(x/λ―ft)時間を2πが何個分かで見る
v,T,λ2π{x/(vT)―vt/λ }λ/v=Tよりλ=vT,
1/T=v/λ
k,vk(x―vt)x軸方向にvt平行移動した形
【kx―ωtに等しい】
ω,tω(x/v-t)x=0での振動から考えるか、
ω=kvの関係から

単位を利用した関係式の理解の仕方【次元解析】

波動に関する物理量の関係式は基本的ないくつかの式(T=1/fなど)を除くとそもそも覚え込むような性質のものではありませんが、それにしても分母と分子の関係がごっちゃになったりする事もあるかもしれません。微積分の計算等とはまた違った難しさがあると言えます。

そこで、あくまで補助的なものである事は強調されるべきかと思いますが、単位の関係を利用して理解に役立てたり、関係式を思い出す際に混乱した時などに使える事があります。
(物理では「次元解析」とも言います。この「次元」とは平面を2次元、空間を3次元と呼んだりする「次元」とは直接的には無関係です。)

例えばλ,v,Tの関係を考えてみましょう。
これらの単位はそれぞれ【m】【m/s】【s】です。
すると、もし例えばλvとかv/Tといった値を考えるとそれらの単位は【m/s】とか【m/s】(後者は加速度の単位)といったものになってしまいますが、いずれもλ,v,Tの単位に該当せず、波動に関する他の物理量の単位にも当てはまりません。

すなわちλvとかv/Tといった量は少なくとも基本関係式で使う事は無いという判断が可能であるとも言えるわけです。

もし関係式を忘れてしまって必要なのに急に思い出せないとして、
単位の関係からλ,v,Tに対して成立する正しい関係式を推測するとしましょう。

すると、【m】と【s】から【m/s】が作れるはずであり、
λ【m】/T【s】=v【m/s】の関係が推測できます。実際、それは正しい関係式になっています。
同じように単位の関係だけからT【s】=λ【m】/v【m/s】の式を推測しても
実際にT=λ/vは正しい関係式です。

続いて、λ【m】=v【m/s】T【s】の推測からもλ=vTも正しい関係式を得ます。
λ=vTの式の右辺についてvTなのかv/Tなのか混乱した時には
単位として【m】となる前者が正しく、
【m/s】すなわち加速度の単位になる後者は波長λを表す量としてあり得ない事を判定できます。

同様に、前述の波動に関する物理量の関係式は単位の関係からも理解可能です。
(下表で、振動数の単位は【Hz】ではなく【/s】で書いています。)

物理量関係式次元解析による理解の補助
周期T=1/f
T=λ/v
【s】=1/【/s】
【m】/【m/s】=【s】
波長λ=vT
λ=v/f
【m】=【m/s】・【s】
【m】=【m/s】/【/s】
振動数f=1/T
f=v/λ
【/s】=1/【s】
【/s】=【m/s】/【m】
速さv=λ/T
v=λf
【m/s】=【m】/【s】
【m/s】=【m】・【/s】
波数k=2π/λ
k=2π/(vT)
k=ω/v
【rad/m】を基本形として、
【rad/m】=【rad】/(【m/s】・【s】)
【rad/m】=【rad/s】/【m/s】
角周波数ω=2πf
ω=2π/T
ω=kv
【rad/s】を基本形として、
【rad/s】=【rad】/【s】
【rad/s】=【rad/m】・【m/s】

このような関係は単に式を覚えやすくなるという事に留まらず、物理学一般において異なる物理量の関係を調べる時に整合性がとれてるかの確認等を含めて考察の対象になる事があります。

また、物理量の単位というのは「1秒当たりに何メートル進むか」を【m/s】で表すといったように、それ自体に物理的な意味が含まれている事もあると言えます。
λ=vTの関係では速さに時間を乗じているから距離となるわけで、
そこに波動現象に特有の1サイクルあたりという意味が加味されるわけです。

物理的な意味(図的な意味も含めて)や数式的な意味に加えて、単位を使った理解の仕方も補助的に知っておくと便利な事があります。

波動方程式の解としての正弦波

一般的に、波動を表す式は次の波動方程式の解として得られます。

波動方程式

u(x,y,z,t)に対する次の微分方程式は波動方程式と呼ばれます。 $$\nabla^2u=\frac{1}{v^2}\frac{\partial^2 u}{\partial t^2}$$ $$\nabla^2=\frac{\partial^2 }{\partial x^2}+\frac{\partial^2 }{\partial y^2}+\frac{\partial^2 }{\partial z^2}$$ 右辺の定数項の分母でvの文字を使っていますが、
実は波動方程式の解から得られる波動の速さはこの式中のvで表されます。
▽の記号はナブラと言います。

正弦波の式は1次元の場合の波動方程式の解の1つとなっています。
【ただし解の「1つ」であって、解の全て(一般解)ではありません。】
1次元の場合は関数に対するyの偏微分、zの偏微分は0であるとして波動方程式は、
対象の関数をy=y(x,t)を使って次式になります。

$$\frac{\partial^2 y}{\partial x^2}=\frac{1}{v^2}\frac{\partial^2 y}{\partial t^2}$$

y=Asin(kx-ωt)がこの式の解であるかどうかは実際に偏微分を行う形で確認できます。
合成関数の微分(1変数)に注意して計算をまとめると次のようになります。

y=Asin(kxーωt)xによる偏微分tによる偏微分
偏微分1回目kAcos(kx-ωt)-ωAcos(kx-ωt)
偏微分2回目-kAsin(kx-ωt)-ωAsin(kx-ωt)

tによる偏微分の2回目では、cos の微分由来のマイナスと-ωtの微分由来のマイナスの2つが乗じられるので結果的に符号は1回目の偏微分の時から変わらない事になります。

y/∂x∂y/∂tの計算結果を見比べてみると、
y/∂x=(k/ω)(∂y/∂t) となっています。

つまり、v=ω/k であると考えると確かに上記の波動方程式を満たしています。
さらに、波の関係式においてω=vkでしたから波動方程式を満たす定数としての
v=ω/kは正弦波の進行の速さのvと同一の量である事を確認できます。

方向余弦の定義と公式

方向余弦(direction cosine)とはベクトルに対して考えられる補助的な量で、ベクトルの大きさに乗じる事で各成分の値になるような余弦(コーサイン、cos)を指します。(空間ベクトルの平面への射影を考える時の余弦とは一般的に異なるものです。)

この方向余弦の応用として特に重要であるの直交座標同士の座標変換です。
(局所的には直交座標から直交曲線座標への変換もできます。)

■関連記事:ベクトルの内積

■応用例:直交曲線座標系の成分にベクトルを変換する方法

「方向余弦」の定義

方向余弦とは、ベクトルと座標軸とのなす角に対して考える余弦であり、xyzの空間での直交座標なら1つのベクトルに対して3つ定義されます。平面であれば2つです。

方向余弦の定義

大きさが0でないベクトル\(\overrightarrow{A}\) =(A,A,A)に対して
\(\left|\overrightarrow{A}\right|=A\) ( >0)とおくとして、
\(A\cos\theta_x=A_1\),  \(A\cos\theta_y=A_2\),  \(A\cos\theta_z=A_3\) である時、
余弦 cosθ,cosθ,cosθ を特に「方向余弦」と呼ぶことがあります。
本質的に関数としては普通の余弦 cosθと同じものではありますが、
ベクトルに関する性質と組み合わせる事で特有の関係式がいくつか成立するものになります。

「おおきさが0でないベクトル」という条件を付しているのは、ゼロベクトルに対して方向余弦の定義を適用するとベクトルの大きさも0ですが、成分も全て0なので方向余弦は「任意の角度の余弦」であってもよい事になってしまうからです。
そのため、定義自体をできないわけではありませんがゼロベクトルに対する方向余弦は
「あまり意味のないもの」になってしまうので、ここでは除外して考えるという事です。

方向余弦をベクトルの大きさに乗じる事で、ベクトルの成分が計算されます。
具体的で簡単な数値で考えてみると、例えば(1,1,1)のようなベクトルなら
ベクトルの大きさは\(\sqrt{3}\)なので、各軸に対する方向余弦は3つとも等しく1/\(\sqrt{3}\)になります。
\(\sqrt{3}\cdot\frac{1}{\large{\sqrt{3}}}=1\)であり、大きさ×方向余弦=成分となっています。

この時に、具体的な角度の値は必ずしも分かっていなくてもよい事も多くあります。
cosθ=1/\(\sqrt{3}\)に対しては角度は約54.7°、弧度法で0.955≒0.3πとも書けますが、
角度の値よりも「余弦の値」のほうが重要である場合も少なからずあります。
(特にこの記事で見て行く方向余弦の公式や諸性質・応用ではその傾向があります。)

このように方向余弦の定義自体は比較的簡単なものですが、
注意すべき点があるとすれば方向余弦は3次元の空間の場合には一般的に
「ベクトルをxy平面やxz平面に射影する余弦とは異なる」という事です。
平面であれば、方向余弦はx軸あるいはy軸に対してベクトルを射影する余弦でもあります。
空間の場合でも確かに「軸に対する射影」を行うベクトルであるとは言えますが、それはxy平面等の「平面に対する射影」とは異なるのです。

図で見ると、一般的に3次元空間でのベクトルの方向余弦はxy平面等に対して「斜めになった平面」における直角三角形の1つの角に対する余弦となります。

公式1:方向余弦の2乗和に対する公式

方向余弦は普通の余弦と同じく三角比や三角関数の公式が使えますが、特に方向余弦に対して成立する公式として「3つの方向余弦(平面であれば2つ)の2乗の和は1になる」というものがあります。

方向余弦の2乗和に対して成立する公式

3次元空間における3つの方向余弦に対しては次式が成立します。 $$\large{\cos^2\theta_x+\cos^2\theta_y+\cos^2\theta_z=1}$$ 平面では次式です。
(空間で1つの方向余弦だけが0と考えても同じ。) $$\large{\cos^2\theta_x+\cos^2\theta_y=1}$$ この公式は「方向余弦」について成立するものであり、
一般の余弦 cosθで成り立つものではありません。
平面の場合では図を見ると実質的には sinθ+cosθ=1 と同じである事も分かるでしょう。

この公式は式で考えても導出できますし、図による平面幾何的な導出も可能です。
(式で考えたほうが、実はやや簡単かもしれません。)

証明

式で見る場合には、ベクトルの大きさ(の2乗)を成分で敢えて表してみると公式がすぐに出ます。(同じベクトルでの内積で考えても同じです。)

ベクトルの大きさをAとすると方向余弦を使った成分は
(A cosθ,A cosθ,A cosθです。ここでA>0であるとします。
成分を使って敢えて大きさの2乗を計算すると
A cosθ+A cosθ+A cosθです。
しかし考えているベクトルの大きさは A なのですから、その式の値はAです。
A cosθ+A cosθ+A cosθ=A
A>0なので
cosθ+cosθ+ cosθ=1となり、公式が導出されます。

図で見る場合は、平面だと分かりやすくて式で見る場合と同じように三平方の定理で斜辺の長さを見れば数式だけで考えた時と同じ式を得ます。

また、同じ角度で三角比の意味での余弦を2回考えるという方法も可能です。
すなわち長さ A の斜辺に対して A cosθ を考えて、さらにそこを斜辺とする線分を探します。
するとベクトルが作る直角三角形において直角の頂点から斜辺に垂線を下ろした時に、
そこを境にA cosθの長さの部分とA cosθの長さに分かれる部分となる事が分かります。

空間の場合も似た考察ができますが、平面と比べるとどうしても単純さが失われる傾向があります。

三平方の定理を使うのが一番早く、式で考える場合と結局同じになります。
それ以外の方法だと、かえって複雑です。
図形的にはベクトルの辺はA cosθ+A cosθの部分とA cosθの部分に分かれます。

いずれにしても、方向余弦に関しての性質を調べる時には平面の場合は図形的な考察は比較的容易でも、空間の場合では式で取り扱ったほうが見やすい事を示唆しています。

平面の場合は、2つの方向余弦のうち1つはもう片方の角度から見た正弦と実質的には同じです。
平面の場合は図で見ても比較的分かりやすいですが、空間の場合だとやや複雑になる傾向があります。後述していく方向余弦の関係式や公式の証明では基本的に内積などの式による計算を使っています。

公式2:ベクトルの直線に対する射影についての関係式

ベクトル\(\overrightarrow{A}\) =(A,A,Aと始点のみを共有する直線があるとして、
始点からの長さが「その直線への\(\overrightarrow{A}\)の射影に等しい」ベクトルを\(\overrightarrow{B}\) とします。
どちらのベクトルもゼロベクトルではないとします。
その他、次のように設定を考えます。

  • \(\overrightarrow{B}\) =(B,B,Bとします。
  • \(\overrightarrow{A}\)と\(\overrightarrow{B}\) とのなす角をφとします。
  • \(\overrightarrow{A}\)の方向余弦の角度をθ,θ,θとします。
  • \(\overrightarrow{B}\)の方向余弦の角度をω,ω,ωとします。
  • ベクトルの大きさについては\(\left|\overrightarrow{A}\right|=A\)( >0)および \(\left|\overrightarrow{B}\right|=B\)( >0) とおきます。

この時、B=A cosφ ですが、他にも次の公式が成立します。

ベクトルの直線への射影と方向余弦の関係式

上記の設定のもとで、次式が成立します。 $$\large{\cosφ=\cos\theta_x\cos\omega_x+\cos\theta_y\cos\omega_y+\cos\theta_z\cos\omega_z}$$ $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ これらの式が一体何を言っているのかというと、
最初の式は2つのベクトルのなす角の余弦を互いの方向余弦の積の和で表せる事、
2式目は1つのベクトルの大きさを3つの方向余弦と
「射影のもとになっている別のベクトルの成分」で表せるという事です。
また、1式目は2式目を導出するのに使う式でもあります。

複数の方向余弦が取り扱われる時にはl,m,nなどの文字によって方向余弦が書かれる事もありますが、ここでは普通の余弦として表記しています。

証明

第1式の証明は内積を使います。また、第1式から第2式を証明できます。

ベクトルの成分表示を方向余弦を使って書き、内積をとります。

\(\overrightarrow{A}\) =(A,A,A)=A (cosθ,cosθ,cosθ)
\(\overrightarrow{B}\) =(B,B,B)=B (cosω,cosω,cosω)
\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB (cosθcosω+cosθcosω+cosθcosω)

他方で\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB cosφ なので、
AB cosφ=AB (cosθcosω+cosθcosω+cosθcosω)
A>0かつB>0よりAB>0なので
cosφ=cosθcosω+cosθcosω+cosθcosω

次に2式目については、Acosφ=B の関係式に1式目の結果を代入します。
A cosθ=A等の関係を使って途中の変形を行います。

B=Acosφ
=A (cosθcosω+cosθcosω+cosθcosω)
=(A cosθ) cosω+(A cosθ) cosω+(A cosθ) cosω
=Acosω+ A cosω+Acosω

この2式目のほうの式は、次に見て行くように2つの直交座標においてベクトルの成分の変換公式を導出するのに必要です。(直交座標から直交曲線座標への変換も局所的には可です。)

公式3:2つの直交座標系でのベクトル成分の変換公式

原点を共有する2つの異なる直交座標を考えます。1つの直交座標に対して、もう片方の直交座標が原点を共有した状態で回転したような位置関係です。
この時のベクトルの成分に対する座標変換に対して、方向余弦を使う事ができます。

ここで言う「ベクトルの成分に対する座標変換」とは、
1つの直交座標における成分で表されたベクトルが、空間での大きさと向きは同じにしたままで
「別の直交座標から見た時」にはどのような成分で書けるだろうか?という問題です。

得られる公式は形が規則的ではあるのですが、3軸の3軸に対する方向余弦を考える必要があるので合計9個の方向余弦を必要とします。
それらは1~3の番号の組み合わせを使うと処理をしやすい場合もありますが
(線形変換的な式なので、特に行列などを使う場合など)、
ここではx,y,zとX,Y,Zの文字で区別を行う事にします。

原点を共有する2つの直交座標間の変換公式

原点を共有するxyz系とXYZ系の2つの直交座標軸があり、
片方はもう片方に対して原点回りに回転したような位置配置となっているとします。
この時にx,y,zの軸上のベクトルからX,Y,Zの軸への方向余弦を考えます。
x軸上のベクトルに対するY軸への方向余弦を cosθxYのように書く事にすると、
xyz座標系で成分を考えたベクトル\(\overrightarrow{A}\) =(A,A,A)(\(\neq\overrightarrow{0}\))を
XYZ座標系の成分(AX,AY,AX)で書く時の変換の式は次のようになります。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz

また、逆にXYZ座標系の成分で書かれた(AX,AY,AX)を
xyz座標系の成分(A,A,A)で書くには次のような変換をします。

  • A=AXcosθXx +AYcosθYx +AZcosθZx
  • A=AXcosθXy +AYcosθYy +AZcosθZy
  • A=AXcosθXz +AYcosθYz +AZcosθZz

後述しますが、2つの異なるベクトルに対してこの変換を適用した時に
2つのベクトルの内積は変換前と変換後で値は同じ(=不変)になります。
(そこから前提である2つのベクトルの大きさも変換の前後で値は同じという事も見れます。)

ここでも考えているベクトルはゼロベクトルを除いていますが、考えている2つの直交座標系は原点を共有しているという設定なので、原点におけるゼロベクトルはそもそも変換の必要はなくどちらの座標系でも同じ成分(0,0,0)として共有されている事になります。

上記の変換の3式は線形結合の形なので、次のように行列の積で表現する事もできます。
また、方向余弦の添え字が一定の規則性を持つので行と列に上手く対応させる事ができます。 $$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) $$ 3行3列程度ならわざわざ行列にするよりも普通に式で書く方が早いし分かりやすいと見るか、
行列で見たほうが規則性が明らかで書く手間も少し減ると見るかは人それぞれと思われます。

9つの方向余弦の位置関係を表にして整理すると次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へcosθXxcosθYxcosθZx
y軸へcosθXycosθYycosθZy
z軸へcosθXzcosθYzcosθZz
方向余弦の添え字が規則的で、式が線形結合の形なので行列の積で関係式を書く事もできます。また、ここでのアルファベットの添え字を番号に変えると行列の行と列の番号に対応させる事もできます。

余弦が角度のプラスマイナスで同じ値になる事を考えると、これらの方向余弦は「xyz系の軸からXYZ系の軸への方向余弦」を考えた時と同じ値になります。つまり例えば「z軸からY軸への方向余弦」は「Z軸からy軸への方向余弦cosθZy」と同じものを使ってよいという事です。
ただしxyz系の軸からXYZ系変換への公式は導出過程に由来して、
単純にx,y,zとX,Y,Zの置き換えをすればよいわけではなく
「x軸から考えた場合の3つの方向余弦」を使う必要があります。
表で言うと、
XYZ系への変換では1つの変換につき「縦」の3つを使うのに対して、
xyz系への変換では1つの変換につき「横」の3つを使う事になります。

ここで具体的な角度よりも「余弦の値」自体のほうが基本的に重要となる事を考えて、
方向余弦を cosθXy=CXyのように略記すると次のように書けます。

方向余弦X軸からY軸からZ軸から
x軸へCXxCYxCZx
y軸へCXyCYyCZy
z軸へCXzCYzCZz

さらに、添え字をアルファベットではなく1~3の番号だけで書くと次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へC11C12C13
y軸へC21C22C23
z軸へC31C32C33

変換後の式が線形変換の形になっている事に由来して方向余弦の配列を行列として扱う時には、添え字の組み合わせと行・列の番号が一致するので便利な事もあります。また、和をシグマ記号で表したい時も添え字がアルファベットではなく番号になっているほうが便利です。
ただし2種類の添え字を同じ1~3の番号で表すと、どの軸からどの軸への方向余弦を考えているかといった図的な位置関係は少し見えにくくなります。そのため、この記事では番号ではなくアルファベットによる添え字を使用しています。いずれの表示方法でも表現する事自体は同じです。

この公式の変換は原点を始点として考えていますが、任意の点を始点とする場合でもそこを基準に考えるかベクトルを原点に平行移動して考える事によって変換公式を適用する事ができます。直交座標系ではベクトルの向き(および大きさ)を保ったまま平行移動を行っても軸とのなす角は同じ値に保たれます。つまり方向余弦の値も同じものが使えるので、上記の変換公式を適用できます。

証明

変換公式の証明には前述の「ベクトルの直線への射影と方向余弦の関係式」を使います。本質的には、意味を把握しているならその関係式に当てはめる事で変換の式はそのまま導出できます。

(再掲)ベクトルの直線への射影と方向余弦の関係式

前述の公式を書くと次の通りです。
ここでは射影ベクトルの始点からの距離を表すほうの式だけを使います。 $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ 変換公式の証明用に変数を対応させると次のようになります。 $$\large{A_X=A_x\cos\theta_{Xx}+A_y\cos\theta_{Xy}+A_z\cos\theta_{Xz}}$$ 実はこれで変換公式の証明に既になってしまっているのですが、
以下もう少し詳しく説明を加えます。

まず、xyz系からXYZ系への変換を考えたいので
「AをA,A,Aと方向余弦で表す」事を考えます。
そこで、ベクトル\(\overrightarrow{A}\)のXYZ系の各軸への射影を1つずつ考えます。
すると、ベクトルの終点から軸に下ろした垂線の足と始点までの距離は、
実はそれがそのまま「XYZ系における座標成分」になっています。

すると「X軸からのx軸」「X軸からのy軸」「X軸からのz軸」への方向余弦を考えて、公式に当てはめればXYZ系でのベクトル\(\overrightarrow{A}\)の「X成分」が得られるという流れです。
それが AX=AcosθXx +AcosθXy +AzcosθXzの式になります。

Y軸についても同様に「Y軸からのx軸」「Y軸からのy軸」「Y軸からのz軸」への方向余弦を考え、
Z軸についても同様に「Z軸からのx軸」「Z軸からのy軸」「Z軸からのz軸」への方向余弦を考えて
AY=AcosθYx +AcosθYy +AcosθYz および
AZ=AcosθZx +AcosθZy +AcosθZz の式を得ます。

逆変換の式の場合

同じ考え方で、XYZ系の成分で表されたベクトルをxyz系の成分で表す逆変換の式も作れます。
ただし「考え方」が同じでも使う方向余弦が違ってくるので注意も必要です。【余弦の値自体はx軸からY軸の方向余弦はY軸からx軸への方向余弦と同じものを使えます。cosθ=cos(-θ)であるため。】

xyz系からの変換を考える時には、使う方向余弦は次のようになります。

Aを表すために使う方向余弦Aを表すために使う方向余弦Aを表すために使う方向余弦
「x軸からX軸」cosθXx
「x軸からY軸」cosθYx
「x軸からZ軸」cosθZx
「y軸からX軸」cosθXy
「y軸からY軸」cosθYy
「y軸からZ軸」cosθZy
「z軸からX軸」cosθXz
「z軸からY軸」cosθYz
「z軸からZ軸」cosθZz

XYZ系からの変換の時とは微妙に違っていて、各変換の式で使用する方向余弦のうち1つは共通していて残り2つは異なっています。(行列表示で言えばcosθXxなどの対角成分は共通していて、残り2つが違うものになっています。)

式で使うベクトル\(\overrightarrow{A}\)の成分についてはXYZ系での成分であるA,A,Aを使用します。
これらによって、xyz系での成分であるA,A,Aを表す式を得るわけです。

すなわち
A=AXcosθXx +AYcosθYx +AZcosθZx
A=AXcosθXy +AYcosθYy +AZcosθZy
A=AXcosθXz +AYcosθYz +AZcosθZz の3式が導出されます。

局所的には直交曲線座標への変換にも適用可能である件

上記の方向余弦による直交座標間のベクトルの変換公式は、
局所的には極座標や球面座標などの「直交曲線座標」にも適用可能です。
その事についてもここで簡単に触れておきます。

ここで「局所的に」というのは、直交曲線座標においては1つ1つの点において2つまたは3つの座標曲線(極座標だと同心円と放射状に伸びる直線)の接線ベクトルが互いに直交するので、そこに限定して見れば「直交座標とみなせる」という事を指します。

ただし直交曲線座標では一般的に、そのような局所的には直交座標の軸とみなせる接線ベクトルも位置を変えれば向きが変わってしまいます。ですので直交曲線座標においては「向きが異なる局所的な直交座標」が至るところに存在するという感じです。

そのため、直交曲線座標に対して上記の変換公式を使う時には方向余弦を微分や偏微分を使って表します。そのようにする事で、変換の式が座標変数による関数として表せるので、結果的に領域全体での変換を表す事が可能になります。これは微分方程式に対して基本ベクトルを変更する形での極座標変換を行う時などに重要になります。

基本ベクトルを変更しない形での微分方程式の極座法変換もあり、その場合には方向余弦を使った公式は不要になります。
方向余弦を使った変換公式を適用する必要があるのは力ベクトルなども含めたベクトル場の成分をx,y,zではなくr,θ,φで表し、rやθによる変化を考えたい場合です。

直交座標から直交曲線座標へのベクトルの成分の変換を行う時には方向余弦を微分や偏微分によって表す事になります。微積分・ベクトル解析的な考察は多少必要ですが、方向余弦による変換の公式自体は直交座標同士の変換の場合と同じ形で考える事ができます。図で、方向余弦はCの文字と添え字によって略記しています。
直交曲線座標への変換での方向余弦の具体的な関数形は表し方が2通りあり、いずれも微分・偏微分によって表されます。

公式4:直交座標変換における方向余弦の関係式

上記は9つの方向余弦を使った「成分についての座標変換の公式」でしたが、
9つの方向余弦自体に対して成立する関係式も公式として存在します。

直交座標の変換における方向余弦同士の関係式

■ J,K =X,Y,Z のそれぞれ(J≠K)に対して次式が成立します。
$$\large{ \cos\theta_{Jx}\cos\theta_{Kx}+\cos\theta_{Jy}\cos\theta_{Ky}+\cos\theta_{Jz}\cos\theta_{Kz}=0 }$$ ■ j=x,y,z のそれぞれに対して次式が成立します。 $$\large{ \cos^2\theta_{Xj}+\cos^2\theta_{Yj}+\cos^2\theta_{Zj}=1 }$$ ■ j, k = x,y,z のそれぞれ(j≠k)に対して次式が成立します。
【j=kの時は第2式になります。】 $$\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0 }$$ ■J=X,Y,Z のそれぞれに対して次式が成立します。
(第1式の左辺でJ=Kとした時に相当。) $$\large{ \cos^2\theta_{Jx}+\cos^2\theta_{Jy}+\cos^2\theta_{Jz}=1 }$$ J≠Kおよびj≠kのもとで
第1式の意味は「XYZ系の2つの軸からのxyz系の1つの軸への方向余弦の積の和は0になる」
第2式の意味は「xyz系の1つの軸からのXYZ系の各軸への方向余弦の2乗和は1になる」
第3式の意味は「xyz系の2つの軸からのXYZ系の1つの軸への方向余弦の積の和は0になる」
という事になります。
第3式でj=kとした場合が第2式、
第1式でJ=Kとした場合が第4式であり、値が変わる事になります。
(j=kとj≠kおよびJ=KとJ≠Kの場合分けで全体を2式にまとめる事もできます。)
第2式と第4式は、空間内の直交座標系の任意のベクトルに対して「各軸への方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

これらの公式は「暗記」するようなものではなく、このような規則的な関係が成立するという認識のもと、もし必要であれば適宜参照すればよいと考えるべきでしょう。後述する「原点を共有する直交座標間の変換の前後でベクトルの内積は不変である」事の証明ではこれらの関係式の一部を使います。

この図での各方向余弦は、略記で記しています。公式が表す結果で考えると、要するに和を考えると0になる関係式と1になる関係式がそれぞれ2つずつ、計4つ存在します。xyz系の軸とXYK系の軸の対応関係から整理すると比較的見やすいかもしれません。

$$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) =\left(\begin{array}{lcr} C_{11} &C_{12}&C_{13}\\ C_{21} &C_{22}&C_{23}\\ C_{31} &C_{32}&C_{33}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right)$$ のように方向余弦を略記して、さらに行列の要素に対応する番号で表す時には
上記の公式は次のようにも書けます。 $$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$ $$\sum_{n=1}^3(C_{nj})^2=1$$ $$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$ $$\sum_{n=1}^3(C_{Jn})^2=1$$ (J,K=1,2,3は、ここでは行の番号です。j,k=1,2,3はここでは列の番号。)

公式行列要素での表記
 cosθJxcosθKx
+cosθJycosθKy
+cosθJzcosθKz=0
(J≠Kの時)
 cosθXxcosθZx
+cosθXycosθZy
+cosθXzcosθZz=0
【X,Z軸からの方向余弦の積の和】
$$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$
 cosθXj
+cosθYj
+cosθZj=1

(第3式でj=kの時)
 cosθXy
+cosθYy
+cosθZy=1

【y軸への方向余弦の2乗和】
$$\sum_{n=1}^3(C_{nj})^2=1$$
 cosθXjcosθXk
+cosθYjcosθYk
+cosθZjcosθZk=0

(j≠kの時)
 cosθXxcosθXz
+cosθYxcosθYz
+cosθZxcosθZz=0

【x,z軸への方向余弦の積の和】
$$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$
 cosθJx
+cosθJy
+cosθJz=0
(第1式でJ=Kの時)
 cosθZx
+cosθZy
+cosθZz=0

【Z軸からの方向余弦の2乗和】
$$\sum_{n=1}^3(C_{Jn})^2=1$$

証明

証明はいずれも内積計算を使いますが、2乗和の形の式はそれ以外の方法でもできます。
ここで考えるベクトルは任意のベクトルではなく「始点と終点が軸上にあるベクトル」です。
以下、そのようなベクトルを「軸に重なるベクトル」と呼ぶ事にします。
1つの座標系における軸に重なるベクトルであっても、別の座標系から見た成分で書くと通常のベクトルとして扱われる事になり、その事をここでの証明でも使います。

第1式

第1式については、X,Y,Z軸の異なる2つの軸は直交しますから、それらの軸上のベクトル同士の内積は0です。そこで、ベクトルの成分で内積を計算して0に等しいとする事で証明されます。(同じ1つの軸同士【公式でJ=K】であれば当然直交はせず、内積は大きさの2乗になります。それは第4式の証明です。)

J≠Kの時に J 軸と K 軸(例えばX軸とZ軸)は直交するので、
大きさが P(>0)のJ軸上のベクトル\(\overrightarrow{P}\)について成分はxyz系での座標で書ける事に注意すると
\(\overrightarrow{P}\)= P (cosθJx,cosθJy,cosθJz)
同じように大きさがQ(>0)であるK軸に重なるベクトル\(\overrightarrow{Q}\) は次のように書けます。
\(\overrightarrow{Q}\)= Q (cosθKx,cosθKy,cosθKz)
2つのベクトルは直交するので内積は0であり、
\(\overrightarrow{P}\cdot\overrightarrow{Q}\)=PQ(cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz)=0
PQ≠0なので J≠K であれば
cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz=0

第2式

第2式については、xyz系の軸に重なるベクトルから見て考えます。
xyz系のj軸(例えばy軸)に重なる大きさ(p>0)のベクトル\(\overrightarrow{p}\)を考えて、
成分をXYZ系の座標として書きます。
方向余弦はXYZ系からxyz系へのものを選んで使う事ができ、
k軸からX,Y,Zに向かうものを選ぶ事に注意すると次のように書けます。
\(\overrightarrow{p}\)= p (cosθXj,cosθYj,cosθZj)
同じベクトル同士の内積\(\overrightarrow{p}\cdot\overrightarrow{p}\)を考えるか、
成分で計算したベクトルの大きさ=pと考える事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=p(cosθXj+cosθYj+cosθZj)=p
p>0なので
cosθXk+cosθYk+cosθZk=1

この式は第3式でj=kとして考えた場合でもあります。

第3式

第3式はxyz系から見て、第1式の時と同じように考えます。
j,k=x,y,zでj≠kのもとで、p>0およびq>0が大きさである
j軸とk軸に重なる2つのベクトルを考えると、2つのベクトルは直交します。
両者をXYZ系の座標で書き、内積を成分で計算して0になるとおくと結果の式を得ます。
\(\overrightarrow{p}\)= p(cosθXj,cosθYj,cosθZj)
\(\overrightarrow{q}\)= q (cosθXk,cosθYk,cosθZk)
\(\overrightarrow{p}\cdot\overrightarrow{q}\)=pq(cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk)=0

p>0かつq>0なのでj≠kであれば
cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk=0

第4式

第4式は、第1式において大きさがP (>0)の1つのベクトル同士の内積か大きさを成分で計算する事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=P(cosθJx+cosθJy+cosθJz)=P
P>0なので
cosθJx+cosθJy+cosθJz=1

第2式と第3式はxyz系から見て計算を考えましたが、得られた方向余弦の関係式はXYZ系をxyz系に変換する場合でも成立しているので必要があれば使ってもよい事になります。
また、第2式と第4式に関しては成分を考えている座標系だけから見れば「ある1つのベクトル」を考えている事になります。そのため、前述の「方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

方向余弦を使った直交座標の変換の前後において内積は不変である事の証明

座標変換をした時に値が変わらない量(「不変量」)についての考察は数学的に重要で、扱う対象によっては物理学でも重要となる場合もあります。

ところで前述の原点を「共有する直交座標同士のベクトルの成分の変換」は、ベクトル自体はいじっていないはずなので変換前と変換後で大きさは「同じはず」です。もしも、現に計算したらベクトルの大きさの値が変わってしまうなどという結果が出たら整合性がとれず困った事になります。
しかし実際は計算をしてもベクトルの大きさは同じ値に保たれる事が数式でも分かります。
そして実は、変換前と変換後ではベクトルの大きさだけでなく内積が同じ値に保たれているのです。

方向余弦を使った座標変換の前後における内積

2つのベクトルの成分を、原点を共有する2つの直交座標間で変換するとします。
\(\overrightarrow{A}\) =(A,A,A)および\(\overrightarrow{B}\) =(B,B,B)を考えて、
変換後の座標はそれぞれ
(AX,AY,AZ)および(BX,BY,BZ)であるとします。
この時に2つのベクトルの内積\(\overrightarrow{A}\cdot\overrightarrow{B}\) の値は、変換前のxyz系の座標成分で計算しても、
変換後の座標成分で計算しても同じ値になります。 $$\overrightarrow{A}\cdot\overrightarrow{B}=A_xB_x+A_yB_y+A_zB_z=A_XB_X+A_YB_Y+A_ZB_Z$$ 同じベクトル同士の内積を考える事により、
変換の前後でベクトルの大きさも同じ値に保たれる事も確認される事になりす。
(外積ベクトルについては変換によって異なるベクトルに変化してしまいます。)

証明

変換後の成分で内積を計算し、変換前の内積の値に等しくなる事を示します。

2つのベクトルの変換について、使用する方向余弦は「座標軸から座標軸へのもの」なので共通して使う事ができます。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz
  • BX=BcosθXx +BcosθXy +BcosθXz
  • BY=BcosθYx +BcosθYy +BcosθYz
  • BZ=BcosθZx +BcosθZy +BcosθZz

さて、これの内積を計算するとなるとX成分だけで見ても9つの項ができる事になりますが
規則性があるので全体としても3項の和の塊が9つという形です。
さらに前述の座標変換時の方向余弦に関する関係式を使うと、実は多くの部分が0になるのです。

  1. ABcosθXx+ABcosθYx+ABcosθZx=AB
    【∵cosθXx+cosθYx+cosθZx=1】
  2. ABcosθXxcosθXy+ABcosθYxcosθYy+ABcosθZxcosθZy=0
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0】
  3. ABcosθXxcosθXz+ABcosθYxcosθYz+ABcosθZxcosθZz=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0】
  4. ABcosθXy+ABcosθYy+ABcosθZy=AB
    【∵cosθXy+cosθYy+cosθZy=1】
  5. ABcosθXycosθXx+ABcosθYycosθYx+ABcosθZycosθZx
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0(2番目の計算と同じ)】
  6. ABcosθXycosθXz+ABcosθYycosθYz+ABcosθZycosθZz=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0】
  7. ABcosθXzcosθXx+ABcosθYzcosθYx+ABcosθZzcosθZx=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0(3番目の計算と同じ)】
  8. ABcosθXzcosθXy+ABcosθYzcosθYy+ABcosθZzcosθZy=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0(6番目の計算と同じ)】
  9. ABcosθXz+ABcosθYz+ABcosθZz=AB
    【∵cosθXz+cosθYz+cosθZz=1】

ここでは一応全部記してみましたが、
「2番目と5番目」「3番目と7番目」「6番目と8番目」は
掛け合わせる方向余弦の順番が違うだけで実質的に同じ計算であり、しかも値が0になります。
つまり6式については実は3組のほぼ同じ計算の式で、しかも0になって消えるわけです。
残るのは他の3つだけで、それらは方向余弦の部分が上手い具合に1になります。
よって、XYZ系に成分を変換後の内積の値は
AB+AB+ABとなり、
これは変換前の内積の値に一致するわけです。

シグマ記号で計算する場合、1~3の番号を使った処理も可能です。

XYZ系からxyz系への逆変換の式でも、内積の不変性は同様に証明も同様に可能です。

乗じる項の順番が異なるだけで実質的に同じ計算になる2組の箇所が3つあったのはあながち偶然ではなくて、実は行列の非対角部分でC12とC21のような転置の配置にある要素の組がそれらに該当します。
また、計算結果が0にならなかった部分は対角部分の3つです。
ここでの変換の場合に方向余弦が行列の要素に対応するような結果の式であったので、そのような規則性が見れるわけです。

上記の証明について、シグマ記号を使った証明も記します。
番号を使ってやる事も可能ですが、ここではアルファベットのままやる方法を書きます。
方向余弦はcosθXz=CXzのような略記号を使います。$$\large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{J=X,Y,Z}A_JB_J}$$ $$\large{=\sum_{J=X,Y,Z}\left\{\left(\sum_{j=x,y,z}C_{Jj}A_j\right)\left(\sum_{k=x,y,z}C_{Jk}B_k\right)\right\}}$$ $$\large{=\sum_{J=X,Y,Z}\left(\sum_{j,k=x,y,z}C_{Jj}C_{Jk}A_jB_k\right)}$$ $$\large{=\sum_{j,k=x,y,z}\left\{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)\right\}}$$ この式をよく見ると、1つのJを決めてj,k=x,y,zについて加え合わせた時に、
前述の公式によりj=kの場合以外は0になる事が分かります。 $$j\neq kの時、\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0なので、 }$$ $$j\neq kの時、\large{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)=0}$$ よって内積はk=jの項だけ考えればよい事になりますが、
k=jの時は同じ形の式が1になるので結局、方向余弦は全て式から無くなります。
整理すると、次のようになります。 $$ \large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{j=x,y,z}\left\{A_jB_j\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jj}\right)\right\}} $$ $$\large{=\sum_{j=x,y,z}\left(A_jB_j\right)}$$ これによってXYZ系の成分による内積の結果と、
xyz系の成分による内積の結果が等しい事が示されます。

部分積分の公式

部分積分の公式は「部分積分法」もしくは単に「部分積分」とも言い、置換積分と同じく積分において関数の原始関数(=微分するとその関数が得られる)を探すのに使われる基本公式の1つです。
英語名:integration by parts

公式の内容

関数が次の形をしている時には部分積分の公式を適用して積分の計算ができます。
この公式は不定積分でも定積分でもどちらでも使えて、
具体的な例に適用して計算していく場合はどちらの場合の形も使用します。

部分積分の公式(部分積分法)

不定積分の場合は次式です。 $$\int \left(\frac{d}{dx}f(x)\right)g(x)dx=f(x)g(x)-\int f(x)\left(\frac{d}{dx}g(x)\right)dx$$ 定積分の場合は次式になります。 $$\int_a^b \left(\frac{d}{dx}f(x)\right)g(x)dx=\large{[f(x)g(x)]}_a^b-\int_a^b f(x)\left(\frac{d}{dx}g(x)\right)dx$$ $$=f(b)g(b)-f(a)g(a)-\int_a^b f(x)\left(\frac{d}{dx}g(x)\right)dx$$ 定積分のほうの形は、1つ前の段階として(d/dx){f(x)g(x)} に対する
積分区間 [a, b] での定積分を考えているのでこのような形の式になっています。

部分積分の公式を適用する事を指して「部分積分する」というふうにもよく言います。
文章の表現としては例えば「左辺を部分積分すると次のようになる」などといった具合に使います。

証明については次に述べますが、積の微分公式を変形したものを積分して公式が得られます。

また具体例についても後述しますが、部分積分の公式を実際の計算で適用する時には
まずてきとうなh(x)g(x)の形の関数に対する積分があって、
何か別の関数f(x)を考えると「h(x)=(d/dx)f(x)となるようだ」と気付く事で部分積分の公式を適用してみるといった流れになる事が多いと言えます。

$$計算で使う時は主に、\int h(x)g(x)dxの形の式に対して、$$

$$h(x)=\frac{d}{dx}f(x)となるようなf(x)を見つけて公式を適用します。$$

導出・証明

実は、部分積分の公式を導出する方法は微分の公式を知っていれば非常に簡単です。

置換積分法が合成関数の微分公式を根拠に成立しているのに対して、
部分積分法は積の微分公式を根拠に成立しています。

積の微分公式を書くと次のようになります。

$$\frac{d}{dx}(f(x)g(x))=\left(\frac{d}{dx}f(x)\right)g(x)+f(x)\left(\frac{d}{dx}g(x)\right)$$

微分の書き方が複数ある事などに由来して、例えば次のように書いても同じです。 $$\frac{d}{dx}(f(x)g(x))=\frac{df}{dx}g(x)+f(x)\frac{dg}{dx}$$ $$(f(x)g(x))^{\prime}=f^{\prime}(x)g(x)+f(x)g^{\prime}(x)$$ f(x)=f、g(x)=gと略記するなら次のようにも書けます。 $$(fg)^{\prime}=f^{\prime}g+fg^{\prime}$$

積の微分公式において、
右辺の片方の項(ここでは第2項)を左辺に移行します。

$$\left(\frac{d}{dx}f(x)g(x)\right)-f(x)\left(\frac{d}{dx}g(x)\right)=\frac{d}{dx}(f(x)g(x))$$

これを右辺=左辺の形に入れ換えます。

$$\frac{d}{dx}(f(x)g(x))=\left(\frac{d}{dx}f(x)g(x)\right)-f(x)\left(\frac{d}{dx}g(x)\right)$$

次に両辺をxに関して積分し、(d/dx){f(x)g(x)}のところは積分するとf(x)g(x)になります。

$$\int \left(\frac{d}{dx}f(x)\right)g(x)dx=\int\frac{d}{dx}(f(x)g(x))dx-\int f(x)\left(\frac{d}{dx}g(x)\right)dx$$

$$=f(x)g(x)-\int f(x)\left(\frac{d}{dx}g(x)\right)dx$$

すると、全体を見ると部分積分の公式になっています。(不定積分の項が残っているので任意定数はここではつけていません。)
ですので、積の微分公式を知っていれば非常に簡単な成り立ちの積分公式であると言えます。

定積分の場合も同じように部分積分の公式の内容を得られます。
不定積分の場合の最後から1つ前の式から考えると比較的分かりやすいかと思います。

$$\int_a^b \left(\frac{d}{dx}f(x)\right)g(x)dx=\int_a^b\frac{d}{dx}(f(x)g(x))dx-\int_a^b f(x)\left(\frac{d}{dx}g(x)\right)dx$$

$$=\large{[f(x)g(x)]}_a^b-\int_a^b f(x)\left(\frac{d}{dx}g(x)\right)dx$$

部分積分によって計算できる積分の例

初等関数の簡単な組み合わせであっても、
原始関数を直接探す事で積分を計算する事は一般的に非常に難しい事が知られています。

ですが、一部の関数については部分積分や置換積分によって原始関数が分かる場合があります。ここでは、部分積分の公式が使える代表的な例をいくつか挙げて説明します。

指数関数や三角関数との積になった関数

以下、指数関数と言ったら自然対数の底 e に対する eを考えるとします。
これは単独では(d/dx)e=eなので積分も直接計算できますが、別の関数がくっついていると話が変わってきます。三角関数についても似た事が言えます。

例えば次のような関数です。

  • xe
  • e
  • xsinx
  • esinx

こういった形の関数の積分は、部分積分の公式を使う事によって原始関数が分かるようになり、それで積分を計算する事ができます。

1つ1つ具体的に見て行きますが、基本的な考え方は「積を構成している個々の関数に着目し、微分を上手く使って原始関数が明らかに分かるような形に変形していく」事になります。

まずxeという関数について見てみましょう。これは部分積分の公式を適用して計算ができます。まず(d/dx)e=eである事から部分積分の公式を使える形である事に着目します。具体的に不定積分を計算すると次の通りです。(最後の結果に加えてあるCは任意定数です。)

$$\int xe^xdx=\int x\left(\frac{d}{dx}e^x\right)dx=xe^x-\int \left(\frac{d}{dx}x\right)e^xdx$$

$$=xe^x-\int e^xdx=xe^x -e^x +C$$

得られた結果が本当にxeの原始関数なのかを確かめると、
(d/dx)(xe-e)=e+xe-e=xe となっていますので大丈夫という事になります。

部分積分の公式自体が積の微分に由来にする関係式であるわけですが、
結果の式も「積の形」の項をを含むものになっています。
部分積分を使って府定積分を計算すると必ずそうなるというわけではありませんが、
元々の積分対象が積の形である時に部分積分法によって原始関数を導出すると、結果の式も積の形を含む場合も少なからずあるという事です。また、公式の形に由来して結果が2項以上の和や差になる事も多いのが特徴です。

定積分の場合は、例えば積分区間が [0, 1] であれば次のようにします。

$$\int_0^1 xe^xdx=\int_0^1 x\left(\frac{d}{dx}e^x\right)dx=\left[xe^x\right]_0^1-\int_0^1 \left(\frac{d}{dx}x\right)e^xdx$$

$$=e–\int_0^1 e^xdx=e-\left[e^x\right]_0^1=e-(e-1)=1$$

不定積分で最後の結果の原始関数を出してから、積分区間の端点を代入して計算しても同じ結果です。
(任意定数の部分は定積分では必ずC-C=0になって無くなります。)

次にxeの不定積分は、部分積分の公式を2回使って計算をします。
あるいは、xeの不定積分が分かっている前提なら、それも途中で直接的に計算に出てくるので結果を利用できます。ここではそれで計算します。もしxeの不定積分の結果が不明な状態であればそこで2度目の部分積分を行うわけです。

$$\int x^2e^2dx=\int x^2\left(\frac{d}{dx}e^x\right)dx=x^2e^x-\int \left(\frac{d}{dx}x^2\right)e^xdx$$

$$x^2e^x-2\int xe^xdx=x^2e^x-2(xe^x -e^x)+C$$

$$=(x^2-2x+2)e^x+C$$

このように見ると、xsinxなども同様に部分積分の公式で計算できる事が分かります。
その場合は、sinx=(d/dx)(-cosx)のように考えます。

$$\int x\sin xdx=\int x\left(-\frac{d}{dx}\cos x\right)dx=x(-\cos x)-\int \left(\frac{d}{dx}x\right)(-\cos x)dx$$

$$=-x\cos x+\int \cos x dx=–x\cos x+\sin x +C$$

結果が合っているか確かめると、
(d/dx)(-xcosx+ sinx)=-cosx+xsinx+cosx=xsinx となります。
よって、大丈夫という事になります。

では、esinxのような場合はどうでしょうか。これに関しては、実は部分積分を複数回行っても原始関数が直接的に分かる形には変形ができません。しかし、sinxとcosxに対して微分を行うとsinx→cosx→-sinx→-cosx→sinxのように周期的に同じ形になるので、部分積分で計算を進めた後に簡単な方程式を解く形で原始関数を導出できます。

$$\int e^x\sin x dx=\int \left(-\frac{d}{dx}\cos x\right)e^xdx=-e^x\cos x-\int (-\cos x)\left(\frac{d}{dx}e^x\right)dx$$

$$=-e^x\cos x+\int e^x\cos xdx=-e^x\cos x+\int e^x\left(\frac{d}{dx}\sin x\right)dx$$

$$=-e^x\cos x+e^x\sin x-\int \sin x\left(\frac{d}{dx}e^x\right)dx$$

$$=-e^x\cos x+e^x\sin x-\int e^x\sin xdx$$

この段階でまだ残っている不定積分の項は「最初の不定積分の符号だけ変えたもの」なので、
「方程式を解く形」で原始関数が分かる形になるパターンなのです。

これを不定積分の項に関して解いて、任意定数(CおよびC)も加えると次のようになります。

$$\int e^x\sin x dx=-e^x\cos x+e^x\sin x-\int e^x\sin xdx\hspace{2pt}となっているので$$

$$2\int e^x\sin x dx=-e^x\cos x+e^x\sin x +C_0$$

$$よって、\int e^x\sin x dx=\frac{e^x}{2}\left(-\cos x+\sin x\right)+C$$

ここでの任意定数の扱い方についてはそんなに気にしなくていい程度の事項ではありますが、
一応詳しく見るのであれば考えている関数の原始関数の1つをF(x)として、
2つの任意定数 CとC(別々の値を取り得る)を考えます。すると、
F(x)+C=-ecosx+esinx+F(x)+Cで、
―Cとおけばそれ自体が任意の実数を表し得る、つまり任意定数となるので
2F(x)=e(-cosx+ sinx)+C というようになります。
また、同じくそれ程気にする事項ではありませんが、最後にC=C/2と考えて
F(x)=(e/2)(-cosx+ sinx)+Cとしています。

結果が合っているか確かめると、
(d/dx){(e/2)(-cosx+ sinx)}=(e/2)(-cosx+ sinx)+(e/2)(sinx+cosx )=esinxとなっていて大丈夫である事が分かります。

「xの微分」が1として隠れている例

同じように部分積分の公式を使って原始関数を探す形で積分を計算する例として、ある関数に「xの微分」つまり(d/dx)x=1が乗じられていると見て部分積分の公式を適用する事があります。

これは一見すると数学上だけの技巧的な手段に思えるかもしれませんが、対数関数などの基本的な初等関数の原始関数を見つけるにあたっても重要な計算ですので知っておくと便利です。

比較的重要な次の2つの例で計算をしてみます。
2つのうち後者のほうの例は、置換積分によっても積分を計算できます。

  • ln x(=logex)
  • \(\sqrt{a^2-x^2}\) (定義域は|a| ≧ |x|の範囲)

ここで扱う対数関数は自然対数として考える対数であり、自然対数関数とも呼びます。
「ログナチュラル」と読む事もある lnxと書く表記方法をここでは使います。

まずln xについて、これをln x={(d/dx)x} lnxと考えるなら。対数関数の微分のほうについては(d/dx)ln x=1/xですので積分は部分積分法により上手く行きそうだと予想するわけです。

$$\int \mathrm{ln}x \hspace{1pt}dx=\int\left(\frac{d}{dx}x\right)\mathrm{ln}x \hspace{1pt}dx$$

$$=x\mathrm{ln}x-\int x\left(\frac{d}{dx}\mathrm{ln}x\right)dx=x\mathrm{ln}x-\int x\cdot\frac{1}{x}dx$$

$$=x\mathrm{ln}x-\int dx=x\mathrm{ln}x-x+C$$

$$\left(\int dx\hspace{2pt}は\hspace{2pt}\int 1 dx\hspace{2pt}の事です。\right)$$

結果が正しいか微分して確認すると、
(d/dx)(xlnx-x)=lnx+x・(1/x)-1=lnx+1-1=lnxとなり、
合っている事が分かります。

次に、比較的計算は込み入りますが後者のほうの例\(\sqrt{a^2-x^2}\) の積分についてです。置換積分でも積分を計算できますが、部分積分を使うと実は一般的な原始関数の形が分かります。結論を先に言うと、この関数の積分は逆正弦関数 Arcsinxを含んだ形で表されます。(逆三角関数の1つです。)
|x| <1のもとで
(d/dx)Arcsinx=1/\(\sqrt{1-x^2}\)であり、
(d/dx)Arcsin(x/a)=1/\(\sqrt{a^2-x^2}\)(a≠0の時)なので、
その形を作れないかどうかを考えると計算が理解しやすくなります。

自然対数関数に対する積分の時と同じく、xの微分としての「1」が隠れていると見ます。

$$\int \sqrt{a^2-x^2}dx=\int \left(\frac{d}{dx}x\right)\sqrt{a^2-x^2}dx=x\sqrt{a^2-x^2}-\int x\left(\frac{d}{dx}\sqrt{a^2-x^2}\right)dx$$

$$=x\sqrt{a^2-x^2}-\int x\left(-2x\cdot\frac{1}{2}\frac{1}{\sqrt{a^2-x^2}}\right)dx$$

$$=x\sqrt{a^2-x^2}+\int \frac{x^2}{\sqrt{a^2-x^2}}dx=x\sqrt{a^2-x^2}+\int \frac{x^2-a^2+a^2}{\sqrt{a^2-x^2}}dx$$

$$=x\sqrt{a^2-x^2}+\int \left(\frac{a^2}{\sqrt{a^2-x^2}}-\sqrt{a^2-x^2}\right)dx$$

a≠0の時は、積分の中の第1項をx/a を変数とする Arcsin(x/a)で表せます。
また、その段階で式を整理すると実は「積分の項に関して移項して解く」タイプの形になっている事が分かるので積分の結果が分かります。

$$a\neq 0 の時、\int \sqrt{a^2-x^2}dx=x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}-\int \sqrt{a^2-x^2}dxであるので$$

$$2\int \sqrt{a^2-x^2}dx=x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}+C_0$$

$$よって、\int \sqrt{a^2-x^2}dx=\frac{1}{2}\left(x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}\right)+C$$

細かい事ですがもしa=0であれば定義域は|a| ≧ |x|でしたから、定義域はx=0となり関数の値も0です。従って、もしそれをxで積分をするとしてもその値も0となります。ですので積分を考える場合には最初から|a|>0として考える、という事もできます。

以上の2例については一応結果をまとめておきましょう。
(結果を覚える必要があるというよりは、「部分積分法を使えばこのように結果を出せる」という事のほうが重要と思われます。)

自然対数関数と\(\sqrt{a^2-x^2}\) の不定積分

自然対数関数の不定積分は次のようになります。 $$\int \mathrm{ln}x \hspace{1pt}dx=x\mathrm{ln}x -x +C$$ \(\sqrt{a^2-x^2}\) の不定積分は a≠0 の時は次のようになります。
(a=0 の時はxも関数値も0となるので、不定積分も0) $$\int \sqrt{a^2-x^2}dx=\frac{1}{2}\left(x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}\right)+C$$ $$\left(例えばa=1の場合は\int \sqrt{1-x^2}dx=\frac{1}{2}\left(x\sqrt{1-x^2}+\mathrm{Arcsin}x\right)+C\right)$$ これらはいずれも「隠れた1」が関数に乗じられていると見て、
部分積分の公式を適用して計算すると結果が得られるタイプの不定積分です。

\(\sqrt{a^2-x^2}\) の不定積分の結果について、
計算が合っているかの検証用に結果の式を微分するのは少し面倒ですが
最初の項が積の微分で2項に分離し、全体の合計が元の関数になる事を確認できます。 $$\frac{d}{dx}\left\{\frac{1}{2}\left(x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}\right)\right\}$$ $$=\frac{1}{2}\left(\sqrt{a^2-x^2}+x\cdot(-2x)\cdot\frac{1}{2} \frac{1}{\sqrt{a^2-x^2}}+\frac{a^2}{\sqrt{a^2-\frac{x^2}{a^2}}}\right)$$ $$=\frac{1}{2}\left(\sqrt{a^2-x^2}-\frac{x^2}{\sqrt{a^2-x^2}}+\frac{a^2}{\sqrt{a^2-x^2}}\right)$$ $$=\frac{1}{2}\left(\sqrt{a^2-x^2}+\frac{a^2-x^2}{\sqrt{a^2-x^2}}\right)$$ $$=\frac{1}{2}\left(\sqrt{a^2-x^2}+\sqrt{a^2-x^2}\right)=\frac{1}{2}\cdot 2\sqrt{a^2-x^2}=\sqrt{a^2-x^2}$$

応用例1:テイラー展開を部分積分から導出する方法

関数のテイラー展開と、その特別な場合であるマクローリン展開は微分係数を使った多項式の形により関数を近似する関係式で、数学上も物理等での応用においても非常に有用でよく使われる式です。

例えば自然対数の底による指数関数exのマクローリン展開(「x=0における」テイラー展開)は次のような無限級数になります。(この無限級数は収束します。)

$$e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots+\frac{x^n}{n!}+\cdots$$

この式の出し方は色々あるのですが、実は部分積分の公式を使って導出可能です。exの式を見ると3!とか4!とかの階乗の部分が一体なぜ出て来るのか疑問に思われるかもしれませんが、部分積分の観点から言うとその部分の根拠は関数xの微分です。正確に言えばその積分をする事で出てくるので自然数の係数は全て分母についています。

少し工夫は必要ですが、ex =「x=0の値」+「x=0での微分係数」x+「x=0での2階導関数の微分係数」x+「x=0での3階導関数の微分係数」x+・・・のような形にする事を考えます。
つまり、積分の計算をするために部分積分の公式を使う時と違って、式の項をどんどん増やしていきます。以下、少し詳しく丁寧に見ていきます。

まず、e0=1である事を踏まえて次のようにします。

$$e^x=1+\int_0^xe^td=\hspace{5pt}\left(=1+\large{\left[e^t \right]_0^x}=1+e^x-1\right)$$

ここで、積分の項は「xの関数」として扱いたいので変数xと「積分変数t」を敢えて分けて考えています。(この考え方は元々の定積分や不定積分を定義dする段階で実は存在します。)

次に定積分の項に関して部分積分の結果を考えながら、「t=xを代入すると0になり、t=0を代入すると-xになる関数」を考えます。ちょっと妙な気もするかもしれませんが、これはt-xという関数が該当します。これにeが乗じられた(t-x)eが部分積分の結果として出てくる事を予想します。

そこで、積分変数tに関して1=(d/dt)(t-x)が乗じられていると見ます。
ここで、xをtに関する定数とするので(d/dt)x=0です。対数関数の積分を部分積分によって計算する時と同じ考え方です。

「積分に関してはxを定数と考える」というのは少し分かりにくいかもしれませんが、
まずxが「定数」だと考えて積分の結果を出してから
「そのxの値がどの実数値でも成立するので変数としてみなせる」と考える事もできます。
例えばx=3とか7とかいったてきとうな定数を考えてみて、
「0から7までの定積分」などを計算してみるとよいかもしれません。
その場合、定数に対する微分の結果は0ですから、
(d/dt)(t-7)=(d/dt)t=1というふうに確実に計算の過程を見れます。

「隠れた1がある」として考えた時、計算は次のようになります。

$$e^x=1+\int_0^xe^td=1+\int_0^x\left\{\frac{d}{dt}(t-x)\right\}e^tdt$$

$$=1+\large{\left[(t-x)e^t\right]_0^x}-\int_0^x(t-x)\left(\frac{d}{dt}e^t\right)dt$$

$$\large{=1+\{0-(-x)e^0\}-\int_0^x(t-x)e^tdt}$$

$$\large{=1+x+\int_0^x(x-t)e^tdt}$$

さらに、この後も同じような部分積分を続けて項を増やします。
ただし、ここから先は次のように考えます。

  • 部分積分の2項目で必ずマイナス符号が出てくる事をあらかじめ予測する
  • 操作を続けて行くにあたり、「最後の項が0に収束する」事を期待する

そこで、部分積分の操作を続けて行くと「分母の値が大きくなる」事を期待してtではなくtの微分が乗じられている形の項を考えます。そのような項の条件を整理しておきます。

  • xを定数としてtで微分すると-(t-x)=x-tになる
  • t=xで0になる
  • t=0でxの関数になる

すると、具体的には-(x-t)/2の形を考えると、
xを定数扱いとしてtで微分すると
-{-2(x-t)}/2=x-tとなるので、まず微分に関する条件は満たします。
また t=xでは-(x-t)/2=0であり、
t=0としてマイナス符号を付けると-{-(x-0)/2}=x/2です。
そこで、上記の積分の項において
-(x-t)/2のtによる微分とeが乗じられていると見て部分積分を続けます。

$$\large{e^x=1+x-\int_0^x(x-t)e^tdt=1+xe^x+\int_0^x\left\{\frac{d}{dt}\frac{-(x-t)^2}{2}\right\}e^tdt}$$

$$=1+x+\large{\left[-\frac{(x-t)^2}{2}e^t\right]_0^x}-\int_0^x\frac{-(x-t)^2}{2}\left(\frac{d}{dt}e^t\right)dt$$

$$\large{=1+x-\left\{\frac{-(x-0)^2}{2}e^0\right\}-\int_0^x\frac{-(x-t)^2}{2}e^tdt}$$

$$\large{=1+x+\frac{x^2}{2}+\int_0^x\frac{(x-t)^2}{2}e^tdt}$$

定積分の項に対してさらに部分積分を続けます。
微分して(x-t)/2になる関数を考えると-(x-t)/(2・3)が該当するので、
eに対して(d/dt){-(x-t)/(2・3)}=(d/dt){-(x-t)/(3!)}
が乗じられていると見ます。
そしてその次は、eに対して
(x-t)/(3!)=(d/dt){-(x-t)/(4!)}が乗じられていると見ると、
部分積分によりx/(4!)の項が付け加わります。

$$\large{e^x=1+x+\frac{x^2}{2}+\int_0^x\frac{(x-t)^2}{2}e^tdt}$$

$$\large{=1+x+\frac{x^2}{2}+\int_0^x\left\{\frac{d}{dt}\frac{-(x-t)^3}{3!}\right\}e^tdt}$$

$$\large{ =1+x+\frac{x^2}{2}+\left[\frac{-(x-t)^3}{3!}e^t\right]_0^x-\int_0^x\frac{-(x-t)^3}{3!}\left(\frac{d}{dt}e^t\right)dt }$$

$$\large{ =1+x+\frac{x^2}{2}-\left\{\frac{-(x-0)^3}{3!}e^0\right\}-\int_0^x\frac{-(x-t)^3}{3!}e^tdt }$$

$$\large{ =1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\int_0^x\frac{(x-t)^3}{3!}e^tdt }$$

$$\large{ =1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\int_0^x\left\{\frac{d}{dt}\frac{-(x-t)^4}{4!}\right\}e^tdt }$$

$$\large{ =1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\left[\frac{-(x-t)^4}{4!}e^t\right]_0^x-\int_0^x\frac{-(x-t)^4}{4!}\left(\frac{d}{dt}e^t\right)dt }$$

$$\large{ =1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\int_0^x\frac{(x-t)^4}{4!}e^tdt }$$

ここでは計算を少し詳しく書いていますが、要所以外は省略してももちろん可です。

これの次は eに (x-t)/(4!)=(d/dt){-(x-t)/(5!)}が乗じられていると見て
これまで同様にしてx/(5!)の項が付け加わります。
その後も部分積分の計算をずっと繰り返していきます。

このようにして
e=1+x+x/2+x/(3!)+x/(4!)+x/(5!)+・・・+「最後の項」
が出てくるわけです。結果だけ見ると不思議な事ですが指数関数を多項式の形に変形できています。
この、有限の値の「最後の項」を含む段階の関係式をテイラー公式と言います。

部分積分法により導出した e の指数関数のテイラー公式

e の x= 0における eのテイラー公式は次式です。$$e^x=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots+\frac{x^n}{n!}+\int_0^x\frac{(x-t)^n}{n!}e^tdt $$(他の方法でもテイラー公式を導出した時は最後の項の形だけ異なる形になります。)
部分積分を行う積分範囲をt=aからt=xとした場合は、eの微分は何階の導関数でも形が変わらずeであり、部分積分をした時にt=aを代入した(xーa)ea/k!の形の項が残る事に注意すると、次式です。$$e^x=e^a+e^a(x-a)+e^a\frac{x^2}{2}+e^a\frac{(x-a)^3}{3!}+\cdots+e^a\frac{(x-a)^n}{n!}+\int_0^x\frac{(x-t)^n}{n!}e^tdt $$ $$=e^a\left\{1+(x-a)+\frac{x^2}{2}+\frac{(x-a)^3}{3!}+\cdots+\frac{(x-a)^n}{n!} \right\}+\int_0^x\frac{(x-t)^n}{n!}e^tdt $$ 指数関数以外でも同様の式を作れます。
関数f(x)のx=aにおけるテイラー公式を部分積分で計算すると次式です。 $$f(x)=f(a)+f^{\prime}(a)(x-a)+\frac{f^{\prime\prime}(a)}{2!}(x-a)^2+\cdots+\int_a^x\frac{(x-t)^n}{n!}\frac{d^nf(t)}{dt^n}dt$$ $$\left(\frac{df}{dx}= f^{\prime}(x) \hspace{10pt} \frac{d^2f}{dx^2}=f^{\prime\prime}(x) \hspace{2pt}と表記されます。\right)$$ 最後の項(剰余項)がn→∞で0に収束する時には式全体は収束する無限級数となって、それが関数のテイラー展開と呼ばれ、「x=0におけるテイラー展開」はマクローリン展開とも呼ばれます。指数関数や三角関数は、どの実数の値においても剰余項がn→∞で0に収束するので全実数の範囲でテイラー展開が可能である事を証明できます。

ここでの導出方法における定積分の項の扱いについては、
より正確に 数学的帰納法として証明を書くなら次のようになります。
示すべき命題は任意の自然数nに対して次式が成立する事です。 $$e^x=\left(\sum_{k=0}^n\frac{x^k}{k!}\right)+\int_0^x\frac{(x-t)^n}{n!}e^tdt$$ $$ \left(=1+x+\frac{x^2}{2}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots+\frac{x^n}{n!}+\int_0^x\frac{(x-t)^n}{n!}e^tdt\right)$$ シグマ記号で書いた部分について、階乗の定義により0!=1です。
n=1の時には次のようになるので成立しています。(n=0の時から考えても可です。) $$e^x=1+e^x-1=1+\int_0^xe^tdt=1+\int_0^x\left\{\frac{d}{dt}(t-x)\right\}e^tdt$$ $$=1+\large{\left[(t-x)e^t\right]_0^x}-\int_0^x(t-x)\left(\frac{d}{dt}e^t\right)dt$$ $$=1+\frac{x}{1!}+\int_0^x\frac{(x-t)}{1!}e^tdt$$ (n=0から始める場合は\(\large{e^x=1+\int_0^xe^tdt=\frac{x^0}{0!}+\int_0^x\frac{(x-t)^0}{0!}e^tdt}\) であり、証明すべき式は成立しています。 ですが、分かりやすさのためにここではn=1から始めています。)
n=kの時に証明すべき式が成立すると仮定し、
定積分の項に対して部分積分の公式を適用すると次のようになります。 $$\large{ e^k=1+x+\frac{x^2}{2}+\cdots+\frac{x^k}{k!}+\int_0^x\frac{(x-t)^k}{k!}e^tdt }$$ $$\large{ =1+x+\frac{x^2}{2}+\cdots+\frac{x^k}{k!}+\int_0^x\left[\frac{d}{dt}\left\{\frac{-(x-t)^{k+1}}{(k+1)!}\right\}\right]e^tdt }$$ $$\large{ =1+x+\frac{x^2}{2}+\cdots+\frac{x^k}{k!}+\left[\frac{-(x-t)^{k+1}}{(k+1)!}e^t\right]_0^x}$$ $$\large{-\int_0^x\frac{-(x-t)^{k+1}}{(k+1)!}\left(\frac{d}{dt}e^t\right)dt }$$ $$ \large{ =1+x+\frac{x^2}{2}+\cdots+\frac{x^k}{k!}+\frac{x^{k+1}}{(k+1)!}+\int_0^x\frac{(x-t)^{k+1}}{(k+1)!}e^tdt }$$ よってn=k+1の時も確かに成立するので、
任意の自然数nに対して証明すべき式(x=0におけるeのテイラー公式)が成立します。

指数関数に限らず、n階までの微分が可能な関数は同じ計算でテイラー公式を導出可能です。
また、部分積分法を使う計算以外にもテイラー公式を導出する方法は存在します。その場合は最後の剰余項が異なる形になりますが、指数関数や三角関数においてはその時の剰余項もn→∞で0に収束し、部分積分で計算した時と同じく全実数の範囲でテイラー展開が可能です。

応用例2:近似式の導出(スターリングの公式での例)

スターリングの公式は、十分大きい自然数に対する階乗N!についての
自然対数 ln(N!)に対する近似式です。

この近似式の導出過程には主に2つあって1つはガンマ関数を使う方法ですが、
もう1つは階乗に対する対数を近似的な「面積」と見て、自然対数関数の積分で近似する方法です。

ところで前述のように、e を底とする単独の自然対数関数の積分は部分積分によって計算するやり方が見やすいのでした。ここでの使用例は、割と普通に定積分の計算を普通にするために部分積分の公式を使うというものになります。

そこで、積分を考えたところから部分積分を使って具体的に導出過程を見てみます。積分区間は、十分大きい自然数Nと、何か小さい実数 a( >0)を使って [a, N +a]で考えます。

$$\mathrm{ln}(N!)≒\int_a^{N+a}\mathrm{ln}x\hspace{2pt}dx=\int_a^{N+a}\left(\frac{d}{dx}x\right)\mathrm{ln}x\hspace{2pt}dx$$

$$=\large{[x\mathrm{ln}x]_a^{N+a}}-\int_a^{N+a}x\cdot\frac{1}{x}\hspace{2pt}dx$$

$$=\large{[x\mathrm{ln}x]_a^{N+a}}-\int_a^{N+a}dx=\large{[x\mathrm{ln}x+x]_a^{N+a}}$$

$$=(N+a)\mathrm{ln}(N+a)+(N+a)-a\mathrm{ln}a-a=(N+a)\mathrm{ln}(N+a)+N-a\mathrm{ln}a$$

ここで、a が小さくてNは十分大きいとするとN+a ≒N と考えて、
また a ln a の項も他項に比べて小さく無視できるとします。

実際の近似ではNをそれほどを大きくとらなくても十分である時もあるのですが、
例えば分かりやすくNが1万で、aが0.1としましょう。
すると、 10000と10000.1の比較になりますが、
このような時には両者の差は十分小さいと見れるわけです。

すると、残った項により式を次のように近似できます。

$$\mathrm{ln}(N!)≒(N+a)\mathrm{ln}(N+a)-a\mathrm{ln}a+N≒N\mathrm{ln}N +N$$

これがスターリングの公式あるいはスターリングの近似式と呼ばれる近似式です。
主に統計力学などで使用されます。

応用例3:変分問題での例
(オイラー・ラグランジュ方程式)

理論物理学で非常に重要となる変分に関する基本的な問題(と言っても決して易しくありませんが)であるオイラー・ラグランジュ方程式(あるいは「オイラー方程式」)の導出過程では、実は計算としては部分積分を使います。しかも、使うと計算が便利というだけでなく関係式を導出するにあたって肝心となる式の変形を担っています。これは数学の問題でもありますが、むしろ物理学等のほうに関連が深い話となります。

部分積分を使う箇所に絞って取り上げると、次のような計算問題です。

積分の計算問題(オイラー・ラグランジュ方程式の導出過程)

xについての閉区間 [a, b]があり、η(a)=η(b)=0を満たす任意の関数η(x)がある。
また、xについての関数F(x) と F2(x)があり、 次の式が成立しているという。 $$\int_a^b\left\{\eta(x)F_1(x)+\frac{d\eta(x)}{dx}F_2(x)\right\}dx=0$$ この時、実はη(x)を含まない形でF(x) と F2(x)に関する微分方程式が成立しますが、
それは具体的にどのような関係式となりますか。

具体的な関数の形が一部の条件以外は何もありませんから、普通に定積分をこのまま計算するという事はできません。しかし、定積分の中身にη(x)という関数の導関数dη(x)/dxと、別の関数F(x)の積の形が含まれている事に注意すると、部分積分の公式を使う事ができるのです。

そこで、(dη(x)/dx)F(x) の項について部分積分の公式に当てはめて計算を進めてみます。

$$\int_a^b\frac{d\eta(x)}{dx}F_2(x)dx=\large{[\eta(x)F_2(x)]_a^b}-\int_a^b\eta(x)\frac{dF_2(x)}{dx}dx$$

$$=\eta(b)F_2(b)-\eta(a)F_2(a)–\int_a^b\eta(x)\frac{dF_2(x)}{dx}dx$$

$$\eta(a)=\eta(b)=0の条件により、\int_a^b\frac{d\eta(x)}{dx}F_2(x)dx=-\int_a^b\eta(x)\frac{dF_2(x)}{dx}dx$$

つまり、積分区間の端点における条件η(a)=η(b)=0がありましたから、
部分積分の行った後の第1項(値を代入する部分)は0となって「消える」わけです。
すると、実質的には元の定積分の中身に対して符号を入れ換えたうえで「微分する対象を入れ換える」
という変形ができた事も意味します。

物理等での部分積分法の活用方法

このようにできたりする事が、物理等で部分積分が要所の計算で意外に活用される大きな理由の1つです。つまり、0になってしまう項や0に近似できる項を分離して「消してしまう」事で、関数の全体の形を変形する手段として部分積分法が使われる事があります。
ここでの例は閉区間内の定積分ですが、無限大で関数が0に収束する条件を使う事で部分積分法を適用した時の1つの項を「消す」という場合もあります。後述の量子力学での波動関数などはその例です。

部分積分を行っていない項と合わせると、次のようになります。

$$\int_a^b\left\{\eta(x)F_1(x)+\frac{d\eta(x)}{dx}F_2(x)\right\}dx=\int_a^b\left\{\eta(x)F_1(x)-\eta(x)\frac{dF_2(x)}{dx}\right\}dx$$

$$=\int_a^b\eta(x)\left(F_1(x)-\frac{dF_2(x)}{dx}\right)dx$$

$$今、\int_a^b\left\{\eta(x)F_1(x)+\frac{d\eta(x)}{dx}F_2(x)\right\}dx=0という条件であり、$$

$$\eta(x)は端点での条件を満たす「任意」の関数形なのでF_1(x)-\frac{dF_2(x)}{dx}=0$$

つまり、F(x)-(d/dx)F(x)=0が、η(x)を含まない形でのF(x)とF(x)が満たす微分方程式である、という事になります。(※η(x)が「任意」でなかったら、積分全体が0であるからといって被積分関数またはその一部が0だとは言えませんので注意も必要です。)

変分問題とオイラー・ラグランジュ方程式

上記の問題の元の形を一応記しておくと次のようになります。
比較関数η(x)を使わないで内容としては同じ問題を考える場合もあります。
■問題:
閉区間 [a, b] において関数y=y(x)があって、sを実数としてy(x)にsη(x)という関数を付け加えたものを考える。(関数形自体を自由に変形するという事。)
y(a) および y(b) は定数で、η(a)=η(b)=0の条件のもと、 x,y,y’(=dy/dx)を変数として表される別の関数F(x,y,y’)があるという。
その条件下で [a, b] におけるF(x,y,y’)に対するxでの定積分I[y]を最小にするyの関数形が存在する時、F(x,y,y’)についてη(x)を含まない形で成立する式は何ですか。
【答え:微分方程式 ∂F/∂y-d/dx(∂F/∂y’)=0】 $$y(a)およびy(b)が定数であり、\eta (a)=\eta (b)=0の条件のもと、$$ $$I[y]=\int_a^bF(x,y,y^{\prime})dxを最小にするy(x)の関数形に対して次式が成立します。$$ $$\frac{\partial F}{\partial y}- \frac{d}{dx}\left(\frac{\partial F}{\partial y^{\prime}}\right)=0$$ この「オイラー・ラグランジュ方程式」は式に偏微分を含みますが、微分方程式としてはxに関する「常微分方程式」になります。yもdy/dxも、最終的にはxの関数として表せるためです。ただし実際問題としてはyなどをそのままの形で残して扱う場合も多いです。

応用例4:遠方で0になる関数の積分(量子力学など)

変分問題と同部類の部分積分の応用例としては、他にも
無限遠で0に収束する関数の積に対する(-∞,+∞)の範囲で行う積分などがあります。
量子力学で扱う波動関数(あるいは「状態」を表す関数)に対する積分計算はその例です。

波動関数の場合で言うと、無限遠と言っても正確には「ミクロのスケールから見て十分遠方の位置」を指しており、つまりメートル単位の遠方はそのような「十分な遠方」に該当します。ただし数式的にはとりあえず、それを無限大として扱うわけです。

そのような時、2つの波動関数ΨとΨがあるとします。(あるいは波動関数でなくても、遠方での条件が類似するような関数。)そのうちの片方の位置による微分(偏微分)による導関数と、もう片方の積(∂Ψ/∂x)Ψを考えて積分を(-∞,+∞)で行うとしましょう。部分積分に関しては積の微分を根拠にした公式ですので、偏微分で行っても1変数の微分でも同じ形になります。また、量子力学では波動関数は一般的には複素数関数ですが、やはり部分積分は適用可能です。

(∂Ψ/∂x)Ψに対する積分を、部分積分によって変形すると次のようになります。

$$\int_{-\infty}^{\infty}\frac{\partial \psi_1}{\partial x}\psi_2 dx=\large{[\psi_1\psi_2]_{-\infty}^{\infty}}-\int_{-\infty}^{\infty}\psi_1\frac{\partial \psi_2}{\partial x} dx$$

$$=-\int_{-\infty}^{\infty}\frac{\partial \psi_2}{\partial x} \psi_1dx$$

無限遠方でΨとΨは0と考えているので、部分積分を行った後の第1項は0になって「消える」わけです。すると、符号の入れ替えはありますが「微分する対象が入れ替わった積分」として式を変形できるという結果を得ます。

これを利用して近似式を考えたり、微分を含む演算子の作用の関係を考察できたりします。
量子力学における波動関数でなくても、類似の条件の関数に対する積分を計算する時は部分積分による近似計算は全く同じように可能となります。ただしそういった条件の関数に対して上記のような積分を行う典型例としては、量子力学の波動関数を挙げる事ができるという事です。

ここでは簡単のために上記のような例で考えましたが、先ほど触れたように波動関数は一般に複素数関数ですので多くの場合では波動関数Ψに対する「共役」\(\overline{\psi}\)(概略としてはいわゆる複素共役)も考えて理論を展開します。

応用例5:ガンマ関数の関係式の導出

より数学的な話ですが、ガンマ関数(特殊関数の1つ)に対して成立する関係式
Γ(x+1)=xΓ(x)は、実は部分積分の公式を使った比較的簡単な直接計算によって導出されます。

ガンマ関数は次のようにそもそもが積分で表される関数です。定義域はx>0として必ず考えます。
そのため、積分区間の端点の「0」のほうも「0への極限を考える」という意味になります。

$$\Gamma(x)=\int_{0}^{\infty}t^{x-1}e^{-t}dt$$

ガンマ関数に対して成立する関係式

定義域であるx>0における任意の実数xに対して、次の関係式が必ず成立します。$$\Gamma(x+1)=x\Gamma(x)$$ この関係式においてxが自然数である場合を敢えて考えて少し計算をすると、自然数に対するガンマ関数の値は階乗の形で表される事が分かります。

変数をx+1に置き換えたΓ(x+1)について、積分中の指数関数のほうに対して部分積分を考える事で変形ができます。(前述のxeのような関数の積分に対して部分積分を行う時と同じ考え方です。)

$$\Gamma(x+1)=\int_{0}^{\infty}t^xe^{-t}dt=\int_{0}^{\infty}t^x\left(\frac{d}{dt}-e^{-t}\right)dt$$

$$=\large{\left[-e^{-t}t^x\right]_0^{\infty}}-\int_{0}^{\infty}\left(\frac{d}{dt}t^x\right)\left(-e^{-t}\right)dt$$

$$=-\lim_{t\to\infty}\frac{t^x}{e^t}+\lim_{t\to 0}\frac{t^x}{e^t}+\int_{0}^{\infty}xt^{x-1}e^{-t}dt$$

$$\lim_{t\to\infty}\frac{t^x}{e^t}=0\hspace{2pt}であり、\hspace{2pt}\lim_{t\to 0}\frac{t^x}{e^t}=0\hspace{2pt}なので$$

$$\Gamma(x+1)=\int_{0}^{\infty}xt^{x-1}e^{-t}dt=x\int_{0}^{\infty}t^{x-1}e^{-t}dt=x\Gamma(x)$$

最後の箇所では、xはここでの積分においては定数扱いとなるので積分全体に乗じられる定数としています。(テイラー公式を部分積分で導出した計算と同じ考え方です。)

このような計算によって導出がされるわけで、Γ(x+1)=xΓ(x)の関係において
「1」という自然数がどこから出てくるのかというと、xを定数扱いする時に
「tによる微分計算でtの指数が1減る事」つまり(d/dt)t=tx-1という、微分の計算方法を知っていれば非常に単純な式に由来する事が分かります。

ここでも「xは定数扱い」としている事が重要で、
(d/dt)t は (d/dx)tとは異なるのです。
(d/dx)t をもし計算するなら、それは指数関数の微分になるので異なる結果となります。 $$\frac{d}{dt}t^a=t^{a-1}の計算をしていて、これは\frac{d}{dx}a^x=\mathrm{log}_ea^xとは異なります。$$

また、この計算では部分積分の公式を適用した時の第1項が0になる事(ここでは極限値として0)を利用しているとも言えるので、広い意味では前述の変分問題や波動関数に対する積分での部分積分法の使い方と同部類のものであるとも言えるでしょう。

上記の計算で少し分かりにくい所は、途中の極限の項が0に収束するという箇所でしょうか。
t→∞(無限大)だけでなくt→0の極限も考えている(定義域がx>0でt>0でもあるので)わけですが、いずれの場合も、t/e(=te-t)という関数についての
「任意の実数x>0に対する」t→0とt→∞の極限を考えています。
ただし、t→0の極限のほうは実質的に「tに0を代入」で済む話となり、xがいかなる値であっても極限値は0であるとすぐに分かります。
他方でt→∞の極限のほうも結論から言うと極限値は0となりますが、
数式的にはt/e(=te-t)という関数において
任意の実数x>0に対してt→∞の時 t/e →0かどうか?を少し考える必要があります。
これは例えばx=2でもx=100でも、
t→∞の時に t/e →0でありt100/e →0であるかという問題です。
この極限は、直感的にはtに対する指数がいかに大きくても、分母の指数関数のほうが最終的には圧倒的に大きくなるので「t→∞で0に収束する」と理解できます。
数式でそれを明確にする方法はいくつかありますが、例えばロピタルの定理という微積分での計算法を使うと、比較的簡単な計算によって任意のx>0についてt/e のt→∞での極限が0になる事を示せます。

置換積分の公式

置換積分は「ちかんせきぶん」と読みます。
「置換積分の公式」「置換積分法」とも言い、1変数の積分における公式の1つです。定積分にも不定積分にも、どちらにも使えます。微積分学の基本定理および部分積分と並んで、置換積分は定積分の計算法としてよく使われる公式です。

積分の理論全般について言える事ですが、積分の逆演算である微分のほうについて計算をある程度知っておくと分かりやすくて便利です。また、この記事の説明では三角関数や対数関数の公式なども比較的多く使用します。

置換積分は「1変数での定積分」に対して適用できる公式です。すなわち「2変数以上で積分を行う重積分においては適用できない」ので、その点は注意が必要です。
ただし、物理等での応用では一般論としては2変数・3変数の関数を扱っても具体的な事例を考察する時にはモデルを工夫して「計算は1変数で実行できる」ようにする事も少なくないのです。ですから1変数の定積分に関する公式も、初歩的だからといって役に立たないという事では無く、むしろ可能であれば積極的に使用される性質のものではあります。

公式の内容と意味

置換積分の「置換(ちかん)」とは「置き換える」という意味で、
被積分関数(積分の対象となっている関数)の「積分変数を別の変数に変換する」という事を意味します。つまり置換積分とは、積分における積分変数に対する変数変換を行う時に成立する公式です。

置換積分の公式は不定積分に対しても定積分に対しても成立します。

置換積分の公式(不定積分)

連続関数f(x)に対してx=g(w)がwで微分可能である時、
その積分区間でのf(x)のxを積分変数とする定積分はxをwで変数変換し、
積分変数をwとして次式で計算できます。 $$\int f(x)dx=\int f(g(w))\frac{dx}{dw}dw$$ この時、普通はあまり気にする必要はないですが\(\Large{\frac{dx}{dw}}\)は連続関数になっている必要があります。

この式で\(\Large{\frac{dx}{dw}}\)はx=g(w)をwで微分して得られる導関数を表します。

ここでは変数変換を行う対象をwとしてますが、文字としてはtでもsでも、変数だと分かるもので何かの誤解を生じないものであれば何でも構いません。後述する具体例では、xを角度θに変数変換して置換積分を行う場合の計算例を説明しています。

「覚え方」としては見かけ上「dx=(dx/dw)・dw」としたようになっており、微分の元々の意味から言うと必ずしも間違った捉え方でもありませんから、そのように理解してもよいと思います。ただし、1変数の時以外ではその考え方は一般的には使えませんので注意も必要です。
(特別な場合では、多変数でも同様の考え方を適用できます。)
数学上の定義では(dx/dw)はひとまとまりで微分により得られる導関数を表し、
「積分と一緒に使うdxやdwという記号」はあくまで積分変数を表す記号になります。

代入操作以外に「微分」がかならずくっついてきます。

次に、定積分の場合です。
この場合には変数変換をする時に、積分区間も変換される事に注意が必要となります。
その時に普通は2つの端点だけを変換すれば十分で、
例えばx=w+2のような変換の場合には、xに関する [0,1] の閉区間はwに関する [2.3] の閉区間となって積分区間が変更されるのです。(そうしないと計算の結果は合いません。)

置換積分の公式(定積分)

連続関数f(x)に対してx=g(w)がwで微分可能であり、
xに関する積分区間 [α,β] をwによって [a,b] = [g(p),g(q)] で表せるとします。
(つまりwでの積分区間は [p, q] となる。)
その積分区間でのf(x)に対するxを積分変数とする定積分は、
xをwで変数変換し、積分変数をwとして次式で計算できます。 $$\int_a^bf(x)dx=\int_{g(p)}^{g(q)}f(x)dx=\int_p^qf(g(w))\frac{dx}{dw}dw$$ 不定積分の時同様に、普通はそんなに気にする必要はないですが
\(\Large{\frac{dx}{dw}}\)は考えている区間において連続関数になっている必要があります。
例えばxに関する閉区間 [-1,1]が積分区間の時に、x=1/wのような変換をしたいと思ったら(あまりそういう変換はしないのですが)x=0となるwの値は存在せず、不連続点が発生するわけです。そういった変換をしてしまうと計算が変になります。
(x=1/wのような場合、w→∞での極限ではx→0に収束するので、強いて言えば積分区間を分けて端点での極限を考える「広義積分」として捉える事自体は可能です。しかしそういった場合にはまた別の数学的な考察も必要になります。)

置換積分の公式を適用する時に行う操作を整理し、列挙すると次の事です。

  1. y=f(x)に対してx=g(w)である時、
    wで表される式をf(x)に代入してy=f(g(w))の形にする。
  2. x=g(w)について、xをwで微分する。
    (なので、微分可能な関数による変換でないと公式は使えません。)
  3. 積分の中のy=f(g(w))に対してxに対するwによる微分(導関数)を掛け算し、積分変数をxからwに変える(dxからdwに変える)。それからwで積分をする。
  4. 特に定積分の場合にはxでの積分区間が [a, b] であったら、
    a =g(p),b=g(q) となるようなw=pとw=qを見つけて、積分区間を [p, q]に変更する。
    一応、不連続点が発生するような変換をしていないかどうかに少し注意。
  5. 不定積分の場合は、wで出された結果をxに戻す事も多い。
    (定積分であれば結果は基本的には数値の事が多いです。)

ただしこの手順の2番目でx=g(w)と考える事については、後述する具体例で見るようにw=h(x)の形で置き換えをしてから、その逆関数としてx=g(w)を考えるような場合もあります。(微分については、公式dw/dx=1/(dx/dw)を使えます。)ただしそのような変数変換のパターンでも、逆関数を考えずに積分を計算できるといった場合もあります。それらの事については、具体例を見たほうが多分分かりやすいでしょう。

「置換」という言葉は数学で単独の意味で使われる事もあって、それは順序を持つ集合の要素を「並べ替える」事を指します。1つの順列を、別の順列に変換する事であると言っても大体同じです。もう少し詳しく言うとそのような「写像」を指して「置換」と呼ぶことがあります。
他方で、1変数の定積分での「置換積分」はあくまで「変数変換」という意味での「置き換え」を行う時に成立する公式を指しています。ですので「置換積分」という呼び名は基本的にはその言葉全体でひとまとまりの意味を持っています。

公式の証明

置換積分の公式は、覚え方や理解の仕方としては「dx=(dx/dw)dw」と考える事に差し支えはないけれども、それを数学的な証明とする事はできません。ですのであのような公式が成立する事は自明な事であるとは言えず、証明が必要となります。

証明は、微積分学の基本定理および合成関数の微分法などの微分の演算を組み合わせる事で行えます。(これは数学の解析学的に見た場合も同じで、極限や積分の大元の定義に戻って考える必要はありません。微分の演算等を利用して「解析学的に見ても厳密な証明」になっています。)

最初に不定積分のほうの置換積分の公式を証明します。

まず、「微分すればf(x)になる」という意味でのf(x)の「原始関数」を考えます。この原始関数自体は、任意定数(微分すると0)を加える事で一意的に定まらず無数に存在しますが、そのうちの特定の1つをF(x)とおきます。原始関数全体が不定積分に該当します。(不定積分は、1つの原始関数があった時にはそれに定数を加えたF(x)+Cの形しかとり得ないという定理があります。)

$$Cを任意の実数定数として\int f(x)dx=F(x)+C$$

$$この時、\frac{d}{dx}\int f(x)dx=\frac{d}{dx}\left(C+F(x)\right)=f(x)が成立$$

今、x=g(w) がwで微分可能とすると f(x) の原始関数F(x) はwでも微分可能で、合成関数の微分公式により F(x) をwで微分して得られる導関数は次のように書けます。

$$\frac{d}{dw}F(x)=\frac{dF(x)}{dx}\frac{dx}{dw}=f(x)\frac{dx}{dw}=f(g(w))\frac{dx}{dw}$$

という事は、最右辺の形の関数に対するwに関する原始関数の1つはF(x)である事になります。あるいは、微分方程式を解くと捉えてwで積分すると考えても同じです。

$$Cを任意定数として、\int f(g(w))\frac{dx}{dw}dw=F(x)+C$$

$$\int f(x)dx=F(x)+Cであったから、\int f(g(w))\frac{dx}{dw}dw=\int f(x)dx$$

定積分の場合は、「不定積分の場合とほぼ同じ」としてもそんなに問題はないのですが、積分区間に関して「端点の部分だけ対応させればよい」事を明確にするために次のような形で証明を行います。

x=g(w)のもとで、g(p)= a でありg(q)= bであるとして、F(x)を先ほどと同じくf(x)の原始関数の1つであるとします。F(x)をwの関数として見る(wだけの式で書く)事を強調するならF(x)=F(g(w))です。不定積分の時の結果は得られているというもとでwに関してf(g(w))(dx/dw)の定積分を計算すると次式になります。

$$\int_p^qf(g(w))\frac{dx}{dw}dw=\large{[F(g(w)) ]}_p^q=F(g(q))-F(g(p))$$

$$=F(b)-F(a)=\int_a^bf(x)dx=\int_{g(p)}^{g(q)}f(x)dx$$

つまり、定積分を行う時には不定積分の時の結果と合わせて、積分区間の端点についてだけxとwとで対応させれば確かに同じ計算結果を得るという事が言えるわけです。

計算例1:円と楕円の面積計算

おそらく、置換積分が「計算に有効な事もある」という事が非常に分かりやすい例の1つは
円や楕円の面積を定積分で計算する場合ではないかと思われます。

円の面積に関しては平面幾何的な考察で「半径×円周率」という事が分かるほかに、積分を使うにしても実は円周の長さを表す「半径×2×円周率」の式で半径rに関して積分すればよいという方法もあるのですが、ここでは直交座標上でxに関して積分する場合を見てみます。

原点を中心とする円を考えて、半径はrであるとします。(r>0)
そして、xとyがともにプラスの範囲における4分円(円の1/4の部分だけ考えたもの)の面積についてだけ考えてみます。円全体の面積はその4倍です。

円を表す式はx+y=rです。yについて解くとy≧0のほうの解は\(y=\sqrt{r^2-x^2}\)となります。これをxに関して0からrまで積分すれば「πr/4になるはず」ですが、実際のところは一体どうなのだろうという話です。

そのタイプの関数の不定積分は実は直接的に逆三角関数を使っても表せるのですが、置換積分を使うと計算がより簡単であり、「角度」を使って積分できるようになるので図形的なイメージがしやすくなる利点があります。
(参考:逆三角関数を使う方法は、部分積分による計算です。)

そこで、x=rcosθという変数変換をします。rは定数(円の半径)でθは変数です。この変数変換は「極座標変換」でもありますが、置換積分を行うという積分の計算だけに着目する場合には、変数変換は図形的な意味を持つ必要は必ずしもありません。
例えば、ここでの計算ではx=rsinθとする事も可能で、同じ積分の結果を得ます。(ただし、図形上の考察であれば図と対応させたほうが分かりやすい場合というのはあります。)

この変換のもとで置換積分を考えると、三角関数の公式 sinθ+cosθ =1により平方根を除いて計算できるようになるので積分の見通しが良くなるのです。積分区間はxについて の[0,r]をθについての [π/2,0]に変えます。数の大小について一見妙に見えるかもしれませんが、余弦が0から1に増える時は角度は小さくなっていきます。それをそのまま公式に当てはめて計算します。

$$x=r\cos\theta および\frac{dx}{d\theta}=-r\sin\theta を置換積分の公式に当てはめると、$$

$$\int_0^r\sqrt{r^2-x^2}dx=\int_{\large{\frac{\pi}{2}}}^0\sqrt{r^2-r^2\cos^2\theta}\frac{dx}{d\theta}d\theta$$

$$=\int_{\large{\frac{\pi}{2}}}^0r\sin\theta(-r\sin\theta)d\theta =-r^2\int_{\large{\frac{\pi}{2}}}^0\sin^2\theta d\theta=r^2\int_0^{\large{\frac{\pi}{2}}}\sin^2\theta d\theta$$

$$=r^2\int_0^{\large{\frac{\pi}{2}}}\frac{1-\cos 2\theta}{2}d\theta(加法定理か倍角の公式より)$$

$$=\frac{r^2}{2}\large{\left[\theta -\frac{1}{2}\sin 2\theta\right]_0^{\large{\frac{\pi}{2}}}}=\frac{r^2}{2}\cdot\large{\frac{\pi}{2}}=\frac{\pi r^2}{4}$$

つまり、確かに円の4分の1の面積を表す結果となりました。(最後の部分で原始関数に値を代入する箇所では、1次式の θ にπ/2を代入した項以外は全て0となります。)
途中計算での sinθの積分を行う時には余弦関数の加法定理を変形して(もしくは倍角の公式を適用)計算を行っています。

楕円の場合も同様に原点を中心としてx≧0,y≧0の範囲で全体の1/4を考えて計算できます。
楕円を表す式はx/a+y/b=1です。aもbもプラスの数であるとします。この式をyについて解くとy≧0のほうの解は次のようになります。

$$y=\sqrt{b^2-\frac{b^2x^2}{a^2}}=\frac{b}{a}\sqrt{a^2-x^2}$$

この式の形を見ると、円の時の式でr=aとして全体をb/a倍にしたものになっています。
ですので円の場合と同様に置換積分で計算する事ができますが、
楕円(の4分の1)において積分する区間もxについて[0, a]なので
「半径aの円の、積分によって導出した面積のb/a倍」を考えても同じ結果になります。

$$楕円全体で計算すると、4\cdot\frac{\pi a^2}{4}\cdot\frac{b}{a}=\pi ab$$

これが楕円の面積を表す式になります。図形的には、2aおよび2bはどちらが長いか短いかで「長径」と「短径」を表します。また、a=bであれば円になりますが、面積の式もきちんとそれに対応している事が分かります。さらに円を「縦や横の一方向にだけ拡大縮小した場合」にはその倍率の分だけ面積も増加または減少する事が、数式的に見れるわけです。(a=bの状態から例えばa=2bとすれば面積もa=bの時の2倍になります。)

計算例2:物理・電磁気学での使用例

物理での計算で、考察の対象によっては置換積分が計算に使える事があります。

例えば電磁気における特定の場合などです。ここでは電気のほうで例を見てみましょう。
静電気力と電場に関する1つの計算例です。
長さが2L[m]の直線状の棒が、線密度λ[C/m]で一様に帯電している(1mあたりの電荷がλ[C])とします。この棒の中心から棒に対して垂直にr[m]の位置において、電場の大きさ(1[C]の電気量の電荷が受ける力)はいくらになるでしょうか。

棒の中心を原点にとり、そこからの距離を向きを含めてx[m]とします。それぞれの微小な区間における電気量はλdx[C]で、電場を考える位置までの距離は三平方の定理を使って(x+r)1/2[m]です。クーロン力が働くと考えるとそれの逆2乗に比例するので(x+r)-1が式に乗じられます。

棒に帯電している電荷が対称的な分布である事を考えると、棒の中心を通る垂線上では電場のベクトルの「合計」の向きは棒に対して垂直です。(棒の平行な向きの成分はプラスマイナスで打ち消して0です。1つ1つの電場ベクトルの向きは基本的に斜め方向。)そこで、成分の比率を考えると棒に対する垂直方向成分の割合は図形的な関係からr/(x+r)1/2になります。比例定数をkとすると、電場は微小区間による帯電が作る電場(ベクトル)の合計なので、棒に対する垂直成分の合計は積分で考える事ができて次のようになります。(ここで変数はxのみです。)

$$E=\int_{-L}^{L}\frac{k\lambda}{(x^2+r^2)}\frac{r}{\sqrt{x^2+r^2}}dx=k\lambda r\int_{-L}^{L}\frac{1}{\large{(x^2+r^2)^{\frac{3}{2}}}}dx$$

それで、この積分は原始関数を探す事で計算できるのかという話なのですが、
これは実は置換積分を行う事で計算できる部類の式です。

図で、x=rtanθとなるように角度θをとります。棒の端点ではθ=θLおよび-θLであるとします。これはx=Lとx=-Lに対応するわけです。すると、dx/dθ=r/cosθである事を使って置換積分を行うと次のようになります。

$$\frac{dx}{d\theta}=\frac{d}{d\theta}(r\tan\theta)=\frac{r}{\cos^2\theta}であり、$$

$$x^2+r^2=r^2(\tan^2\theta +1)=r^2\frac{1}{\cos^2\theta}にも注意して$$

$$E=k\lambda r\int_{-\theta_L}^{\theta_L}\frac{1}{\large{(r^2\tan^2\theta+r^2)^{\frac{3}{2}}}}\frac{dx}{d\theta}d\theta=k\lambda r\int_{-\theta_L}^{\theta_L}\left(r^2\frac{1}{\cos^2\theta}\right)^{\large{-\frac{3}{2}}}\frac{r}{\cos^2\theta}d\theta$$

$$=k\lambda r\int_{-\theta_L}^{\theta_L}r^{-3}\cos^3\theta\frac{r}{\cos^2\theta}d\theta=\frac{k\lambda}{r}\int_{-\theta_L}^{\theta_L}\cos\theta d\theta=\frac{k\lambda}{r}\{\sin\theta_L-\sin(-\theta_L)\}$$

$$=\frac{2k\lambda}{r}\sin\theta_L=\frac{2kL\lambda}{r\sqrt{r^2+L^2}}$$

電場の大きさの単位は [N/C] になります。最後の変形は図形的に見て正弦を辺の比で表しています。物理的な考察としては、単独の点電荷の場合とは距離の影響が異なってくる事や、L→∞とした場合はどうなるかといった事を見れます。

少し長ったらしい計算ではありますが、このように結果を出せるわけです。一見複雑な積分でも置換積分を行うと、角度θでの積分だと意外と単純な定積分計算に変わった事が分かります。この例では、置換積分で使う変数変換を図の関係にも合わせる事によって、図で平面幾何的に成立する関係も使えるようになっています。(例えば三角関数を辺の比で表す事など。)このように上手く行く事ばかりではないのですが、置換積分の公式を応用計算に使える事もあるという例の1つです。

力のベクトルを2方向に分解して考える事はこの例の状況に限らず、どんな時でもできます。ここでの例の状況下では、棒の中央に引いた垂線上では静電気力の「帯電した棒に対して平行な成分」は常に0であり、棒に対する垂直方向の成分のみを考えればいいという事です。

似た計算は磁場に関しても可能で、ソレノイドが作る磁場や、直線電流が作るビオ・サバールの磁場を具体的に計算する時なども似た感じの積分計算を行います。

計算例3:数学上の色々な不定積分の計算

微分に関しては多少複雑な形の関数であっても、公式を組み合わせて丁寧に計算すれば導関数を計算できるのが普通です。しかし、積分のほうに関してはそれほど複雑でない形の関数に対してでも原始関数の具体的な形を直接見つける事は難しい場合のほうが多いのです。そこで、部分積分や置換積分を使うと原始関数が分かる場合があります。

以下の例はどちらかというと数学上の理論的な計算が中心になりますが、一部は応用にも使えます、

具体的な積分に対して置換積分を使える場合というのは、実際のところは2パターンあります。

  • x=g(w) の形で置き換えをすると式が簡単になる場合
  • xで表される式についてh(x)=wとおいてから逆関数としてx=g(w)を計算して公式を適用するか、もしくはdw/dxを計算した式を使うという場合

前者の場合は公式通りの使い方です。前述の円の面積を積分で計算する方法や、電場の大きさを計算する過程での置換積分の使用においてはこちらのパターンです。すなわち例えばx=rcosθ やx=rtanθのように変数変換をしたのでした。

他方で後者のほうは、一般的には面倒な形になっているxの式を別の1つの変数としてしまってから、何らかの方法で置換積分ができるところまで持って行くというものです。
これは例えば、w=xであるとかw=tanxとする事を指しており、それでもあくまでxの代わりにwによる変数変換で置換積分を行うという例です。多少分かりにくいと思うので後ほどw=tan(x/2)とする例などで具体的に説明していきます。

原始関数がいくつかの和や差の項に分離するパターン

まず、「微妙に定数分だけ値がずれた項を含む」関数の原始関数を計算する場合です。
例えば\(x\sqrt{x+2}\) などの積分です。

もしこれが\(x\sqrt{x}\)であれば、平方根の部分はx1/2ですので
全体をx3/2として考えて原始関数は(2/5)x5/2+Cとなるわけです。

この考え方のみでも一応計算はできて、
それは\(x\sqrt{x+2}=(x+2)\sqrt{x+2}-2\sqrt{x+2}\) とする事で可能になるのです。

$$\int x\sqrt{x+2}dx=\int\{(x+2)\sqrt{x+2}-2\sqrt{x+2}\}dx$$

$$=\int(x+2)^{\frac{3}{2}}dx-\int2(x+2)^{\frac{1}{2}}dx$$

$$=\frac{2}{5}(x+2)^{\frac{5}{2}}-\frac{4}{3}(x+2)^{\frac{3}{2}}+C$$

この積分は実は置換積分で考えてもよくて、x=w-2と置く事で、置換積分の公式を使えます。
\(x\sqrt{x+2}=(w-2)\sqrt{w}=w\sqrt{w}-2\sqrt{w}\) となります。つまり、若干の違いではありますが「差で表される2つの項に分離する」事が少しばかり自然な形で計算されます。置換積分を行う時にはさらに微分の計算も必要なわけですが、この場合はdx/dw=1ですので簡単に済みます。

$$\frac{dx}{dw}=\frac{d}{dw}(w-2)=1に注意して、$$

$$\int x\sqrt{x+2}dx=\int(w-2)\sqrt{w}\frac{dx}{dw}dw=\int(w\sqrt{w}-2\sqrt{w})dw$$

$$=\frac{2}{5}w^{\frac{5}{2}}-\frac{4}{3}w^{\frac{3}{2}}+C=\frac{2}{5}(x+2)^{\frac{5}{2}}-\frac{4}{3}(x+2)^{\frac{3}{2}}+C$$

最後にwをxに戻す操作ではx=w-2 ⇔ w=x+2を使っています。

置換積分を行う時に、まずw=x+2とおいてから計算を進めても結果は同じです。
この場合は、どちらの方法で最初に考えてもそんなに手間は変わらないと思います。
他方で、平方根の部分を丸ごとwに置き換えて\(\sqrt{x+2}=w(\Rightarrow x+2=w^2)\)と考えてもこの場合は計算は可能で、同じ結果を得ます。

いずれにしても、このようなちょっとした初等関数を組み合わせた関数に対してでも、原始関数は結構面倒な形である事が分かります。計算はやりやすい方法でやればよいのですが、2通り以上のやり方を知っておくと片方を検算用に使えるというちょっとした利点はあります。

三角関数に変換すると上手く計算できるパターン

「見事に上手く行く」例は限られていますが、
xを三角関数に変数変換すると原始関数が分かり、積分を計算できる場合があります。

例えば、1+xという項が含まれる関数では、
x= tanwと変数変換すると上手く計算できる場合があります。
というのも、(d/dw)tanw=1+tanw=1/(cosx)といった計算ができるためです。
前述の電磁気学での電場の計算例で使用した変数変換は、このパターンに属する置換積分です。
被積分関数の分母に含まれる式が1+xではなくr+xでしたから、変数変換はx= rtanθとする事によって、代入するとr(1+tanw)のようにできる工夫をしていたわけです。

また、同じく前述の円の面積計算のところで考察した (1-x)1/2などの式の場合は
x=coswとすれば(1-cosw)1/2=(sinw)1/2=|sinw|などとできます。
【wの範囲によっては(sinw)1/2=sinwで、前述の例では定積分の積分区間がその範囲です。】

x= tanwと変数変換して上手く行く他の例は、例えば次のようなものです。不連続点が発生しないようにするために-π/2<w<π/2の範囲で考えるものとします。(その範囲では cosw>0です。)
(1+x)1/2=(1+tanw)1/2={1/(cosw)}1/2=1/cosw
1+tanw=1/(cosw) ⇔ cosw=1/(1+tanw)
およびdx/dw=1/coswの計算を使います。

$$\int\frac{x}{(1+x^2)\sqrt{1+x^2}}dx=\int\frac{\sin w\cos^3w}{\cos w}\frac{dx}{dw}dw=\int\frac{\sin w\cos^3w}{\cos w}\frac{1}{\cos^2w}dw$$

$$=\int\sin wdw=-\cos w+C=-\frac{1}{\sqrt{1+\tan^2 w}}+C=-\frac{1}{\sqrt{1+x^2}}+C$$

この積分に関しては、計算に慣れていると置換積分を行わなくても直接計算で最後の式を最初から出せるかもしれません。

三角関数による有理関数の積分

xをwによる変数変換で置換積分する時に変数変換として「wをxで表すパターン」には、例えばw=tan(x/2)という形の変数変換があります。
その変換のもとでは
dw/dx=1/{2cos(x/2)}={1+tan(x/2)}/2=(1+w)/2により
dx/dw=2/(1+w)
【※普通、逆関数の微分公式を使うと計算後に変数の入れ替えが必要ですが、ここではdw/dxの結果をxではなく「wで表せる」のでそのまま逆数としたものがdx/dwを表す式になります。】
さらに、加法定理や倍角の公式にも注意すると正弦、余弦、正接のいずれをも、
wの有理関数(分子と分母が多項式の形の分数で表される関数)で表す事ができます。

三角関数を置換積分で有理関数として計算する方法

三角関数の有理関数となっている関数の積分を考える時には、
w=tan(x/2)による変数変換を行って置換積分を行うと有理関数の積分の形に必ずできます。 $$w=\tan \frac{x}{2}とする事により、$$ $$\sin x=\frac{2w}{1+w^2}\hspace{15pt} \cos x =\frac{1-w^2}{1+w^2}\hspace{15pt}\tan x =\frac{2w}{1-w^2}$$ $$\frac{dw}{dx}=\frac{1+w^2}{2}\hspace{15pt}\frac{dx}{dw}=\frac{2}{1+w^2}$$ 変数変換を行った後でも、tanθ=(sinθ)/(cosθ)の基本的な三角関数の関係は成立し続けます。

そして有理関数は部分分数展開などをする事により、「(別の)有理関数」「lnx」「Arctanx(逆正接関数)」およびそれらの合成関数のみで表せるという定理が実は存在します。そのため、三角関数の有理関数(つまり三角関数のベキ乗と係数で作られる多項式)は理論上は有限回の操作で原始関数を導出できるという事になるのです。

w=tan(x/2)の変数変換のもとで、正接・正弦・余弦のうち2つを計算すると、もう1つは三角関数の基本的な関係から変数変換後の形を得る事もできます。これを使った置換積分によって、一応理論上は「三角関数による有理関数」の積分は、全て通常の有理関数の積分に置き換える事が可能です。

ただし有限回の操作で計算の実行が可能という事と、
その具体的な計算の効率が良いかどうかは別問題ですので一応注意は必要です。
しかし、比較的単純な三角関数の有理関数の積分であれば、
w=tan(x/2)の形の変数変換による置換積分は積分の計算に活用できます。
例えば1/cosx=(1+w)/(1-w)のようになるので、
これはdx/dw=2/(1+w)と掛け合わせると
(1/cosx)(dx/dw)=2/(1-w)=2/{(1+w)(1-w)}となります。
この形の式は実は部分分数展開で2項の和に分ける事ができるパターンなので、
原始関数を対数関数と三角関数(最後にwをxに戻す)の組み合わせで表す事ができます。

$$\int\frac{1}{\cos x}dx=\int\frac{1+w^2}{1-w^2}\frac{dx}{dw}dw=\int\frac{1+w^2}{1-w^2}\frac{2}{1+w^2}dw$$

$$=\int\frac{2}{(1+w)(1-w)}dw=\int\frac{1}{1+w}dw+\int \frac{1}{1-w}dw$$

$$=\mathrm{ln}\left|1+\tan\frac{x}{2}\right|-\mathrm{ln}\left|1-\tan\frac{x}{2}\right|+C=\mathrm{ln}\large{\left|\frac{1+\tan\frac{x}{2}}{1-\tan\frac{x}{2}}\right|}+C$$

このように、三角関数の逆数を積分すると原始関数には対数関数が含まれて来る事が分かります。
置換積分なしでこの結果を予想するのは少し難しいと言えそうです。

ここで使っている対数は自然対数です。
lnx=logexで、\(\large{\frac{d}{dx}\mathrm{ln}x=\frac{1}{x}}\)であり、
x<0のとき\(\large{\frac{d}{dx}\mathrm{ln}(-x)=\frac{1}{x}}\)なのでまとめて\(\large{\frac{d}{dx}\mathrm{ln}|x|=\frac{1}{x}}\)とも書きます。

1/sinxの不定積分も同じように計算できて、計算はより簡単です。

$$\int\frac{1}{\sin x}dx=\int\frac{1+w^2}{2w}\frac{dx}{dw}dw=\int\frac{1+w^2}{2w}\frac{2}{1+w^2}dw$$

$$=\int\frac{1}{w}dw=\mathrm{ln}|w|+C=\mathrm{ln}\left|\tan\frac{x}{2}\right|+C$$

合成関数の利用によっても原始関数が分かるパターン

ある形をしている関数の積分は、原始関数を直接見つける事は可能だけれども、
もし分かりにくければ置換積分を使うとよいという部類のものです。

具体的には、\(\large{xe^{x^2}}\)や、\(\Large{\frac{1}{x\mathrm{ln}x}}\) などの関数です。
あるいは、正接関数 tanxの原始関数も実は同じ部類のものです。
これらは置換積分で計算する事もできますが、もし合成関数の微分に慣れていると原始関数は直接計算でも導出可能と言える部類の関数です。

1.合成関数の微分を考慮して直接計算で積分する場合

上記の関数の積分を直接計算する時には、例えば次のようにします。

$$\frac{d}{dx}\large{e^{x^2}}=2x\large{e^{x^2}}なので\int\large{xe^{x^2}}dx=\frac{1}{2}\large{e^{x^2}}+C$$

$$\frac{d}{dx}\mathrm{ln}(|\mathrm{ln}x|)= \frac{1}{x}\frac{1}{\mathrm{ln}x}=\frac{1}{x\mathrm{ln}x}なので\int\frac{1}{x\mathrm{ln}x}dx=\mathrm{ln}(|\mathrm{ln}x|)+C$$

正接関数 tanxについても、実は対数関数を使って原始関数を導出できます。

$$\frac{d}{dx}\mathrm{ln}|\cos x|=-\frac{\sin x}{\cos x}=-\tan xであるから\int\tan x dx=-\mathrm{ln}|\cos x|+C$$

つまり、(dg/dx)f(g(x))の形になっている関数は、
合成関数の微分を考える事で原始関数を見つけて積分を直接計算できるわけです。

ところで(dg/dx)f(g(x))という関数の形は、変数を取り換えると(dg/dw)f(g(w))となり、x=g(w)とすれば(dg/dw)f(g(w))=(dx/dw)f(g(w))です。
つまり、置換積分の公式の「積分の中身」の形になっています。
その事が、置換積分によっても計算が可能である事と関係しています。

2.置換積分を使う場合

直接計算が少し分かりにくければ置換積分を使う事もできます。
ただし、ここでの例のような場合はいずれもw=h(x)の形をまず考えるタイプの計算になります。

例えば、上記の指数関数の例ではw=x,対数関数の例ではw=lnx、
正接関数の場合はw=cosxと置きます。

ここでx=g(w)の形の逆関数を考えると、例えばlnx=wに対してはx=eですが、逆三角関数などを考えるのは微分の計算もある事を考えるとちょっと面倒そうです。

このような場合、微分に関してはxに関して行ったほうが最初の計算は簡単です。

$$\frac{d}{dx}x^2=2x\hspace{15pt}\frac{d}{dx}\mathrm{ln}x=\frac{1}{x}\hspace{15pt}\frac{d}{dx}\cos x=-\sin x$$

すると、ここでの例は「特別な場合」である事は強調される必要はありますが、
xでの微分の結果(つまりdw/dx)が原始関数を導出したい関数の一部に実は含まれています。
例えば\(\large{xe^{x^2}}\)において、xはxの微分を定数係数を乗じた形です。
(※そこまで分かると前述の直接計算も可能になます。)
さらに、逆関数の微分公式によりdw/dx=1/(dx/dw)ですから、
置換積分を行う時に「掛け算で1にする」事ができます。

上記の指数関数が含まれる例では次のようになります。

$$\large{w=x^2 とおくとxe^{x^2}}=\frac{1}{2}\frac{dw}{dx}e^wなので、$$

$$\int\large{xe^{x^2}}dx=\frac{1}{2}\int\frac{dw}{dx}e^w\frac{dx}{dw}dw=\frac{1}{2}\int e^wdw=\frac{1}{2}e^w+C=\frac{1}{2}\large{e^{x^2}}+C$$

式の途中計算で分かるように、置換積分の公式で使用するdx/dwがdw/dxに乗じられる事で1になって積分計算が簡単になっているわけです。もちろん、この関数はそのようになる「特別な形」をしているのでそのようにできます。

対数関数の逆数が含まれる例では次の通りです。

$$\large{w=\mathrm{ln}x とおくと\frac{1}{x\mathrm{ln}x}}=\frac{dw}{dx}\frac{1}{w}なので、$$

$$\int\frac{1}{x\mathrm{ln}x}dx=\int\frac{dw}{dx}\frac{1}{w}\frac{dx}{dw}dw=\int\frac{1}{w}dw=\mathrm{ln}|w|+C=\mathrm{ln}(|\mathrm{ln}x|)+C$$

正接関数では次のようになります。

$$w=\cos x とおくと\tan x=\frac{\sin x}{\cos x}=-\frac{dw}{dx}\frac{1}{w}なので、$$

$$\int\tan x dx=-\int\frac{dw}{dx}\frac{1}{w}\frac{dx}{dw}dw=-\mathrm{ln}|w|+C=-\mathrm{ln}|\cos x|+C$$

これらの場合においては、置換積分を使ったほうが分かりやすいかどうかは人によって感じ方が違うでしょう。分かりやすいほうで理解したほうがよいと思われます。

階乗(数式の「!」記号)の意味と使われ方

数学では、数式中にいわゆるびっくりマーク(感嘆符)の「!」が使われる事があります。これは階乗(factorial)を表す記号です。意味としてはすごく簡単なのですが、この記事では「具体的にどのような時に階乗を使うのか」という例も多く挙げる事で詳しく解説をします。

※プログラミングでは感嘆符「!」の記号が「否定」の意味で使われる場合があります。例えばプログラミング言語の1つである C# では「!=」は「等しくない」つまり一般の数学で使う「≠」を表します。他に論理演算での否定を表す事もできて、例えば「!(a >0)」は 「a >0」の否定(つまり a ≦0, プログラム上は a <=と書く)を表します。
しかしこの記事では、そういったプログラミングでの用法ではなく一般的な数式で使われる階乗の意味としての「!」記号について説明します。

階乗の定義と計算方法

階乗は自然数(および0)に対して考えるもので、
自然数nに対して「1からnまでの全ての自然数を掛け算したもの」を表します。
記号でそれを「n!」と書きます。

階乗と「!」記号の定義

階乗は0または自然数である数nに対して定義し、「nの階乗」をn!と書きます。
nの階乗は次のようなものです。

  • n≧1に対して、n!は1からnまでの自然数のそれぞれを乗じたもの。
    n!=n(nー1)(nー2)(nー3)・・・×3×2×1
  • n=0の時は0!=1と定義する。

(英語読みの場合、階乗そのものの事を factorial と呼び、n!のひとまとまりで n’s factorial と読みます。factor は「因数」(積の形になっている数を構成する各項)の事です。)

階乗は(n-1)!のような書き方も可能で、
(n-1)!=(n-1)(n-2)(n-3)・・・×3×2×1です。
ここでは少し大きめのnを想定していますが意味としては1からnまでの自然数を全て掛け合わせるという事なので、3!=3×2×1=6であり、2!=2×1=2であり、1!=1です。
【「1の掛け算」の×1の部分はもちろん計算結果に影響しないので書かなくても問題ありませんが、ここでは意味の分かりやすさのために敢えて書いています。】

階乗を「積の記号」を使って定義する事もできます。ただしかえって表記が面倒になるので、
むしろこのような「積の記号の代わり」に「!」記号という簡便な表記方法が使われていると言ってもよいかもしれません。 そう考えると「n!」という表記の便利さも少し見えるでしょうか。

積の記号を(敢えて使った)階乗の定義

nの階乗n!を次の形の式として定義する事もできます。 $$n!=\prod_{k=1}^{n}(n+1-k)$$ $$=n(n-1)(n-2)\cdots 3\cdot 2\cdot 1$$ 積の記号は、文字としては「パイ」のキャピタル(大文字)です。
和の記号であるシグマΣと同類の記号です。
k=1から始まってk=nまで、記している形の項の積(掛け算)を表します。
0!=1と定義する事は先ほどと同じです。

小さい自然数の階乗についていくつか具体例を記しますが、計算結果は何回やっても毎回同じですので、n=5くらいまでは結果を覚えられるのであれば覚えてしまってもよいかもしれません。

  • 5!=120 【5・4・3・2・1=120】
  • 4!=24  【4・3・2・1=24】
  • 3!=6   【3・2・1=6】
  • 2!=2
  • 1!=1
  • 0!=1【定義】

ところで、階乗は「nから1までの自然数の積」であるわけですが数が途中から始まるような、例えば「4から10までの自然数の積」を表す記号はあるのでしょうか。そのような場合は、階乗の記号を使って少し工夫をして表記するのが普通です。

「4から10までの自然数の積」であれば、それは「1から10までの自然数の積」を「1から3までの自然数の積」で割ったものに等しくなります。つまり、4×5×6×7×8×9×10=10!/3!と書けるわけです。

そのようにして「階乗同士の割り算」を考える事で3以上の自然数から始まる一連の積を表す事ができます。より一般的に、自然数mから自然数nまでの自然数のそれぞれの積は2つの階乗を考えて割り算する事で表現できます。

自然数mから自然数nまでの積を階乗で表す式

2つの自然数mとn(0<m<n)があった時
mからnまでの自然数のそれぞれに対する積は次のように書けます。 $$m\cdot(m+1)\cdot(m+2)\cdots(n-2)\cdot(n-1)\cdot n=\frac{n!}{(m-1)!}$$ 積の記号を使って次のようにも書けます。
(k=1に対する因数はnで、k=nーm+1が因数mに対応。) $$\prod_{k=1}^{n-m+1}(n+1-k)=\frac{n!}{(m-1)!}$$ 右辺における式の分母のほうでm!ではなく(m-1)!と書いているのは自然数の数え方の都合上、そのようにする必要があります。
例えば「1から20」を何かで割って「8から20」までの積としたい時には「1から20」を「1から7」で割る必要があります。つまり「mから1を引いた自然数」に対する階乗を考えなくてはいけません。つまり(m-1)!で割る必要があるわけです。

数学の諸理論と応用における階乗の使われ方

では次に、階乗は「何に使われるのか」「どういった数式の考察で役に立つのか」を見て行きましょう。後半の内容は高校では覚える必要のない事項ですが高校等の人にも参考にはなるかと思います。

例1:順列と組み合わせ

いわゆる「場合の数」として並び方や選び方を表す順列組み合わせは、階乗を使って一般的な式を表して理解するのが便利です。

区別されるn個の「物」の並べ方が順列(パーミテーション)で、同じく区別されるn個の物からm個選び取る組の個数が組み合わせ(コンビネーション)です。これは、もう少し数学的に考えると何個かの要素数の集合があった時に順番を区別した場合や、何個かを抜き取って新しい集合を考える事を表します。

順列では例えば要素が4つあるなら次のように考えます。
4つの中から1つ選び、残り3つの中では3通り、
残り2つから2通りで4!=24通りの並べ方があるというわけです。
{A,A,A,A}という集合があった時に、順番も区別すると
{A,A,A,A}とか{A,A,A,A}とか様々なものがあって、全部では計算すると意外と多くて24通りもあるという事です。

このように順列は一般的に階乗を使って表されます。5!=120ですから、5つの要素を並び替えるなら120通りも方法がある事を意味します。

より一般的には、n個の要素からm個を取って並び替える事も順列に含めて考えて、と書きます。これは「n-m+1からnまでの自然数の積」に等しく、階乗を使って表現できます。(前述の「mからnまでの自然数の積」の考え方を使います。)例えば7個から2個選ぶなら7×6通りですが、階乗を使うなら5!で割ってP=7!/5!=7×6=42のようになるわけです。

全ての要素を並び替えるなら=n!通りです。

他方、組み合わせの場合には例えば4つの中から2つを選ぶ場合の数をCのように書き、これはn個からm個を取って並べたPの順番の区別をなくした場合の数に等しいのでP=m!で割ります。

順列と組み合わせを表す式

n≧m≧0のもとで、
順列と組み合わせは階乗を使って式で次のように表す事ができます。 $$順列\hspace{5pt}_n\mathrm{P}_m=\frac{n!}{(n-m)!}$$ $$特にn=mの時は\hspace{5pt}_n\mathrm{P}_n=n!$$ $$組み合わせ\hspace{5pt}_n\mathrm{C}_m=\frac{_n\mathrm{P}_m}{m!}=\frac{n!}{m!(n-m)!}$$ 順列のほうの式で分母については (nーm)!=(nーm+1-1)!です。
これはn=mの時に0!となりますが定義により0ではなく「1」として計算上扱えます。にn個の物を全て並び替える時はそもそもn!通りになると考えもよいのですが、
0!=1と定義されている事によって計算式にn=mを代入するという形でも整合性がとれるようになっています。
順列と組み合わせの双方について、形式上m=0の場合を考える事もできて値は1になります。

このような形で、階乗を計算に使う事ができます。これらを1つ1つn(n-1)(n-2)・・・と書いたり積の記号を使って書いたりすると非常に大変です。それを比較的簡潔に済ます表記方法として階乗の記号を使えるわけです。

例2:二項定理(二項展開)

上述の「組み合わせ」と直接関連して、二項定理(または二項展開)でも係数を階乗を使って表します。

二項定理とはnを自然数として(a+b)の形の式を直接に展開して各項の係数を「a と b の組み合わせの数」に着目して表すものです。

二項定理における「階乗」

nを自然数として、二項定理における各項の係数は組み合わせで表されます。 $$(a+b)^n=\sum_{k=0}^{n}\hspace{1pt}_n\mathrm{C}_ka^kb^{n-k}$$ $$=\hspace{1pt}_n\mathrm{C}_0a^n+\hspace{1pt}_n\mathrm{C}_1a^{n-1}b+\hspace{1pt}_n\mathrm{C}_2a^{n-2}b^2+\cdots+\hspace{1pt}_n\mathrm{C}_ka^kb^{n-k}+\cdots+\hspace{1pt}_n\mathrm{C}_nb^n$$ $$=a^n+na^{n-1}b+\frac{n(n-1)}{2!}a^{n-2}b^2+\cdots+\frac{n!}{k!(n-k)!}a^kb^{n-k}+\cdots+nab^{n-1}+b^n$$

この二項定理によれば例えば(a+b)や(a+b)などに関する「展開の公式」の暗記の必要は無くて、
(a+b)におけるabの係数などは=3と計算できます。
必要性は無いかもしれませんが(a+b)のように指数が大きい場合でも、例えばa3b4の係数は
C=7!/(3!4!)=7・6・5/(3・2・1)=35と計算できるわけです。

実は式としては二項定理の指数は自然数に限らず実数でもよく、
その事を指して一般二項定理と言います。一般二項定理において自然数でない実数で展開をすると組み合わせに似た形の項で係数を表せますが、計算を進めても係数が0にならずにずっと続く無限級数となるのが普通です。

例3:初等関数の高階微分

個数や方法の数などを数える時以外にも自然数や整数が計算式で扱われる事があります。その代表的なものの1つが微分です。例えば2次関数の2次の項がxであったとして、これを微分するとd/dx(x)=2xとなって明確に自然数が係数として結果に表れます。(参考:初等関数の微分公式

の形の式(単項式)や自然対数関数に関しては微分操作をm回行った時の一般的な式を階乗を使って書く事ができます。これは、xを微分するとnxn-1となる事に由来します。つまりその操作を続けるとn(n-1)(n-2)・・・という形ができるわけです。2回以上に渡って微分を行う操作を「高階微分」と言い、得られる導関数を高階導関数と言います。(具体的にm回の微分なら「m階」のように当てはめて使います。)

単項式と自然対数関数の高階微分

nとmを自然数としてn≧m>0とします。
微分をm回行って得られるn階導関数について次式が成立します。 $$\frac{d^m}{dx^m}x^n=(n-1)(n-2)\cdots(n-m+1)x^{n+m}=\frac{n!}{(n-m)!}x^{n+m}$$ $$\frac{d^m}{dx^m}\mathrm{ln}x=(-1)^{m-1}\frac{(m-1)!}{x^m}$$

いずれの式も基本的に微分を繰り返す事で規則的な係数が得られますが、数学的帰納法を使うとより明確に式を証明できます。

単項式の微分については指数が実数でも同じ形の導関数が得られます。そのため高階微分についても同じ形の項式が得られますが、xに対してrが自然数でなく(整数でもない)場合は階乗の記号は使わずに(d/dx)x=r(r-1)(r-2)・・・(r-m+1)xr-mという形に留める事が普通です。

他の初等関数の高階微分に関しては、三角関数については周期的に同じ形の導関数が現れ、
自然対数の底に対する指数関数 eでは何回微分しても同じ形の関数が得られます。
(eaxのような場合はn階導関数は aeaxです。)

例4:テイラー展開とマクローリン展開

何回でも微分可能などの諸条件を満たした関数について関数の形を問わず多項式による無限級数で表す方法があり、テイラー展開と言います。(どの座標の位置で微分を考えるかで形が変化し、原点で行うテイラー展開を特にマクローリン展開と言います。)

テイラー展開においては、関数の具体的な形によらずに係数に必ず階乗の形が含ます。導出・証明方法として部分積分を使う方法を考えると、その数学的根拠は比較的見やすくなります。部分積分では微分と積分が逆演算の関係にある事(微積分学の基本定理)を利用します。そして規則的に「階乗」の形になって各項の係数に現れる自然数も単項式の微分に由来するというわけです。

テイラー展開とマクローリン展開

考えている閉区間で関数f(x)に対して諸条件(※)が成り立つ時には f(x)を各点で無限級数展開できます。
x= a におけるテイラー展開は次式です。 $$f(x)=f(a)+f'(a)(x-a)+\frac{f^{(2)}(a)}{2!}(x-a)^2+\frac{f^{(3)}(a)}{3!}(x-a)^3+\cdots$$ $$+\frac{f^{(n)}(a)}{n!}(x-a)^n+\frac{f^{(n+1)}(a)}{(n+1)!}(x-a)^{n+1}+\cdots$$ $$(1階の微分による導関数をf'(x)と書きn階微分による導関数をf^{(n)}(x)と表記)$$ x=0における展開(マクローリン展開)は次のようになります。 $$f(x)=f(0)+f'(0)x+\frac{f^{(2)}(0)}{2!}x^2+\frac{f^{(3)}(0)}{3!}x^3+\cdots+\frac{f^{(n)}(0)}{n!}x^n+\cdots$$ ※閉区間内で微分が何回でも可能である、
テイラー公式における剰余項がn→∞で0に収束するなどの条件。
それら一部の条件が満たされていなくても、テイラー公式を作る事や漸近展開を行う事は可能である場合があります。

マクローリン展開のうち、三角関数や指数関数に対するものは形が規則的で考えやすいので特に重要で、他にもマクローリン展開は平方根の展開と近似に応用できる事もあります。

例5:統計力学での例とスターリングの公式

物理学での使用例としては、前述のマクローリン展開で特定の関数を多項式で近似する他に統計力学での使用があります。数式としての「階乗」がどのような形で使われるかを見るという点に絞って要点だけ述べるに留めますが、統計力学の中で分配関数という理論上重要となる関数の導出などで階乗についての取り扱いが必要になります。

考え方としてはマクロな状態の中に多くのミクロな状態が存在していて、ミクロな状態の数は
「N個の要素をM個の組に分ける場合の数」に等しいと仮定します。その分け方は場合の数の数学上の問題なのですが、W 通りであるとすると次式になります。

$$W=\frac{N!}{N_1!N_2!N_3!\cdots N_M!}$$

理論の流れとしてはこのWが最大になるような組み合わせを考えてマクロな状態量(熱力学的な)として扱えると考えていくのですが、そのために数式の扱いとしては上式の対数(底は e )を考えます。対数の基本的な性質により、積は和に、商は差に変換できます。

$$\mathrm{ln}W=\mathrm{ln}\frac{N!}{N_1!N_2!N_3!\cdots N_M!}=\mathrm{ln}(N!)-\mathrm{ln}(N_1!)-\mathrm{ln}(N_2!)-\mathrm{ln}(N_3!)-\cdots -\mathrm{ln}(N_M!)$$

ここで数式としてはさらに階乗の部分を和の形でそのまま分解する事も可能ではありますが、分配関数を導出するための理論ではむしろスターリングの公式というものを使って ln(N!) などの項の展開と近似を考えます。

スターリングの公式とは漸近展開の一種なのですが、ln(N!) に対してNが十分大きい自然数であれば連続的な自然対数関数 ln x の積分で近似できるというのが基本的な発想と考え方です。スターリングの近似式などとも言います。

簡単にだけ述べますが、まず次のようにします。

$$\mathrm{ln}(N!)=\mathrm{ln}1+\mathrm{ln}2+\mathrm{ln}3+\cdots+\mathrm{ln}N$$

これをグラフ上での長方形の面積の集まりと考える事で「Nが十分大きい時」という条件のもとで、
同じくグラフ上の「面積」でもある定積分との差を十小さくできると考えます。

ある程度小さい実数を a として、ln(N!) を次のように近似します。
(計算しやすいようにa =1/2などにする事が多い。)

$$\mathrm{ln}(N!)≒ \int_a^{a+n}\mathrm{ln}xdx$$

これを部分積分で計算し、いくつかの項を他の項と比べて著しく小さいので無視できるとしたものがスターリングの公式になります。

スターリングの公式(十分大きい自然数Nに対する近似式)

Nが十分大きい自然数である時、次式を近似式として使える場合があります。 $$\mathrm{ln}(N!)≒ N\mathrm{ln}N-N$$ 対数ではなくて指数で書いた場合は次式になります。 $$N!≒ N^Ne^{-N}=\frac{N^N}{e^N}$$ このスターリングの公式で実際にはどれくらいの誤差が出るのかという問題に関しては別の議論も必要ですが、参考までにNの値が数十~200程度であると誤差は4未満ほどになります。

統計力学の理論の流れの続きとしては、スターリングの公式で近似を行った後に主に未定乗数法という方法(物理学では時々使う方法)を使って分配関数を導出します。

スターリングの公式は少し異なった考え方のもとで別の形で書かれる事もあって、そちらを使うと近似が少し良くなる傾向があります。

スターリングの公式の別の形

次の形のものをスターリングの公式、スターリングの近似式と飛ぶ場合もあります。 $$n!≒\sqrt{2\pi n}N^Ne^{-N}=\frac{\sqrt{2\pi n}N^N}{e^N}$$ これは、実は次に述べる「ガンマ関数」の近似として導出する事が多い式です。

スターリングの公式の別バージョンの形をよく見ると
N!≒NNe-N の式にさらに乗じる項を付けて値を大きくしたものになっています。
しかし対数にすると実はその項はそれほど大きな変化をもたらすものではなく、誤差を縮める程度の補正になっています。

例6:ガンマ関数(特殊関数の1つ)での例

ガンマ関数とは「特殊関数」の1つで、初等関数に属さない関数です。

基本的には次のように積分での定義になります。
端点に不連続点があり極限値として定義される「広義積分」です。(積分自体も極限値として考えるものですが、定積分を行う時にさらに極限を考えるという事です。)

ガンマ関数(広義積分での定義)

次の形のx>0の範囲で定義される特殊関数をガンマ関数と言います。 $$\Gamma (x)=\int_0^{\infty}t^{x-1}e^{-t}dt=\int_0^1(\mathrm{ln}t)^{x-t}dt$$ 多くの場合は広義積分の形で書かれ、最右辺の形との関連はt→lntの変数変換になります。

また、ガンマ関数には次の定義も存在します。

ガンマ関数の別定義

x>0の範囲でガンマ関数は次の形でも定義されます。 $$\Gamma (x)=\lim_{r\to\infty}\frac{r!r^x}{x(1+x)(2+x)(3+x)\cdots(r+x)}$$ (2つの定義が同等である事は自明ではなく、証明するのは結構面倒です。)

ガンマ関数には少し変わった性質があって、例えば変数として自然数を代入すると結果は自然数で、しかも階乗の形で規則的に表されます。

$$x=n\in\mathbb{N}の時、\Gamma (n)=(n-1)!$$

また、Γ(x+1)=xΓ(x)という関係も実は成立しています。
(この関係式は部分積分の公式によって導出できます。)
他にも、別の特殊関数のゼータ関数との関係など、様々な性質を有しています。実関数としてだけでなく、複素関数として考える事もあります(その場合には実部はプラスの数とします)。

前述のスターリングの公式の別バージョンとの関係ではまずt-xlntという関数を考えて「最小値(微分で導出)におけるテイラー展開」を計算します。そこで3次以降の項を小さいものとして無視し、ガンマ関数の積分の中身に当てはめてから積分を普通に計算するとΓ(x+1)の形でスターリングの公式の別版(変数はx)が得られます。

さらに、変数が自然数である場合にはΓ(n)=(n-1)!である事とΓ(x+1)=xΓ(x)の関係を合わせてΓ(n+1)=nΓ(n)=n・(n-1)!=n!という事でスターリングの公式の別バージョンの式になるという流れです。

こうして見ると階乗の意味と計算の仕方を知っておく事で、理論物理学から純粋数学まで、考察できる事の幅が広がる事が分かるのではないかと思います。

数学的帰納法とは?証明が簡単になる場合

数学的帰納法(「すうがくてききのうほう」)は数学の命題や定理の証明を行う手段の1つで、整数や数列的な内容が含まれる命題や定理を証明する時に使える場合があります。

「帰納」とはどのような意味?

数学的「帰納」法と言いますが、
実は帰納という言葉自体は元々数学用語ではなくもっと一般的な語です。

「帰納」は「演繹(演繹)」と対になる語です。

  • 帰納:個々の具体的事実から一般的・普遍的な法則や命題を導く事
  • 演繹:一般的・普遍的な法則等から、より具体的な結論を導く事

ですので、例えばA=nであるという事からA=1,A=4,A=9といった計算をする事は一般的に言うなら「演繹」に該当します。(ただし数学や理学系の学問ではその言葉は基本的に使用しません。)

では逆に、A=1,A=4,A=9,A4=16であれば「自然数nに対してA=n」と言えるでしょうか?

数学ではそのように「予想」するところまではOKで、
「証明」として断定する事はNGになります。

1,4,9,16という数が続いていたら「次は25かな」という事は「予想」できるわけで、これは具体例からnという一般的な式を予想している事に他なりません。
実際、「nが自然数でn≦4の範囲」ではその予想は実際に正しいので「証明」にもなります。

しかし、nの範囲が1以上の全ての自然数であるなら、もしn=1からn=4まで「A=n」が正しくても、n=5以降においてはそれが正しい事は無条件には保証されないと数学では考えます。

例えば数学では極端な話「n≦4の時はA=nでn≧5の時はA=n」などという数列を考えても構わないのです。つまり何の条件もなくて1,4,9,16という数が続いているだけなら
「n=1からn=4まではA=nとなり、n≧5以降はそれが成立しない数列」は無限に多く考える事ができます。

そこで「数学的帰納法」ではそういった「予想」をもう少し発展させた考え方をして、命題について任意の自然数nに対して確かに成立する事を「証明」する方法と手順を明確にしています。

数学的帰納法による証明の手順

自然数を含む命題において、n=1,2,3・・・の全ての番号において命題が成立する事、つまり任意の自然数において命題が成立する事を数学的帰納法で証明する場合には次の事を行います。

数学的帰納法で証明を行う時の手順

数学的帰納法で命題の証明を行う時には次の事を行います。

  1. n=1において命題が成立する事を具体的な計算などで示す。
  2. n=kの時に命題が成立すると仮定して、
    n=k+1の時も同様に命題が成立する事を示す。
  3. そこまでできたら「任意の自然数に対して命題が成立する事が証明された」と言ってよい。

数列の番号に0が含まれる場合や自然数ではなく整数である場合も考え方は同じです。初項の番号が0であればまずその場合を示してから上記の2番目の手順「n=kの時・・」に移ります。番号が0以下に減少していく場合は、「n=kの時命題が成立すると仮定して、n=k-1の時も正しい事を示す」という形になります。

「n=kの時に命題が成立すると仮定してn=k+1の時も成立する事を示す」というのは一体何をする作業なのかというと、「n=1の時に成立 ⇒ n=2の時も成立 ⇒ n=3の時も成立 ⇒n=4のときも・・・」という連鎖的な論理式をまとめて作る事に該当します。【⇒ は数学的な記号で「ならば」と読みます。参考:十分条件と必要条件

文章表現としては「n=kの時に命題が正しいと仮定すると」「n=kの時に命題が真であると仮定すると」「n=kの時に・・である(命題の内容)と仮定すると」など、その一般的な番号で命題が正しい事を仮定するという意味が分かれば何でも構いません。

もう少し詳しく見ると任意の自然数kに対して「n=kで命題が成立する⇒n=k+1で命題が成立する」という「命題」を示して、もう1つ「n=1で命題が成立する」という事も示す事でn=1で命題が成立する⇒n=2で命題が成立する⇒n=3で命題が成立する⇒・・・つまり「任意の自然数nにおいて命題が成立する」と言えて証明が完結する事になるわけです。

数学的帰納法を使ったほうがよい場合とは?

数学的帰納法は便利な証明方法ですが、数列的な式が含まれる命題なら何にでも使えばよいというわけではありません。例えば次の命題は数学的帰納法を使わずに直接証明をする事ができます。(これは自然対数の底 e の存在を証明する時に使う命題です。)

$$A_n=\left(1+\frac{1}{n}\right)^nとする時、任意の自然数nに対してA_n<3であり数列\{A_n\}は単調増加数列$$

この式の単調増加性を調べる時には数列の番号がn+1の時の場合を考えますが、それは数学的帰納法における「n=kで正しいとしてn=k+1でも正しい事を示す」事とは異なるのです。
この命題の単調増加性をもし数学的帰納法で証明するならA-A1>0を示してから
「Ak+1-A>0を仮定した時にAk+2-Ak+1>0となる事を示す」というようになります。(それをしなくても実際はAn+1-Aを直接計算すればAn+1-A>0を示せます。)

では、数学的帰納法を使用したほうが明らかによいと言える命題はどのようなタイプのものなのでしょうか。それは一概に方法論としては決められるものではないのですが、例えば次のような命題は数学的帰納法を使用したほうが良いと言えます。

$$f(x)=\mathrm{ln}xにおいて任意の自然数nに対して\frac{d^nf}{dx^n}=(-1)^{n-1}\frac{(n-1)!}{x^n}$$

つまり「n階導関数」(微分をn回行った時の関数)が提示されている式である事を示すという命題です。lnxは自然対数関数であり、 log e x の事です。
また、式中の「!」記号は「階乗」の意味で、数を1ずつ減らして1になるまで掛け算し続ける操作を指します。例えば5!=5×4×3×2×1=120です。

このような命題の場合、具体的な微分を仮に頑張って数十回手計算で行ったとしても提示された式の形になると「予想」しかできません。考えている自然数nが微分という操作を行う「回数」であるために一般性を直接的に持たせにくいわけです。

そこで数学的帰納法を使うとこの手の命題は証明がしやすくなります。

まずn=1の時はd/dx(ln)=1/xであり、これ自体が自明な式ではなく証明が必要ですがそれはできているものとします。(微分の公式・対数関数の微分

提示されている式に対してn=1を代入してみて正しい事を確認します。

$$n=1の時、(-1)^{n-1}\frac{(n-1)!}{x^n}=\frac{1}{x}なので正しい。(0!=1という定義)$$

次に、n=kの時に正しいと仮定します。そのもとでn=k+1の時にも正しい事をどのように言えばよいのでしょうか。ここでの場合はnは微分を行う回数です。つまり、n=kの時の導関数を「もう1回微分」すればよいのです。

$$n=kの時命題が成立すると仮定すると\frac{d^kf}{dx^k}=(-1)^{k-1}\frac{(k-1)!}{x^k}$$

$$両辺をxで微分すると\frac{d}{dx}\left(\frac{d^kf}{dx^k}\right)=(-k)\cdot(-1)^{k-1}\frac{(k-1)!}{x^{k+1}}=(-1)^k\frac{k!}{x^{k+1}}$$

$$同時に\frac{d}{dx}\left(\frac{d^kf}{dx^k}\right)=\frac{d^{k+1}f}{dx^{k+1}}であるから、$$

$$\frac{d^{k+1}f}{dx^{k+1}}=(-1)^k\frac{k!}{x^{k+1}}=(-1)^{(k+1)-1}\frac{(k+1-1)!}{x^{k+1}}$$

よって、n=k+1の時も命題は成立しているので、任意の自然数nに対して命題は成立します。証明終わり、とするわけです。

本質的には前述のように「n=1の時に命題が成立」⇒「n=2の時に命題が成立」⇒「n=3の時に命題が成立」⇒・・という連鎖的な論理式が任意の自然数について成立する事が数学的に保証される事を証明したという事です。

この「自然対数関数の高階微分の公式」の証明の計算の説明をすると、簡単に言うと
最初の微分で1/xという形の導関数が得られるので、
それ以降は 1回微分するごとに
「1/x(=x-n)」の微分に由来する係数である次の2つ
①マイナス1と
②指数(nの部分)に等しい自然数
が掛け算され、それが1回ごとに増えて行くという事です。
同じような命題で、話が簡単であればそういった「1回の操作ごとに付け加わる結果」を繰り返す事で結論を得るという事を証明の代わりにする事は可能です。
しかしそれを「具体的に式で表してより明確にする方法」として数学的帰納法があるわけです。
「1回微分するごとに」という部分は
「n=kとした時に実際に微分してみる」
という形で式としてより明確にできます。
係数が乗じられて項として付け加わっていくという事も、数学的帰納法の中でn=kの時に実際に微分してみる事で式で表せて、その次の番号のn=k+1の時も確かに命題が成立するという事を確実に表現できるという利点があるわけです。

ベクトルの相等:自由ベクトルと束縛ベクトル…【2つのベクトルが等しいとはどういう事か?】

「同じ向きで同じ大きさのベクトル」を、
「始点を基準とした向き」と「大きさ」を変えずに移動させたベクトルの扱いについて説明します。

一般的に、原則的な扱い方は大体決まっているのですが、
書籍等では少し曖昧に説明されている場合もあるので詳しく説明をします。

ベクトルの相等
・・同じベクトルと異なるベクトルの違いは?

ベクトルの始点と終点を明示した表記方法では、\(\overrightarrow{AB}\) と \(\overrightarrow{BA}\) は異なるベクトルになります。

この事は図形的に見てもそのように言えて、
「大きさは同じ」で「向きが異なる(同一直線上で逆方向)」という異なる2つのベクトルなのです。

さて、ここで問題にしてみたいものがあります。

2つのベクトルが、次のような条件を両方満たす場合です。

  • 「向きと大きさの両方が同じ」
  • 「しかし、始点と終点が異なる」

例えば、平行線の関係にある異なる線上の2つのベクトルで、大きさは同じで向いている方向も同じという場合です。
それらは、異なるベクトルと考えるべきでしょうか?

図形における線分であれば、異なる端点を持つ線分ABと線分CDは、必ず異なるものとして考えます。そうでないと、図形的に正しい議論ができないのです。

ベクトルは「大きさ」と「向き」を持つ量として考えたはずですが、
それらは同じで始点と終点が異なる場合は?

では、ベクトルの場合はどうでしょうか。同様に考えるべきでしょうか?

「2つの異なるベクトルが等しい事」を指して数学ではベクトルの相等と呼ぶ事があります。
ここでは、ベクトルの相等が始点と終点の位置に関係するか?
それともそれらには無関係で向きと大きさだけに依存するものか?
という事を考えています。

実のところ、それに対する答えには2つの立場があって扱いが異なるのです。
ただし数学上の考察を含めて一般的に、何の断りもなければ原則としてどちらの立場で考える事が普通であると言う事はできます。

基本的にはベクトルは「自由ベクトル」

ベクトルの場合は、向きと大きさを持つ「量」として考えている事もあって、
実は「向きと大きさの両方が同じ」であれば、「始点と終点が異なる」場合でも同じベクトルであると考えるのです。
特に断り書きが無ければそれが基本的な考え方になります。
ただしそのように考えるベクトルである事を強調して、特に自由ベクトルと呼ぶ事もあります。

自由ベクトルは、向きと大きさを保ったまま自由に動かす事ができます。
(そのような移動を「平行移動」と言います。)

普通、数学的な考察の中で何のことわりもなく「ベクトル」と言ったらそれは自由ベクトルを指しています。つまり向きと大きさを保ったまま始点と終点を変更しても、移動前と移動後のベクトルは等号で結べるという事です。

自由ベクトルとして考える場合には、ベクトルの相等は向きと大きさにだけ依存し、始点と終点の位置には依存しないと言う事もできます。

ベクトルの相等についての基本的な考え方
  • 原則として、何も断り書きが無ければベクトルは自由ベクトルとして扱う。
  • ベクトルの相等は「向き」と「大きさ」だけで決まり、
    始点(および終点)が異なっていても同一のベクトルとみなし、等号で結ぶ事ができる。

例えば「始点が同一である」力ベクトルは合成する事ができて、数式的にはベクトルの合成(足し算と引き算)で考える事になります。すこの時に、片方のベクトルを平行移動させて平行四辺形を作って合成を考えます。つまりその時にはそのベクトルを自由ベクトルとして考えているわけです。

ベクトルの加算で片方のベクトルを平行移動して「平行四辺形」を作る図形的な考察は、ベクトルを自由ベクトルとみなしている場合の代表的な例の1つです。

ベクトルに関して数学的な一般論として考察や計算を考える時には、
基本的にはベクトルは自由ベクトルとして考えます。

始点の位置を問題にする「束縛ベクトル」

それに対して、状況によっては始点が特定の場所に固定されていると考える必要がある場合があります。つまり、始点が異なれば別のベクトルとみなす必要がある場合です。そのように考えるベクトルは、特に束縛ベクトルと呼ばれる事があります。

例えば現実に2本の綱があったとしましょう。
それらを2人の人が引けば2つの力ベクトルを考える事ができます。
しかしそれらの力ベクトルの始点(力の作用点)は異なります。
そういった場合に、仮に2つの力ベクトルを平行移動でぴたりと重ね合わせる事ができたとしても、それらを「同一の力」と評するには違和感があります。
その違和感は、ベクトルの始点が異なっている事に由来するのです。

力が作用している点が異なれば、大きさと始点からの向きが等しいベクトルであっても別々の力であり、同一の力ベクトルとは考えない事が普通です。
そのような場合でも、力ベクトルの大きさに関して F1 = F2 のように書けます。

束縛ベクトルを考える場合には、
必ずしもベクトルの始点が「同一の点」ではなくてもよい事もあります。
例えば「同一の線上」「同一の面上」であればよいとする事もあるのです。

いずれにしても、ベクトルの始点が具体的にどこにあるのか範囲が限定されているベクトルが束縛ベクトルであり、ベクトルの相等が「向き」と「大きさ」と「ベクトルの始点が存在する位置」に依存するわけです。

ただし、考察対象のベクトルが自由ベクトルであるか束縛ベクトルであるかの区別は、数学的というよりは物理的な解釈により判断する事が普通であると思われます。
例えば異なる物体に作用している複数の力ベクトルであれば、「別々の物に加わっている別々の力なのだから、その時点でベクトルを等号としては結べる事はない」と解釈しても何の支障もありません。

具体的な状況下で複数の束縛ベクトルを考えた場合でも、その時に考えている始点を基準にして限られた範囲で自由ベクトルのように考える事ができます。例えば、ある力の作用点に対して重力と摩擦力が働いている場合には、元々ベクトルの始点は同一である事は大前提にしたうえで、ベクトルを平行移動させてベクトルの「平行四辺形」を考えて力ベクトルを合成するといった計算ができます。

自由ベクトルは始点が原点である場合を基準にできる

始点を原点としてベクトルを考える場合にはベクトルは座標で表すか、終点が分かる文字で代表させる表記方法ができます。
この時には始点が皆共通ですから、向きと大きさが一致すれば終点も必ず一致します。

さてそこで、自由ベクトルとして考えているベクトルでは向きと大きさを保てば自由に移動させて構わないので、始点を原点にそろえる事もできるわけです。

この考え方のもとでは、
平面上あるいは空間内の任意のベクトルは座標を使って表す事ができる事になります。

例えば次の2つのベクトルを考えます。

  • 原点を始点とした(1,1)というベクトル
  • (2,1)を始点としてx方向とy方向にそれぞれ1ずつ進み、
    (3,2)に向かうベクトル

これらは、自由ベクトルとしては全く同一のベクトルとしてみなせるのです。

☆ベクトルの減算を使うと、
2番目のベクトルは(3,2)-(2,1)=(1,1)と計算して表す事ができ、
確かに1番目のベクトル(1,1)に一致する事を見れます。

ここでの例で、点(2,1)をAとして、点(3,2)をBとすれば
\(\overrightarrow{AB}=(1,1)\) と書く事ができます。

つまりベクトルを自由ベクトルとして考える前提のもとでは、
\(\overrightarrow{AB}\) のような始点と終点を明記した形のベクトルも、
原点を基準とした座標成分による表記方法と、数学的に等号で結べるという事を意味するのです。
この時には、平面上あるいは空間内の具体的な2点間のベクトルである事を明示しつつ、
「向きと大きさは原点を基準とした時の(1,1)というベクトルに等しい」という事を表現しているとも解釈できます。

今回のまとめ
  • 基本的にはベクトルは自由ベクトルとして考えて、
    「向き」と「大きさ」が等しければ、始点の位置によらずに同じベクトルであると考えて等号で結ぶ事ができる。
  • 特に断りが無ければ、数学的な計算や考察ではベクトルは自由ベクトルであると考える。
  • ただし物理学等での個別の考察を行っている時には、
    始点が限定された範囲内にないと、向きと大きさが等しくても同一のベクトルとはみなせない束縛ベクトルとして実質的に考える事もある。
  • ベクトルが自由ベクトルであれば、
    始点と終点を明記する表記と原点を基準にした表記は同一視する事ができ、
    等号で結ぶ事もできる。