ライプニッツ級数の導出【四分円を使う方法】

ライプニッツ級数とは「分子が1で分母を奇数とする分数を、プラスマイナスの符号を交互に変えて加えて行くと円周率の1/4に収束する」という無限級数を指します。

この無限級数の導出方法はいくつか存在し、ここでは図形的な考察をもとにした式変形と定積分の計算、それと幾何級数展開を使った導出方法を説明します。

ライプニッツ級数の導出方法はここで説明するものだけではなく、いくつか方法があります。例えば、逆正接関数のマクローリン展開から導出する方法や、連分数展開によって得る方法などがあります。

数学史的には、π/4=1ー1/3+1/5-1/7+・・・という式自体はライプニッツ以外の学者によっても独立に得られていた事が知られています。
また、この記事内でも後述しますが
「ライプニッツ級数1ー1/3+1/5-1/7+・・・がπ/4という値に収束する事」と
「ライプニッツ級数が収束するか否かの判定」は、実は別々に考察できます。
ライプニッツ級数は交代級数(交項級数)という種類の無限級数の1つです。 備考として、一般の交代級数が収束する十分条件を提示する命題は「ライプニッツの定理」と呼ばれる事があります。

ライプニッツ級数とは

まず、ライプニッツ級数の具体的な表式は次のようになります。

ライプニッツ級数

次の式で表される無限級数がライプニッツ級数です。\(\pi\) は円周率です。 $$\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\frac{1}{11}+\cdots$$ $$\left(≒0.785398\cdots\right)$$ この値は無理数になります。

無理数を「有理数で表せる」?

ライプニッツ級数の左辺は無理数ですが右辺は「各項が有理数である無限級数」となっています。

これについては、右辺が表す無限級数は「π/4という無理数に収束するという事」すなわち 「項数を増やせばπ/4という無理数との差をいくらでも小さくできる事」を意味しています。

ですので、ライプニッツ級数の式において「無理数≠有理数」という当然の関係式は崩れてはいません。どこか有限の項数で計算をやめたら、 その値はπ/4には一致しない事になります。しかし項数を増やせばπ/4との差はいくらでも縮まります。それが、ライプニッツ級数が数式的に表すものです。

ライプニッツ級数は特徴的な式の形をしているため、「奇数だけを用いて円周率を表せる」というキャッチ―な表現が使われる事があります。 その表現自体は誤っているわけではありませんが、「無限級数が収束する値として円周率を表せる」という事を踏まえておく必要があります。

ライプニッツ級数が「無限級数」でありπ/4が「極限値」である事を、より明確に表すのであれば次のようになります。 $$\frac{\pi}{4}=\lim_{n \to \infty}\sum_{k=0}^n\frac{(-1)^k}{2k+1}=\sum_{n=0}^{\infty}\frac{(-1)^n}{2n+1}$$ 但し、多くの場合はライプニッツ級数は「円周率と奇数」の関係を強調して
1-1/3+1/5-・・・の形で書かれます。

3.141592・・・をライプニッツ級数で出せる?

円周率の 3.141592・・・の値を計算する式としては、実はライプニッツ級数はあまり優れた式ではありません。無限級数の収束の速さが遅く、 項数を非常に多く増やさないと3.14・・・の値に近付いて行かないためです。(円周率の数値計算用として優れた式としては、 複数のマチン型の公式が知られています。逆三角関数の記事で解説。) 変更なし:

円周率の 3.141592・・・の値を計算する式としては、 実はライプニッツ級数はあまり優れた式ではありません。無限級数の収束の速さが遅く、項数を非常に多く増やさないと3.14・・・の値に近付いて行かないためです。 (円周率の数値計算用として優れた式としては、複数のマチン型の公式が知られています。逆三角関数の記事で解説。)

もし整数だけを準備して円周率計算が手計算で簡単にできるなら何とも便利そうですが、 式として興味深い形をしている事と色々な意味での実用性や有用性は残念な事に必ずしも重ならないという例になっています。

「奇数」が得られる根拠

ライプニッツ級数において、「奇数」以前に「整数」が得られるのはなぜでしょう。それは具体的には、単項式の微分法を根拠にしています。

の微分(「導関数」)は3xになります。積分を行う場合は逆の演算です。
の原始関数はx/3です。 この関係によって1/3,1/5,1/7といった「分母が整数である分数」が式中に発生します。

ライプニッツ級数に限らず、計算式中の「整数」の出所が微分法や積分法であるという場合は少なからずあります。

次に、ライプニッツ級数の各項において「偶数が欠けている」理由は幾何級数展開(等比級数展開)を使う時の公比の形に由来しています。

具体的には、-zという公比による幾何級数展開を考えて1ーz+z-z+・・・という式を得て、 さらにそれにzを乗じてzーz+z-z+・・・の形を作ります。 そして、その各項を積分(項別積分)する事でz/3ーz/5+z/7-z/9+・・・の形の式を得ます。 これがライプニッツ級数の形を作っているわけです。無限級数の項別積分を実行可能であるには条件がありますが、ここではそれを満たします。

具体的には、-zという公比による幾何級数展開を考えて1ーz+z-z+・・・という式を得て、 さらにそれにzを乗じてzーz+z-z+・・・の形を作ります。 そして、その各項を積分(項別積分)する事でz/3ーz/5+z/7-z/9+・・・の形の式を得ます。 これがライプニッツ級数の形を作っているわけです。無限級数の項別積分を実行可能であるには条件がありますが、ここではそれを満たします。

ライプニッツ級数において幾何級数展開が使われる部分は正確には「1/3」以降の項からであり、最初の「1」は出所が異なる事になります。

幾何級数展開の式を使用する事は「無限級数が得られる事」と「プラスとマイナスが交互に出てくる事」の根拠でもあります。 そのため、次に述べて行くライプニッツ級数の導出方法では微積分の基本計算と並んで幾何級数展開が非常に重要な要素となっています。但し、 この幾何級数展開を使用するには「公比の絶対値が1未満である」という条件があるので注意が必要です。

導出に使う式や考え方
  • 円とその接線の式、面積の関係などから得る式変形と変数変換(円周率は円の面積から)
  • 単項式(xなど)の積分計算(「奇数」が分母にある根拠)
  • 幾何級数展開(無限級数の形となる根拠)
ライプニッツ級数の「奇数」の出所
この図の式の積分区間は開区間(0,1)内の2つの値εとδを使った [ε,δ] として、 最後にε→0,δ→1の極限を考えるものとしています。その理由は、円の式の導関数の不連続点を除くためと、 幾何級数展開が可能な範囲内で式を考えるためです。厳密性にこだわらないなら、最初から積分区間を[0,1] として計算してもライプニッツ級数の導出は可能です。 (積分する関数は円の式なので、端点を含めたからといって面積としての定積分の値が発散する事はありません。)

証明と導出【四分円の面積を利用する方法】

全体の流れ

大きく分けて記すと次のようになります。

$$四分円y=\sqrt{2x-x^2}に対してy=\frac{dy}{dx}x+zという式変形を考えるとx=\frac{2z^2}{1+z^2}$$

$$|z|<1のもとで幾何級数展開により\frac{1}{1+z^2}=1-z^2+z^4-z^6+\cdots$$

$$部分積分と置換積分により\int \left(\frac{dy}{dx}x+z\right) dx=\frac{1}{2}\left(xy+zx-\int x dz\right)と変形できる。$$

その後、幾何級数展開した箇所について項別積分を行い積分区間の端点の極限を考慮したうえで計算を進め、 得られる無限級数の収束値が半径1の四分円の面積π/4に等しいという形でライプニッツ級数を導出できます。

$$\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=1-\lim_{\epsilon \to 0, \delta \to 1} \left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$これが半径1の四分円の面積\int _0^1y dx=\frac{\pi}{4}に等しい。$$

以下、各過程を詳しく見て行きます。

  1. 円の式と導関数
  2. 円の接線の式を利用して関係式を作る
  3. 積分においてyの形を変形する(面積変換定理)
  4. 幾何級数展開を適用
  5. 定積分の計算と極限の考察
  6. 参考:(アーベルの)連続性定理

①円の式と導関数

具体的な計算としては半径が1の四分円(半円のさらに半分)の面積を定積分で計算します。
しかし円を表す式を使って普通に定積分の計算をする (置換積分か逆三角関数を使用)と、π/4という値は出ますが1-1/3+1/5-・・・という無限級数の式は出てきません。

使う式:四分円(半円のさらに半分)

閉区間 [0, 1] およびy≧0の範囲における、中心座標(1,0)半径1の円の式を使います。 $$y^2 +(x-1)^2=1\hspace{3pt}$$ $$\Leftrightarrow y^2 +x^2 -2x=0$$ $$y≧0においては、y=\sqrt{2x-x^2}$$ $$y>0の時、\frac{dy}{dx}=\frac{1-x}{\sqrt{2x-x^2}}\left(=\frac{1-x}{y}\right)$$ 微分により得られる導関数dy/dxはこの後で積分計算に使用しますが、x=0の時に無限大になってしまう (図形的に接線はx軸に垂直でy軸に平行となる)ので、厳密にはx=0は積分区間に含める事ができず極限値を考える必要があります。導関数を考えないなら普通に原点を積分区間に含める事ができます。

微分の計算は次のようにしています。合成関数の微分法を使います。(ここでの場合は、後述する図形的考察でもこの導関数は導出可能です。)

$$\frac{dy}{dx}=\frac{d}{dx}\sqrt{2x-x^2}=\frac{d}{dx}\left(2x-x^2\right)^{\frac{1}{2}}=\frac{1}{2}\left(2x-x^2\right)^{-\frac{1}{2}}\cdot (2-2x)=\frac{1-x}{\sqrt{2x-x^2}}$$

半径1の円の面積は1×1×π=πです。その1/4である四分円の面積はπ/4です。この値が無限級数1ー1/3+1/5-1/7+・・・の収束値である事を積分を使って証明して行きます。

しかしy≧0における円の式をそのままxで定積分するとπ/4の値は得られますが無限級数の式は得られません。何か別の方法で円の面積を計算する必要があります。

四分円の式と導関数
ライプニッツ級数の導出に使う積分計算で「厳密には」積分区間からx=0を除いて考えるのは、計算に使う導関数の式がx=0 (この時にy=0)において無限大に発散してしまう事によります。

②円の接線の式を利用して関係式を作る

そこで、実は「円の接線の式」を利用すると通常とは異なる形で面積の積分計算ができます。

但し積分を行う対象の関数は円の式なので、接線上の点を考えるわけではなく「円周上の点(x,y)に対して成立する関係式」を接線の式を利用して作ります。

円周上の点(x,y)における接線の傾きはdy/dxで表される導関数です。そして、接線のy切片(接線とy軸の交点)をzとします。この時にy=(dy/dx)x+zが成立します。

この時にzはxの関数です。そのようなz=z(x)という関数がxの開区間(1,0)の範囲内において円周上の点(x,y)に対して必ず存在できます。 このzの値が存在できる事は図形的に見ても確認できますが、式でも確かに示せます。

$$y>0においてy=\frac{dy}{dx}x+zとすると、\frac{dy}{dx}=\frac{1-x}{y}であるので$$

$$y=\frac{x-x^2}{y}+z\Leftrightarrow zy=y^2-(x-x^2)=y^2-x+x^2$$

$$円の式y^2 +x^2 -2x=0より、zy=x$$

$$y>0であればz=\frac{x}{y}=\frac{x}{\sqrt{2x-x^2}}$$

ここで考えているy=(dy/dx)x+zという式は、 あくまで円周上の点(x,y)に対して成立する式です。接線自体の式として考える場合はxとyを接線上の点の座標として考えるわけですから、円周上の点を別の文字で例えば(a,b)として表し、 その点における微分係数f’(a)を使う必要があります。その時に接線の式はy=f’(a)x+z(a)であり、これは接線上の点(x,y)に対して成立する関係式です。

接線の式を利用した変換
y>0の範囲で円の接線のy切片をzとすると、円周上の点(x,y)に対してy=(dy/dx)x+zを満たすz=z(x)が存在します。

この時にxをzで表す事もでき、後の計算で重要です。

$$z=\frac{x}{\sqrt{2x-x^2}}=\sqrt{\frac{x}{2-x}}から、z^2(2-x)=x$$

$$\Leftrightarrow x=\frac{2z^2}{1+z^2}$$

この後の計算では、このzを変数として四分円の面積を積分計算する事を考えて行きます。xをzで表した式を見ると分母が1+z2となっており、これが幾何級数展開可能な式の形になっています。

後の計算で重要な関係式

0<z<1の範囲においてはzで表したxの式は、公比を-z2とした幾何級数展開が可能です。 $$x=\frac{2z^2}{1+z^2}=2z^2(1-z^2+z^4-z^6+\cdots)$$

(補足)図形的にy切片と導関数を計算する場合

上記の計算でzの具体的な形としてz=x/yが得られましたが、この関係は平面幾何的にも導出できます。ここで考えている円はy軸が原点における接線となっているので、「接線のy切片と接点と円の中心」で作られる三角形を考えて合同関係に着目すれば三平方の定理によってzとxおよびyとの関係式を作る事ができます。

接線のy切片(0,z)から接点(x,y)までの距離は三角形の合同関係からzです。また、接線のy切片からx軸方向にx進み、y軸方向にy-z進めば接点(x,y)にたどり着きます。

同じく図形的考察からy>0において接線の傾きは(yーz)/x=(yーx)/(xy)です。そしてyをxで表すと、微分により得る導関数と同じ式を得ます。

$$y>0の時、接線の傾きは\frac{y-z}{x}=\frac{y-\frac{x}{y}}{x}=\frac{y^2-x}{xy}$$

$$=\frac{2x-x^2-x}{x\sqrt{2x-x^2}}=\frac{x-x^2}{x\sqrt{2x-x^2}}=\frac{1-x}{\sqrt{2x-x^2}}\left(=\frac{dy}{dx}\right)$$

③積分においてyの形を変形する(面積変換定理)

次に四分円の面積を積分によって考えます。この時に、積分変数xでyを積分する計算において
y=(dy/dx)x+zの式変形をしてzを積分計算に持ち込みます。以下、まず積分区間に依存せずに不定積分で可能なところまで式変形の計算を進めて行きます。

$$\int ydx=\int\left(\frac{dy}{dx}x+z\right)dx$$

この段階では積分変数の変換を行ったわけではありません。
(dy/dx)x+z={(1-x)/y}・x+x/y
=(2x-x)/y
=y/y=y
という関係を使ってyを表しているだけとなります。

次に2つの項のそれぞれについて積分変数の変換を考えます。

まず(dy/dx)xの項については部分積分の公式を適用して変形をします。

$$\int\frac{dy}{dx}xdx=xy-\int y\left(\frac{d}{dx}x\right)dx=xy-\int ydx$$

この部分積分による式変形は、定積分で計算した時には長方形領域の面積を曲線で分割した時の関係を表す意味を持ちます。

置換積分を行ってから(d/dy)y=1が乗じられていると見て部分積分を行い、積分の項に対して再度置換積分を行って積分変数をxに戻す事でも同じ式を得ます。$$最初に置換積分を行うと、\int\frac{dy}{dx}xdx=\int xdy$$ $$次に積分変数yで部分積分を行うと\int x dy=\int x \left(\frac{d}{dy}y\right)dy=xy-\int\frac{dx}{dy}ydy$$ $$置換積分を再度適用してxy-\int\frac{dx}{dy}ydy=xy-\int y dx$$ 但し、定積分を行う時にはxでの積分であったかyでの積分であったか注意も必要です。(ここでの四分円に対する計算ではx=0の時y=0でx=1の時y=1なので結果的にそれほど問題は起こらない。)

積分の変形と面積の関係
置換積分を最初に行った場合、ここでの変数変換は相似な三角形の辺の比に対応しています。この図では原点を通る曲線に対して原点からの定積分を考えていますが、任意の積分区間で考えた場合も同様に面積を分割する図形的意味を持ちます。

同様の部分積分の適用の仕方でzの項についても式変形し、
さらに置換積分によって「積分変数zでxを積分する」形に変形します。

$$\int z dx=\int z \left(\frac{d}{dx}x\right)dx=zx-\int\frac{dz}{dx}xdx=zx-\int x dz$$

置換積分と部分積分の順序を入れ換えて、置換積分を先に実行して積分変数をxからzに変える 事もできます。定積分する時には積分変数に注意。 $$単純に置換積分を行った場合は、\int zdx=\int z\frac{dx}{dz}dz$$ $$=zx-\int\left(\frac{d}{dz}z\right)xdz=zx-\int xdz$$

式を整理すると、積分変数xによるyの積分の項が2つあるのでまとめる事ができます。

$$\int y dx=xy-\int y dx+zx-\int x dz$$

$$\Leftrightarrow 2\int y dx=xy+zx-\int x dz$$

$$\Leftrightarrow \int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)$$

ここで式中のxyととzxは積分変数をxとして考えた時の原始関数です。但し上記の補足説明のように積分変数をyやzで計算した場合はyやzの原始関数として端点の値を代入する必要があります。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)$$この関係式を定積分で考えたもの(あるいはzに関する計算をする前の段階のもの)はライプニッツの面積変換定理と呼ばれる事があり、円の式に限らず積分可能な一般の1変数関数に対して成立します。図形的な意味としては積分における面積計算の領域を2つに分けて、そのうちの1つを接線のy切片であるzによって積分計算しているものになります。
尚、この式の右辺をxで微分するとyに等しくなる「はず」ですが、
具体的にチェックをしてみると次のようになります。 $$zはxだけの関数で表せる事と、\int x dz=\int x\frac{dz}{dx}dxに注意して、$$ $$\frac{d}{dx}\frac{1}{2}\left(xy+zx-\int x dz\right)=\frac{1}{2}\left(y+x\frac{dy}{dx}+z+x\frac{dz}{dx}-x\frac{dz}{dx}\right)$$ $$=\frac{1}{2}\left(y+x\frac{dy}{dx}+z\right)=\frac{1}{2}\left(y+y\right)=y$$

④幾何級数展開を適用

「xを積分変数zで積分する」項について、0<x<1の時に0<z<1であるので1/(1+z)の部分に対して幾何級数展開を適用できます。公比は-zです。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)において、$$

$$\int x dz=\int \frac{2z^2}{1+z^2}dz=2\int z^2\cdot\frac{1}{1+z^2}dz$$

$$=2\int z^2(1-z^2+z^4-z^6+\cdots)dz=2\int(z^2-z^4+z^6-z^8+\cdots)dz$$

$$=2\left(\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right)$$

これを項別積分するには関数列が一様収束するという条件が必要ですが、ここではその条件は満たされています。(収束する整級数が一様収束する事の証明は、連続性定理の証明の一部として後述。級数変化法による計算と、コーシー列に関する考察を含みます。)

よって、次式が成立します。

$$\int y dx=\frac{1}{2}\left(xy+zx-\int x dz\right)=\frac{1}{2}\left(xy+zx\right)-\left(\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right)+C$$

(この段階ではまだ不定積分で考えているので、積分定数Cを加えた形にしています。)

ここで行われた式変形を細かく表現すると
「0<x<1の範囲内で0<z<1であり、
その範囲の任意のzに対して公比を-zとして1/(1+z)を幾何級数展開できる」
という事になります。
幾何級数(等比級数)は公比の絶対値が1未満である時は公式を適用できます。 $$|r|<1の時、1+r+r^2+r^3+\cdots=\frac{1}{1-r}$$ (導出:第n項までの和をSとして、S-rS=(1-r)Sを計算して(1-r)で割り、n→∞)
逆に、|r|<1の時に1/(1ーr)の形の項は幾何級数の形に展開できます。1/(1+r)の形の場合は公比が-rになります。ここでは展開後の結果にzを乗じていますが、初項がzであるとしてz/(1+z)に対して幾何級数展開を適用しても最終的な計算結果は同じになります。

⑤定積分の計算と極限の考察

ライプニッツ級数は「四分円の面積π/4が無限級数1ー1/3+1/5-・・・に等しい」という式であり、四分円の面積は円の上半分の式\(y=\sqrt{2x-x^2}\)をx=0からx=1まで定積分すれば得られます。そのため本来は、上記で得られた積分の変形式でも積分変数xに対して積分区間を [0,1] としたいところです。簡易的な方法としてはそれでライプニッツ級数を導出可能です。

すなわち、x=0の時にy=z=0,x=1の時にy=z=1の関係から、得られている不定積分を定積分に変える事でライプニッツ級数を得ます。(積分中のxy,zxは共に積分変数をxとしている原始関数であり、例えばx=1を代入してyについてもその時にy=1なのでxy=1という計算。)

$$\frac{1}{2}\left([xy]_0^1+[zx]_0^1\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_0^1=\frac{1}{2}\left(1+1\right)-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$これが\int_0^1 y dx=\frac{\pi}{4}に等しいとすると\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

しかしここでは一応、積分区間にx=0とx=1を含める事はできないとした場合の計算も記します。

  • x=0を含めないのは、式変形で使用したdy/dxがx=0で無限大となるため
  • x=1を含めないのは、幾何級数展開時に|z|<1の条件が必要なため

0<ε<δ<1であるεとδを考え、積分区間を[ε,δ]と置きます。そして計算結果においてε→0,δ→1の極限を考えます。ε→0の時y→0およびz→0であり、δ→1の時y→1およびz→1です。

ライプニッツ級数自体がπ/4に収束する「無限級数」なので、積分区間の極限を考えた時にも等式は問題なく成立します。四分円を普通に定積分した時に積分区間[ε,δ]に対してε→0,δ→1とすればπ/4に収束するので、「2つの式の極限値が同じ値に収束する」という事でライプニッツ級数の等式が成立します。

$$\int_\epsilon^\delta y dx=\frac{1}{2}\left([xy]_\epsilon^\delta+[zx]_\epsilon^\delta\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$\lim_{\epsilon \to 0, \delta \to 1}[xy]_\epsilon^\delta=1\cdot1-0\cdot0=1,\hspace{7pt}\lim_{\epsilon \to 0, \delta \to 1}[xy]_\epsilon^\delta=1\cdot1-0\cdot0=1$$

幾何級数展開した部分についての極限については、何が問題なのかを整理しておきます。

  • 幾何級数が収束する事が保証されるのは|z|<1の範囲(0<x<1)であり、級数が収束しないなら項別積分もできない。
  • z=0(x=0)の時には幾何級数展開自体は可能で、1/(1+z)に対して初項1だけが残り、z=0を乗じて全体が0になる。従って、ε→0の時の全体の極限値も0。

つまり、考察が複雑になるのは積分区間の端点を1に近付けて行く場合です。より具体的には
/3ーz/5+z/7+・・・に「z=1を代入してみた場合の式」が収束するかどうかの判定が曖昧になっています。

この時にz/3ーz/5+z/7ー・・・の形の無限級数が収束するかどうかは、実は独立に確かめる方法があります。z=1を代入してみた時の形1/3ー1/5+1/7ー・・・は収束する事を確認できます。(但し、その方法では1ー1/3+1/5ー・・・がπ/4に収束するかどうかは判定できません。)

(交代級数に関する)ライプニッツの定理

数列{a}について
・数列{|a|}が単調減少 かつ
・n→∞でa→0ならば
交代級数aーa+aーa+・・・は収束する。
(但しこの逆は真ではなく、交代級数が収束しても上記2条件が満たされるとは限らない。)
※微分に関する同名の「ライプニッツの定理」も存在し、状況によっては使用を避けたほうが良い名称です。

この判定方法によれば、1/3ー1/5+1/7ー・・・は「収束する」事が分かります。

■参考:交代級数の収束性の検証(1/3ー1/5+1/7ー・・・の場合。逆三角関数によるライプニッツ級数の導出過程にて。)

このような時にz/3ーz/5+z/ー・・・はz→1の時に収束し、
その極限値は1/3ー1/5+1/7ー・・・の極限値に等しくなる事を保証する定理(連続性定理)がまた別に存在します。そのため、幾何級数展開した部分の極限は次のようになります。

$$\lim_{\epsilon \to 0, \delta \to 1}\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta=\left(\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots\right)-0$$

$$=\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots$$

$$よって、\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=\frac{1}{2}\left([xy]_\epsilon^\delta+[zx]_\epsilon^\delta\right)-\left[\frac{z^3}{3}-\frac{z^5}{5}+\frac{z^7}{7}-\frac{z^9}{9}+\cdots\right]_\epsilon^\delta$$

$$=\frac{1}{2}(1+1)-\left(\frac{1}{3}-\frac{1}{5}+\frac{1}{7}-\frac{1}{9}+\cdots\right)=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

$$同時に、\lim_{\epsilon \to 0, \delta \to 1}\int_\epsilon^\delta y dx=\int_0^1 y dx=\frac{\pi}{4}であるから$$

$$\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots$$

ライプニッツ級数の導出で使う式や計算をまとめるとこのようになります。置換積分と部分積分を行う箇所については順序を入れ換える事もできます。端点の極限を厳密に考える時には交代級数の収束性と連続性定理を考える必要があります。

■参考:(アーベルの)連続性定理

積分区間の端点の極限の考察で使用した連続性定理は次のようなものです。

連続性定理

x=0を中心とする整級数において収束半径がρ(>0)の時、 $$x=\rhoにおいて\sum_{n=0}^\infty a_nx^nが収束する\Rightarrow \lim_{x\to\rho -0}\sum_{n=0}^\infty a_nx^n=a_n\rho^n$$ $$\left(x=\rhoにおいて\sum_{n=0}^\infty a_nx^nが収束する\Rightarrow f(x)はx=\rho において左側連続\right)$$ xはρよりも小さい側からの極限を考えるものとしています。(「x→ρー0」の意味)
x=0を中心とする整級数(以下、単に「整級数」と呼びます)において収束円が(-ρ, ρ)であるという事は、|x|>|ρ|で収束しない事を意味します。
この時にもしx=ρにおいては整級数が収束する時に、その条件下で整級数が収束する範囲内でxを動かしてx→ρの極限を考えるとx=ρでの整級数(のnに関するxの極限関数)の連続性が保証されるというのが連続性定理の内容です。
この定理の表現方法はいくつか存在します。
例えば$$\sum_{n=0}^\infty a_nx^nが収束円の1つの端で収束する\Rightarrow\sum_{n=0}^\infty a_nx^nはその端において連続である$$と言っても同じ事です。
また、連続である事を表す極限については、例えば0以上1未満のtを使って\(\sum_{n=0}^\infty a_n(\rho t)^n\)に対してt→1の極限を考えても同じ事になります。
整級数の中には収束円の端点の片側だけで収束して、もう片方の端点では発散するというものが存在します。連続性定理もx=ρで整級数が収束する時にx=ρ側だけで連続性を保証し、
x=ーρの連続性は分からないものになります。

■連続性定理の証明

まず、各xでの整級数の極限関数がL(x)であるとします。
x=ρで収束するので $$\sum_{k=0}^{\infty}a_k\rho^k =L(\rho)として、$$ $$任意の\epsilon>0に対して、n>Nであれば\left|\sum_{k=0}^na_k\rho^k -L(\rho)\right|<\epsilonとなる自然数Nが存在$$ $$b_0=a_0-L(\rho),\hspace{5pt}n\neq0の時はb_n=a_nとするとn>Nであれば\left|\sum_{k=0}^nb_k\rho^k\right|<\epsilon$$ 次に|x|<|ρ|の任意のxに対しても、n>Nであれば一律に任意の同一のプラスの実数値以下(あるいは未満)にできるかを調べます。【εごとにxに依存しないで1つの値Nを決定できるかどうかを調べたい。】 $$n>M>Nに対して|S_n|=\left|\sum_{k=M+1}^nb_k\rho^k\right|=\left|\sum_{k=0}^nb_k\rho^k-\sum_{k=0}^Mb_k\rho^k\right|<2\epsilon\hspace{5pt}\cdots(*)$$ $$n> M+1の時S_n-S_{n-1}=b_n\rho^n\hspace{10pt}n=M+1の時、S_{M+1}=b_{M+1}\rho^{M+1}$$ $$x=\rho tとすると、\sum_{k=M+1}^nb_kx^k=\sum_{k=M+1}^nb_k\rho^kt^k=S_{M+1}t^{M+1}+\sum_{k=M+2}^n(S_k-S_{k-1})t^k$$ $$=S_{M+1}t^{M+1}+(S_{M+2}-S_{M+1})t^{M+2}+\cdots+(S_{n-1}-S_{n-2})t^{n-1}+(S_{n}-S_{n-1})t^n$$ $$=S_{M+1}(t^{M+1}-t^{M+2})+S_{M+2}(t^{M+2}-t^{M+3})+\cdots+S_{n-1}(t^{n-1}-t^n)+S_nt^n$$ |t|<1(すなわち|x|<|ρ|)の時はtk+1-tk>0であり、
削除: かつn>M>NであればSに関して上記(*)式が成立するので次の不等式が成立します。 $$\small{\left|\sum_{k=M+1}^nb_kx^k\right|≦|S_{M+1}|(t^{M+1}-t^{M+2})+|S_{M+2}|(t^{M+2}-t^{M+3})+\cdots+|S_{n-1}|(t^{n-1}-t^n)+|S_n|t^n}$$ $$<2\epsilon(t^{M+1}-t^{M+2})+2\epsilon(t^{M+2}-t^{M+3})+2\epsilon(t^{M+3}-t^{M+4})+\cdots$$ $$+2\epsilon(t^{n-2}-t^{n-1})+2\epsilon(t^{n-1}-t^n)+2\epsilon t^n$$ $$=2\epsilon t^{M+1}<2\epsilon$$ 【以上の不等式の組み立て方は級数変化法と呼ばれ、より一般的な形の命題が存在します。】
$$|x|<|\rho|である任意のxに対して、任意の2\epsilon>0を考えた時に$$ $$n>M(>N)であれば\left|\sum_{k=M+1}^nb_kx^k\right|=\left|\sum_{k=0}^nb_kx^k-\sum_{k=0}^Mb_kx^k\right|<2\epsilon$$ $$\left|\sum_{k=M+1}^nb_kx^k\right|=\left|\sum_{k=M+1}^na_kx^k\right|であるから【初項a_0,b_0がないので】、$$ $$n>M>Nであれば\left|\sum_{k=M+1}^na_kx^k\right|=\left|\sum_{k=0}^na_kx^k-\sum_{k=0}^Ma_kx^k\right|<2\epsilonでもある。\cdots(**)$$ 今、整級数を関数列{f}として見た時に、集合Fを{fn, fn+1, fn+2, ・・・}として考えて、
Fに対する上限と下限B=supFおよびA=infFを考えます。
各xに対してn>Nの時、
任意のδ>0に対してB-δ<fとなる自然数p>Nがあり【上限の定義から】、
2ε=ε>0に対して別の自然数q>Nを考えて上記(**)式でn=p,M=qとすると
|f-f|<εであり、-ε<f-f<ε
もしp<qならn=q,M=pとして考えて、成立する不等式は結果的に同じになります。
すると、B-δ<f<ε+fとなり、B-f<ε+δ
1つのqとεに対してδは0より大きい範囲で任意であるので、
B-f<εは成立し、B-f=εもあり得るけれども
B-f>εは成立しないので
B-f≦ε・・・(***)
下限については任意のδA>0に対してA+δA>fとなる自然数j>Nがあり【定義から】、
先ほどの(***)式はq=jの時でも成立し、B-f≦ε⇔f≧B-εとなるので
+δA>f≧B-εであり、
+δA>B-ε⇔B-A<δA+ε
δAは0より大きい範囲で任意なのでB-A≦ε
これはn→∞とした時にB→Aを意味して、閉区間 [B,A] は1つの点{c}に収束します。
さらに、n>Nの範囲でB≧c≧Aであるから、この時に任意のn>Nに対して|f-c|≦ε
(この範囲内でB=Aでなければ|f-c|<ε
よってcは整級数fの極限値でもあり、各xに対してc=L(x)であり、
n>Nであれば|x|<|ρ|の範囲内の任意のxについて一律に|f-L(x)|≦ε=2εとなります。
またx=ρの時はn>Nでε未満になるので、2ε以下という不等式も満たします。
【この事は整級数が|x|<|ρ|およびx=ρにおいて一様収束する事を表しています。
また、(**)式を示した後の証明はコーシー列に関する考察の一部です。整級数に限らず一般の数列に対して成立する事も含んでいます。】
次にx=ρでの連続性を見るためにx→ρの極限を連続性の定義の式から考えると、
三角不等式の考え方を利用して $$\small{\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^\infty a_k\rho^k \right|≦\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^na_kx^k \right|+\left|\sum_{k=0}^n a_kx^k-\sum_{k=0}^na_k\rho^k \right|+\left|\sum_{k=0}^n a_k\rho^k-\sum_{k=0}^\infty a_k\rho^k \right|}$$ 右辺の絶対値記号内の3項はnの値やxの範囲により、それぞれがε未満か2ε以下になります。
【特にnについて考える時に、上記で示したようにxの値に関わらずn>Nであれば一律に不等式が成立する事が重要です。】
①右辺第1項について、整級数の一様収束性よりn>Nの時。(Nの値はxに依存しない。)
②右辺第2項について、有限の次数の多項式はx=ρで連続なので、x=ρを含む十分小さな開区間U内の任意のxに対して。【この項はx→ρの極限で、nの値は任意で成立。】
③右辺第3項について、x=ρにおいても整級数は収束するのでn>Nの時。
そこで、nが①と③を満たすように十分大きく、
xが②を満たす開区間U内の範囲にあり、かつ|x|<|ρ|であれば $$\left|\sum_{k=0}^\infty a_kx^k-\sum_{k=0}^\infty a_k\rho^k \right|<2\epsilon+\epsilon+\epsilon=4\epsilon$$ $$\epsilonおよび4\epsilonは任意の小さな実数であるので、xの関数\sum_{k=0}^\infty a_kx^kはx=\rhoで左側連続。$$ ここでは(-ρ,ρ)の区間内でx=ρにおいて左側連続である事が示されています。もしマイナス側のx=-ρでも整級数が収束するなら、同様にx=-ρで右側連続である事を示せます。
【以上の証明は、いくつかの命題や補題に分けて説明される事もあります。】

立体角の定義と使われ方

立体角(solid angle)は、平面上の角度を空間的な広がりに拡張したものであり、球の表面積を利用して表されます。通常の平面の角度の事は、この記事では主に「平面角」と表記します。

立体角の単位は無単位とする事もありますが【sr】(steradian) という単位も一応あります。この記事では平面角のラジアン【rad】と区別する目的で、立体角に対して単位を付けて表記している事があります。

平面角はθで表される事が多いのに対して立体角はΩあるいはω(いずれも「オメガ」)で表記される事が多く、この記事でもその文字を使用します。Ωという文字は、電気抵抗の単位でも使われてその時は「オーム」と読みますが、ここではその意味ではなく文字の1つである「オメガ」として使用します。

立体角の定義と「錐面」

あまり聞き慣れない語かもしれませんが立体角の定義には錐面(「すいめん」)という言葉を使うと表現的に便利です。(使わなくても定義はできますがここでは使用する事にします。)

立体角は1つの点を基準として球面(範囲は任意)に対して錐面が囲む領域の表面積でとして定義されます。「錐面」とは円錐や三角錐などをより一般的に表した立体的な図形の側面の部分を表します。

錐面(「すいめん」)とは

錐面とは空間内の「1点」から伸びて1つの閉曲線を通過する直線の集まりによって形成される曲面を指します。(三角錐の側面のように平面状である物も含みます。)
1点を通過する直線の集まりとしても考えられますが、立体角を考える」場合には普通は半直線の集まりとしての錐面を考えます。
錐面を形成する閉曲線が円であればそれが「底面」を成して全体を構成する立体(錐体) は円錐であり、三角形であれば三角錐、四角形であれば四角錐となるといった具合になります。
立体角を考える時には模式的に円錐状の広がりを考える事も多いですが(分かりやすいので)、考える錐面は理論上は色々なものがあってよい事になります。

平面では三角形の一部に対して通常の角度(平面角)を考えますが、空間では円錐などの錐体を一般化したものの側面である錐面によって空間的な広がり(立体角)を考える事ができます。この図では円錐などの「底面」を敢えて上側に持ってきて描いています。
立体角の定義

立体角Ω【sr】はある1点Oからの3次元空間的な広がりを定量的に表します。
Oを中心とする半径rの球面において
「Oを頂点とした錐面で囲まれる領域」の面積をSωとした時に、次式で表されます。 $$\Omega=\frac{S_{\omega}}{r^2}$$ ところで球の表面積は \(4\pi r^2\) で表されるので、実はこの式は
考えている球の半径の具体的な値に関わらず立体角は同じ値になる定義となっています。
そこで、錐面で囲まれる球面上の領域の面積を「球面全体の面積のK倍」とすると次式で考える事もできます。 $$S_{\omega}=4\pi r^2Kと置く時、$$ $$\Omega=\frac{S_{\omega}}{r^2}=4\pi K$$ つまり立体角は4πの倍数(任意の実数倍ですが普通は1以下の有理数)で表され、
半球全体の広がり(空間全体の2分割)を表す立体角は2π【sr】です。(K=1/2)

次に見て行くように立体角は考えている球面(あるいは任意の曲面)がプラスとマイナスの符号の違いがあり、さらに任意の実数の値を考える事ができます。

球の表面積を表す記号としてはSでもAでも他の文字でも何でもよいのですが、ここでは一般の閉曲面の表面積も考えていくので球面上の領域の面積には添え字を付して区別しています。

平面で通常の角度である平面角θを考える時も実は同じような考え方がなされています。
原点から伸びる2直線と、原点を中心とするてきとうな半径rの円との交点を考えて、その円弧の長さLを半径rで割った値が弧度法での角度θであると言えます。つまりθ=L/r【rad】と考えていて、L=2πrkとおくならθ=2πk【rad】であり、すなわち
「2πの何倍か」によって平面上の1点から伸びる2直線の広がりを角度θで表している
というわけです。
ただし平面角の場合、その倍率であるkは任意の実数値ですが普通は敢えて無理数では考えずに有理数を使う事が多いわけです。
90°であれば2π/4=π/2【rad】
60°であれば2π/6=π/3【rad】
45°であれば2π/8=π/4【rad】のようにしている事の
拡張が立体角の考え方であると言えます。
ただし立体角の場合は、同じ立体角の値となる広がりの錐面の形状は一般的に1つとは限らず様々な形状があり得ます。

立体角の大きさの範囲

立体角を0【sr】から2π【sr】に増加させると、広がりとしては半球の大きさ分になります。
図形的に見るとそこから先も半球分に立体角を加えていく事は可能に見えるわけで、実際そこからさらに立体角を増やす事は可能です。

立体角が2π【sr】を超える時には図形的には錐面は球面の反対側の領域を切りとっていく事になるはずです。この時に錐面と球面の交わりで作られる閉曲線の「内側」と「外側」の関係を統一的に考えて、0【sr】から始めて「閉曲線の内側」と考えていた向きを2π【sr】から先も保つとします。

すると、錐面が切り取る球面上の領域の表面積は2π【sr】にさらに値が追加されていく事になります。それを続けると立体角は「球の内側から見た球面全体に対する広がり」(すなわち「空間全体」に対する広がりと同じ)を表す4π【sr】まで増加します。

つまり通常の3次元空間での立体的な広がりを表すには、立体角の「大きさ」は0≦Ω≦4πの範囲で考えれば十分という事になります。球全体の表面積に対する倍率では0≦K≦1を考えています。
ただし後述するように、曲面に対する表裏の関係で立体角を符号も含めて考える時は
マイナスの値も含まれるようになって範囲が-4π≦Ω≦4πとなります。(さらにその範囲外の場合も立体角は定義されますが、ここでは原則として除いて考える事にします。)

後述するように、あるいは図形的に考えて閉曲面内に立体角を考える点を設置して閉曲面全域に対して立体角を考える場合にはその立体角のは符号も含めて4π【sr】です。逆に閉曲面の外側から閉曲面全域についての立体角を考えると、その立体角は0【sr】になります。(閉曲面の外側から閉曲面全域の立体角を考える場合、閉曲面を2に分割して同じ大きさのプラスマイナスの符号だけ異なる立体角を合計する事で0になります。)

動く点から1つの曲面に対して立体角を考える場合には
点が曲面の外を通って1周した後に曲面を通過してもとの位置に戻る時に、
曲面通過時に立体角が4π【sr】または-4π【sr】変化するという事が起こります。
ただし通常の図形的な考察ではその場合を考えなくてもよいので、
以下ではその場合を除いて考えていきます。

立体角が負の数である時の定義

立体角Ωが0≦Ω≦4πの範囲の時、
立体角を考える基準の点は球面(半径に関わらず)の内側にあります。

そこで、空間内のてきとうな位置から何かの曲面に対して立体角を考える時には
曲面に表と裏がある時には次のように立体角の符号を決める定義をします。

立体角のプラスとマイナスの符号の定義
  • 基準点が曲面の裏側にある時:立体角の値の符号はプラス+
  • 基準点が曲面の表側にある時:立体角の値の符号はマイナス-

ここでの曲面の表裏の関係は、法線面積分等を考える時の意味での曲面の表裏と同じです。
符号の関係をここでの場合とは逆にしても定義は可能ですが、ここでは混乱を避けるためにこの定義のもとで話を進めます。

ここでの「表側」「裏側」という事をより具体的に言えば、
曲面の外縁となっている閉曲線の各点から基準点に向けての錐面を構成する線分が曲面の表面側から出る方向を向いているか、裏面側から出る方向を向いてるかの違いになります。

この定義とは逆の方法で、立体角の符号を逆に考える定義もあります、ただし以下ではこの図の位置関係での定義として立体角の符号を考えます。

法線面積分およびガウスの積分との関係式

立体角は前述の符号も含めた関係の定義のもとで、
てきとうな曲面Sがあった時にその曲面上の法線面積分で表す事ができます。

さらに立体角を法線面積分で表す時、被積分関数はガウスの積分【位置ベクトル(x,y,z)を距離の3乗で割ったものに対する「閉曲面」上の法線面積分】での被積分関数になります。
そのため、特にSが閉曲面の時には立体角は-4π≦Ω≦4πの範囲においてガウスの積分として値が3通りに決まります。

法線面積分による立体角を表す式

原点をOとして\(\overrightarrow{r}=(x,y,z)\) として、その大きさはrで書きます。
ある曲面Sの外縁となっている閉曲線の各点から原点に直線を引いて錐面を作った時、 原点Oから見た立体角は次のように符号も含めて法線面積分で表されます。 $$\Omega=\int_S\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}$$ ■右辺を勾配で表した時 $$\Omega=-\int_S\left\{\mathrm{grad}\left(\frac{1}{r}\right)\right\}\cdot d\overrightarrow{s}$$ ■特に曲面Sが閉曲面である時
上記の積分はガウスの積分であり、
値は原点OとSの位置関係によって次の値になります。

原点Oの位置立体角Ωの値(およびガウスの積分の値)
閉曲面Sの内部\(\Omega =4\pi\)
閉曲面Sの外部\(\Omega =0\)
閉曲面S上\(\Omega =2\pi\)

閉曲面を考える場合には閉曲面に対して立体角を考える点が
「内部にあれば裏側」「外部にあれば表側」という事が確定するので、
-4π≦Ω≦4πの範囲で立体角が符号も含めてこれらの3通りに決まります。
ある点から曲面あるいは閉曲線に向けての立体角を考える時、その立体角を曲面等から点に向けて「張る」立体角であると表現される事もあります。

立体角を法線面積分で表す関係式を導出する方法としては、
曲面を細かい平面に分割して角度(平面角)の関係から微小面積に対する関係式を考えるか、もしくは最初から積分で考えてみてガウスの発散定理を適用する方法があります。

曲面が閉曲面の時にはガウスの積分そのままの計算であり、値の導出の計算にはガウスの発散定理を使うと導出する事ができます。

立体角の定義から考えると、外縁となる閉曲線を共有する複数の開曲面に対して錐面の延長をはみ出さない限りは「立体角は1つだけの値として決まるはず」です。
その事は、立体角を考える点から見て「曲面の表裏の関係が同じであれば」成立します。

【積分の表記の場合でもガウスの発散定理を使う事でそれが成立する事を確認できます。下記の2番目の方法でも触れるように、\(\overrightarrow{r}\)/(r)の発散は0である事を使用します。】

この場合、錐面から曲面がはみでている場合でもはみ出た部分によって閉曲面を考えると、その部分の符号も含めた立体角はガウスの積分で表せることから0となって消えるので立体角の大きさに影響しない事になります。

他方で、立体角を考えている点Oに向けて閉曲線から曲面を引っ張ってきたような場合には話が変わってきます。例えばそれで1つの曲面が点Oに重なる場合には積分の表記で考えると実は2つの曲面に対する立体角には2πの差ができます。さらに、閉曲線を共有する1つの曲面ともう1つの曲面が1つの閉曲面として点Oを内部に含むようになると、2つの曲面に対する立体角には4πの差が生じます。【その時に2つの立体角についてΩ=Ω+4πという関係になります。立体角は4πを超える事もありますが、ここでの場合に限定して言うと片方の曲面の表裏の関係を保ったまま動かしているのでΩ2はマイナスの値の立体角となり、Ω<4πとなります。】

微小面積で考える場合の導出

立体角を考える基準点の原点Оは開曲面Sの裏側のほうに位置しているとします。

まず球面の領域の表面積から立体角を考える定義のもとで1つの立体角は球面の領域を分割して考える事ができて、さらに考える球面の半径は任意でよい事から分割した微小領域ごとに立体角を考えるための球の半径を自由に設定できます。

ここで球面を微小な平面領域で近似する場合には一般的に半径が大きい球のほうが細かい分割が必要なので、大きい半径を考える時ほどさらに細かく分割を行うものとします。

分割は球面上および曲面上の3点をつないで三角形領域で行うとして、
曲面Sの分割領域の頂点から原点Оに向けて直線を引き、球面に対しても微小領域の頂点がその直線上にあるように分割を行います。必要に応じて分割はより細かくします。

\(\overrightarrow{r}=(x,y,z)\)を考えて、球面の微小領域がその点を含むように位置で球の半径を調整します。(積分をする時にはS上の微小領域上にベクトルを平行移動させるとして考えます。)
\(\overrightarrow{r}\)は原点から(x,y,z)に向かうベクトルであり、原点を中心とする球の球面に対して垂直です。

次に微小領域同士がなす角度θ(平面角の意味)は、
図の位置関係から\(\overrightarrow{r}\)と曲面S上の面積要素ベクトル\(d\overrightarrow{s}\)のなす角に等しくなります。
(面積要素ベクトルは曲面上の微小領域に垂直です。)

曲面S上の微小領域の面積を\(|d\overrightarrow{s}|\) =dsとして
球面上の微小領域の面積をdAとおくと、dA=dscosθです。

他方で\(\overrightarrow{r}\)と\(d\overrightarrow{s}\)の内積を計算すると\(\overrightarrow{r}\cdot d\overrightarrow{s}\)=r ds cosθ=r(ds cosθ)=rdAです。
そのため、今考えている微小領域に対する立体角の微小量をdΩの定義式から計算すると次のようになります。【途中で分子に対してr(ds cosθ)の形を作る変形をしています。】

$$d\Omega =\frac{dA}{r^2}=\frac{rdA}{r^3}=\frac{rds\cos\theta}{r^3}=\frac{\overrightarrow{r}\cdot d\overrightarrow{s}}{r^3}$$

そこで、曲面Sの領域全体に対して微小領域を合計して分割の極限をとる事で法線面積分の形になります。(dΩを同じ領域で積分すると、曲面S上の分割と球面上の分割は1つ1つ対応させているので全体の立体角Ωとなります。)

$$\Omega=\int_S\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}$$

\(\overrightarrow{r}\)/(r)は、-1/rに対する勾配ベクトルを使って-grad(1/r)とも書けます。

閉曲面の場合には開曲面を2つ考えてつなぎ合わせる事により、
表と裏の関係による符号にだけ注意すれば同じように関係式が成立します。

微小面積に対する立体角の式

同時に、ここでの導出での途中式で得られている関係式も
物理的な考察に使える事があります。 $$d\Omega =\frac{dA}{r^2}=\frac{ds\cos\theta}{r^2}$$ 導出ではこれを内積として考えて法線面積分ができる形にしていますが、
これをそのまま使える場合というのもあります。

発散定理から考える方法

曲面Sの外縁の閉曲線の各点から原点Оに向かって直線を引いて錐面を作り、原点は曲面Sの裏側のほうに位置しているとします。球面は原点を中心とします。原点と曲面の間のてきとうなところで球面を考えて、「開曲面Sと錐面と球面上領域S」で構成される閉曲面Sを考えます。

すると原点から向かう位置ベクトル\(\overrightarrow{r}\)は、その閉曲面上では曲面S上で表側を向き、球面上では裏側を向きます。つまり同じ被積分関数\(\overrightarrow{r}\)/(r)に対する法線面積分は符号が互いに逆になります。

原点を中心とする球面上では球面に対して\(\overrightarrow{r}\)は垂直なので各微小領域で\(\overrightarrow{r}\)/(r)と面積要素ベクトルとの内積は1/(r)とdsの積です。球面上で1/(r)は一定値である事に注意すると、法線面積分は定数をS=0から「表面積の値」まで積分したものになります。
そこで球面上領域Sの面積を4πrkとおくと、S上の法線面積分は、閉曲面Sでは裏側で行う事にも注意して-4πk(=-Ω)となります。

$$\int_{Sc}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}=\int_{Sc}\left|\frac{\overrightarrow{r}}{r^3}\right|ds=\int_{Sc}\frac{1}{r^2}ds=\frac{1}{r^2}\int_{Sc}ds【S_c 上でrは一定値なので】$$

$$=-4\pi r^2k\cdot\frac{1}{r^2}=-4\pi k$$

また錐面は\(\overrightarrow{r}\)の定数倍の線分で構成される微小平面の集まりなので、各微小領域で面積要素ベクトルは\(\overrightarrow{r}\)に垂直です。よって、錐面での\(\overrightarrow{r}\)/(r)の法線面積分は0になります。

ここで、ガウスの発散定理を使うために
\(\overrightarrow{r}\)/(r)に対する発散(無限大の発散ではなく div のほう)を考えると次の公式がつかえます。

使用している公式

ベクトル場に対する発散 div の直接計算により次式が成立します。 $$\mathrm{div}\left(\frac{\overrightarrow{r}}{r^3}\right)=0$$ ベクトル場の発散 div\(\overrightarrow{F}\) はスカラー量です。

そこで、ガウスの発散定理を使うと次式が成立します。

$$\int_{S0}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}=\int_V\mathrm{div}\left(\frac{\overrightarrow{r}}{r^3}\right)dv=0【発散定理より】$$

$$他方で、\int_{S0}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}=\int_{S}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}-4\pi k$$

$$よって、\int_{S}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}-4\pi k=0\Leftrightarrow\int_{S}\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}=4\pi k=\Omega$$

Sを閉曲面として考える場合には原点ОからSに向かって引いた直線でSに接するものを考えます。接点で構成される閉曲線によりSを2分割して錐面と球面上の領域を含めた全体の領域を考えれば、その内部にある開曲面上の法線面積分は表と裏で合計するとプラスマイナスが打ち消して0になるので上記と同じく開曲面Sに対しての考察で関係式を導出できます。

\(\overrightarrow{r}\)/(r)に対する発散の計算は上図のようになります。当サイト他記事より内容を引用。

円錐の半頂角と立体角の関係式

円錐があった時に、円錐の頂点から見た時の円錐の広がりを表す立体角はどれほどになるでしょうか。これは「底面の中心を含む円錐の断面に等しい三角形を考えた時に、斜辺を半径として円錐の頂点を原点とする球が円錐の底面の周によって切り取られる領域の表面積はいくらですか」という問題です。

円錐の場合には立体角以外にも半頂角(これは平面角)を使う事でも広がりを表現できます。
半頂角とは、
「円錐の頂点と底面の中心を含む断面の三角形における円錐の頂点を含む角度の半分」です。
半頂角の大きさを弧度法で表してφ【rad】であるとして、立体角との関係式を作る事ができます。

円錐の半頂角と円錐の頂点から見た立体角の関係

底面の中心を含む円錐の断面に等しい三角形を考えた時に、
斜辺の長さをrとして、半頂角の大きさをφ【rad】とすると
円錐の頂点から見た立体角は次のように表されます。 $$\Omega=2\pi (1-\cos\varphi)【sr】$$ rは円錐の底面の円周上の点から頂点までの距離でもあり、また円錐の頂点から見た立体角を考える時の球の半径としても特に扱います。(立体角を考える球の半径は任意ですが、一番計算しやすい半径としてここでのrを使います。)
この式でφ=π/2(これは半頂角の値で、2倍するとπです)とおくと
半球分の表面積をrで割った値となり、半球分の立体角を表します。

この式は図形的な考察と積分(1変数の)によって導出します。

底面の中心から球面上に直線を引き、円錐の高さとなっている線分とのなす平面角をθとします。底面の中心から球面上までの長さを保ったまま直線を回転させると球面上に円ができます。この時に円錐の頂点と底面の中心を含む断面ではθの値は同じです。円錐の頂点からその円までの範囲の面積をSとするとそれはθの1変数関数S(θ)です。円錐が作る立体角はΩ=S(φ)/(r)です。

ΔS=S(θ+Δθ)-S(θ)とすると、
図形的な考察によりΔS≒(rΔθ)・(2πrsinθ)であり、
ΔS/ΔθはΔθ→0の極限でr・(2πrsinθ)=2πrsinθと表せます。
そこで、逆に2πrsinθを積分すればS(θ)が得られるはずで、
定積分すればS(φ)が得られるはずであるという流れです。
【より詳しくは (rΔθ)・2πrsinθ ≦ ΔS(θ) ≦ (rΔθ)・2πrsin(θ+Δθ) となり、
変形すると2πrsinθ ≦ ΔS(θ)/Δθ ≦2πrsin(θ+Δθ) となるのでΔθ→0として、
sin(θ+Δθ)→sinθとなる事に注意して導関数(微分)がdS/dθ=2πrsinθのように表せると考えます。すなわち、1変数の定積分および微積分学の基本定理の考え方です。】
rΔθは円弧の長さ(直線状の線分の長さに近似)を計算していて、
ΔSの面積の部分の「幅」でもあります。
2πrsinθはS(θ)の表面積の領域の外周である円周の長さです。

この時にはθを積分変数として区間を[0,φ]のもとで積分をすると表面積に等しくなります。(この場合はこの計算で球の表面積の一部分を表せるという事であり、一般の曲面の表面積はより複雑です。)この積分でθの関数になっているのはsinθの部分だけになります。

$$S(\varphi)=\int_0^{\varphi}2\pi r^2\sin\theta d\theta=-2\pi r^2\large{[\cos\theta]_0^{\varphi}}=2\pi r^2(1-\cos\varphi)$$

立体角はS(φ)/(r)なので式からはrが消えて次式になります。
(Ωはrに依存しないはずなので、その事とも合っています。)

$$\Omega=\frac{S(\varphi)}{r^2}=\frac{2\pi r^2(1-\cos\varphi)}{r^2}=2\pi (1-\cos\varphi)$$

例1:立体角による電場に関するガウスの法則の理解

電場に関するガウスの法則(ガウスの発散定理とは関係はあるけれども別物)は、電荷が作る電場の大きさが距離の2乗に反比例する事に由来して数式的にはガウスの積分の形をしています。さらに法線面積分を考える対象が閉曲面であり、電荷が閉曲面の内部に含まれる考え方としては「立体角は4πになるので」という事で直ちに法則の結果を得るというわけです。

電場に関するガウスの法則の立体角による説明

Q【C】の電荷を囲む閉曲面Sに対して、電荷が作る電場に関して次の法則が成立します。
(εは真空の誘電率) $$\int_S\overrightarrow{E}\cdot d\overrightarrow{s}=\frac{Q}{\epsilon_0}$$ この式は「法則」なので(定理ではなく)そのまま受け取ればいいのですが、
この法則の場合は数式的に左辺が右辺に等しい事を見るために考察ができます。
電場ベクトルは大きさがQ/(4πε)【1/(4πε)はクーロン力の比例定数】であり、
向きは電荷の位置を原点とした時の単位位置ベクトル\(\overrightarrow{r}/r\)です。
【\(\overrightarrow{r}/r\)は、ベクトル(x.y,z)をrで割って大きさを1としたもの】
それをもとに書き直すと、法則の左辺は立体角に対する定数倍の形で表せます。

具体的に法則の左辺をQやrの形にすると次のようになります。

$$\int_S\overrightarrow{E}\cdot d\overrightarrow{s}=\frac{Q}{4\pi\epsilon_0}\int_S\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}$$

つまりガウスの積分の定数倍という事になりますが、前述の考察によりそれは閉曲面に対する立体角と同一視する事もできるわけです。

そしてここでは電荷の位置(原点)は閉曲面の内部にあるので「積分の値は4π」であると考えれば、定数であるQ/(4πε)に乗じる事で法則の右辺の形Q/εを直ちに得れるという見方もできます。

$$\int_S\overrightarrow{E}\cdot d\overrightarrow{s}=\frac{Q}{4\pi\epsilon}\int_S\frac{\overrightarrow{r}}{r^3}\cdot d\overrightarrow{s}=\frac{Q}{4\pi\epsilon_0}\cdot4\pi=\frac{Q}{\epsilon_0}$$

これは計算としてはガウスの積分を使った場合と同じになります。

例2:電気二重層が作る電位

薄い導体板の片側に一様プラスの静電荷が一様な大きさで分布していて、その裏側ではマイナスの静電荷が一様な大きさで分布している電気二重層が作る電位は立体角を使って表現できます。

電気二重層が作る電位

導体板の厚さがb【m】で、板の表側の表面電荷密度がσ【C/m】(>0)であり
裏側の表面電荷密度が-σ【C/m】であるとして、
導体板内には電荷は存在せず、真空の誘電率はεとします。
この時に板から離れた点(板の厚さに比べて十分離れた位置)Pから板に向けて考えた立体角をΩとすると、点Pでの電位は次のように表されます。 $$V=\frac{b\hspace{1pt}\sigma\hspace{1pt}\Omega }{4\pi\epsilon_0}【V】$$ この式で、より具体的にはΩは別途に計算される必要があります。
考え方としては板磁石や、環状電流が作る磁場で電流が作る磁場の渦が十分弱いとみなせる位置において便宜的な量である「磁位」の計算する事にも使えます。

この関係式は板の表と裏に電気双極子(互いにわずかに離れた位置にある同じ大きさの電気量で存在するプラスとマイナスの電荷)が分布していると考えて、板の微小な部分が作る電位を計算すると点Pから見た微小面積に対する立体角の定数倍となる事から導出されます。

電気双極子が作る電位

互いにb【m】離れている+Q【C】と-Q【C】があり、 電荷の中点からr【m】離れていて2つの電荷を通る直線とのなす平面角がθの 位置Pでの電位を考えると、bに比べてrが大きければ次の近似式が成立します。 $$V=\frac{b\hspace{1pt}Q\hspace{1pt}\cos\theta}{4\pi\epsilon_0r^2}【V】$$ 単独の点電荷が作る電位はrに反比例するという結果なので、電気双極子の場合にはrの2乗に反比例するという結果が得られる所が異なります。
この式は単独の電荷が作る電位を合計して(差の形になりますが)、rがbに比べて十分大きいという近似のもとで平方根を一般二項定理により展開する事で得られます。

板の微小面積がdsの部分による点Pに作る電位dVを、電気双極子が作る電位とみなして計算します。プラスとマイナスの電荷の大きさはσdsで、電荷の距離は板の幅でdです。

$$dV=\frac{b\hspace{1pt}\sigma \hspace{1pt}ds\cos\theta}{4\pi\epsilon_0r^2}=\frac{b\hspace{1pt}\sigma}{4\pi\epsilon_0}\cdot\frac{ds\cos\theta}{r^2}=\frac{b\hspace{1pt}\sigma}{4\pi\epsilon_0}d\Omega$$

ここで行ったのは定数となる部分と立体角の微小部分dscosθ/(r)を見やすくするために分けた事と、前述の考察による微小面積部分におけるdΩ=dscosθ/(r)を代入した事になります。

ところで分割を十分細かくとったうえでdΩの合計をとると立体角Ωとなるわけですが、ここで考えている電位はスカラー量であり単純に加える事で合計の電位となるのでdV=kdΩの形の量を十分細かい分割のもとで合計すればVが得られます。すると板全体では、ここでは実はV=kΩを意味します。

$$分割を十分細かくした極限で合計してV=\frac{b\hspace{1pt}\sigma\hspace{1pt}\Omega}{4\pi\epsilon_0}$$

ただし先ほど触れた通り、より具体的に計算をするには板の形状などを指定したうえでΩの具体的な値の計算が必要です。

光の二重スリット干渉実験【ヤングの実験】

ヤングによる実験をもとにしている二重スリットを使った光の干渉実験は光の波動性を確認できるとともに、可視光の波長の概算的な測定ができる実験です。
また、光の干渉を利用した種々の干渉計のもとになっているという意味での重要性も持ちます。
数式的には三角比も含めた平面幾何的な考察によって、光の異なる2つの経路の長さの差(光路差)を計算する事により波長を含んだ関係式を導出できます。

この実験では光のコヒーレンス可干渉性)の考え方も、重要な要素の1つとなっています。

模式図としては、分かりやすさのためにスリットの並びとスクリーン上の干渉縞が画面や紙面に対して縦方向に現れるように書かれる事が多くこの記事でもそうしていますが、実際の実験ではその方向が地面に対して平行であるようにする事がどちらかというと多いと思われます。

この記事では古典論での光の波動性を示す干渉実験について説明しています。
量子力学的な意味での二重スリット干渉実験もありますが、そちらでは粒子(とみなせる塊)を1つずつ、ある程度の時間の間隔をあけて二重スリットに向けて打ち出すという手法がとられます。ただしスリットのどちらかを狙い打ちするように打ち出すのではなく、スリットを通過する際に「どちらのスリットを通過したか不確定である」ようにします。そこがヤングによる干渉実験と異なる部分となります。量子力学的な二重スリット干渉実験は20世紀後半以降、電子や光子、一部の分子(比較的分子量が大きいものも含む)などについて行われています。

人の目に見える領域の光である「可視光線」の波長は実は非常に短く、
「ナノメートル」や「マイクロメートル」の単位のスケールでの長さとなります。
単位についてのメートルとの関係は次の通りです。
【nm】・・・「ナノメートル」 1【nm】=10-9【m】
【μm】・・・「マイクロメートル」 1【μm】=10-6【m】
【mm】・・・「ミリメートル」 1【μm】=10-3【m】
「センチメートル」【cm】は10-2【m】(百分の1メートル)になります。

■関連サイト内記事:

スリットとは【実験の概要】

スリット(slit)は物理の実験用に使われる板などに開けた非常に細い隙間の穴の事であり、
二重スリットあるいはダブルスリット(double slit, double-slit )は非常に近い間隔でスリットが2つある構造を指します。

slit とは英語において通常の語としても使われており、
「(刃物等による)切れ目」とか「切れ目を入れる」という意味で使われます。
「スリット」という言葉は実は現代日本語でも使われる時があり、パンや服、その他の色々なものに施された切れ目や溝、細い穴を指してスリットと言う事があります。

光の干渉(「かんしょう」)を調べる実験では、二重スリットにおけるそれぞれのスリットから光を出してスクリーン上に当てて波が強め合う位置(明るくなる)と弱め合う位置(光がなく暗く見える)が現れる事を見ます。それが縞模様のように見える事が多いので明暗のパターンの模様を干渉縞(「かんしょうじま」)と呼ぶ事もあります。
また、ある位置で2つ以上の光の重ね合わせの事を干渉光と呼ぶ事があります。

干渉は波動一般に対して起こる現象です。
ある位置で2つ以上の波の波形がぴったりと重なっていると合計として1つの大きな振幅の波となって強め合い、逆に波の最大値(プラスの値)と最小値(マイナスの値)が重なってしまうと波がつぶれて振幅が任意の時刻で0になってしまい弱め合います。
ここでは2つの光線の干渉を考えますが、3つ以上の光線の干渉を考える事もできます。

光には結論から言うと波動性がありますが、もし波動性が無くて「粒子(の集まり)としてだけ」振る舞うとしたらそのような縞模様ができる必然性がないので、干渉縞が現れる事が波動性を持つ事の根拠であるとして物理学的には解釈されているわけです。

実験用に使う二重スリットには色々なものがあり得ますが例としては、
1つのスリット自体の幅は0.1【mm】程度(光が回折するのに必要なおおよその細さ)、
2つのスリット間の距離は0.1~1.0【mm】程度のものがあります。
(スリットが開けられているスリット板の大きさは、例えば横10cm,縦5cm程度など。)

水面の波が平面波として進行しているような場合は位相が揃っている波が隙間に入ります。
基本的に、光の干渉を調べる時にも同じ状況を作る必要があります。
スリットから出た波が広い範囲に広がっていくようにするには波の回折の現象を利用します。
可視光線の干渉の場合、波が強め合う位置は明るい点や線となって見えて、波が弱め合う位置は明るさが無く暗く見えます。

1つ1つのスリットからは1方向だけに光線が出るのではなく、非常に広い範囲にたくさんの光線が広がって行く形になります。これは波の回折現象を利用しており、波動性がなければ干渉同様に発生しない現象でもあります。

そのためにスクリーン上の各点では2つのスリットから出た光線のあらゆる重ね合わせが連続的に映し出される事になり、その中で特に光が同位相で強め合う部分と、半波長だけずれて弱め合う部分が目立って見えて干渉縞が形成されるわけです。

光は非常に細いスリットを通過する事ができます。
ただし、二重スリットの実験においてはスリットは意図的に細いものを使います。それはスリットにおいて波の回折を起こさせるためです。
回折とは波が小さい隙間に入り込み、そこから出る時に同心円か同心球状に大きく広がっていく現象です。イメージとしては水面に何か物が落ちた時に波紋が広がっていくような事が波が隙間から出る時に起きる事を指します。しかし回折はどんな波に対してどのような隙間に対しても起こるわけではなくて、基本的には波の波長が短いほど短い隙間が必要になります。
そして結論から言うと可視光線(色として人に見える領域の光)の波長はおおよそ
400【nm】~700【nm】の範囲であり、標準的な音波と比較しても非常に短い波長です。
光の干渉に使うスリットに「細さ」が求められるのはそのためであり、基本的に可視光線のて回折を起こさせるためには0.1ミリメートル程度かそれ以下の細さのスリットを使う必要があると言われます。

模式図としては、分かりやすさのためにスリットの並びとスクリーン上の干渉縞が画面や紙面に対して縦方向に現れるように書かれる事が多くこの記事でもそうしていますが、実際の実験ではその方向が地面に対して平行であるようにする事も多いです。
光源としては広がりが十分狭い「点光源」とみなせるものを使う必要があります。
単色光に近い光の干渉縞の明線の間隔はほぼ一定値です。
ただし、スクリーンの原点部分から離れるにつれて光の強度は小さくなっていくので明線の明るさも少しずつ減っていきます。

波動が正弦波であるとすると、干渉の効果を式で表す事もできます。
2つの光路の大きさをそれぞれRとRとすると2つの波はそれぞれ y=Asin(kR-ωt),y=Asin(kR-ωt)で表され、それらの波の重ね合わせは三角関数の和積の公式または加法定理により次式で計算できます$$A\sin(kR_1-\omega t)+A\sin(kR_2-\omega t)$$ $$=2A\sin\left\{\frac{k(R_1+R_2)}{2}-\omega t\right\}\cos\frac{k(R_1-R_2)}{2}$$この式で余弦の部分は時間に依存しないのでRとRの値によって決まる「振幅」の一部だと見なせます。余弦の部分は時間に依存せず、光路差(の絶対値)| R-R|にのみ依存して干渉光が強め合ったり弱め合ったりする事を表します。

公式を使った後の余弦の部分は(A-B)/2の代わりに(B-A)/2を考えても余弦の値は同じになります。

光の波長と干渉縞に対して成立する関係式

スリット板の中央から垂直に線を引いて、
その線とスクリーンとの交点をここでは「スクリーン上の原点」と呼んでおきます。
スクリーンとスリット板は平行になるようにきちんと立てます。(片方だけ傾いていると結果がおかしくなります。)

光の干渉に関する二重スリットの実験の結果に使う数値は次の通りです。波長を除くと、使用する記号は他のものが使われる事もあります。

  • λ【m】光の波長(可視光ではおおよそ400【nm】~700【nm】の範囲)
  • L【m】スリット板中央からスクリーン原点までの距離(数十【cm】~3【m】の範囲等)
  • d【m】スリット板における2つのスリット間の距離(0.1~1.0【mm】程度)
  • y【m】スクリーン上における、原点部分からの距離。(スリット板に平行な方向。)
    (座標のようにプラスマイナスの値で考える事もあります。)
  • Δy【m】スクリーン上に現れる明線間の距離(数ミリメートル~数センチメートル程度)

その他に、整数nや奇数2n+1などを式中で使います。具体的な数値は色々な場合があり得ますが、光の波長の範囲を考えると特定の数値を極端に大きくしたり小さくし過ぎたりすると上手く測定ができない事につながります。
以下に示す関係式を使う時にはスリットとスクリーン間の距離Lは、yやdと比べて十分大きい値になっている必要がありますが、それについても、極端にLが大きすぎてもおかしくなります。

スリット間の距離については「d」の文字が使われる事が多いのでここでもそうしていますが、微分や微小量とは直接的に関係はありません。ただしそれなりに短い間隔ではあります。

光源としてはレーザー光線のように単色とみなせて位相が揃っている(コヒーレントである)ものを使うのが望ましく、
白色光を使う場合は小さい穴に通して点光源化し、色フィルタ等を置いて多くの波長の光を除外して単色に近くなるようにします。そこから回折により同じ位相の揃った単色に近い波が広がって進行し、二重スリットに至るようにします。

二重スリット実験での測定で光の波長を表す式

二重スリットによる光の干渉実験において、
上記の量と光の波長の関係式は次のように表されます。
■波長をL,d,Δyで表す式 $$\lambda = \frac{(\Delta y)d}{L}【波長を表す式】$$ $$\Leftrightarrow \Delta y=\frac{\lambda L}{d}【明線の間隔を表す式】$$ ■光路差が波長の整数倍になる事および明線の位置を表す式
(nは整数。n=0の時はスクリーン中央、n=1の時はΔyを使った式と同じです。) $$n\lambda=\frac{yd}{L}$$ $$\Leftrightarrow y=\frac{n\lambda L}{d}$$ ■y/L=tanθ を使った場合の表記
(θが小さい値の時に成立。)
$$n\lambda=d\tan\theta≒d\sin\theta≒d\theta$$

波が弱め合う条件を考える場合にはmを「奇数」としてmλ/2を考えて
yd/L≒mλ/2とするか、
あるいは「波長の整数倍に半波長が加わっている」と考えて
yd/L≒(n+1/2)λのようにします。
奇数mをm=2n+1と書けば
mλ/2=(n+1/2)λとなるので、上記2式は同じものです。

可視光の波長のおおよその範囲が
400【nm】~700【nm】=4×10-7【m】~4×10-7【m】なので、
上記の関係式Δy=λL/dから判断すると
Lやdの値によってはΔyの値が小さくなり過ぎて
「干渉縞がつぶれてしまって測定できない」という事もあり得る事が分かります。

仮にd=0.10【mm】=1.0×10-4【m】でL=1.0【m】であるとします。
この時にλ=500【nm】=5.0×10-7【m】の光を光源に使うとすると
Δy=λL/d=5.0×10-3【m】=5.0【mm】となり、
おそらく目視で干渉縞を確認できるだろうという計算になります。
(n=1~4くらいまではL がyに対して十分大きいという前提条件も確認できます。)

可視光の波長はいわゆる「色」(普通の赤、青、紫などの色)で特徴づけられます。白色に関しては色々な波長の光が混ざったものです。
(黄寄りの赤・紫寄りの青・緑の光を混ぜると大体白色になるとされます。)
また「物体の色」に関しては白色光等から特定の波長の光が吸収されて、
残りが反射される事で「補色」が見えているというのが一般的に言われる事です。

おおよその波長
特に光では幅がある
備考
紫色の光約400
~450【nm】付近
約380【nm】を下回ると紫外光
(基本的に人の目では見えない)
青色
水色の光
約450
~500【nm】付近
紫色・緑色との境界は曖昧
緑色の光約500
~550【nm】付近
水色・黄色との境界は曖昧
黄色
橙色の光
約550
~600【nm】付近
緑色・赤色との境界は曖昧
赤色の光約600
~700【nm】付近
約780【nm】を超えると赤外光
(基本的に人の目では見えない)
音波約1.715【m】空気中,20【℃】200【Hz】で
音速約343【m/s】の場合
空気中の音波に比べると可視光の波長は非常に短いという観測結果が得られています。
ただし光でも目に見えない領域では種類によっては波長が長く、
例えばラジオ波と呼ばれる領域だと波長が1【m】を超える事もあります。
逆に紫外線やX線の領域だと波長は可視光よりもさらに短くなります。

可視光のそれぞれの「色」にも幅があるわけで、例えば「紫色」は大体400【nm】付近の色と言う事はできても「ぴたりと397ナノメートルの色」のようにはなかなか言えません。しかし物理的には同じ紫色でも具体的な測定対象の光に対して「どのような紫色なのか」を波長によって定量的に表す事ができて(それに意味があるのか、活用の仕方は何かという事はまた別の議論として)、その測定方法の1つとして二重スリットによる干渉実験があるわけです。

関係式の導出(図形的考察)

スクリーン上の原点からy【m】の位置に向かう2つのスリットからの光線に着目して、
「1つの光線に対するスリットからスクリーン上の点までの距離(光路の長さ)」の差
である光路差を図から計算する事を考えます。
この計算はいくつかやり方があって、ここではそのうちの2つを説明します。

図の見た目は一見単純なのですが意外と結構くせもので、
スリット板~スクリーン間の距離Lがyやスリット間距離dに対して十分大きい」という条件から近似(角度や平行関係含む)を行わないと関係式の導出がうまくできないので注意が必要です。

三角比を使う場合

三角比を使う場合は式の構造は単純ですが、図において厳密に成立する関係と近似によってほぼ成立すると見てよいものを区別する必要がある事に注意が必要です。

まず厳密に成立する関係を見るために図の下側のスリットからの光線に注目して、
「スクリーン上の原点とスリット板中央を結ぶ直線」とのなす角をθとします。
(あるいはスリット板に垂直な任意の直線とのなす角と考えても同じです。)

ここではθθという2つの角度を考えて、それらが近似的にほぼ等しいとみなせるという形で関係式を導出しますが、最初から2つを同一視して話が進められる事も多いです。得られる結果は同じです。

次に図の下側のスリットからの光線に対して、上側のスリットから垂線を引きます
その垂線とスリット板とのなす角はθに等しくなります

ここでLが十分大きいとして近似を行います。まず、2つの光線は平行ではありませんが
「ほぼ平行」と考えて光路差はdsinθであると考えます

さらに2つの光線は平行とみなせるほどになす角が小さいとします
すると、スリット板中央から「スクリーン上の原点よりyの距離の位置」に対して引いた直線も2つの光線とほぼ平行と見なせます。

今、θを tanθ=y/Lを満たす角度とすると、上記の近似によりθ≒θとできるので、
光路差はdsinθdsinθと書く事ができます。θの値が小さい時にはさらにsinθ≒tanθの近似式も成立するのでdsinθ≒dtanθ=yd/Lの関係が近似的に成立します。
【cosθ≒0のもとでtanθ=(sinθ)/(cosθ)≒sinθ】

そこで、スクリーン上で波が強め合う条件としては光路差が「波長の整数倍」になっている事を考えればよいので、nを整数として次の関係式を導出できる事になります。

  • dsinθ≒nλ
  • dtanθ=yd/L≒nλ
  • y≒nλL/dにより、Δy=λL/d
    【Δy=(n+1)λL/d-nλL/d=λL/d】
    【単純にn=1の時を考えてΔy=λL/dとしても同じです。】
  • λ=Δyd/L

以上の方法は、近似を認めるなら非常にシンプルで分かりやすいとも言えますが、肝心の近似が本当に成立するのかが図だけからは分かりにくい(図では説明の都合上、拡大して描かれる事が多いので)という事も同時に言えるかもしれません。

上記の近似を本当にしてもよいのかという事に関する考察は平面幾何的に考える事も可能ですが、次に見て行く光路差の別の導出方法から計算される結果の一部を使って後述する事にします。

この図では2つの角度を分けて記していて、両者はスリット~スクリーン間の距離が十分大きい条件下で近似的には「ほぼ同じ」とみなせます。他方で、その近似を最初から行うと考える場合もあり、図でも2つの角度を同一視して説明がなされる事があります。

また、この時に sinθ≒θである事もよく強調されます。(θは弧度法での角度とします。)
これはマクローリン展開からsinθ=θ-θ/(3!)+θ/(5!)-・・・
と書けるので、θが0に近い値の時にはベキ乗の項は全て0に近似できるとするものです。
例えばθ=0.01であればθ/(3!)=0.000000166・・・となるので、
θ=0.01に対して「ほぼ無視できる
測定の結果にほぼ無影響と考えてよい)とするわけです。
あるいは、θ=0における正弦関数の微分係数は1であるので、θが0に近ければ
近似1次式として1・θ=θがsinθに非常に近い値になると考える事もできます。
また余弦に関してはcosθ=1-θ/(2!)+θ/(4!)-・・・が成立します。
ここで先ほどと同じように例えばθ=0.01の時には
cosθ≒1-0.000025+・・・≒0999975なので、
tanθ=(sinθ)/(cosθ) の関係から
θが小さい時のtanθ≒sinθの近似式も成立しているとみてよい事が分かります。

一般二項定理で平方根を展開する方法

光路差を計算方法としては、平方根を展開して直接計算するというものもあります。

まず近似のない状況下で三平方の定理によって2つの光路の大きさを計算しておきます。それは平方根を使って書けるわけです。

次に少し式を変形してから、
(1+P)1/2の形の式に対する一般二項定理による展開を使って光路の大きさを表す式を変形します。(マクローリン展開と考えても同じです。)

近似を使うのはそこからで、yやdに対してLが十分大きいという条件から展開式の第3項以降は0に近い数値であるとみなす事で、式が簡単になります。

それから光路差を丁寧に直接計算(単純な引き算)すると、光路差がほぼyd/L(≒tanθ)に等しいという事を導出できます。波が強め合う条件から波長を含んだ関係式を作るのは三角比を使った導出の時と同じになります。

具体的な計算は次のようになります。
2式の違いは、y-d/2を考えるかy+d/2を考えるかの所だけです。

図の上側のスリットからの光路の長さ\(\sqrt{L^2+\left(y-\frac{\Large d}{\Large 2}\right)^2}=L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y-\frac{\Large d}{\Large 2}\right)^2}\)
図の下側のスリットからの光路の長さ\(\sqrt{L^2+\left(y+\frac{\Large d}{\Large 2}\right)^2}=L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y+\frac{\Large d}{\Large 2}\right)^2}\)

これらを一般二項定理で展開します。(1/L) (y-d/2)=y/L-d/(2L)が0に近い値である条件のもとで 3項目以降はほぼ0と考えて、2項目まで残したものに近似すると次のようになります。

図の上側のスリットからの光路の長さ\(L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y-\frac{\Large d}{\Large 2}\right)^2}≒L+\frac{\Large 1}{\Large 2L} \left(y-\frac{\Large d}{\Large 2}\right)^2\)
図の下側のスリットからの光路の長さ\(L\sqrt{1+\frac{\Large 1}{\Large L^2}\left(y+\frac{\Large d}{\Large 2}\right)^2}≒L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2\)

光路差はマイナスの値になっても別に構わないのですが、分かりやすさのために下側の光路の長さから上側の光路の大きさを引く事で光路差を計算すると次のようになります。光路差が波長の整数倍であるとおけば光が強め合う位置での関係式が導出されます。

光路差
の近似式
\(\left\{L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2\right\}-\left\{L+\frac{\Large 1}{\Large 2L} \left(y-\frac{\Large d}{\Large 2}\right)^2\right\}\)
\(=\frac{\Large 1}{\Large 2L}\left(2\cdot\frac{\Large yd}{\Large 2}\right)-\frac{\Large 1}{\Large 2L}\left(2\cdot\frac{\Large -yd}{\Large 2}\right)=\frac{\Large yd}{\Large L}\)
波が強め合う
条件
\(\frac{\Large yd}{\Large L}=n\lambda\), \(\frac{\Large \Delta y d}{\Large L}=\lambda\)【三角比を使って導出した時と同じ】

この導出方法だと、途中計算が少し複雑に思える部分もあるかもしれませんが、yやdに比べてLが十分大きい時にどの項を0に近似しているかが比較的明確になるとも言えます。

計算でたくさん「2」が出てきてややこしいですが、丁寧に計算すると光路差について三角比を使った時と同じ近似式を導出できます。
一般二項定理とここでの使い方

(x+y)aに対する二項展開は指数が任意の実数値でも自然数の時と同じ形の式として書く事ができて次式のようになります。(一般的には無限級数です。)
■一般の式
【厳密には、a が自然数でない時には式が収束する事が保証されるのは(1+P)a の形で|P|<1の時なので、一般の場合には式変形をしてその形にする事が必要。】 $$(p+q)^a=p^a+ap^{a-1}q+\frac{a(a-1)}{2!}p^{a-2}q^2+\frac{a(a-1)(a-2)}{3!}p^{a-3}q^3+\cdots$$ ■上式で a =1/2とした場合は平方根の展開式の1つ $$\sqrt{p+q}=(p+q)^\frac{\large 1}{\large 2}$$ $$=p^{\frac{\large 1}{\large 2}}+\frac{1}{ 2}p^{-\frac{\large 1}{\large 2}}q+\frac{\frac{\large 1}{\large 2}\cdot\left(-\frac{\large 1}{\large 2}\right)}{2!}p^{-\frac{\large 3}{\large 2}}q^2+\frac{\frac{\large 1}{\large 2}\cdot\left(-\frac{\large 1}{\large 2}\right)\cdot\left(-\frac{\large 3}{\large 2}\right)}{3!}p^{-\frac{\large 5}{\large 2}}q^3-\cdots$$ $$=p^{\frac{\large 1}{\large 2}}+\frac{1}{ 2}p^{-\frac{\large 1}{\large 2}}q-\frac{1}{8}p^{-\frac{\large 3}{\large 2}}q^2+\frac{1}{16}p^{\frac{\large 5}{\large 2}}q^3-\cdots$$ ■特にp=1かつa =1/2の場合の式は次式です。 $$\sqrt{1+q}=(1+q)^\frac{\large 1}{\large 2}$$ $$=1+\frac{1}{ 2}q-\frac{1}{8}q^2+\frac{1}{16}q^3+\cdots$$ ■さらに、qが0に近い値なら次式に近似できます。 $$\sqrt{1+q}=(1+q)^\frac{\large 1}{\large 2}≒1+\frac{1}{ 2}q$$

■さらにq=\(\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)とした時
\(\sqrt{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2} =\left\{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2 \right\}^{\frac{\large 1}{\large 2}} \)
\(=1 +\frac{\Large 1}{\Large 2L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2- \frac{\Large 1}{\Large 8}\frac{\Large 1}{\Large L^4}\left(y\pm\frac{\Large d}{\Large 2}\right)^4 +\cdots【ここで3項目以降は0に近似可能】\)
\(≒1 +\frac{\Large 1}{\Large 2L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)
よって、\(L\sqrt{ 1+\frac{\Large 1}{\Large L^2}\left(y\pm\frac{\Large d}{\Large 2}\right)^2} ≒L+\frac{\Large 1}{\Large 2L}\left(y\pm\frac{\Large d}{\Large 2}\right)^2\)

上記では平方根を展開して第2項まで近似した状態で関係式を導出しましたが、
第2項もじゅうぶん0に近いとして近似すれば
斜辺の長さを底辺とほぼ同じ L として考える事もできます。
そこまで近似するとやり過ぎ感もあるかもしれませんが、実際のところは
それが「θが小さい値の時に tanθ≒sinθ」とする近似に他なりません。
【三角比の定義から考えてみてもb/a≒b/cつまり a≒cという近似です。】
上記の計算からは、考えている諸量(L,dなど)がどのような値の時にその近似をしてよいかがより具体的に分かるとも言えます。
斜辺を底辺とほぼ同じとみなす近似のもとで
前述の三角比による計算でのsinθを数式で書いてみると、$$\sin\theta_0 =\frac{y+\frac{\Large d}{\Large 2}}{L+\frac{\Large 1}{\Large 2L} \left(y+\frac{\Large d}{\Large 2}\right)^2}≒\frac{y+\frac{\Large d}{\Large 2}}{\large L}$$ところで sinθ≒tanθ=y/Lですから、sinθ≒sinθ≒tanθ=y/Lの近似が成立するには
「yに対してd/2がじゅうぶん小さい時」
つまりy+d/2≒yと見なせる時
であると言えます。
実の所それは図で見てもそうであるわけですが、数式的に考えるのであれば例えばこのような方法もあるという事になります。
例えばd=1.0×10-4【m】,L=1.0【m】,λ=5.0×10-7【m】であれば、
三角比を使わない方法でもΔy≒λL/dの関係式は導出できた事にも注意して
Δy≒λL/d=5.0×10-3【m】なので
「n=1の時のy」(=Δy) とd/2は100倍の大きさの違いという事になります。
これもまた図形的にも見る事ができますが、n=2,3の時には
yの値は2倍,3倍になるのでyとd/2の倍率の違いはさらに大きくなる事が分かります。
以上の計算は考察の方法の1つであり、考え方は他にもあります。

干渉光の強度の式

干渉縞の明線の間隔Δyは一定値となりますが、yが大きくなると光の重ね合わせの「強度」は小さくなっていきます。それに対応する形で、明線の明るさはスクリーン中央で最大であり、中央から離れていく(yおよびnが大きくなっていく)ほどわずかに薄く弱い輝きになっていきます。

光を正弦波で表せると仮定した時、光の強度定量的に表すと次のようになります。

波が正弦波である時の干渉光の強度

正弦波の「強度」は定量的には「波の振幅の2乗」として定義されます。
【振幅の2乗に比例する量として考える事もありますがここではその比例係数を1とします。】
重ね合わさる前のもとの光の振幅がともに A【m】で、
強度もともに等しくA2=I0であるとすると
スクリーン上での2つの光の重ね合わせ(「干渉光」)の強度は次式で表されます。 $$I=4I_0\cos^2\left(\frac{\pi yd}{\lambda L}\right)$$ $$=4A^2\cos^2\left(\frac{\pi yd}{\lambda L}\right)$$yが増えて行くと余弦の値が小さくなり、強度も小さくなるという計算になります。 この式の余弦の中身は実験で使っている諸量に由来しますが、「余弦自体」は二重スリット実験における図形的な位置関係に由来するものではない事に少し注意が必要です。つまり、二重スリット干渉実験で波長を表す近似式で使っている三角比とは別物です。
強いて表すなら、近似式で使った三角比は強度を表す式の「余弦の中身」に入ります。 $$I=4I_0\cos^2\left(\frac{\pi yd}{\lambda L}\right)≒4I_0\cos^2\left(\frac{\pi d\sin\theta}{\lambda }\right)≒4I_0\cos^2\left(\frac{\pi d\tan\theta}{\lambda }\right)$$

光の波が正弦波であると仮定した時の干渉光の強度に関する式は、この記事内でも少し触れた加法定理による重ね合わせの式から導出できます。すなわち、正弦と余弦の積になった形の式において時間変動を含まない部分を余弦も含めて振幅とみなして2乗する事で上式が導出されます。整理してまとめると次のようになります。

スクリーン上の1つの点で
正弦波で表された2つの光
Asin(kR1-ωt)
Asin(kR2-ωt)
重ね合わせて加法定理
により得る干渉光の式
\(2A\sin\left\{\frac{\Large k(R_1+R_2)}{\Large 2}-\omega t\right\}\cos\frac{\Large k(R_1-R_2)}{\Large 2}\)
光路差を表す式\(R_1-R_2≒d\tan\theta=\frac{\Large y d}{\Large L}\)
波数の定義\(k=\frac{\Large 2\pi}{\Large \lambda}\)
干渉光の振幅
(時間変動を含まない部分)
\(2A\cos\frac{\Large k(R_1-R_2)}{\Large 2}=2A\cos\left(\frac{\Large \pi yd}{\Large \lambda L}\right)\)
干渉光の強度
(振幅の2乗)
\(4A^2\cos^2\left(\frac{\Large \pi yd}{\Large \lambda L}\right)=4I_0\cos^2\left(\frac{\Large \pi yd}{\Large \lambda L}\right)\)
この干渉光の強度についての式の導出においては、数式的には
波長λは波数の定義から式に入っている事になります。

同じように正弦波で表せる仮定のもと、波動を敢えて複素数で表す場合でも(指数関数表示・極形式による表示では三角関数を含む形になるので)同じ式を導出できます。
その場合には強度は複素数で表した波の絶対値の2乗として定義し、
波を重ね合わせた時の強度は形式的に余弦定理を使った形の式で表されます。
その式において2つの波の振幅は同じであるとして加法定理、半角の公式、倍角の公式のいずれかを適用する事で上記と同じ形の式が得られます。

光源に要求されるコヒーレンス(可干渉性)

ところで、光の二重スリット干渉実験では光源として使用する光の種類についての考察も重要な実験の要素の1つと言えます。

波の干渉を調べる場合、2つ以上の波が強め合うかつぶれて弱め合うかを解析して計算をするにはどこか最初の位置で「位相を同じ値にしておく」という制御が必要です。

その事は、二重スリットの部分においては波の回折を起こさせる事で実現しています。つまり元々位相がそろった波面の波を2つのスリットに進入させる事によって、その2点から進む「同時刻で同位相の2つの光」の光路の長さと波形のずれの関係を適切に計算できるわけです。

他方で、二重スリットに入る光のもとになっている光源の光の種類にも実は注意する必要があります。光の二重スリット干渉実験の光源としては結論としてはレーザー光を使うのが最も好ましいわけですが、逆にそれ以外の光ではだめなのかという話にもなります。

太陽光やいわゆる「白色光」には実は多くの波長の光が混ざっています。
そのため、そのような光をそのまま光源に使って直接的に二重スリットに通しても干渉縞が発生しないか、干渉縞が観測できても上手く測定ができないという事があるのです。

光の干渉実験に白色光を使う場合には
①光源からの光を小さい穴に通して回折を起こさせて位相を揃えた波を作る
②色フィルタ等をおいて単色光に近い光にする
という工夫が必要になります。
もし①だけ行って②を行わない場合、虹のようなたくさんの色の干渉縞が現れます。そのような干渉縞は、測定があまりしやすくない事があります。

光の二重スリット干渉実験にもとになっているのはイギリスの人ヤングによる実験(19世紀初め頃)で、当時は光源として太陽光を使って光の干渉を確かめる実験が行われたと言われます(当時はレーザー光は利用不可能)。その時に干渉縞はしっかりと確認されて、光の波動性が確認された最初の実験であるとされます。また、残っている講演の資料等によるとヤングは光の干渉を上手く起こすためのコヒーレンシーの考え方(用語自体ではなく)についても当時から指摘していたとされます。

それに対してレーザー光は単色とみなせるほどに波長の幅が小さい光であり、また位相もそろっている光です。レーザー光のように波動(主に光)の位相が揃っている事を指して可干渉性あるいはコヒーレンスと呼び、そのような性質を持った光をコヒーレント光あるいはコヒーレントな光であると分類する事があります。太陽光や白色光は一般的にコヒーレンスを備えていません。

レーザー光線は基本的に人工的に形成される光ですが、光の干渉を調べる時に使う光源としては最適です。重要な特徴を整理すると次のようになります。

  • 単色性:非常に近い値の波長の光だけで構成され、ほぼ単色とみなせる。
  • 可干渉性(コヒーレンス):位相がほぼそろっている光で構成されており、精度の高い干渉縞を観測可能。単に「干渉性」と言ったり、コヒーレンシーと呼ぶ場合もあります。
  • 指向性(収束性):長距離を光があまり広がる事がなく進行し、非常に狭い範囲に光を集める(収束させる)事が可能。
  • 高出力性および高輝度性:時間あたりに放出するエネルギーが非常に大きい光(材料加工などに使用)であり得る。光の干渉実験で使うレーザー光は、出力としては弱いものを使用します。

詳しく見ると、コヒーレンス(coherence)には波の位相の波数および位置座標を含む項に由来する「空間的なコヒーレンス」と、角周波数および時間を含む項に由来する「時間的なコヒーレンス」があります。レーザー光は空間的にも時間的にもコヒーレントな光ですが、それが特定の物質を通過して拡散する事で、時間的なコヒーレンスだけを備えた光になるという事もあり得ます。
coherent という語は少し聞き慣れない語かもしれませんが一応普通に使われる語でもあり、密着しているとか結合しているといった意味合いが元々あって、転じて「話や議論の筋が通っている、理路整然としている」 といった意味などとして使われます。

微分の定義と接線

微分の定義とイメージを、図形的な意味と数式の両方の観点から説明します。

微分は積分の逆演算でもありますが、ここでは「関数のグラフの接線の傾き」という図形的な意味に特に着目して説明をします。

■サイト内関連記事:各種の微分に関する公式の証明等です。

微分のイメージと接線

接線の傾き

例えばy=sinxを微分すると、その計算結果の公式としてy’=cosxが得られますが、
実はこれは定義域内のy=sinxのグラフ上の任意の点における接線の傾きを表す関数です。
y’=cosxにx=0を代入すると計算結果は1ですがそれは
「x=0におけるy=sinxのグラフの接線の傾き」に一致するのです。

微分のイメージは「曲線の接線の傾き」であり、
実際にその計算による値は関数を表すグラフ上の特定の点での接線の傾きに一致します。
正弦関数以外の三角関数やy=xやy=x等の関数、あるいは円を式で表した関数も微分する事が可能で、各点での接線の傾きを計算する事ができます。

微分を表す記号は、後述するようにy’ f’(x) dy/dxなどです。
ただしそれらは関数として統一的に考えている接線の傾きであり、
x=0での具体的な接線の傾きを知りたい場合にはx=0の値を代入する必要があります。

正弦関数y=sinxにおいてx=π/2の部分をグラフ上で見ると、
その部分の接線はx軸に平行で「傾きは0」なのではないかと予想ができます。そして実際にそれは正しくて、微分演算により得るy’=cosxにx=π/2を代入するとy’=0であり、それがx=π/2におけるy=sinxの接線の傾きです。

他方で円を座標上に描いたような時には左右に2箇所、接線がy軸に平行になる部分が存在します。そのような時には接線の傾きは∞(無限大)であるとみなす事もできますが、微分によっては傾きを数値として表せないと考える事が多いです。

微分演算(計算)・導関数・微分係数の関係と使い分け

微分を式で考える場合には、
少しややこしいようですが「微分という演算(計算)」と、
演算の結果として得られる「関数」(各点での接線の傾きを表現)と、
それに変数の値を代入した「数値」(具体的な接線の傾き)があります。

接線の傾きを表す関数は数学的には導関数(「どうかんすう」)と呼ばれ、
導関数に具体的な値を代入して得る値(=具体的な接線の傾き)は微分係数と呼ばれます。
微分係数は「x=0における微分係数」とか「x=1における微分係数」といった形で表現されます。

y=sinxに対して微分演算を行う
導関数y’=cosxを公式として得る事になり、
導関数y’=cosxにx=0を代入した時の
cos0=1がx=0における微分係数です。

関数導関数x=0における
微分係数
x=1における
微分係数
x=πにおける
微分係数
y=sinxy’=cosxcos1-1
y=xy’=2x2π
y=xy’=3x3π

「微分」という語の使われ方

ところで導関数の事を指して単に「微分」と呼ぶ事もあります。
例えば「y=sinxの微分はy’=cosxであるから・・・」などといった具合です。
ただしこれは数学よりもむしろ日本語の用法上の問題であるとも考えられて、
「微分する」事を「・・の微分」と言っているとも見れます。いずれにしても「微分」という言葉の使い方は数学上においてもそれほど厳密ではなく、多少緩く扱ってもよい事になっているのが実情と思われます。実質的には「微分」という語は演算を指す事を基本としながらも、便宜的に「導関数」と同義の語としても使われています。

しかし「導関数は関数」であり「微分係数は定数」であるため、
「導関数」と「微分係数」の2つの語の使い分けは必要であり重要であるとも言えます。

ところで接線の傾きが分かれば「接線を表す直線の式」も関数として分かる事になります。
x=aにおける微分係数をf'(a)と書くとするとその点での接線の式は
f(x)-f(a)=(x-a)f'(a)であり、
本来「微分」とはむしろそのような接線の式を指して呼ぶという考え方もあります。
この考え方のもとでは、
接線の式の左辺をdyと書き右辺のx-a の部分をdxと書く事があります。
すると接線の式はdy=dxf’ (a)のようになります。
つまり接線の式を指して微分と呼ぶ考え方は、接点を原点とした新たな1次式(直線の式)においてxの変化分dxに対するyの変化分dyを指して「微分」と呼んでいるわけです。
(この場合、置き換えをしているだけなのでdyやdxは必ずしも微小量とは限りません。)
この考え方のもとでは「割り算としてのdy/dx」は微分係数f'(a)に等しい事になり、物理等では微小量においての考察でこれにかなり近い考え方が使われる事があります。
ただしその考え方のもとでも「dy/dx」という記号は1つの塊として導関数f'(x)を指し、「微分する」と言えば微分演算の事を指します。
微小なxとyの変化分の割り算を考えて、極限をとる事で微分演算とする考え方は微分の定義式の1つでもあります。しかし、記号としては割り算を行う時にdyやdxを使う事はなるべく避けられて、代わりにΔy(「デルタy」)やΔxの記号が使用される事が多いです。

微分の定義式

微分の定義式は、次のように極限の形式になっています。
この定義式を使う事により、各種の微分公式を導出する事ができます。

微分の定義式(3パターン)

■2点間の変化率(傾き)の極限値としての微分の定義
【次式の極限値が存在する時、それが f(x) の導関数。】 $$f^{\prime}(x)=\lim_{a \to x}\frac{f(x)-f(a)}{x-a}$$ ■x-a=hとおいた表記
【各種の微分の公式を導出する時にはこれが便利です。】 $$f^{\prime}(x)=\lim_{h \to 0}\frac{f(x+h)-f(x)}{h}$$ ■x-a =Δxと書いて,f(x)-f(a)=Δyと書いた時の表記
【文章中で表記を簡易的に済ませたい時に便利な事もあります。】 $$f^{\prime}(x)=\lim_{\Delta x \to 0}\frac{\Delta y}{\Delta x}$$ ΔxとΔyを「増分」と呼ぶ事もありますが、マイナスの値の時もあります
特にΔyは、xの増加に対して減少して行く関数では普通にマイナスの値を取り得ます。
また、ΔxとΔyという記号は「微小な変化量」の意味で使われる事も多いです。

また、微分係数は導関数が存在する場合にxに具体的な値を当てはめる事でも計算できますが、上記の定義式とほぼ同じ形を使って書く事も一応可能です。
例えば関数y=f(x)のx=xにおける微分係数は次の式で書く事もできます。

$$x=x_1における微分係数:f^{\prime}(x_1)==\lim_{a \to x_1}\frac{f(x_1)-f(a)}{x_1-a}$$

微分の定義式の極限を考える対象の式は、一般的にはxy平面での座標上の任意の2点を通る直線の傾きを表す式です。その片方の点を、もう片方に一致する寸前まで限りなく近づけて行く事で接線の傾きを算出するというのが微分演算のイメージです。この図では微分を考えている点に向けて左側から近づけて行く形ですが、右側から近付けて考える事もできます。(ただし、対象の関数によってはどちら側から近付けるかで接線の傾きの値が変わってしまい「微分不可能」の判定になる事もあります。)

微分の定義式において、極限を考えている対象の式{f(x)-f(a)}/(x-a) を関数y=f(x)の「平均変化率」と呼ぶ事もあります。その観点からは微分は、平均変化率を限りなく短い区間で考えた極限値であると言う事もできます。

微分の表記方法

微分を表す記号は大きく分けて3種類が使われていて、
①関数を表す文字の右上に「 ’ 」の記号【プライムあるいはダッシュ】を付けるか、
微分演算子 \(\frac{\Large d}{\Large dx}\)(文章中での略記:d/dx)を関数に作用させるか、
③あるいは関数を表す文字の上に「・」【ドット】を付けるかで表します。

具体的にy=sinxやy=x+xといった関数や、より一般的にy=f(x)で表される関数に対する微分は次のような表記で書かれます。

微分の表記方法の例
関数表記の例(いずれも意味は同じ)備考
y=sinx\(y^{\prime}\) \((\sin x)^{\prime}\) \(\frac{\Large dy}{\Large dx}\) \(\frac{\Large d}{\Large dx}(\sin x)\) \(\dot{y}\)y’ 表記は「xによる微分」
である事が明確な時に使用。
+x\((x^2+x)^{\prime}\) \(\frac{\Large d}{\Large dx}(x^2+x)\)\((x^2)^{\prime}+x^{\prime}\)および
\(\frac{\large d}{\large dx}(x^2)+\frac{\large d}{\large dx}x\)に等しい
y=f(x)\(f^{\prime}(x)\) \(\frac{\Large df}{\Large dx}\) \(\frac{\Large df(x)}{\Large dx}\) \(\frac{\Large d}{\Large dx}f(x)\)f(x)に対するドット表記\(\dot{f}\)や\(\dot{f}(x)\)
は、あまり使われない。
微分演算子を使用する時の文章中の略記はdy/dxや(d/dx) (sinx)などです。

f’(x)は「fプライムx」「fダッシュx」のように読んだりします。
dy/dxなどの記号はそのまま「ディーワイディーエックス」などと読まれて、
\(\dot{y}\) は「ワイドット」のように読まれる事があります。
数学史的にはdy/dx型の表記はライプニッツが使っていたとされる表記で、
ドットによる表記はニュートンが使用していたというのが通説です。

導関数をy’ あるいはf’(x)で表す表記は「y=f(x)というxを変数とする関数があり、xで微分演算を行う」という事が明確である場合に便利な表記です。

微分演算子を使う表記では、変数がxではない場合には変数の部分の記号を変えて使用します。例えばtによる関数y=tを微分する時にはxではなくtで微分するのでdy/dt,d/dt(t)のように表記します。言い換えると、微分演算子による微分の表記は「何の変数で微分しているのか」を明確にできます。

ドットを使った表記は主に物理で使用されて、微分した後にさらに2乗するだとか、その他式が複雑になる時に表記上便利です。例えば導関数の2乗を使う式の場合、(dy/dx)といった表記を長い式の中で何度も繰り返すのは大変ですが、\(\dot{y}^2\) の表記なら比較的簡単に済む場合があります。

微分の表記としてドットを使う場合の使用例としては、サイト内記事で取り扱っている例としては少々複雑な計算ですが古典力学における運動方程式を極座標系の成分で書き直すための計算などがあります。その例では時間tを変数とした微分を考えています。

微分の四則演算

2つの関数f(x)とg(x)をそれぞれf,gと略記します。またcは定数であるとします。

定義式から、
f+g【関数の和】,f-g【関数の差】、cf【関数の定数倍】に対する微分は
それぞれ次のように計算できます。

  • (f+g) ‘=f’+g’
  • (f-g) ‘=f’-g’
  • (cf) ‘=cf’

あるいは、3式をまとめて
(cf±cg) ‘=cf’±cg’
のようにも表現できます。

これらの演算は、定義式に当てはめて丁寧に計算すると証明する事ができます。
(証明は比較的容易ですが、「自明」な事実では無い事に注意は必要です。)

具体的には、例えばx+x+1のような多項式の微分は
+x+1) ‘=(x) ‘+(x) ‘+(1) ‘=2x+1+0=2x+1
のように計算してよい事を意味します。
これは地味ですが微分を利用していくうえで非常に重要な公式であるとも言えます。

他方で、関数同士の積fgや商f/gに対する微分は少し妙な形の公式である
(fg) ‘=f’g+fg’ および (f/g) ‘=(f’g-fg’ )/(g)
が成立します。これら2式も微分の定義式から証明できます。

微分不可能な場合とは

微分の定義式を見ると極限の形になっています。その極限値が存在するなら導関数として扱えるという事であり、極限値が存在しない(収束しない)場合には導関数を表せません。
そのような時、関数は微分不可能であると言います。

また、極限の計算自体は一応できても導関数や微分係数が1つの形に定まらない場合も同様に微分不可能とみなす事が普通です。

逆に導関数が存在する時には微分可能である(もしくは可微分である)と言います。

定義域内のほとんどの点では微分可能であっても、ある特定の点でだけ微分不可能という場合もあります。そのような場合には「例えばx=0では微分不可能」といったようにその特定の点での微分係数を式で表現できない事を表します。

微分可能であるか微分不可能であるかどうかという事を指して微分可能性とも言います。用語としては「x=0における微分可能性を調べてみると、・・・」のように使います。

初等関数では定義域内のほとんどの点で微分可能であり、
一部の点が微分不可能になっている場合があります。

そもそも定義されていない点

関数y=1/xの「x=0の点」や、正接関数y=tanxの「x=π/2の点」のように、そもそも関数を定義できない点では図形的に接線を引く事もできず、数式的に微分をする事もできません。

それらの点に対して導関数の極限を考える事は可能ですが、反比例の関数や正接関数ではその極限も無限大に発散します。図形的には、そのような点に向かって接線は限りなくy軸に平行な直線に近付いていく事になります。

関数は定義できても導関数だと定義できなくなる領域

考えている点で関数が定義されていても微分できない点が存在する場合もあります。

そのような場合の1つは、もとの関数では定義が可能であっても導関数を計算すると不連続点が発生して微分係数が無限大に発散する場合です。図形的に見ると、大抵はその点での接線はx軸に垂直でy軸に平行になっています。つまり傾きで言うと「無限大」になっている状況です。

この状況を「微分係数が∞(無限大)である」と考える事はできなくは無いですが、基本的にはその時には微分の定義式で極限が収束せず無限大に発散するので微分係数は存在しないと考えます。

具体的には、円を座標上の関数として考えた場合や、xの平方根に対してそのような点が存在します。例えばxの平方根は、もとの関数ではx=0での関数値が存在します。しかし微分して得られる導関数はx=0で無限大になり定義できない事が分かります。

関数導関数微分可能性
\(y=\sqrt{x}\)
【定義域:x≧0】
\(y=\frac{\Large 1}{\Large 2\sqrt{x}}\)
【定義域:x>0】
x=0:微分不可能
x>0:微分可能
\(y=\sqrt{r^2-x^2}\)
【-r≦x≦r】
(原点が中心の半円)
\(y=-\frac{\Large x}{\Large \sqrt{r^2-x^2}}\)
【定義域:-r<x<r】
x=±r:微分不可能
-r<x<r:微分可能
円のほうの式の微分計算には合成関数の微分公式を使用しています。

同じ点で微分係数が2つの異なる値をとる場合

微分の定義式を計算すると極限値が有限の値として存在するけれども、詳しく見ると「値が2通り存在してしまい、1つの値に定まらない」という場合があります。このような場合にもその点では微分不可能であると考えるのが一般的です。

具体的にはy=|x|のような関数が該当します。
これはx≧0の時y=x,x<0の時y=-xという関数であり、
場合分けをして定義するような種類の関数です。
この関数は「x=0で微分不可能、その他の区間では微分可能」になります。

これは図形的に見れば直線を組み合わせた形をしているので微分の定義から計算をしなくても「接線」の傾きはそのまま直線の傾きになります。

そこでx=0での微分可能性を見てみると、「接線」は引く事ができてしかも有限の値であるけれども、傾きは+1と-1の両方があり得てしまう事が分かります。このような時には、x=0での微分係数は「値が1つに定まらない」という意味で微分不可能であると考える事が一般的なのです。

この事は、極限一般の観点から言うとh→0の極限は「hをプラスの値に保ったまま0に近付ける」時と「hをマイナスの値に保ったまま0に近付ける」時とで極限値が変わってしまう事がある場合に該当します。前者を右側極限と呼び、後者を左側極限と呼ぶ事もあります。

  • 右側極限:hをプラスの値に保ったまま0に近付ける。「h→+0」とも書く
  • 左側極限:hをマイナスの値に保ったまま0に近付ける。「h→-0」とも書く
  • y=|x| では、x=0における微分の計算で右側極限と左側極限の値が一致しない。

一般的に「微分可能である」という事は微分の定義式の極限において右側極限と左側極限の値が一致する場合のみ、という判定をします。y=|x|のような場合分けを含まない初等関数では、定義できない点がある場合は除外して考える限りにおいては、右側極限と左側極限の一致・不一致の問題は微分計算でそれほど気にする必要は無いと言えます。

y=|x| に対するx=0における微分については、右側極限と左側極限のそれぞれが無限大に発散するわけでは無い事を考慮して「右側微分可能」かつ「左側微分可能」であるけれども「微分は不可能」であると表現する事もあります。

波動の式と用語【正弦波】

波を表す具体的な形として最も基本的な「正弦波」は関数としては三角関数の正弦関数 sinθですが、波動を表す関数として考える時の変数としては位置座標と時間の両方を考えるのが普通です。

「振動」も波動に関連が特に深い物理現象であり、波動においても個々の位置では振動が起きているとみなせる事もあります。ただしここではバネの振動現象などは除いて、特に波動のほうに注目して見て行きます。

水面の波、あるいは数学では三角関数の sinθのグラフのイメージで上下方向の振動(グラフだとy方向)を特に「変位」と呼ぶ事あり、ここでもその言い方を使います。横に進んでいく方向(グラフだとx軸方向)を波が「進行」する方向と呼ぶ事にします。

物理的な「波」の種類

波動は基本的には何かの物質が個々の位置で時間変化により振動していて、その振動が周囲にも伝わっていく事を指します。その振動して波を構成する物質は媒質(「ばいしつ」)と呼ばれます。例えば海の潮の満ち引きの「波」の媒質は水であり、音の場合は基本的には媒質は空気で、水中やそれ以外の物質でも音は伝わるので色々な物質が媒質になり得ます。

他方で「媒質が無くても媒質による波と同じように振る舞うもの」は物理上、普通は「波」として扱われてそのようにも呼ばれる事が一般的です。例えば光(および電磁波)は、実は何かの媒質が直接的に振動しているわけでは無い事が知られています。
また同じく、一般的にミクロのスケールでの量子力学的な「波」は定量的には波動と同じように振る舞うという事を意味し、何かの媒質が直接的に振動しているわけではないという考え方がなされます。(光も、より詳しく見る場合には量子力学的に解析されます。)
他方で正弦波に近い形の電圧である交流電圧は、人工的に起電力をそのような形で発生させ続ける事によって波と同じ関数形として扱うという類のものです。
しかしいずれにしても、数式的に波の形として扱える物理量には、媒質の振動による波動の用語や考え方の多くを適用できます。特に光および電磁波に関しては普通に代表的な波動の現象の1つとして捉えられる事が一般的です。

実際に目で見える波の形や、物理量をグラフとして描いた時の形は波形と呼ばれます。
正弦波の波形はそのまま正弦関数のグラフの形ですが、波形は一般的には他の形状もあります。
例えばグラフ上で長方形状になる波形は
方形波あるいは矩形波【矩形:「くけい」長方形の事。矩とは直角の意味。】などと呼ばれます。
また、一般的に正弦波の波形が微妙に歪んでいたり台形状や三角形状の波形になっている波を総称してひずみ波と呼ぶ事もあり、矩形波等を含めてそのように呼ぶ事もあります。

数学的には、実は正弦波以外の波は周期関数でないものも含めて
「振動数が異なる複数の正弦波の合計(重ね合わせ)」として表現できます。
そのように解析した場合には波を構成する正弦波のうち振動数が最も小さいものを基本波と呼び、残りの物を高調波と呼ぶ事があります。

波動は進行方向に対する振動の向きの方向によっても分類され、一般的に横波と縦波の2つに大別されます。(ただし、数式的に「波として扱える」だけの場合はどちらにも含めない事もあります。)
正弦関数のグラフの形が実際の波の波形として観察できるようなものは「横波」のほうで、水面や弦を伝わる一般的なイメージの波や、光および電磁波は横波に相当します。
横波は、より詳しくは「各位置での振動が波の進行方向に対して垂直である波」を指します。

他方で、ばねを多数連結させた構造や、音波などは「縦波」です。これは、各位置での振動の向きが波の進行方向に対して平行(そして重なっている)である事を意味していて、媒質の密度が大きくなったり小さくなったりを繰り返すので「疎密波」とも呼ばれます。

数式的には縦波も横波と同様に扱う事ができます。
以下では、比較的イメージしやすい横波を想定して説明をしていきます。

また、まずは基本的な考え方となる「進行方向が1次元の波」を正弦波として扱います。(進行方向が1つの軸方向という意味で1次元であり、振動による「変位」も含めれば2次元です。)

波の進行が平面や空間で行われる場合には波の振動の変位が一定となっている波面を想定し、
波面が平面状である平面波や波面が球面状(球対象)である球面波をなどを考えます。
また、平面波において平面電磁波のように波(として扱える物理量)の変位の向きが平面の特定の方向であるものは偏波とも呼ばれます。(光の場合は特に「偏光」とも言います。)
偏波における波の振動の変位の方向が変化しないものは特に直線偏波と呼ばれ、
振動の変位の方向が平面内で変化する場合の偏波を回転偏波と呼ばれる事があります。
さらに細かく見ると回転偏波には特定の規則性を持った円偏波などがあります。

波を構成する物理量

規則的にうねる波を正弦関数で表す事を考える時に、
「波と言ってもどのような波なのか」を表す物理量として次のものがあります。
便宜上ここでは、1回転して元の状態に戻る事をさして「1サイクル」と表現しておきます。

  • 周期:何秒で正弦波が1サイクルするのか
  • 波長:波形で見た時に1サイクルが何メートルあるか(時刻は固定して見た時)
  • 振動数:1秒間で考えた時に何サイクルしているのか。周波数とも言います。
  • 速さ:波形が1秒当たり何メートル進行していくのか。(時間を進めながら位置も見る。)
  • 振幅:波の高さが0から最大値まで何メートルあるのか。

正弦関数 sinθの変数は「角度」です。しかし位置や時刻などの物理量は普通はπの倍数で表しませんから、それを補正して正弦関数に反映されるようにします。

  • 波数:考えている位置や距離が「波長の何倍か」を表す係数です。
  • 角周波数:「1秒当たり角度は何ラジアン進むのか」を表します。角振動数とも言います。回転運動等で使う「角速度」と数式的には同じです。
  • 位相:sinθのθの部分を合成関数になっている場合も含めて特に指す量。
    基本的に弧度法(2πを360°とする)で表します。「引数」と呼ばれる事もあります。
    位置座標や時刻は、波数や角周波数を乗じる事によって位相としての量に変換されます。
    「2つの波は位相がπずれている」などと言う場合には角度全体で言うと sinθとsin(θ+π)の関係である事を表します。普通は位相は0から2πまたは-2πから2πまでの値とします。

また、波のy座標方向の値をここでは「変位」と呼んでおきます。

これらに対して多く使われる記号や関係式を整理すると次のようになります。

波動を表す正弦波は A sin (kx―ωt) を基本形として表されます。【あるいはA sin (ωt―kx)】
A:振幅 k:波数 x:位置座標 ω:角周波数 t;時刻 kx―ωt:位相

波動を表す基本的な物理量
物理量記号関係式備考単位
周期TT=1/f=λ/vperiod, time period【s】秒
波長λλ=vT=v/fwave length【m】メートル
振動数ff=1/T=v/λfrequency 別名:周波数【Hz】ヘルツ
速さvv=λ/T=λfwave speed 波の進行の速さ【m/s】
振幅色々0からの最大値amplitude 【m】メートル
波数kk=2π/λwave number 1波長で2π【rad/m】
角周波数ωω=2πf=2π/T
ω=kv
angular frequency
別名:角振動数
【rad/s】
λ「ラムダ」 ω「オメガ」
単位については「ラジアン」の代わりに無単位とする事もあります。
v は速度(velocity) から。通常は速度ベクトルの大きさを「速さ」と呼びます。
振幅の記号は用途ごとに変えるのが普通です。(一般論ではAが多い。)
光に対しては振動数をν(ニュー)で表す事もあり、光の速さはcで表します。

波動を正弦波として考える時には基本的に角度を弧度法で扱います。すなわち円周率πの何倍であるかで正弦関数の変数を表して、2π で1サイクルして0の時と同じ関数の値に戻ると考えます。

物体の位置関係や傾き具合を三角比として表すような場合であれば、
物理現象を表す時でも「斜面に対して45°の傾きなので cos45°を乗じて・・」といった表現でも全く支障は無いと言えます。
しかし波動や振動においては周期関数としての三角関数を扱う必要がある事に加えて、
微分や積分を行う観点からも三角関数の位相部分を弧度法で扱っていく必要があります。
例えばy=A sin (kx―ωt)をxやωで偏微分すると
合成関数の微分(ここでは1変数の時と同じ)となるので
(∂y/∂x)=kA cos (kx―ωt)
(∂y/∂t)=-ωA cos (kx―ωt)
のような計算になりますが、
もし位相の部分を度数法で表していたら同じ計算にはなりません。
そのため物理学の中でも特に波動や振動を扱う時には、三角関数の角度は度数法ではなく弧度法で統一的に表す事が理論的にも重要であると言えるわけです。
合成関数に対する偏微分の一般式は、ここでは不要ですが項が1変数の時よりも増えます。

周期と振動数の関係

振動数の単位には普通【Hz】(「ヘルツ」)を使いますが、
これは無単位(正確には「1」)を秒で割った【/s】にも等しいものです。

周期と振動数の関係T=1/fについては、
例えば1秒間に50サイクルの振動を繰り返す場合には
1サイクルあたり0.02秒という事になり、
これは50【Hz】の振動数に対して
1/50=0.02【s】という計算をしているわけです。

T=1/fという事はTf=1が必ず成立する事を意味しますが、
Tは「1サイクルするのにT秒かかる」事を意味し、
fは「1秒間にfサイクルする」事を表すので
要するにTf=1は「T秒間で1サイクルする」という事を表します。
先ほどの具体例で言うと50【Hz】の振動数のもとでは1秒間に50サイクルですから、
1サイクルあたりの時間(=周期)は0.02【s】です。
その時間あたりに1サイクルするという関係式が
0.02【s】×50【/s】=1というわけです。

振動数は、波の速さと波長との関係f=v/λもあります。意味は「1秒間に進む距離は何波長分か」という事で、それは1秒間あたりに何サイクルしているかに等しくなるわけです。

周期は振動数の逆数なのでT=λ/vとなります。これは1サイクルの波長に対して何秒で進行できるかを表し、それは1サイクルに要する時間である周期に等いというわけです。

波の進行方向の速さvは、進行方向(x軸)に向かって同じ変位(y座標)の部分が進んでいく速さを表します。「y方向の変位の速さ」はまた別物となります。

また、後述する角周波数がω=2π/Tである事からT=2π/ωです。
その事はy=A sin(kx-ωt)の正弦波があった時に角周波数だけn倍したy=A sin(kx-nωt) は周期が1/n倍となっている事を意味します。

光や音波は一定の条件下で一定であるかほぼ一定とみなせるので、
その場合は振動数と波長は反比例の関係にあります。
光や音波の性質は振動数で大きく決まります。紫外線などの光や「高い音」は振動数が大きくて波長が短く、逆に赤外線などの光や「低い音」は振動数が小さくて波長が長い波動となっています。
可視光で言うと紫色の振動数が大きく、青、緑、黄色と小さくなって赤が振動数が一番小さい領域です。波長では逆に赤のほうが紫よりも大きくなります。
さらにより詳しく見ると一般的に振動数が高い波動ほどエネルギーが高く、紫外線などの振動数が高い光はエネルギーが高い光でもあります。

正弦波の波長

波の波長は基本的には時刻を固定した時の、
進行方向に対する「1周期分の波の長さ」を測ったものと言えます。

位置や距離を位相に換算する波数がk=2π/λで表され、
位置座標に由来する位相の部分はkxで表されます。
1周期分の距離(=波長)は2πに換算されます。
波長の1/2の「半波長」であればπに換算されるという計算です。

ただし時間を動かした時にも波長を考える計算はできます。
例えば波の進行の速さが200【m/s】である時、
1周期が0.1秒であるなら「1秒間に200メートル」は1秒が10周期分です。
つまりこの時、1周期分の0.1秒あたりは20メートルの進行があります。
さらに波の振動方向も見るとその間に1サイクルの振動が完了しているわけで、
進行方向の長さは波長です。
これは200【m/s】×0.1【s】=20【m】という計算です。

もし1周期が4秒だったら、波長は200【m/s】×4【s】=800【m】です。

これらの計算が「波長、速さ、周期の関係」を表すλ=vTの関係の意味です。
周期の代わりに振動数を使えばλ=v/fの関係になります。

もし光のように一定条件下で速さが常に一定であると考えられる場合にはλ=cTであり、波長と周期は比例関係にあります。(cは非常に大きい値なので短い周期でも波長は長くなり得ます。)

波の波長は、波同士を重ね合わせた時の波の干渉を分析する時に重要な量です。同じ物理量で表される2つの波が微妙に位相がずれた状態で重ね合わさると、波長の整数倍だけずれていると波は強め合い、波長の整数倍に半波長が加わると弱め合うという現象が起きます。
光が波動であるという実験的な根拠は、光に対して波の干渉が起きるという事(ヤングによる実験)です。(光は同時に粒子でもあります。その粒子が多数集まった時に波動性を表すようになります。ただし粒子同士が相互作用して波になっているという事では無く、より量子力学的な現象としてです。マクロなスケールでは光の波動性は電磁波としても扱われます。)

正弦波の速さ

波動が生じている時、
媒質は各位置で上下に振動しているだけだったとしても
見た目は波形が横に進行していくようにも見えます。

波の速さとは、そのような「波形が移動していく速さ」を指します。
波長および周期との関係式があり、λ=vTおよびλ=v/fが成立します。

そのため、質量を持った媒質の一部分に対して運動方程式を考えるような時には加速度はあくまで媒質の変位方向(波の進行方向に対して垂直方向など)を考える必要がある場合もあります。

時刻がt=0の時に波形がy=A sin(kx)で表されている正弦波が、
速さvでx軸方向に移動しているとすると
一般の時刻tではy=A sin{k(x―vt)}=A sin{2π(x/λ―vt/λ)}で表されます。
【sin(kx-vt)ではない事に注意。vtメートル進むのはx軸での距離です。】

しかし正弦波の基本形はy=A sin(kx―ωt)であったはずです。
すると速さを考える時にはそれとは違った形になってしまうのか?というと、実はそうでは無く
ω=2π/T=2πv/λによりωt=2πvt/λとなるので、
A sin{k(x―vt)}=A sin (kx―ωt)の関係があります。

もう少し詳しく見ると波動において進行方向の速さがvであるという事は、
1つの時刻を固定した時に(例えばt=tと指定)
xを変数とする2つの関数f(x)とg(x)があって、
f(x)=g(x+vt)が任意の位置xと時間tに対して成立する事を指します。
この関係式は「波がvt【m】進行した」という事を見やすい式です。
しかし、ではその時にy=g(x)はどのような関数形かというと、
x=X+vtとおくと、f(X)=g(X+vt)ですが
X=x-vtなのでf(x-vt)=g(x)であり、
y=f(x)をx軸方向にpだけ平行移動した関数y=g(x)はg(x)=f(x-p)で表される
という関数とグラフ上の平行移動についての一般的な関係式が得られます。
図形的にも物理的にも、y=Asin(kx)の波形全体がx軸のプラス方向に移動する時には
まず最初にx=0の位置においてyの値は小さくなっていきます。
関数は正弦関数ですから位相の値も0の状態からまず小さくなっていくわけで、
y=Asin(kxーωt)におけるーωtの項の意味を表しています。

ある正弦波y=A sin(kx―ωt)があってその進行方向を進行波として基準に考える時、同じ波形と物理量を持って「進行の向きだけが逆向き」の波はy=A sin(kx+ωt)で表され、反射波と呼ばれます。(物理的に見て、そのような波は多くの場合にどこかの端で反射して戻ってくるものなので。)

反射波のほうの式をvを使って書く事を考えると、
ここでは後述するω=kvの関係式を使う事にして
y=A sin(kx+ωt)=A sin(kx+vkt)=A sin {k(x+vt) } であり、
y=A sin(kx) の波形全体を「x軸のマイナス方向にvtだけ平行移動させた関数」に一致します。

角周波数

角周波数あるいは角振動数ωは、ωtの形で位相の時間部分を表す量です。

「角速度」(angular velocity)は回転運動を表すのに使う量ですが1秒間あたりの角度の変化量という意味では角周波数と同じであり、記号も同じωを使う事が多いです。
ただし角速度は波動以外の一般の運動に対して使う量ですから、波動における関係式は一般的には成立しません。

ω=2π/Tは、1周期分の時間で位相がπになるようにする換算の計算です。
例えばある時刻から0.5周期分だけの時間が経っているなら位相の変化(「位相差」)は
ωt=(2π/T)×0.5T=πとなる計算です。

ω=2πfの関係式も成立します。
例えば50【Hz】の振動数に対しては1秒間あたり100πの位相差が生じる事を意味します。
(※ただしその場合は100πは2πの整数倍ですから位置を固定すれば正弦関数の値は変化せず、実質の位相差は0と同じです。)
0.01秒間ではωt=2πft=100π×0.01=πの位相差が生じる計算になります。

基本となるA sin (kx―ωt)の形を見ると波数kと角周波数ωは一見全く別々の物理量かとも思えるわけですが、速さvによってkとωの関係式を作れます。
k=2π/λで、ω=2π/T=2πv/λなのでω=kvの関係が実はある事が分かります。

時刻を固定してから波の進行を考えてA sin (kx-ωt)の形を導出できるのと同様に、最初に位置を固定して時間による振動から考える事もできます。

t=0の時にx方向に関してはsin (kx)の波形があるとします。
この時に波がプラス方向に進行する時にはy方向の変位はx=0においてマイナス方向に現れ始めるので、敢えて「x=0でA sin (-ωt)の振動がある」と考えます。

プラスの値のxの位置で
「x=0の時と同じyの変位が現れる時刻」は波の速さを考慮してx/v秒後です。
よって、任意のxの位置における振動はω=kvの関係式も使って
y=A sin {-ω(t-x/v)}=A sin (-ωt+ωx/v)=A sin (kx―ωt)の形を得ます。

波数と平面や空間での波数ベクトル

波数はk=2π/λで表され、速さvを使うとk=2π/(vT)=ω/vとも表せます。

いずれにしても意味としては
「1波長分(1周期分)がいくつ含まれているかを位相に換算する量」という事になります。

平面や空間では、波の進行方向を表すベクトルとして波数ベクトルが使われる事があります。

波数ベクトルの表し方はいくつかありますが、
その1つは個々の位置での波の進行についての速度ベクトルを使う方法です。

速度ベクトルを(v,v,v)として、その大きさ(速さ)をvとします。
すると、速度ベクトルを「大きさが1である」単位ベクトルにした
(1/v) (v,v,v)というベクトルを考えると
これは各点において波の進行方向を向く単位ベクトルです。

それにkを乗じたものを波数ベクトルとして考える事ができます。
すなわち、\(\overrightarrow{k}\)=(k/v) (v,v,v)として考えます。
波数ベクトルの大きさは波数kに等しくなります。

特に平面波では同じ位相の平面が波を作っており
それらの平面間の距離によって位相差が決まるので、
原点から個々の点(x,y,z)から波の進行方向への射影を図形的に考えると距離の変化による位相の変化は波数ベクトルとベクトル(x,y,z)の内積で表す事ができます。
【原点を通る波面は必ず存在し、平面波においてその波面上での位相は等しいので統一的に波面と波面の位相差を「距離に波数kを乗じる」という式で表す事ができて、さらにそれは波数ベクトルを使うと内積により表現可能であるという事です。】

波数ベクトル

波の進行についての各点での速度ベクトルを\(\large{\overrightarrow{v}=(v_x,v_y,v_z)}\)として、
その大きさをvとすると 波数ベクトルは次式で表されます。 $$\overrightarrow{k}=k\frac{\overrightarrow{v}}{v}$$ $$\left|\overrightarrow{k}\right|=k=\frac{2\pi}{\lambda}$$ ■特に空間内の平面波において各点の変位 u(x,y,z,t) を正弦波で表せる場合には、
\(\large{\overrightarrow{r}=(x,y,z)}\)として次式が成立します。 $$u(x,y,z,t)=A\sin\left(\overrightarrow{k}\cdot\overrightarrow{r}-\omega t\right)$$ ωtの部分は進行方向が1次元の場合と同じです。
また、平面波であれば実は正弦波でなくても
より一般的に \(u(x,y,z,t)=f\left(\overrightarrow{k}\cdot\overrightarrow{r}-\omega t\right)\)と表す事が可能です。

波を正弦ではなく余弦で表す事と「位相のずれ」の関係

ところで正弦波を通常の三角関数として考えた時に、正弦ではなくて余弦で表してもよいのではないか?と思われるかもしれませんが、実際その通りで正弦波で表される波は余弦関数で表しても何ら支障はありません。

つまりy=A cos (kx―ωt)として波を表してもよいわけです。

ただし同じ物理量の波を正弦波で表した場合との関係には注意するべきで、
y=A cos (kx―ωt)=A sin (kx―ωt+π/2)の関係があります。
y=A sin (kx―ωt)とy=A cos (kx―ωt)との間には位相差があって、2つの関数を同時に使う時は正弦と余弦の関係からも分かるように同一の関数ではありません。

また同様に、正弦波をy=A sin (kx―ωt)ではなくy=A sin (ωt―kx)で表したとしてもそれ自体は波動の現象を考察するうえで基本的に問題は無いわけですが、やはり同じくy=A sin (kx―ωt)の波とは位相のずれがあり、
y=A sin (ωt―kx)=A sin (kx―ωt+π)=の関係があります。
今度は位相のずれはπになっているわけです。
【+πを-πとしても同じです。三角関数は2πを周期とするためです。
y=A sin (ωt―kx)=―A sin (kx―ωt)に等しいと見る事もできます。】

y=A sin (kx―ωt)は、より正確には定数θを使って
y=A sin (kx―ωt+θ)の正弦波でθ=0としたものです。
【通常はそれで問題は起きません。】
x=0,t=0の時の値がy=A sinθとなります。
そしてそのθは必要があればπ/2でもπでもよいわけで、
そのような場合には波はy=A sin (kx―ωt+θ)は
A cos (kx―ωt)やA sin (ωt―kx)に直接的に変形できます。
言い換えるとx=0,t=0の時のy=A sinθの値の設定次第で、
あるいは現に存在する波に対して
「進行方向のどこを原点にとっていつを時刻t=0に設定するか」により
A sin (kx―ωt),A cos (kx―ωt),A sin (ωt―kx)の形は実は自由に選べるわけです。

このグラフ上で正弦で表した式の位相にπ/2を加えると、
k=2π/λなのでkx-ωt+π/2=k(x+λ/4)-ωtとなり、
x軸のマイナス方向にλ/4【波長の1/4】だけもとの波形を平行移動させた形になっています。
正弦波の位相にπを加えた時は、同様にして
x軸のマイナス方向にλ/2だけもとの波形を平行移動させた形になっています。

正弦波の位相の表し方の整理

正弦波y=A sin (kx―ωt)において位相の形kx―ωtを見ると、位置座標と時刻の両方が変数になっています。つまり、同じ位置で時間による変動を見てもよいし、時刻を固定して波形の様子を見る事もできるようになっています。

つまり、いずれにしても位相に対する正弦関数の値として統一的に波の様子を表現できるようになっているわけです。

この事は、時刻を固定してx軸とy軸の関係でグラフを正弦関数として描けるだけでなく、位置xを固定して時刻tとy軸の関係におけるグラフも同じく正弦関数として描ける事を意味します。なぜならばどちらを変数としても、もう片方を固定すればy=A sin θの形の関数になっているためです。

正弦波の位相部分に対してはk=2π/λ,ω=2π/Tの関係を使って
y=A sin (kx―ωt)=A sin {2π(x/λ―t/T)}のように書く事もできます。
これは関係式を使って書き直しただけと言う事もできますが、
「位置や距離が波長の何倍か」「時刻や時間が周期の何倍か」で位相の変化を考えている事をより明確にするならこのようになるという事です。
もちろん、同じ意味をより簡潔に記せばy=A sin (kx―ωt)であるわけです。

さらに振動数fなどを使って書く事もできて、整理すると次のようになります。

使用する物理量の例正弦波の位相備考
k,ωkx―ωt基本形【ωt-kxでも可】
λ,T2π(x/λ―t/T)位置は波長の何倍か、
時間は周期の何倍かで位相を見る
λ,f2π(x/λ―ft)時間を2πが何個分かで見る
v,T,λ2π{x/(vT)―vt/λ }λ/v=Tよりλ=vT,
1/T=v/λ
k,vk(x―vt)x軸方向にvt平行移動した形
【kx―ωtに等しい】
ω,tω(x/v-t)x=0での振動から考えるか、
ω=kvの関係から

単位を利用した関係式の理解の仕方【次元解析】

波動に関する物理量の関係式は基本的ないくつかの式(T=1/fなど)を除くとそもそも覚え込むような性質のものではありませんが、それにしても分母と分子の関係がごっちゃになったりする事もあるかもしれません。微積分の計算等とはまた違った難しさがあると言えます。

そこで、あくまで補助的なものである事は強調されるべきかと思いますが、単位の関係を利用して理解に役立てたり、関係式を思い出す際に混乱した時などに使える事があります。
(物理では「次元解析」とも言います。この「次元」とは平面を2次元、空間を3次元と呼んだりする「次元」とは直接的には無関係です。)

例えばλ,v,Tの関係を考えてみましょう。
これらの単位はそれぞれ【m】【m/s】【s】です。
すると、もし例えばλvとかv/Tといった値を考えるとそれらの単位は【m/s】とか【m/s】(後者は加速度の単位)といったものになってしまいますが、いずれもλ,v,Tの単位に該当せず、波動に関する他の物理量の単位にも当てはまりません。

すなわちλvとかv/Tといった量は少なくとも基本関係式で使う事は無いという判断が可能であるとも言えるわけです。

もし関係式を忘れてしまって必要なのに急に思い出せないとして、
単位の関係からλ,v,Tに対して成立する正しい関係式を推測するとしましょう。

すると、【m】と【s】から【m/s】が作れるはずであり、
λ【m】/T【s】=v【m/s】の関係が推測できます。実際、それは正しい関係式になっています。
同じように単位の関係だけからT【s】=λ【m】/v【m/s】の式を推測しても
実際にT=λ/vは正しい関係式です。

続いて、λ【m】=v【m/s】T【s】の推測からもλ=vTも正しい関係式を得ます。
λ=vTの式の右辺についてvTなのかv/Tなのか混乱した時には
単位として【m】となる前者が正しく、
【m/s】すなわち加速度の単位になる後者は波長λを表す量としてあり得ない事を判定できます。

同様に、前述の波動に関する物理量の関係式は単位の関係からも理解可能です。
(下表で、振動数の単位は【Hz】ではなく【/s】で書いています。)

物理量関係式次元解析による理解の補助
周期T=1/f
T=λ/v
【s】=1/【/s】
【m】/【m/s】=【s】
波長λ=vT
λ=v/f
【m】=【m/s】・【s】
【m】=【m/s】/【/s】
振動数f=1/T
f=v/λ
【/s】=1/【s】
【/s】=【m/s】/【m】
速さv=λ/T
v=λf
【m/s】=【m】/【s】
【m/s】=【m】・【/s】
波数k=2π/λ
k=2π/(vT)
k=ω/v
【rad/m】を基本形として、
【rad/m】=【rad】/(【m/s】・【s】)
【rad/m】=【rad/s】/【m/s】
角周波数ω=2πf
ω=2π/T
ω=kv
【rad/s】を基本形として、
【rad/s】=【rad】/【s】
【rad/s】=【rad/m】・【m/s】

このような関係は単に式を覚えやすくなるという事に留まらず、物理学一般において異なる物理量の関係を調べる時に整合性がとれてるかの確認等を含めて考察の対象になる事があります。

また、物理量の単位というのは「1秒当たりに何メートル進むか」を【m/s】で表すといったように、それ自体に物理的な意味が含まれている事もあると言えます。
λ=vTの関係では速さに時間を乗じているから距離となるわけで、
そこに波動現象に特有の1サイクルあたりという意味が加味されるわけです。

物理的な意味(図的な意味も含めて)や数式的な意味に加えて、単位を使った理解の仕方も補助的に知っておくと便利な事があります。

波動方程式の解としての正弦波

一般的に、波動を表す式は次の波動方程式の解として得られます。

波動方程式

u(x,y,z,t)に対する次の微分方程式は波動方程式と呼ばれます。 $$\nabla^2u=\frac{1}{v^2}\frac{\partial^2 u}{\partial t^2}$$ $$\nabla^2=\frac{\partial^2 }{\partial x^2}+\frac{\partial^2 }{\partial y^2}+\frac{\partial^2 }{\partial z^2}$$ 右辺の定数項の分母でvの文字を使っていますが、
実は波動方程式の解から得られる波動の速さはこの式中のvで表されます。
▽の記号はナブラと言います。

正弦波の式は1次元の場合の波動方程式の解の1つとなっています。
【ただし解の「1つ」であって、解の全て(一般解)ではありません。】
1次元の場合は関数に対するyの偏微分、zの偏微分は0であるとして波動方程式は、
対象の関数をy=y(x,t)を使って次式になります。

$$\frac{\partial^2 y}{\partial x^2}=\frac{1}{v^2}\frac{\partial^2 y}{\partial t^2}$$

y=Asin(kx-ωt)がこの式の解であるかどうかは実際に偏微分を行う形で確認できます。
合成関数の微分(1変数)に注意して計算をまとめると次のようになります。

y=Asin(kxーωt)xによる偏微分tによる偏微分
偏微分1回目kAcos(kx-ωt)-ωAcos(kx-ωt)
偏微分2回目-kAsin(kx-ωt)-ωAsin(kx-ωt)

tによる偏微分の2回目では、cos の微分由来のマイナスと-ωtの微分由来のマイナスの2つが乗じられるので結果的に符号は1回目の偏微分の時から変わらない事になります。

y/∂x∂y/∂tの計算結果を見比べてみると、
y/∂x=(k/ω)(∂y/∂t) となっています。

つまり、v=ω/k であると考えると確かに上記の波動方程式を満たしています。
さらに、波の関係式においてω=vkでしたから波動方程式を満たす定数としての
v=ω/kは正弦波の進行の速さのvと同一の量である事を確認できます。

電磁場の波動方程式と真空中の電磁波の式

4つのマクスウェル方程式からは電磁波の式を得るための波動方程式およびそのもとになっている一般形の方程式の導出されます。

■関連サイト内記事

個々のマクスウェル方程式の性質や数式的な解析は他記事で詳しく説明しています。

電場と磁場の波動方程式

結論を先に述べると、マクスウェル方程式からは
次のような電場と磁場のそれぞれについての波動方程式を導出できます。

真空中での電場と磁場の波動方程式

真空中でρ=0および\(\overrightarrow{j}\)=0である条件では
電場と磁場のそれぞれについて成立する式は、
微分方程式としては次のように3次元の場合の波動方程式になります。

真空中における
電場の波動方程式
\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{E}=0\hspace{5pt}\)
真空中における
磁場の波動方程式
\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{B}=0\hspace{5pt}\)

εは真空の誘電率、μは真空の透磁率です。
係数については光の速さc=1/\(\sqrt{\epsilon_0\mu_0}\)を使って書いても同じです。
また、方程式を左辺と右辺に分けて書いても同じ微分方程式を表します。

別の書き方左辺と右辺を分けた式光の速さを使った時
電場\(\nabla^2\overrightarrow{E} =\epsilon_0\mu_0\frac{\Large\partial^2} {\Large\partial t^2}\overrightarrow{E}\) \(\left(\nabla^2-\frac{\Large 1}{\Large c^2} \frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{E}=0\)
磁場 \(\nabla^2\overrightarrow{B}=\epsilon_0\mu_0 \frac{\Large\partial^2}{\Large\partial t^2} \overrightarrow{B}\) \(\left(\nabla^2-\frac{\Large 1}{\Large c^2}\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{B}=0\hspace{5pt}\)

このように電場と磁場のそれぞれについて全く同じ形の式がマクスウェル方程式から導出されるわけですが、「真空中」という条件がついています。

これらの波動方程式には、もとになっている形があります。

マクスウェル方程式から法則と数学的な変形だけで直接的に導出される式は、
真空中に限らず一般の場合に成立する式です。

もとの形の式(真空中とは限らず一般の場合)

マクスウェル方程式から導出されるもとの形の式は次の通りです。 $$\left(\nabla^2-\epsilon_0\mu_0\frac{\partial^2}{\partial t^2}\right)\overrightarrow{E}=\frac{1}{\epsilon_0}\mathrm{grad}\rho+\mu_0\frac{\partial\overrightarrow{j}}{\partial t}$$ $$\left(\nabla^2-\epsilon_0\mu_0\frac{\partial^2}{\partial t^2}\right)\overrightarrow{B}=-\mu_0\mathrm{rot}\overrightarrow{j}$$ 一般の場合では電場と磁場の両方の式に電流密度が関係してくる事になります。

また、電場に対するスカラーポテンシャル(時間変動も含めた一般的な形)と磁場に対するベクトルポテンシャルを使った形の波動方程式と、そのもとになっている関係式もあります。

ポテンシャルを使った場合の波動方程式(一般形)
一般形εμを使って書いた時光の速さを使った時
電場の式\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\phi=-\frac{\Large\rho}{\Large\epsilon_0}\)\(\left(\nabla^2-\frac{\Large 1}{\Large c^2}\frac{\Large\partial^2}{\Large\partial t^2}\right)\phi=-\frac{\Large\rho}{\Large\epsilon_0}\)
磁場の式\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial}{\Large\partial t^2}\right)\overrightarrow{A}=-\mu_0\overrightarrow{j}\)\(\left(\nabla^2-\frac{\Large 1}{\Large c^2}\frac{\Large\partial}{\Large\partial t^2}\right)\overrightarrow{A}=-\mu_0\overrightarrow{j}\)

右辺を0とみなせる状況下では普通の波動方程式の形になります。
ただし、後述するこの式の解は右辺の電荷密度と電流密度が0でない場合も含んだ形の解です。

電磁波と光の関係

真空中の光の速さをcとすると実は数値的にεμ=1/(c2) が成立しています。

ε=8.8542×10-12
μ=1.2566×10-6
c=2.9979×10です。

1/(εμ)≒1/(11.126187×10-18)≒8.9878×1016で、この平方根を考えると確かに真空中の光の速さとほぼ同じになります。
(物質中では光の速さは変わります。また、同じく誘電率と透磁率の値も物質中では変わります。)

さらに、波動方程式の解から分かる波(電磁波)が進行する速さは1/\(\sqrt{\epsilon_0\mu_0}\) です。

これは電磁現象に限らず一般の波動について言える事で、
例えば速さvで「波形」が進行するsin(kx-ωt)のような形の関数はω/k=vのもとで
\(\left(\frac{\Large\partial^2}{\Large\partial x^2}-\frac{\Large k^2}{\Large \omega^2}\frac{\Large\partial^2}{\Large\partial t^2}\right)\sin(kx-\omega t)=0\) を満たします。
この時に時間で偏微分する項の係数の逆数の平方根(プラスの値)はω/kで、
ωは角速度または角周波数で周期Tとω=2π/Tの関係があります。
またkは波数で波長λとk=2π/λの関係があるのでω/k=(2π/T){λ/(2π)}=λ/Tです。
ここで波の進行の速さvはv=λ/Tで表されるので、ω/k=vとなっています。
正弦波に限らず波動に対しては速さを考える事ができ、また正弦波でない波動を正弦波の重ね合わせとして考える方法もあります。

εμ=1/(c2) からc=1/\(\sqrt{\epsilon_0\mu_0}\) なので、
電磁波が真空中を伝わる速さは光の速さに等しいという結果が得られます。

ところで光はマクロで見ると波なので、
物理学的には電磁波と光は波動として同じものであると捉えられています。
上記の関係式は、偶然にもほぼ一致するという事では無くて
「理論的にも実験的にも必ず成立する式である」
というのが物理学における解釈であるわけです。

いわゆる「目に見える光」は可視光とも呼ばれ、光の波長によって見える範囲が限定されている事が分かっています。(人と動物ではその範囲が違っていたりします。)

電磁波が光であるというのは基本的には「波動としては」という事であり、光は粒子(光子)でもあります。より詳しく言うと光は1つ1つは粒子として振る舞うけれども、それが多数集まると波として振る舞うようになります(干渉などの現象を起こすようになる)。ただし、電磁波と光を同一視できる関係は通常のマクロなスケールにおいてだけでなく、ミクロのスケールにおいても電場と磁場(のポテンシャル)から考えて光を量子力学的に考察する事がなされます。

導出に必要な式および法則・記号・公式等

まず、マクスウェル方程式のうち時間微分を含む2式であるアンペールの法則と電磁誘導の法則の式に着目します。それらは、発散と回転の分類から言うと膜ウェル方程式の中で電場と磁場の回転に関する2式でもあります。

マクスウェル方程式の微分形
マクスウェル方程式
(微分形)
時間微分を含まない式
(電磁場の発散)
時間微分を含む式
(電磁場の回転)
電場の式電場に関するガウスの法則
\(\mathrm{div}\overrightarrow{E}=\frac{\Large\rho}{\Large\epsilon_0}\)
アンペールの法則
\(\mathrm{rot}\overrightarrow{B}=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
磁場の式磁場に関するガウスの法則
\(\mathrm{div}\overrightarrow{B}=0\)
電磁誘導の法則
\(\mathrm{rot}\overrightarrow{E}=-\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\)

「ベクトル場の回転に対する回転」はベクトル解析での公式によりラプラス演算子(x,y,zでの2階偏微分を内積的な計算で作用させる演算子)を含む形になり、さらに途中計算で出てくる発散の項をガウスの法則(電場と磁場両方を使用)によって変形する事で波動方程式の形の微分方程式が得られる、というのが基本的な理論の流れです。

さらに「真空中」という条件を付ける事で電流密度の項を無視できるとすると比較的見やすい形の微分方程式となります。また、電場に対するスカラーポテンシャル(=電位)と磁場に対するベクトルポテンシャルからも同じく波動方程式を作る事ができて、特定の解を導出するにはそちらを使う方が簡単である場合もあります。

ナブラを使って書いた場合は次のようになります。

ナブラで書いた時
マクスウェル方程式
(微分形・ナブラ表示)
時間微分を含まない式
(電磁場の発散)
時間微分を含む式
(電磁場の回転)
電場の式電場に関するガウスの法則
\(\nabla\cdot\overrightarrow{E}=\frac{\Large\rho}{\Large\epsilon_0}\)
電磁誘導の法則
\(\nabla\times\overrightarrow{E}=-\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\)
磁場の式磁場に関するガウスの法則
\(\nabla\cdot\overrightarrow{B}=0\)
アンペールの法則
\(\nabla\times\overrightarrow{B}=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)

電磁波の式の導出の時には2階の時間微分を使うのでラプラス演算子を使うと表記が便利です。
これはナブラによって表記できますがベクトルに対してはdiv, rot, grad の簡単な組み合わせでは書けません。
ただしスカラー場に対しては∇φ = div(gradφ) の関係は成立します。

使う公式

■「ベクトル場の回転」に回転をさらに作用させた時の式

通常表示$$\mathrm{rot}\left(\mathrm{rot}\overrightarrow{F}\right)=\mathrm{grad}\left(\mathrm{div}\overrightarrow{F}\right)-\nabla^2\overrightarrow{F}$$
ナブラ使用時$$\nabla\times\left(\nabla\times\overrightarrow{F}\right)=\nabla\left(\nabla\cdot\overrightarrow{F}\right)-\nabla^2\overrightarrow{F}$$

■ラプラス演算子(∇または△)
【これは記号として定義するものです。スカラーに対してもベクトルに対しても使えます。】 $$\nabla^2\overrightarrow{F}=△\overrightarrow{F}= \left(\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2}\right)\overrightarrow{F}$$ $$=\frac{\partial^2\overrightarrow{F}}{\partial x^2}+\frac{\partial^2\overrightarrow{F}}{\partial y^2}+\frac{\partial^2\overrightarrow{F}}{\partial z^2}$$ ■勾配ベクトルや発散に対する時間による偏微分
勾配や発散で使われる偏微分は座標変数によるものであり、
微分可能(ここでは2階まで)な関数であれば偏微分の順序は入れ換える事ができるので $$\frac{\partial}{\partial t}(\mathrm{grad}\phi)=\mathrm{grad}\left(\frac{\partial\phi}{\partial t}\right)$$ $$\frac{\partial}{\partial t}\left(\mathrm{div}\overrightarrow{F}\right)=\mathrm{div}\left(\frac{\partial\overrightarrow{F}}{\partial t}\right)$$ のように式を変形できます。
■その他のベクトル解析の公式

  • スカラー場φに対して、∇φ=div (gradφ)
  • \(r=\sqrt{(x-a_1)^2+(y-a_2)^2+(z-a_3)^2}\)に対して、
    r≠0の時 ∇(1/r)=div {grad(1/r)}=0
  • \(\overrightarrow{r}=(x-a_1,\hspace{2pt}y-a_2,\hspace{2pt}z-a_3)\)
    \(\overrightarrow{R}=\frac{\Large 1}{\Large r}(x-a_1,\hspace{2pt}y-a_2,\hspace{2pt}z-a_3)\) の時、
    grad(φ/r)=φgrad(1/r)+(1/r)gradφ
    =\(-\frac{\Large\varphi}{\Large r^2}\overrightarrow{R}+\frac{\Large 1}{\Large r}\mathrm{grad}\varphi\)
  • grad(1/r)=-{1/(r)} \overrightarrow{r}
  • \(\mathrm{div}(r^n\overrightarrow{r})=(n+3)r^3\)
    特にn=-1の時、\(\mathrm{div}\overrightarrow{R}=\mathrm{div}\left(\frac{\Large 1}{\Large r}\overrightarrow{r}\right)=2r^{-1}=\frac{\Large 2}{\Large r}\)
  • (∂/∂x)r= (x―a)/r
  • φ)=∇φ+2(gradφ)・(gradφ)+∇φ
    (積の微分公式を2回使う事に由来。第2項は内積です。)
  • div(φ\(\overrightarrow{F}\))=(gradφ)・\(\overrightarrow{F}\)+φdiv\(\overrightarrow{F}\)

以下ではラプラス演算子のみナブラ記号による∇を使用し、
その他は div, grad 等の表記を使います。それらは全てナブラ記号で表現する事は可能です。

電場についての波動方程式の導出

電場と磁場の両方についてかなり似た操作でそれぞれについての波動方程式を導出できます。電磁誘導の法則とアンペールの法則をそれぞれ使いますが、実は計算の過程において電場と磁場の場合の両方でマクスウェル方程式のうち3つを使う事になります。

電場についての波動方程式を導出する時には、まず電磁誘導の法則の式から始めます。

電磁誘導の法則の微分形\(\mathrm{rot}\overrightarrow{E}=-\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\)
両辺に回転を作用させる

右辺は磁場の回転に対する
時間微分として書ける
\(\mathrm{rot}\left(\mathrm{rot}\overrightarrow{E}\right)=-\mathrm{rot}\left(\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\right)\)

\(\Leftrightarrow\mathrm{rot}\left(\mathrm{rot}\overrightarrow{E}\right)=-\frac{\Large\partial}{\Large\partial t}\left(\mathrm{rot}\overrightarrow{B}\right)\)
アンペールの法則
右辺に代入して
電場だけの式にする
◆時間による2階微分は
ここで生じます。
\(\mathrm{rot}\left(\mathrm{rot}\overrightarrow{E}\right)=-\frac{\Large\partial}{\Large\partial t}\left\{\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\right\}\)
\(=-\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{E}}{\Large\partial t^2}\)
左辺に公式を適用して変形\(\mathrm{grad}\left(\mathrm{div}\overrightarrow{E}\right)-\nabla^2\overrightarrow{E}=-\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{E}}{\Large\partial t^2}\)
電場に関する
ガウスの法則
を左辺に代入
\(\mathrm{grad}\left(\frac{\Large\rho}{\Large\epsilon_0}\right)-\nabla^2\overrightarrow{E}=-\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{E}}{\Large\partial t^2}\)
\(\Leftrightarrow\frac{\Large 1}{\Large\epsilon_0}\mathrm{grad}\rho-\nabla^2\overrightarrow{E}=-\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{E}}{\Large\partial t^2}\)
電場の項とその他を
左辺と右辺に分けて整理
\(\Leftrightarrow\frac{\Large 1}{\Large\epsilon_0}\mathrm{grad}\rho+\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}=\nabla^2\overrightarrow{E}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{E}}{\Large\partial t^2}\)
\(\Leftrightarrow\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{E}=\frac{\Large 1}{\Large\epsilon_0}\mathrm{grad}\rho+\mu_0\frac{\Large\partial\overrightarrow{j}}{\Large\partial t}\)
真空中で電荷密度と
電流密度が0であると
すると、
3次元の波動方程式
の形になる
真空中を想定してρ=0および\(\overrightarrow{j}\)=0であるとすると

\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{E}=0\)
\(\left(\Leftrightarrow\nabla^2\overrightarrow{E}=\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\overrightarrow{E}としても可\right)\)

以上の式では、εμの項が出てきた時点で
光の速さcを使った形である1/(c)に直して計算を進める事もできます。結果は同じです。

磁場についての波動方程式の導出

磁場についてもアンペールの法則から始めて。同様の手順でやれば波動方程式を導出できます。

アンペール法則の微分形\(\mathrm{rot}\overrightarrow{B}=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
両辺に回転を作用させる

右辺は電場の回転に対する
時間微分として書ける
\(\mathrm{rot}\left(\mathrm{rot}\overrightarrow{B}\right)=\mathrm{rot}\left\{\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\right\}\)

\(\Leftrightarrow\mathrm{rot}\left(\mathrm{rot}\overrightarrow{B}\right)=\mu_0\mathrm{rot}\overrightarrow{j}+\epsilon_0\mu_0\frac{\Large\partial}{\Large\partial t}\left(\mathrm{rot}\overrightarrow{E}\right)\)
電磁誘導の法則
右辺に代入して
磁場だけの式にする
◆時間による2階微分は
先ほどと同じく
ここで生じます。
\(\mathrm{rot}\left(\mathrm{rot}\overrightarrow{B}\right)=\mu_0\mathrm{rot}\overrightarrow{j}+\epsilon_0\mu_0\frac{\Large\partial}{\Large\partial t}\left(-\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\right)\)
\(=\mu_0\mathrm{rot}\overrightarrow{j}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}\)
左辺に公式を適用して変形\(\mathrm{grad}\left(\mathrm{div}\overrightarrow{B}\right)-\nabla^2\overrightarrow{B}=\mu_0\mathrm{rot}\overrightarrow{j}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}\)
磁場に関する
ガウスの法則
を左辺に代入
(勾配の項は0になる。)
\(\mathrm{grad}0-\nabla^2\overrightarrow{B}=\mu_0\mathrm{rot}\overrightarrow{j}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}\)
\(\Leftrightarrow-\nabla^2\overrightarrow{B}=\mu_0\mathrm{rot}\overrightarrow{j}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}\)
磁場だけの項と
それ以外を分けて
式を整理
\(\Leftrightarrow-\nabla^2\overrightarrow{B}+\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}=\mu_0\mathrm{rot}\overrightarrow{j}\)
\(\Leftrightarrow\nabla^2\overrightarrow{B}-\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{B}}{\Large\partial t^2}=-\mu_0\mathrm{rot}\overrightarrow{j}\)
真空中で電荷密度と
電流密度が0であると
すると、
3次元の波動方程式
の形になる
真空中を想定して\(\overrightarrow{j}\)=0であるとすると

\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\overrightarrow{B}=0\)
\(\left(\Leftrightarrow\nabla^2\overrightarrow{B}=\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\overrightarrow{B}としても可\right)\)

ポテンシャルによる電磁場の波動方程式の導出

電場のスカラーポテンシャルと磁場のベクトルポテンシャルから波動方程式(および一般の形の方程式)を作る事もできます。

この場合、まず電磁誘導の法則の微分形をベクトルポテンシャルを使った形にします。

ベクトルポテンシャルで
表した磁場
電磁誘導の法則の微分形ベクトルポテンシャルで
表した電磁誘導の法則
\(\mathrm{rot}\overrightarrow{A}=\overrightarrow{B}\)\(\mathrm{rot}\overrightarrow{E}=-\frac{\Large\partial\overrightarrow{B}}{\Large\partial t}\)\(\mathrm{rot}\overrightarrow{E}= -\frac{\Large\partial}{\Large\partial t}\mathrm{rot}\overrightarrow{A}\)
\(\Leftrightarrow\hspace{2pt} \mathrm{rot} \left(\overrightarrow{E}+\ \frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\right)=0\)

ここで、静電場に対する渦無しの法則を考えた時と同様に
「回転が0であるベクトル場」は何かのスカラー場の勾配として書けます。

そのスカラー場を考えて磁場の時間変化が無い時は電位に等しくなるように-Φとします。そのようにおいた式の両辺の発散を考えると式をラプラス演算子で表せます。

スカラー場Φを考えます。
(一般の場合の電場に対する
スカラーポテンシャル)
\(-\mathrm{grad}\phi=\overrightarrow{E}+ \frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\)となるΦが存在する。
両辺の発散を考えます。
すると、左辺は
ラプラス演算子∇
表す事ができます。
\(-\mathrm{div}\left(\mathrm{grad}\phi\right)=\mathrm{div}\left(\overrightarrow{E}+\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\right)\)
\(\Leftrightarrow -\nabla^2\phi=\mathrm{div}\left(\overrightarrow{E}+\ \frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\right)\)
(※スカラー場に対しては∇Φ=div(gradΦ)が成立。
ベクトルに対しては同様の簡単な関係式は作れません。)

ところでベクトルポテンシャルのゲージ条件はまだ何も決めていないので、少し唐突で無理やり感もあるように見えるかもしれませんが次のゲージ条件を課します。

ここで使うゲージ条件

このゲージ条件を特に「ローレンツ条件」と呼ぶ事があります。 $$\mathrm{div}\overrightarrow{A}+\epsilon_0\mu_0\frac{\partial\phi}{\partial t}=0$$ $$\left(あるいは光の速さcを使って\mathrm{div}\overrightarrow{A}+\frac{1}{c^2}\frac{\partial\phi}{\partial t}=0\right)$$ 下記では、この式の時間微分を考えたものと、勾配を考えたものも使用します。
■時間微分をしたもの $$\frac{\partial}{\partial t}\mathrm{div}\overrightarrow{A}+\epsilon_0\mu_0\frac{\partial^2\phi}{\partial t^2}=0$$ $$\Leftrightarrow\mathrm{div}\frac{\partial\overrightarrow{A}}{\partial t}+\epsilon_0\mu_0\frac{\partial^2\phi}{\partial t^2}=0$$ $$\Leftrightarrow\mathrm{div}\frac{\partial\overrightarrow{A}}{\partial t}=-\epsilon_0\mu_0\frac{\partial^2\phi}{\partial t^2}$$ ■勾配を考えたもの $$\mathrm{grad}\left(\mathrm{div}\overrightarrow{A}\right)+\mathrm{grad}\left(\epsilon_0\mu_0\frac{\partial\phi}{\partial t}\right)=0$$ $$\Leftrightarrow\mathrm{grad}\left(\mathrm{div}\overrightarrow{A}\right)=-\left(\epsilon_0\mu_0\frac{\partial}{\partial t}\mathrm{grad\phi}\right)$$ $$電磁誘導の法則に由来する-\mathrm{grad}\phi=\overrightarrow{E}+\frac{\partial\overrightarrow{A}}{\partial t}を使って、$$ $$\mathrm{grad}\left(\mathrm{div}\overrightarrow{A}\right)= \epsilon_0\mu_0\frac{\partial}{\partial t}\left(\overrightarrow{E}+\frac{\partial}{\partial t}\overrightarrow{A}\right) = \epsilon_0\mu_0\frac{\partial\overrightarrow{E}}{\partial t}+\epsilon_0\mu_0\frac{\partial^2\overrightarrow{A}}{\partial t^2}$$

磁場に関するガウスの法則はベクトルポテンシャルを考える事自体に使っている事に注意すると、先ほどの電磁誘導の法則をポテンシャルで考えた式を考えた時点でまだ使っていないマクスウェル方程式は電場に関するガウスの法則とアンペールの法則です。

そこで電磁誘導の法則から得られたベクトルポテンシャルとスカラーポテンシャルの関係式を、同じくポテンシャルで表した電場に関するガウスの法則とアンペールの法則に代入して上記のゲージ条件を適用すると波動方程式が得られます。

電場のスカラーポテンシャルの場合

電場に関するガウスの法則(微分形)\(\mathrm{div}\overrightarrow{E}=\frac{\Large\rho}{\Large\epsilon_0}\)
一般形のスカラーポテンシャルで表した
電場に関するガウスの法則
\(-\mathrm{div}\left(\mathrm{grad}\phi+\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\right)=\frac{\Large\rho}{\Large\epsilon_0}\)
【ゲージ条件から】
\(\mathrm{div}\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}=-\epsilon_0\mu_0\frac{\Large\partial^2\phi}{\Large\partial t^2}\)
【スカラー場で成立する式】
Φ=div(gradΦ)
\(-\nabla^2\phi+\epsilon_0\mu_0\frac{\Large\partial^2\phi}{\Large\partial t^2}=\frac{\Large\rho}{\Large\epsilon_0}\)
\(\Leftrightarrow\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\phi=-\frac{\Large\rho}{\Large\epsilon_0}\)
電荷密度を0とみなせる
場合には波動方程式の形
\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)\phi=0\)

この結果は、ベクトルではなくスカラー場の波動方程式になっています。

また、ポテンシャルで考える場合には電磁場を考える地点での電荷密度を0と考えずに一般形のまま計算をする事がよくあります。さらに、後述するこの微分方程式の解となる式においては電磁場およびポテンシャルを考えている地点とは別の領域に存在する電荷密度の分布を考えます。
それは電位やベクトルポテンシャルを考える時にも使う考え方ではありますが、紛らわしい事もあり注意が必要な点とも言えます。

磁場のベクトルポテンシャルの場合

磁場の場合はアンペールの法則の微分形から始めて、計算式が一見少し複雑になりますが波動方程式の形に変形できます。

アンペールの法則の微分形\(\mathrm{rot}\overrightarrow{B}=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
\(\overrightarrow{B}=\mathrm{rot}\overrightarrow{A}\)を代入
回転に関する公式により変形
\(\mathrm{rot}\left(\mathrm{rot}\overrightarrow{A}\right)=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
\(\Leftrightarrow\mathrm{grad}\left(\mathrm{div}\overrightarrow{A}\right)-\nabla^2\overrightarrow{A}=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
【ゲージ条件から】
\(\mathrm{grad}\left(\mathrm{div}\overrightarrow{A}\right)\)
\(=\epsilon_0\mu_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}+\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{A}}{\Large\partial t^2}\)
代入すると電場の項
(変位電流の部分)
が消えます。
\(\epsilon_0\mu_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}+\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{A}}{\Large\partial t^2}-\nabla^2\overrightarrow{A}\)
\(=\mu_0\left(\overrightarrow{j}+\epsilon_0\frac{\Large\partial\overrightarrow{E}}{\Large\partial t}\right)\)
両辺に同じ係数の変位電流の項があり、消える。
\(\epsilon_0\mu_0\frac{\Large\partial^2\overrightarrow{A}}{\Large\partial t^2}-\nabla^2\overrightarrow{A}=\mu_0\overrightarrow{j}\)
整理するとこの形\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial}{\Large\partial t^2}\right)\overrightarrow{A}=-\mu_0\overrightarrow{j}\)
電流密度を0とみなせる
場合には波動方程式の形
\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial}{\Large\partial t^2}\right)\overrightarrow{A}=0\)

ここでは静電場に限定せず一般の電場を考えているので、
電場のスカラーポテンシャルは\(\overrightarrow{E}=-\mathrm{grad}\phi\)(静電場の場合)ではなく、
上記の
\(-\mathrm{grad}\phi=\overrightarrow{E}+\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\)
\( \Leftrightarrow\overrightarrow{E}=-\mathrm{grad}\phi-\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\)を使用しています。

平面波解として得られる電磁波の式

ベクトルに対する偏微分方程式も、
成分ごとに見ればスカラー関数に対する偏微分方程式になります。例えば、
\(\left(\nabla^2-\epsilon_0\mu_0\frac{\Large\partial^2}{\Large\partial t^2}\right)E_x=0\)などです。

これの解の1つとして比較的簡単で代表的なものは次のような平面波です。
(以下、c=1/\(\sqrt{\epsilon_0\mu_0}\)であるとします。)

平面電磁波の式【電場のx成分についての波動方程式の解の1つ】

2階まで微分可能である任意の2つの関数U(u)とW(w)を使って、
変数をz-ctとz+ctとして電場のx成分について
=U(z-ct)+W(z+ct)
のような関数形を考えます。(xとyに関しては変数ではない関数。)
すると、実はこれは真空中の電場に関する波動方程式の解になっており、
平面電磁波あるいは単に平面波を表すものになります。

これは一体何を言っているのかという話ですが、U(z-ct)は進行波でW(z+ct)が反射波を表します。さらにxとyは変数ではないという関数形である事は「z軸方向に進行していく」事を表します。

※この段階では「波」と言っても周期関数に限らず、何らかの「波形」の関数が時間ごとに進行していくものです。また、zだけが特別扱いというわけではなく、U(y-ct)+W(y+ct)のような関数を考えればこれはy方向に進行していく「波」を表します。
いずれにしても、定数cはそれが進行していく速さを表すわけで、εμ=1/(c2)の関係式によって「電磁波が進行する速さは光の速さに等しい」という事を表しています。
最初のほうで少し触れたように、具体的な正弦波などの関数を想定する場合には波としての速さと関数に対する変数の部分(位相)との間に関係式を作る必要な事があります。
例えばここでの場合で進行波としての正弦関数を考える時には、
振幅E0と波数 k に対してE0sin(ku)の形の式にu=zーctを代入して
E0sin(kz-kct)=E0sin(kz-ωt)のようにします。

上記の式が確かに波動方程式の解になっているかどうかについては直接計算すればよいのですが、意外と少し面倒くさくて変数と微分の関係などに注意する必要があります。(微分をしていくだけの計算問題になるので、記述は後回しにします。)

電場のx成分とy成分が平面電磁波を表す形であるとして、
磁場に関してもx瀬尾文とy成分が同様の形であるとします。
∂E/∂x=0と∂E/∂y=0および∂E/∂x=0と∂E/∂y=0などの関係をマクスウェル方程式に戻って当てはめていくと、他の成分についても決定するものが複数あります。
それらを整理すると次のようになります。

平面電磁波における電場と磁場の成分の関係式
=U(z-ct)+W(z+ct)および
=U(z-ct)+W(z+ct)から
∂E/∂x=∂E/∂y=0
∂E/∂x=∂E/∂y=0
磁場に関しても波動方程式は
同じ形なのでBとB
zとtのみの関数だとして
∂B/∂x=∂B/∂y=0
∂B/∂x=∂B/∂y=0
電場に関するガウスの法則で
電荷密度ρが0のもとで
∂E/∂x+∂E/∂y+E/∂z=0
により∂E/∂z=0
磁場に関するガウスの法則より∂B/∂x+∂B/∂y+B/∂z=0
により∂B/∂z=0
/∂z=0を波動方程式に当てはめて∂E/∂t=0
電磁誘導の法則の微分形の
z成分を考えると
∂E/∂x-∂E/∂y=-∂B/∂tより
∂B/∂t=0

∂E/∂z=0である事を踏まえて、
さらにEがxとyに関しても定数だとしても波動方程式を満たすのでそのようなものを考えます。
つまりその場合は∂E/∂x=∂E/∂y=0です。

その条件下では、電磁誘導の法則のx成分とy成分から
∂E/∂z=∂B/∂t
∂E/∂z=-∂B/∂t
という関係が得られます。

その事から、その条件下で電場と磁場のx成分とy成分の関係は次のようになります。


=U(z-ct)+W(z+ct)
B
=(1/c){-U(z-ct)+W(z+ct)}
∂E/∂z
=∂B/∂t

=U(z-ct)+W(z+ct)
B
=(1/c){U(z-ct)-W(z+ct)}
∂E/∂z
=-∂B/∂t

もし進行波と反射波が別々のベクトルであるとするなら、電磁波の進行方向に対して垂直な平面内で進行波における電場と磁場は直交し、反射波における電場と磁場も直交する事になります。

進行波と反射波が
別々のベクトル
という仮定
電場磁場進行方向に垂直な
平面内での電場と磁場の内積
入射波Ex1=U
Ey1=U
Bx1=-U/c
By1=U/c
(1/c)(-UU+UU)=0
反射波Ex2=W
Ey2=W
Bx2=W/c
By2=-W/c
(1/c)(WW-WW)=0

電磁波における電場と磁場の成分が正弦波あるいはその重ね合わせであると考えると、平面電磁波の電場と磁場の成分が進行方向に垂直である事は「波数ベクトル」との内積が0になる事でも示せます。

=U(z-ct)+W(z+ct)が波動方程式の解である事を見るには次にようにします。
Z=z-ct,Z=z+ctとするとE=U(Z)+W(Z)であり,
(∂/∂t)E=(dU/dZ) (∂Z/∂t)+(dW/dZ) (∂Z/∂t)
=-c(dU/dZ)+(dW/dZ)

【※もしU(P(z,t),Q(z,t))のような関数なら
∂U/∂t=(∂U/∂P)(∂P/∂t)+(∂U/∂Q)(∂Q/∂t)のような計算になります。
ここでは∂z/∂t=0なので見かけ上はその項が無い形になっています。 】
さらに計算すると、
(∂/∂t)E=-c(dU/dZ) (∂Z/∂t)+c(dU/dZ) (∂Z/∂t)
=-c(dU/dZ)+c(dU/dZ)

同様にして、
(∂/∂z)E=(∂/∂z){(dU/dZ) (∂Z/∂z)+(dW/dZ) (∂Z/∂z)}
=(∂/∂z){(dU/dZ)+(dW/dZ)}
=(dU/dZ) (∂Z/∂z)+(dU/dZ) (∂Z/∂t)
=(dU/dZ)+(dU/dZ)

よって、{∂/∂z-(1/c) (∂/∂t)}E=0であり、
=U(Z)+W(Z)はzとtだけの関数という設定なので
xとyによる偏微分は0である事に注意すると
{∇-(1/c) (∂/∂t)}E=0
を満たす事が分かります。
y成分についても同じ変数の形Z,Zと、異なる関数形U,Wを考えて
=U(Z)+W(Z)
というzとtだけの関数として計算すれば波動方程式を満たします。

ポテンシャルによる計算から得られる電磁波の式

ポテンシャルを使ったほうの波動方程式を解くと、少し別の形の数式での電磁波の式を得ます。

スカラーポテンシャルにしてもベクトルポテンシャルにしても、静電場と静磁場の場合には積分の形はとるけれども一応微分方程式の解としてポテンシャルを数式で表す事は可能です。

そして前述のポテンシャルの波動方程式および一般の形の式(ρ≠0等の場合)でも、実はかなり似た形の式が解になります。

静電場や静磁場に限定した時と異なる点は、電荷密度と電流密度に変数として加わる「時間」の部分です。そしてその時間変数は、空間中で電磁波による電磁場を考えている地点と、電磁場を作っている電荷や電流がある領域との時間変化における「時刻」のずれが反映された形にする必要がある事が知られています。

具体的には、まず平面波を表す解で得られた電磁波の速さc=\(\sqrt{\epsilon_0\mu_0}\)が一般に適用できるものだと仮定して、電荷や電流の各位置から電磁場を考える位置までの距離をrとします(これは関数)。

そして、電荷や電流の時間変数をtとした時に、その変数をt-r/cに置き換えたものを考えます。
これはrという位置座標の関数を含むのでx,y,z,tの関数です。
そこでT(x,y,z,t)=t-r/cとおいておきます。

前述のポテンシャルで表した場合の真空中の波動方程式、および電荷密度あるいは電流密度が0でない場合の式における解の1つは次式で表されます。

ポテンシャルによる波動方程式(ρ≠0の場合等の一般形含む)の解

ポテンシャルであるΦと\(\overrightarrow{A}\),および積分していないρや\(\overrightarrow{j}\)は
x,y,zおよびtの関数であるとします。
電荷あるいは電流密度が分布する領域をVとして、
dv=dXdYdXのもとで
(x,y,z)と(X,Y.Z)の距離をrとおき、 T=t-r/c のもとで
積分中の電荷密度ρと電流密度\(\overrightarrow{j}\)はX,Y,Z,T(=t-r/c)の関数であるとします。

式と解もとの式(波動方程式を含む一般形)解となるポテンシャル
電場$$\left(\nabla^2-\epsilon_0\mu_0\frac{\partial^2}{\partial t^2}\right)\phi=-\frac{\rho}{\epsilon_0}\hspace{20pt}$$$$\phi=\frac{1}{4\pi\epsilon_0}\int_V\frac{\rho}{r}dv$$
磁場 $$\left(\nabla^2-\epsilon_0\mu_0\frac{\partial}{\partial t^2}\right)\overrightarrow{A}=-\mu_0\overrightarrow{j}$$$$\overrightarrow{A}=\frac{\mu_0}{4\pi}\int_V\frac{\overrightarrow{j}}{r}dv$$

これらの解は遅延ポテンシャル(retarded potential)とも呼ばれます。
積分の中身とそれ以外の部分で関数が何の変数であるかを整理すると次のようになります。

◆x,y,z,tの関数
電場や磁場を考える位置と時間
◆X,Y,Z,Tの関数【積分の中身】
電荷密度や電流密度の分布内の位置
\(\phi=\phi(x,y,z,t)\)
\(\overrightarrow{A}=\overrightarrow{A}(x,y,z,t)\)
\(\rho=\rho(X,Y,Z,T)\)
\(\overrightarrow{j}=\overrightarrow{j}(X,Y,Z,T)\)

時間変数に関しては T=T(x,y,z,X,Y,Z,t)であり、x,y,z,X,Y,Z,t は互いに独立な変数です。
また、\(r=r(x,y,z,X,Y,Z)\) であり、積分に関してはx,y,zは定数扱いです。

また、ポテンシャルから計算できる電場と磁場は次のようになります。

遅延ポテンシャルから計算される電場と磁場

■電場
\(-\mathrm{grad}\phi=\overrightarrow{E}+ \frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\Leftrightarrow\overrightarrow{E}=-\mathrm{grad}\phi-\frac{\Large\partial\overrightarrow{A}}{\Large\partial t}\)である事と、
電荷密度の分布は領域内で微分可能(従って連続)である関数形である事
(X,Y,Zが積分変数の被積分関数をx,y,zやtで偏微分してから積分可能)、
ベクトルポテンシャルの項は静磁場の時の式を使ってεμ=1/(c )の関係に注意します。
積分内で電荷密度と電流密度は先ほどと同じくX,Y,Z,Tの関数とします。
電場と磁場はx,y,z,tの関数です。また、\(\overrightarrow{R}=\frac{\Large 1}{\Large r}(x-X,\hspace{2pt}y-Y,\hspace{2pt}z-Z)\)とします。 $$\overrightarrow{A}=\frac{\mu_0}{4\pi}\int_V\frac{\overrightarrow{j}}{r}dv=\frac{1}{4\pi\epsilon_0c^2}\int_V\frac{\overrightarrow{j}}{r}dvに注意して、$$ $$\overrightarrow{E}=-\mathrm{grad}\left(\frac{1}{4\pi\epsilon_0}\int_V \frac{\rho}{r}dv\right)-\frac{\partial\overrightarrow{A}}{\partial t}$$ $$=\frac{1}{4\pi\epsilon_0}\int_V\left(\frac{\rho}{r^2}\overrightarrow{R}+\frac{\rho}{cr}\overrightarrow{R}-\frac{\partial }{\partial t}\frac{\overrightarrow{j}}{c^2r}\right)dv$$ ■磁場
回転と外積ベクトルの関係に注意して計算すると\(\mathrm{rot}\overrightarrow{A}=\overrightarrow{B}\)により、次式になります。
積分中のクロス「×」記号は外積の意味です。 $$\overrightarrow{B}=\mathrm{rot}\overrightarrow{A}=\frac{\mu_0}{4\pi}\int_V\left(\frac{\overrightarrow{j}}{r^2}\times\overrightarrow{R}+\frac{\overrightarrow{j}}{cr}\times\overrightarrow{R}\right)dv$$ これらの式は、時間変化する電荷密度や電流密度(具体的には周波数の高い交流電流など)によって電磁波を形成する電場と磁場の関数形を具体的に表せる事を意味しています。
また、電磁波が正弦波のような周期関数になるかどうかも、領域Vに分布する電荷密度や電流密度の形で決まる事になります。
式に積分が含まれている事を見ると分かる通り、実際に詳しく考察する時には工夫が必要です。
これらの式においてrが十分大きい時には1、/rに比例する項に比べて他の項をほぼ0とみなして近似する事ができます。

遅延ポテンシャルが解となっている事の確認計算

先ほどの「遅延ポテンシャル」が波動方程式を作るポテンシャルの式を満たすのかどうかは、少々長ったらしい計算が必要ですが確認する事ができます。

まず、スカラーポテンシャルのほうを見ます。ベクトルポテンシャルについても、成分ごとに見ればスカラーポテンシャルの時と同様に計算ができます。

と発散、勾配はいずれもx,y,zの変数での偏微分を行うものとします。

必要な計算
何を計算していくのか?電場のスカラーポテンシャルについて
電磁場に関する
波動方程式の一般形となるこの式に対して
$$\left(\nabla^2-\epsilon_0\mu_0\frac{\partial^2}{\partial t^2}\right)\phi=-\frac{\rho}{\epsilon_0}$$
このように表されるΦを代入して
式が満たされるのかを検証。
$$\phi=\frac{1}{4\pi\epsilon_0}\int_V\frac{\rho}{ r}dv$$

積分の中身ρ/rについてラプラス演算子を作用させると、公式を使って
(ρ/r)=∇ρ+2{grad(1/r)}・(gradρ)+ρ∇(1/r)

ここでρ∇(1/r)の項に関してはr≠0であれば∇(1/r)=0になります。【ただし、電磁波の電場を考える点(x,y,z)が領域V内にあるような状況(r=0という事)があっても、極限値として考えれば実はこの項は積分をした時に有限の値になります。】
そこで、計算が必要なのは残りの2項になります。

  • ρ
  • 2{grad(1/r)}・(gradρ)

ρとrは積分の中にあり、
ρ=ρ(X,Y,Z,T) と r=r(x,y,z,X,Y,Z) の変数に注意して計算します。

勾配ベクトルの内積部分の計算

勾配ベクトルの内積部分の計算を先に見ます。

積分内のρの変数であるX,Y,Z,Tのうち
x,y,zの関数であるのはTだけです。
∂ρ/∂x=(∂ρ/∂T) (∂T/∂x)
【本来、数学的な計算としては∂ρ/∂x=(∂ρ/∂T) (∂T/∂x)+(∂ρ/∂X) (∂X/∂x)+・・・で、
∂X/∂x=0,∂Y/∂x=0,∂Z/∂x=0なので(∂ρ/∂X)(∂X/∂x)等の項は0】

ここでT=t-r/cなので、
∂T/∂x=-(∂/∂x) (r/c)=-(x-X)/(rc) であり、
∂ρ/∂x=(∂ρ/∂T) (∂T/∂x)=-{(x-X)/(rc)}(∂ρ/∂T)

他方でT=t-r/cをtで偏微分すると∂T/∂t=1であり、
∂x/∂tや∂X/∂t等は0なので
∂ρ/∂t=(∂ρ/∂T) (∂T/∂t)+(∂ρ/∂x) (∂x/∂t)+(∂ρ/∂y) (∂y/∂t)+・・・
=(∂ρ/∂T) (∂T/∂t)
=∂ρ/∂T

独立変数の関係にあるのはx,y,z,X,Y,Z,tであるので
【考えている位置自体は運動していないのでx=x(t)等の関係は無く、xとtは定数の関係。】
x,y,z,X,Y,Zに対するtの偏微分は0(例えば∂x/∂t=0など)

つまり∂ρ/∂t=∂ρ/∂Tの関係があるので
先ほどの式は
∂ρ/∂x=-{(x-X)/(rc)}(∂ρ/∂t)と書けます。
【Tによる偏微分ではなくtによる偏微分でも同じ結果になるという事。】

これらの事はyやzについても同様の計算で、時間変数による偏微分はtで書けます。
∂ρ/∂y=-(y-Y)(∂ρ/∂t)/(rc)
∂ρ/∂z=-(z-Z)(∂ρ/∂t)/(rc)となるので
\(\overrightarrow{R}=\frac{\Large 1}{\Large r}(x-X,y-Y,z-Z)\) とすると、
gradρ=-(1/c) (∂ρ/∂t)\(\overrightarrow{R}\)

ここで、grad(1/r)=-\(\overrightarrow{R}\)/(r)であり、
\(\overrightarrow{R}\)の大きさは1である事に注意すると∇(Φ/r)の式中の内積計算は
2{grad(1/r) }・(gradρ)={-2/(r) } {-(1/c) (∂ρ/∂t) }
={2/(cr) } (∂ρ/∂t)

【この項は、あとで消えます。】

電荷密度に対する∇ρの部分の計算

また、スカラー関数についてはρ=div(gradρ)なので、div(gradρ)を計算します。
grad(∂ρ/∂t)については先ほどのgradρ=-(1/c) (∂ρ/∂t)\(\overrightarrow{R}\)と同じ形の計算が可能で、
grad(∂ρ/∂t)gradρ=-(1/c) (∂ρ/∂t)\(\overrightarrow{R}\)

\(\overrightarrow{R}\) の大きさはr/r=1である事に注意して、
公式div(φ\(\overrightarrow{F}\))=(gradφ)・\(\overrightarrow{F}\)+Φdiv\(\overrightarrow{F}\) および
div\(\overrightarrow{R}\)=2/rも使用すると次のようになります。

$$\nabla^2\left(\mathrm{grad}\rho\right)=\mathrm{div}\left(\mathrm{grad}\rho\right)$$

$$=\mathrm{div}\left\{-\frac{1}{c}\frac{\partial \rho}{\partial t}\overrightarrow{R}\right\}=-\frac{1}{c}\left\{\left(\mathrm{grad}\frac{\partial \rho}{\partial t}\right)\cdot\overrightarrow{R}+\frac{\partial \rho}{\partial t}\mathrm{div}\overrightarrow{R}\right\}$$

$$=-\frac{1}{c}\left\{-\frac{1}{c}\left(\frac{\partial^2 \rho}{\partial t^2}\overrightarrow{R}\right)\cdot\overrightarrow{R}+\frac{2}{r}\frac{\partial \rho}{\partial t}\right\}$$

$$=\frac{1}{c^2}\frac{\partial^2 \rho}{\partial t^2}-\frac{2}{cr}\frac{\partial \rho}{\partial t}$$

これを見ると、式の最後の形の2項目の-{2/(cr)} (∂ρ/∂t)に1/rを乗じると
先ほどの2{grad(1/r)}・(gradρ)={2/(cr)} (∂ρ/∂t)に加えれば0になる事が分かります。

よって、ここで式を一度整理すると次式になります。

$$\nabla^2\left(\frac{\rho}{r}\right)=\frac{1}{r}\nabla^2\left(\mathrm{grad}\rho\right)+2\left\{\mathrm{grad}\left(\frac{1}{r}\right)\right\}\cdot(\mathrm{grad}\rho)+\rho\nabla^2\left(\frac{1}{r}\right)$$

$$=\frac{1}{c^2r}\frac{\partial^2 \rho}{\partial t^2}+\rho\nabla^2\left(\frac{1}{r}\right)$$

この式に1/(4πε)を乗じて領域Vで体積積分します。
【ベクトルポテンシャルの成分の時には、ここでμ/(4π)を乗じます。】

$$\frac{1}{4\pi\epsilon_0}\int_V\nabla^2\left(\frac{\rho}{r}\right)dv=\frac{1}{4\pi\epsilon_0}\int_V\left\{\frac{1}{c^2r}\frac{\partial^2 \rho}{\partial t^2}+\rho\nabla^2\left(\frac{1}{r}\right)\right\}dv$$

$$整理すると、\left(\nabla^2-\frac{1}{c^2}\frac{\partial^2}{\partial t^2}\right)\left(\frac{1}{4\pi\epsilon_0}\int_V\frac{\rho}{r}dv\right)=\frac{1}{4\pi\epsilon_0}\int_V\rho\nabla^2\left(\frac{1}{r}\right)dv$$

r≠0の時はρ∇(1/r)=0なので波動方程式の形を満たす事が分かります。

$$r\neq 0であるなら、\left(\nabla^2-\frac{1}{c^2}\frac{\partial^2}{\partial t^2}\right)\left(\frac{1}{4\pi\epsilon_0}\int_V\frac{\rho}{r}dv\right)=0$$

ではr=0になるような点を含む場合ではどうかというと、その場合でも遅延ポテンシャルの形の式は積分をした時に極限を考える形でρ≠0の場合の方程式を満たします。(デルタ関数で考える事も多い。)また、遅延ポテンシャルによる解は実はかなり一般性を持った形の解でもあります。

直交曲線座標系の成分にベクトルを変換する方法

物理学などでは、微分方程式を座標変換して考える時があります。
例えば極座標における運動方程式や波動方程式を考えてみるといった事です。

そのような場合で特にベクトルを含む微分方程式を考える時には、
x=rcosθ等の関係の代入だけでなくベクトルの基本ベクトルを変更する事まで行う事があります。
普通はベクトルを成分で表す時には(x座標,y座標,z座標)で考えるわけですが、
それを(r座標,θ座標,φ座標)で表す事を意味します。
例えば運動方程式であれば加速度ベクトルや力ベクトルをそのように扱うという事です。

以下、微分も使いながら具体的な変換の方法などを詳しく説明します。

■この記事に特に関連が深い数学的な事項は方向余弦に関する内容と、極座標および球面座標に関する内容です。その他、記事の後半では微分に関する基本公式のいくつかを使用しています。ベクトルと三角関数に関する基本的な事項も使います。

基本ベクトルの変更をする必要がある場合と無い場合

極座標変換等をする場合の微分方程式については、
基本ベクトルを変更する必要がある場合と無い場合があります。

まず、変更の必要が無い場合を見てみましょう。

例えば「等速円運動をしている物体には常に中心力が働いている」という事を
運動方程式を使って示そうとするような場合です。
この時には物体の座標に対して極座標変換を行ってから時間微分を2回行って、
普通に運動方程式に当てはめて力ベクトルを計算する事には何の問題もありません。
このような場合は、極座標変換を使っていても基本ベクトルの変更が必要ない場合です。

少しややこしいようですがそのような場合には、
x=rcos(ωt) のような極座標変換は確かに行ってはいるけれども、
ベクトルの座標成分としては直交座標によるものを考えている
」のです。
ですので極座標による値によって計算をするとしても、
その結果は「xyz直交座標系のx軸で測った値」を出しているわけです。

もう少し詳しく見ると、そのような場合には極座標変換を使用していますがベクトルとして考えている加速度ベクトルや力ベクトルは成分を「x成分」「y成分」「z成分」として考えています。図的にはx軸、y軸、z軸に平行なベクトルの合計として1つの加速度ベクトルや力ベクトルを構成します。

では、加速度や力のベクトルを直交座標ではない成分表示で「r成分」「θ成分」「φ成分」のように表して、図的にも「ある点での曲線の接線方向」を向いたベクトルの合計として1つの加速度ベクトルや力ベクトルを構成できるのか?
という事を考えると、結論を言うと「それは可能である」という事になるのです。

そのような場合の運動方程式は「力が質量と加速度に比例する」という関係は直交座標の時と同じですが、成分ごとに見るとある曲線の接線方向の加速度成分と力の成分を考える事になるわけです。

そのように考える時の具体的なベクトルの成分の変換方法を以下述べていきますが、
一般の曲線座標系への変換は話が複雑過ぎるので、物理学等で使われる事があって数学的にも比較的話が穏やかで済む直交曲線座標系への変換に限定して話を進めていきます。
(と言っても、それでも多少複雑になります。)

直交曲線座標とは、聞き慣れない事も多いかと思いますが
具体的には極座標や球面座標、円柱座標のようなものを指します。
これらの座標系では、座標軸に相当する「座標曲線」が任意の点で直交します。
通常のxyzの直交座標系も、直交曲線座標系の特別な場合であるという見方もできます。

他方で、物理の法則を数式で表す時に座標系ごとに形を変換しないといけないというのでは一般論として議論する時に不便であるという考え方があります。
その考え方のもとで、変分原理による計算で導出する「座標系に依存しない運動方程式等の形」というものも存在します。(ラグランジュ型の運動方程式などとも呼ばれます。)
力学の分野である「解析力学」では、そのような考察を計算によって行います。

基本ベクトルと成分の直交曲線座標系への変換方法

ベクトルを含む微分方程式を座標系ごとの形に変換する時に、まず第一に重要となるのがベクトルを構成する基本ベクトルに対する成分の変換方法です。ここではその具体的な方法について説明します。

直交座標上のベクトルは、
(1,0,0)と(0,1,0)と(0,0,1)という
3つの基本ベクトルの線形結合で表す事ができます。
それらをそれぞれ\(\overrightarrow{e_x}\),\(\overrightarrow{e_y}\),\(\overrightarrow{e_z}\) と表す事にすると
任意のベクトルは実数a,b,cを使って\(\overrightarrow{A}=a\overrightarrow{e_x}+b\overrightarrow{e_y}+c\overrightarrow{e_z}\)と書けます。
そして、ここで使った実数a,b,cはそれぞれベクトルの成分であるわけです。
(数学の理論上はこれらの成分は複素数を使っても可です。)

曲線座標でも実は同じような考え方ができて、直交座標からの変換を考える時は基本ベクトルは「向きが座標曲線の勾配ベクトルである単位ベクトル」であり、ここで言う勾配ベクトルはx,y,zで考えたものを指しています。
【■参考:ベクトル解析の概論の記事(勾配ベクトルの微分による定義など)】

より具体的には1つの座標曲線をxyz直交座標でu=F(x,y,z)で表せるとして grad u により表されますが、実際に直交曲線座標で考える時には「r方向」「θ方向」「φ方向」といった形で図形的に把握していればよい事も多いと言えます。そこで、曲線座標における基本ベクトル \(\overrightarrow{e_r}\),\(\overrightarrow{e_\theta}\),\(\overrightarrow{e_{φ}}\) は分かっているものとして次に成分のほうを考えます。

直交座標系曲線座標系
$$\large{\overrightarrow{A}=A_x\overrightarrow{e_x}+A_y\overrightarrow{e_y}+A_z\overrightarrow{e_z}}$$$$\large{\overrightarrow{A}=A_r\overrightarrow{e_r}+A_{\theta}\overrightarrow{e_\theta}+A_{φ}\overrightarrow{e_φ}}$$

ここで、曲線座標系が直交曲線座標であるならば
ベクトルの成分の変換は局所的には方向余弦を使った線形結合の形で表す事ができます。

方向余弦とはその名の通り三角関数の cosθの形で表される量ですが、ここでは角度の値はあまり重要でないのでCの文字と添え字を使って表す事にします。
直交曲線座標系の3つの各基本ベクトルからの、直交座標系のx軸、y軸、z軸への9つの方向余弦を次のようにここでは表記します。

ここでの方向余弦の
記号の表
x軸に対してy軸に対してz軸に対する
r曲線の基本ベクトル
\(\overrightarrow{e_r}\)から
CrxCryCrz
θ曲線の基本ベクトル
\(\overrightarrow{e_\theta}\)から
CθxCθyCθz
φ曲線の基本ベクトル
\(\overrightarrow{e_{φ}}\)から
CφxCφyCφz

これらの方向余弦を使う事で、各点における基本ベクトルと個々のベクトルの成分を直交曲線座標系のものに変換できます。

方向余弦を使ったベクトル成分の変換公式

上記の9つの方向余弦と、xyz直交座標系での成分を使う事で
直交曲線座標系でのベクトルの3つの成分は次のように表されます。 $$\large{A_r=C_{rx}A_x+C_{ry}A_y+C_{rz}A_z}$$ $$\large{A_{\theta} =C_{\theta x}A_x+C_{\theta y}A_y+C_{\theta z}A_z}$$ $$\large{A_φ=C_{φx}A_x+C_{φy}A_y+C_{φz}A_z}$$ この式は、元々は「原点を共有する2つの直交座標におけるベクトルの成分の変換公式」です。
ただし直交曲線座標では基本ベクトルとなる3つのベクトルが互いに直交するので、
各点での方向余弦を関数として表すという前提のもと、同じ変換公式を適用できます。

そこで次は、これらの方向余弦は具体的にどのような数式で表されるのかが問題になります。
それが分れば一般の変換公式を作れるわけです。

変換で使う「方向余弦」を微分により表す公式

方向余弦とは基本的には「余弦」なので「底辺/斜辺」の関係を使います。ただし基本ベクトルは座標曲線の接線ベクトルとして考えていますから方向余弦も微分偏微分で考える必要があります。また、直交曲線座標系の基本ベクトルからxyz直交座標系の軸への方向余弦の表し方は実は2つあって、どちらを使っても同じ結果を得ます。

直交曲線座標系におけるxyz軸への方向余弦の2つの表現方法

座標曲線をu,v,wとして、u=u(x,y,z)に対する
j軸(x,y,z軸のいずれか)の方向余弦は、 u の弧長をl(u)とした時に
次の2通りの表し方があります。
■勾配ベクトル(xyz直交座標系で表したもの)を使う方法
勾配ベクトルは grad u=(∂u/∂x,∂u/∂y,∂u/∂z)で表されるベクトルであり
(ナブラ記号を使うと grad u=∇u)、gradj uは勾配ベクトルのj成分で∂u/∂jの事です。
直交曲線座標系で成立する|gradu|=du/dlの関係式も使っています(証明と説明は後述)。lはu曲線の弧長で、「u増加する向き」にlが増える方向で考えます。(その時du/dl≧0) $$ C_{uj}=\frac{\mathrm{grad}_ju}{|\mathrm{grad}u|}=\frac{dl}{du}\frac{\partial u }{\partial j} $$ ■弧長を斜辺とする方法
(u曲線上では、他の座標曲線の変数は一定でdv/dl=0およびdw/dl=0) $$ C_{uj}=\frac{dj}{dl}=\frac{\partial j}{\partial u}\frac{du}{dl}+\frac{\partial j}{\partial v}\frac{dv}{dl}+\frac{\partial j}{\partial w}\frac{dw}{dl}$$ $$ =\frac{\partial j}{\partial u}\frac{du}{dl}$$ 弧長に対するuによる微分での導関数dl/duは次のように表されます。 $$\frac{dl}{du}=\sqrt{\left(\frac{\partial x}{\partial u}\right)^2+\left(\frac{\partial y}{\partial u}\right)^2+\left(\frac{\partial z}{\partial u}\right)^2}$$ また、dl/duは1変数の導関数なのでdu/dlを次のように表せます。
逆関数の微分公式によります。) $$\frac{du}{dl}=\frac{1}{\Large{\frac{dl}{du}}}=\frac{1}{\large{\sqrt{\left(\frac{\partial x}{\partial u}\right)^2+\left(\frac{\partial y}{\partial u}\right)^2+\left(\frac{\partial z}{\partial u}\right)^2}}}$$

極座標や球面座標への基本ベクトルおよび成分の変換を行う時には
具体的にはx=rcosθなどと表す事から∂x/∂θなどが計算しやすい場合が多くあります。その時には上記の「弧長を斜辺とする方法」を使ったほうが比較的分かりやすくなります。(この記事の後半でもそちらの形の公式を使用。)

dl/dθ や dθ/dlを表す事になる弧長の式については、次に見て行くように球面座標であればr,θ,φの3つ分計算しておく必要があります。平面の極座標であればrとθの2つ分です。

勾配を使った表す方は、直交曲線座標系で成立する |grad θ|=dθ/dlの関係を使ってさらに変形できます。ただし、
曲線の弧長を表す式の元の形

曲線の弧長については元々は定積分で次のように書く事ができて、
上記ではそれを微分した導関数を使用しています。$$l(u)=\int_0^u\sqrt{\left(\frac{\partial x}{\partial u}\right)^2+\left(\frac{\partial y}{\partial u}\right)^2+\left(\frac{\partial z}{\partial u}\right)^2}dt$$ 微分は、ここでの変数で言うとuで行います。 この式は曲線を折れ線に近似して図的に見る事でも理解可能ですが、解析学的に証明もできる式です。

同じ方向余弦の表し方が2つ存在する事と、
|grad u|=du/dlの関係式についての証明と説明

勾配ベクトルについて一般的に成立するのは、スカラー場の値が一定値となっている「等位面」に対して必ず垂直であるというものです。(以下、等位面に含まれる曲線を「等位線」と呼んでおきます。)
極座標のθ曲線である「原点を中心とする同心円」の円周上では
半径が一定であり同心円は「rが一定値である等位線」を構成しています。
球面座標ではrが一定値の球面が等位面として存在します。
スカラー関数F(x,y,z)と弧長がlで表される曲線があるとして、曲線上の座標を成分とするベクトルを\(\overrightarrow{r}=(x(l),y(l),z(l))\)とします。
曲線上でdF/dlを計算すると次式になります。(合成関数に対する偏微分の公式を使用。)$$\frac{dF}{dl}=\frac{\partial F}{\partial x}\frac{dx}{dl}+\frac{\partial F}{\partial y}\frac{dy}{dl}+\frac{\partial F}{\partial z}\frac{dz}{dl}=(\mathrm{grad}F)\cdot\frac{d\overrightarrow{r}}{dl}$$ $$ここでもし\frac{dF}{dl}=0であるなら、(\mathrm{grad}F)\cdot\frac{d\overrightarrow{r}}{dl}=0$$ つまり「Fの値が変化しない曲線」=「Fの等位線」においては
「Fの勾配ベクトルは曲線の接線ベクトルに常に垂直」という事になります。
ところで、直交曲線座標においては1つの座標曲線上では他の変数の値が一定であり、r曲線とφ曲線上でθは一定値です。
また、θ曲線上の任意の点ではr曲線およびφ曲線との交点が存在します。
【より詳しく言えばこれらの曲線は「曲面」を構成しています。】
ところで直交曲線座標系であればr曲線およびφ曲線はθ曲線との交点で直交します。
これは具体的には任意の点での「曲線の接線ベクトル」同士が直交するという意味です。
先ほどの考察から、勾配ベクトル gradθ は
「θが一定値であるφ曲線およびθ曲線上の任意の点」での接線ベクトルに直交します。
よって、gradθ はu曲線上の任意の点において、その点でu曲線と交わるφ曲線およびθ曲線に直交しています。
そして、u曲線自体もφ曲線およびθ曲線に直交しているのでした。 という事はその点においてu曲線の接線ベクトルとgradθは平行なベクトルである事になり、それはすなわちgradθがその点におけるθ曲線の接するベクトルの1つである事を示しています。
先ほどのdF/dlの式においてFの代わりにθを考えると $$\frac{d\theta}{dl}=\frac{\partial \theta}{\partial x}\frac{dx}{dl}+\frac{\partial \theta}{\partial y}\frac{dy}{dl}+\frac{\partial \theta}{\partial z}\frac{dz}{dl}=(\mathrm{grad}\theta)\cdot\left(\frac{dx}{dl},\hspace{2pt}\frac{dy}{dl},\hspace{2pt}\frac{dz}{dl}\right)$$ と表せるわけですが
dx/dl等は、大きさがΔlであるベクトル(Δx,Δy,Δz)における
方向余弦 であるΔx/ΔlのΔl→0の極限値でもあります。
すると、方向余弦についての関係式により、
θ曲線の接線ベクトル(dx/dl,dy/dl.dz/dl)方向の
gradθの成分はdθ/dlである事になります。
よって、何らかの余弦cosω()を使って|gradθ|cosω=dθ/dlと表せる事になりますが、
θ曲線の接線ベクトルと gradθは同じ点でθ曲線に接するのでcosωの値は1か-1です。
上式でF=u(x,y,z)で表す場合【より正確にはこれは曲面を表します】には、弧長であるlは「u増加する向きにlが増えて行く方向」で考えます。
そのためdu/dl ≧0であるので、
cosω=1であり(-1ではなく、という意味)|gradθ|=dθ/dl
するとgradθとθ曲線の接線ベクトルは同じ向きのベクトルであるのでx軸,y軸,z軸への方向余弦は「直角三角形の底辺/斜辺」=「直交座標系でのベクトルの成分/ベクトルの大きさ」として同じ値を持ちます。
(向きは同じでも、ベクトルの大きさは異なります。|gradθ|=dθ/dlですがこれは接線ベクトルの大きさとは一般的に異なります。)
以上の事は直交曲線座標系の任意のu曲線で成立します。

補足として、ベクトルの「方向余弦」自体は余弦 cosθ であるので、軸に対する向きが同じであれば大きさはどのようなベクトルであっても底辺/斜辺の関係で方向余弦を表す事ができます。
つまり数学的には1つの方向余弦の表し方は無限にあるわけですが、ここでの一般的な変換に使えるような微分による方向余弦の表し方の方法としては上記の2通りがあるという事になります。

変換の具体例1(平面の極座標変換の場合)

ベクトルの基本ベクトルと成分に対して具体的に平面での極座標変換をしてみます。平面なので必要な方向余弦は4つで、それを表すために偏微分が4つと弧長の式が2つ必要になります。

まず、xとyに対するrとθの偏微分です。

極座標変換の時∂/∂r∂/∂θ
x=rcosθcosθ-rsinθ
y=rsinθsinθ rcosθ

次に弧長の計算です。∂x/∂rなどを計算してあるので、公式に代入します。
dr/dlなどを使う事になりますが、まずはdl/drの形で記しておきます。

$$\frac{dl}{dr}=\sqrt{(\cos\theta)^2+(\sin\theta)^2}=1$$

$$\frac{dl}{d\theta}=\sqrt{(-r\sin\theta)^2+(-\cos\theta)^2}=\sqrt{r^2}=r$$

このように意外と簡単な式になります。
さらに、θのほうの弧長の式で出てきたrは∂x/∂θの式にあるrと打ち消して方向余弦の値には含まれなくなります。(そのように計算が簡単になる事は一般的に保証されるわけではありませんが、球面座標の場合でも同じ事が起こります。)

方向余弦はCrx=(∂x/∂r)・(dr/dl)=cosθ のように計算します。
θについては例えばCθx=(∂x/∂θ)・(dr/dl)=(-rsinθ)・(1/r)=-sinθです。
先ほど述べたようにrは打ち消して式から無くなるわけです。

4つの方向余弦は具体的には次のような形になります。

  • Crx=(∂x/∂r)・(dr/dl)=cosθ
  • Cry=(∂x/∂r)・(dr/dl)=sinθ
  • Cθx=(∂x/∂r)・(dr/dl)=-sinθ
  • Cθy=(∂x/∂r)・(dr/dl)=cosθ

よってrθ極座標系での基本ベクトルでの\(\overrightarrow{A}\)の成分は
=CrxA+Cry=Acosθ-Asinθ
θ=CθxA+Cθy=Asinθ+Acosθ であり、

\(\overrightarrow{A}\)=(Acosθ-AsinθAθ ,Asinθ+Acosθ)となります。

ところでこれらについて運動方程式等に適用するために微分を考える場合などはどうなるのか?という事については後述します。時間微分に関しては得られた変換の結果の式をそのままtで微分すればよいのですが、元の座標系の値であるAに関する処理が必要となります。

極座標による基本ベクトルと成分の変換公式

xy直交座標系からrθ極座標系に基本ベクトルと成分を変換する式は次のようになります。 $$A_r=\hspace{7pt}A_x\cos\theta+A_y\sin\theta$$ $$A_{\theta}=-A_x\sin\theta+A_y\cos\theta$$ 平面極座標への変換の場合には、直交座標を原点回りに回転させる形で
各点での局所的な変換を行うものとして図から導出する事もできます。

変換の具体例2(球面座標変換の場合)

次に球面座標の場合を見てみます。角度のとりかたはθとφの2箇所がありますが、ここでは平面極座標との関連を見やすくするためにθをxy平面での角度にとり、Φをr曲線(と言っても直線ですが)とz軸のなす角にとって考えます。

9つの偏微分と3つの弧長をまとめると次の通りです。

球面座標変換の時∂/∂r∂/∂θ∂/∂φ
x=rsinφcosθsinφcosθ-rsinφsinθrcosφcosθ
y=rsinφsinθsinφsinθrsinφcosθrcosφsinθ
z=rcosφcosφ-rsinφ
弧長逆数(dr/dlなど)
dl/dr
dl/dθrsinφ1/(rsinφ)
dl/dΦ1/r

弧長の式に関する具体的な計算は次のようになります。 $$\frac{dl}{dr}=\sqrt{\left(\frac{\partial x}{\partial r}\right)^2+\left(\frac{\partial y}{\partial r}\right)^2+\left(\frac{\partial z}{\partial r}\right)^2}=\sqrt{(\sin φ\cos\theta)^2+(\sinφ\sin\theta)^2+(\cos φ)^2}$$ $$=\sqrt{\sin^2φ(\cos^2\theta+\sin^2\theta)+\cos^2φ}=\sqrt{\sin^2φ+\cos^2φ}=1\hspace{60pt}$$ $$\frac{dl}{d\theta}=\sqrt{\left(\frac{\partial x}{\partial \theta}\right)^2+\left(\frac{\partial y}{\partial \theta}\right)^2+\left(\frac{\partial z}{\partial \theta}\right)^2} =\sqrt{(r\sin φ\sin\theta)^2+(r\sinφ\cos\theta)^2+0^2}\hspace{15pt}$$ $$=\sqrt{r^2\sin^2φ(\sin^2\theta+\cos^2\theta)}=\sqrt{r^2\sin^2φ}=r\sin φ\hspace{105pt}$$ $$\frac{dl}{dφ}=\sqrt{\left(\frac{\partial x}{\partial φ}\right)^2+\left(\frac{\partial y}{\partial φ}\right)^2+\left(\frac{\partial z}{\partial φ}\right)^2}\hspace{200pt}$$ $$ =\sqrt{(r\cos φ\cos\theta)^2+(r\cosφ\sin\theta)^2+(r\sin φ)^2}\hspace{115pt}$$ $$=\sqrt{r^2\cos^2φ(\cos^2\theta+\sin^2\theta)+r^2\sin^2 φ}=\sqrt{r^2(\cos^2φ+\sin^2φ)}=\sqrt{r^2}=r\hspace{0pt}$$ dl/dθの計算では、角度φは正弦sinφが0以上の値をとる範囲で考えるとします。それは0≦φ≦πの範囲になりますが、図的に見てもその範囲だけで考えても十分である事になります。それは球面座標においてはθの変化もあるからです。

以下、上記の結果と公式を適用して計算をしていく事で
基本ベクトルを直交座標から球面座標に変換した時のベクトルの変換の公式を得ます。

$$
方向余弦の式\hspace{5pt}C_{uj}=\frac{\partial j}{\partial u}\frac{du}{dl}\hspace{5pt}【u=r,\theta,φ\hspace{3pt}j=x,y,z】$$ $$(具体例)C_{\theta y}=\frac{\partial y}{\partial \theta}\frac{d\theta}{dl}=(r\sinφ\cos\theta)\cdot\frac{1}{r\sinφ}=r\cos\theta$$

方向余弦x軸y軸z軸
r 曲線Crx=sinφcosθCry=sinφsinθCrz=cosφ
θ 曲線Cθx=-sinθCθy=cosθCθz=0
φ 曲線Cφx=cosφcosθCφy=cosφsinθCφz=-sinφ
球面座標による基本ベクトルと成分の変換公式
r 成分 ACrxAx+CryAy+CrzAz= Axsinφcosθ+Aysinφsinθ+Azcosφ
θ 成分 AθCθxAx+CθyAy+CθzAz=-Axsinθ+Aycosθ
φ 成分 AφCφxAx+CφyAy+CφzAz= Axcosφcosθ+Aycosφsinθ-Azsinφ
θはxy平面での角度、φはz軸とr曲線のなす角です。

φ=π/2の時、すなわちr曲線が常にxy平面にある時には
sinφ=1および cosφ=0を代入し、
さらにもとの直交座標でz成分A=0とすれば平面極座標の時の変換公式になります。
(θ成分への変換式はφもAも含んでおらず、実は極座標の時と同じ式です。)

これらの式は
「xy平面での角度をΦとしてz軸とr曲線のなす角をθとした場合」には、
θとφを入れ換える事になります。

「xy平面での角度をΦ、z軸とr曲線のなす角をθとした場合」の変換公式
r 成分 A CrxAx+CryAy+CrzAz = Axsinθcosφ +Aysinθsinφ +Azcosθ
φ 成分 Aφ CφxAx+CφyAy+CφzAz =-Axsinφ+Aycosφ
θ 成分  AθCθxAx+CθyAy+CθzAz = Axcosθcosφ+Aycosθsinφ-Azsinθ

これらの式は単なるθとφの文字の置き換えをしただけであり、
何か新しい変換を行ったという事ではありません。

球面座標の特別な場合として平面の極座標を考える時に、運動方程式におけるような場合では
図のφ=π/2と合わせて「ベクトルのφ成分の時間微分が0である」という条件も考えると一般論としての球面座標から移行を考える事ができます。

運動方程式の球面座標系での成分表示の導出

各成分に対する時間微分を考える時には、直交座標での「ベクトルの時間微分」を1つのベクトルと考えて上記の変換公式を適用します。考え方は、1階の微分でも2階の微分でも同じになります。

  1. 直交座標の成分に対する時間微分dA/dtなどを計算します。
    (2階微分をする時はd/dtを計算します。)
    ただし、計算結果は変換後の変数であるrやθで表す必要があります。
  2. ベクトルの時間微分(d/dt)\(\overrightarrow{A}\) は1つのベクトルであるので、変換の公式を適用して基本ベクトルの変換を行います。
  3. 変換の式に含まれる「直交座標で考えた時の成分」に、直交座標で考えた時間微分dA/dtなどを代入します。

一番簡単な例(と言っても多少複雑ですが)で、
尚且つ重要なベクトルは物体の位置を表す\(\overrightarrow{r}\)=(x,y,z)です。
何の断り書きもなければ直交座標の成分で表されています。

次に、\(\overrightarrow{r}\)=(x,y,z)に対する
1階の時間微分を表す速度ベクトル\({\overrightarrow{v}=\Large\frac{d\overrightarrow{r}}{dt}}\)=(v,v,v)と、
2階の時間微分である加速度ベクトル\(\overrightarrow{a}=\Large{\frac{d^2\overrightarrow{r}}{dt^2}}\)=(a,a,a)について
基本ベクトルを球面座標系に変化した場合の成分はどうなるかを見てみます。
(その特別な場合として平面極座標への変換も分かります。)

=dx/dt,v=dy/dt,v=dz/dtおよび
a=dx/dt,a=dy/dt,a=dz/dt
r,θ,φの時間微分については2階微分のほうの式が少し複雑なので「ドット」で表すのがここでは便利です。ドットが2つ付いていたら2階での時間微分を意味します。
dr/dt=\(\dot{r}\)dθ/dt=\(\dot{\theta}\)dφ/dt=\(\dot{\varphi}\)
r/dt=\(\ddot{r}\)θ/dt=\(\ddot{\theta}\)φ/dt=\(\ddot{\varphi}\)
の表記で式を整理します。

xとyについては積の微分公式を2回使う形で計算をします。
また、θやφをtの関数として考えているので
合成関数の微分公式も同時に使っていく事になります。
例えば sinθやcosφなどの項の時間微分は
(d/dt)sinθ=(dθ/dt)cosθ=\(\dot{\theta}\cos\theta\)
(d/dt)cosφ=-(dφ/dt)sinφ=\(-\dot{\varphi}\sin\varphi\) のようになります。

等速円運動の時のようにx=Rcos(ωt)などとする例ではr=Rは定数であり、θ=ωtの時間微分だけを考えれば良い事になります。(また、平面運動なのでφは式に含まれません。)
しかしここではr,θ,φがいずれもtの関数であるとして一般的な式の形を書きます。

\(\overrightarrow{r}\)=(x,y,z)d/dt
x=rsinφcosθ\(\dot{r}\sin\varphi\cos\theta+\dot{\varphi}r\cos\varphi\cos\theta-\dot{\theta}r\sin\varphi\sin\theta\)
y=rsinφsinθ\(\dot{r}\sin\varphi\sin\theta+\dot{\varphi}r\cos\varphi\sin\theta+\dot{\theta}r\sin\varphi\cos\theta\)
z=rcosφ\(\dot{r}\cos\varphi-\dot{\varphi}r\sin\varphi\)

次に、理論的には1階微分をさらに時間微分する形で2階微分を計算して変換の公式に当てはめれば良い事になりますが、その直接計算は実はかなり面倒です。

具体的な計算式は補足・参考用の資料として記事の最後に載せるとして、計算結果の式は次のようになります。

基本ベクトルを球面座標系に変更した時の加速度ベクトル

2階の時間微分を計算後、
加速度ベクトルに変更の公式を適用するとr,θ,φ成分は次のようになります。 $$a_r=\ddot{r}-\dot{\varphi}^2r-\dot{\theta}^2r\sin^2\varphi$$ $$a_{\theta}=2\dot{r}\dot{\theta}\sin\varphi+2r\dot{\varphi}\dot{\theta}\cos\varphi+r\ddot{\theta}\sin\varphi$$ $$a_{\varphi}=2\dot{r}\dot{\varphi}+r\ddot{\varphi}-r\dot{\theta}^2\sin\varphi\cos\varphi$$ また、θ成分に関しては次のようにも書けます。 $$a_{\theta}=\frac{1}{r\sin\varphi}\frac{d}{dt}\left(r^2\dot{\theta}\sin^2\varphi\right)$$ ここではxy平面の角度をθとしているので、
もしその角度をφとおくなら上式はθとφの文字を入れ替えた形になります。

上式でφ=π/2とおき、時間によるφの変化はないなら平面の極座標での変換を表します。
φ成分がなくなり、r成分とθ成分の式中でsinφ=1となるので式は比較的簡単になります。

平面の極座標の場合

球面座標系への加速度ベクトルの変換の式においてφ=π/2かつdφ/dt=0であれば
平面における極座標での加速度ベクトルの変換の式になります。 $$a_r=\ddot{r}-\dot{\theta}^2r$$ $$a_{\theta}=2\dot{r}\dot{\theta}+r\ddot{\theta}=\frac{1}{r}\frac{d}{dt}\left(r^2\dot{\theta}\right)$$ ここではxy平面の角度をθとしているので、
もしその角度をφとおくなら上式はθとφの文字を入れ替えた形になります。

これらの結果から、球面座標系での運動方程式を作る事ができます。

運動方程式は「力ベクトル=加速度ベクトルと質量の積」という形です。そこで、成分に分けた時に加速度ベクトルの成分として上記の式を使えばよいわけです。それらの成分とはx成分やy成分ではなく、r成分やθ成分であるわけです。

球面座標系における運動方程式の成分表示

球面座標系で運動方程式はr成分、θ成分、φ成分ごとに次のように表されます。 加速度ベクトルに変更の公式を適用するとr,θ,φ成分は次のようになります。 $$F_r=m\left(\ddot{r}-\dot{\varphi}^2r-\dot{\theta}^2r\sin^2\varphi\right)\hspace{5pt}(=ma_r)$$ $$F_{\theta}=m\left(2\dot{r}\dot{\theta}\sin\varphi+2r\dot{\varphi}\dot{\theta}\cos\varphi+r\ddot{\theta}\sin\varphi\right)\hspace{5pt}(=ma_\theta)$$ $$F_{\varphi}=m\left(a_{\varphi}=2\dot{r}\dot{\varphi}+r\ddot{\varphi}-r\dot{\theta}^2\sin\varphi\cos\varphi\right)\hspace{5pt}(=ma_\theta)$$ 平面の極座標においては次のようになります。 $$F_r=m\left(\ddot{r}-\dot{\theta}^2r\right)$$ $$F_{\theta}=m\left(2\dot{r}\dot{\theta}+r\ddot{\theta}\right)=\frac{m}{r}\frac{d}{dt}\left(r^2\dot{\theta}\right)$$ このように運動方程式を書く時には、
力ベクトルの成分も加速度ベクトル同様にr成分、θ成分、φ成分として表されます。
「力」は任意の方向にベクトルと同じ規則で分解できるので(実験で示されます)、
自由な方向での成分を考える事ができます。

これを見ると、一応そのように表せるといっても結構複雑です。直交曲線座標の中では比較的構造が単純で分かりやすい球面座標系であっても、加速度ベクトルや運動方程式をその座標系で考えるとなると直交座標系からの基本ベクトルと成分の変換はそれほど容易でない事が分かります。

平面上の極座標で見れば比較的形は簡単にはなりますが、直交座標での形と比べるとやはり複雑さは増しています。運動方程式の極座標系での成分表示は、回転を伴う運動の一部の解析では有効に機能します(例えば万有引力だけが働く物体の軌道を調べる時など)。

参考:球面座標に変換後の加速度ベクトルの成分計算

参考資料として、非常に地味ですが
速度ベクトルの加速度ベクトルの各成分を直接計算した場合の式を記します。

ここでの計算では、積の微分の規則から式全体は \(\ddot{r}\)の項や\(\dot{r}\dot{\theta}\)の項に分けて、変換の公式を適用までした値を1つずつ計算して最後に合計値を出します。それら自体は単なる微分と三角関数の計算問題なので、「確かに結果の式が直接計算でも得られる」という事を見るための参考用資料です。

(再掲)球面座標における基本ベクトルと成分の変換
r 成分 ACrxAx+CryAy+CrzAz= Axsinφcosθ+Aysinφsinθ+Azcosφ
θ 成分 AθCθxAx+CθyAy+CθzAz=-Axsinθ+Aycosθ
φ 成分 AφCφxAx+CφyAy+CφzAz= Axcosφcosθ+Aycosφsinθ-Azsinφ
θはxy平面での角度、φはz軸とr曲線のなす角
\(\overrightarrow{r}\)=(x,y,z)d/dt(1階微分)
x=rsinφcosθ\(\dot{r}\sin\varphi\cos\theta+\dot{\varphi}r\cos\varphi\cos\theta-\dot{\theta}r\sin\varphi\sin\theta\)
y=rsinφsinθ\(\dot{r}\sin\varphi\sin\theta+\dot{\varphi}r\cos\varphi\sin\theta+\dot{\theta}r\sin\varphi\cos\theta\)
z=rcosφ\(\dot{r}\cos\varphi-\dot{\varphi}r\sin\varphi\)

具体的なr,θ,φ成分の計算

tによる2階導関数(2階微分)はr,θ,φ成分のいずれにも共通して使えます。
異なるのは変換公式における方向余弦になります。
この表は、例えば式中の\(\ddot{r}\)の項の係数は
2階微分を行った時点の変換前でxにおいては\(\ddot{r}\)sinφcosθであり、
r成分への変換用の方向余弦sinφcosθを乗じるとsinφcosθとなっている事を記しています。
yとzについても同様に計算し、例として\(\ddot{r}\)の項については合計すると係数の値は1になります。

sinθ+cosθ=1の関係などで三角関数の大部分は式から消えて、
プラスマイナスで打ち消して無くなる項も多くあるために
最終的な結果で残る項は比較的少なくなります。

\(\ddot{r}\)変換前r成分θ成分φ成分
x由来sinφcosθsinφcosθ-sinφsinθcosθsinφcosφcosθ
y由来sinφsinθsinφsinθsinφsinθcosθsinφcosφsinθ
z由来cosφcosφ-sinφcosφ
合計・・・
\(\dot{r}\dot{\theta}\)係数r成分θ成分φ成分
x由来-2sinφsinθ-2sinφsinθcosθ-2sinφsinθ-2sinφcosφ
sinθcosθ
y由来2sinφcosθ2sinφsinθcosθ2sinφcosθ2sinφcosφ
sinθcosθ
z由来なしなしなしなし
合計・・・2sinφ
\(\dot{r}\dot{\varphi}\)変換前r成分θ成分φ成分
x由来2cosφcosθ2cosφsinφcosθ-2cosφcosθsinθ2cosφcosθ
y由来2cosφsinθ2cosφsinφsinθ2cosφcosθsinθ2cosφsinθ
z由来-2sinφ-2cosφsinφ2sinφ
合計・・・
\(\ddot{\varphi}\)変換前r成分θ成分φ成分
x由来rcosφcosθrsinφcosφcosθ-rcosφcosθsinθrcosφcosθ
y由来rcosφsinθrsinφcosφsinθrcosφcosθsinθrcosφsinθ
z由来-rsinφ-rsinφcosφrsinφ
合計・・・
\(\dot{\varphi}^2\)変換前r成分θ成分φ成分
x由来-rsinφcosθ-rsinφcosθrsinφcosθsinθ-rcosφsinφcosθ
y由来-rsinφsinθ-sinφsinθ-rsinφcosθsinθ-rcosφsinφsinθ
z由来rcosφ-rcosφrcosφsinφ
合計・・・-r
\(\ddot{\theta}\)変換前r成分θ成分φ成分
x由来-rsinφsinθ-rsinφcosθsinφrsinφsinθ-rcosφsinφ
cosθsinθ
y由来rsinφcosθrsinφcosθsinφrsinφcosθrcosφsinφ
cosθsinθ
z由来なしなしなしなし
合計・・・rsinφ
\(\dot{\theta}^2\)変換前r成分θ成分φ成分
x由来-rsinφcosθ-rsinφcosθrsinφcosθsinθ-rcosφsinφ
cosθ
y由来-rsinφsinθ-rsinφsinθ-rsinφcosθsinθ-rcosφsinφ
sinθ
z由来なしなしなしなし
合計・・・-rsinφ-rcosφsinφ
\(\dot{\theta}\dot{\varphi}\)変換前r成分θ成分φ成分
x由来-2rcosφsinθ-2cosφsinφcosθsinθ2rcosφsinθ-2rcosφ
cosθsinθ
y由来2rcosφcosθ2cosφsinφosθsinθ2rcosφcosθ2rcosφ
cosθsinθ
z由来なしなしなしなし
合計・・・2rcosφ

成分ごとに合計すると、加速度ベクトルの変換後の各成分は
\(a_r=\dot{r}-\dot{\varphi}^2r-\ddot{\theta}^2r\sin^2\varphi\)
\(a_{\theta}=2\dot{r}\dot{\theta}\sin\varphi+2\dot{\theta}\dot{\varphi}r\cos\varphi+\ddot{\theta}r\sin\varphi\)
\(a_{\varphi}=2\dot{r}\dot{\varphi}+\ddot{\varphi}r-\dot{\theta}^2r\cos\varphi\)
になります。

他の計算の仕方としては、変換の公式を先に使って例えばv=vxsinφcosθ+vysinφsinθ+vzcosφの形で表して、その式の時間微分をするという方法もあります。その場合でも計算式は多少長くなります。

方向余弦の定義と公式

方向余弦(direction cosine)とはベクトルに対して考えられる補助的な量で、ベクトルの大きさに乗じる事で各成分の値になるような余弦(コーサイン、cos)を指します。(空間ベクトルの平面への射影を考える時の余弦とは一般的に異なるものです。)

この方向余弦の応用として特に重要であるの直交座標同士の座標変換です。
(局所的には直交座標から直交曲線座標への変換もできます。)

■関連記事:ベクトルの内積

■応用例:直交曲線座標系の成分にベクトルを変換する方法

「方向余弦」の定義

方向余弦とは、ベクトルと座標軸とのなす角に対して考える余弦であり、xyzの空間での直交座標なら1つのベクトルに対して3つ定義されます。平面であれば2つです。

方向余弦の定義

大きさが0でないベクトル\(\overrightarrow{A}\) =(A,A,A)に対して
\(\left|\overrightarrow{A}\right|=A\) ( >0)とおくとして、
\(A\cos\theta_x=A_1\),  \(A\cos\theta_y=A_2\),  \(A\cos\theta_z=A_3\) である時、
余弦 cosθ,cosθ,cosθ を特に「方向余弦」と呼ぶことがあります。
本質的に関数としては普通の余弦 cosθと同じものではありますが、
ベクトルに関する性質と組み合わせる事で特有の関係式がいくつか成立するものになります。

「おおきさが0でないベクトル」という条件を付しているのは、ゼロベクトルに対して方向余弦の定義を適用するとベクトルの大きさも0ですが、成分も全て0なので方向余弦は「任意の角度の余弦」であってもよい事になってしまうからです。
そのため、定義自体をできないわけではありませんがゼロベクトルに対する方向余弦は
「あまり意味のないもの」になってしまうので、ここでは除外して考えるという事です。

方向余弦をベクトルの大きさに乗じる事で、ベクトルの成分が計算されます。
具体的で簡単な数値で考えてみると、例えば(1,1,1)のようなベクトルなら
ベクトルの大きさは\(\sqrt{3}\)なので、各軸に対する方向余弦は3つとも等しく1/\(\sqrt{3}\)になります。
\(\sqrt{3}\cdot\frac{1}{\large{\sqrt{3}}}=1\)であり、大きさ×方向余弦=成分となっています。

この時に、具体的な角度の値は必ずしも分かっていなくてもよい事も多くあります。
cosθ=1/\(\sqrt{3}\)に対しては角度は約54.7°、弧度法で0.955≒0.3πとも書けますが、
角度の値よりも「余弦の値」のほうが重要である場合も少なからずあります。
(特にこの記事で見て行く方向余弦の公式や諸性質・応用ではその傾向があります。)

このように方向余弦の定義自体は比較的簡単なものですが、
注意すべき点があるとすれば方向余弦は3次元の空間の場合には一般的に
「ベクトルをxy平面やxz平面に射影する余弦とは異なる」という事です。
平面であれば、方向余弦はx軸あるいはy軸に対してベクトルを射影する余弦でもあります。
空間の場合でも確かに「軸に対する射影」を行うベクトルであるとは言えますが、それはxy平面等の「平面に対する射影」とは異なるのです。

図で見ると、一般的に3次元空間でのベクトルの方向余弦はxy平面等に対して「斜めになった平面」における直角三角形の1つの角に対する余弦となります。

公式1:方向余弦の2乗和に対する公式

方向余弦は普通の余弦と同じく三角比や三角関数の公式が使えますが、特に方向余弦に対して成立する公式として「3つの方向余弦(平面であれば2つ)の2乗の和は1になる」というものがあります。

方向余弦の2乗和に対して成立する公式

3次元空間における3つの方向余弦に対しては次式が成立します。 $$\large{\cos^2\theta_x+\cos^2\theta_y+\cos^2\theta_z=1}$$ 平面では次式です。
(空間で1つの方向余弦だけが0と考えても同じ。) $$\large{\cos^2\theta_x+\cos^2\theta_y=1}$$ この公式は「方向余弦」について成立するものであり、
一般の余弦 cosθで成り立つものではありません。
平面の場合では図を見ると実質的には sinθ+cosθ=1 と同じである事も分かるでしょう。

この公式は式で考えても導出できますし、図による平面幾何的な導出も可能です。
(式で考えたほうが、実はやや簡単かもしれません。)

証明

式で見る場合には、ベクトルの大きさ(の2乗)を成分で敢えて表してみると公式がすぐに出ます。(同じベクトルでの内積で考えても同じです。)

ベクトルの大きさをAとすると方向余弦を使った成分は
(A cosθ,A cosθ,A cosθです。ここでA>0であるとします。
成分を使って敢えて大きさの2乗を計算すると
A cosθ+A cosθ+A cosθです。
しかし考えているベクトルの大きさは A なのですから、その式の値はAです。
A cosθ+A cosθ+A cosθ=A
A>0なので
cosθ+cosθ+ cosθ=1となり、公式が導出されます。

図で見る場合は、平面だと分かりやすくて式で見る場合と同じように三平方の定理で斜辺の長さを見れば数式だけで考えた時と同じ式を得ます。

また、同じ角度で三角比の意味での余弦を2回考えるという方法も可能です。
すなわち長さ A の斜辺に対して A cosθ を考えて、さらにそこを斜辺とする線分を探します。
するとベクトルが作る直角三角形において直角の頂点から斜辺に垂線を下ろした時に、
そこを境にA cosθの長さの部分とA cosθの長さに分かれる部分となる事が分かります。

空間の場合も似た考察ができますが、平面と比べるとどうしても単純さが失われる傾向があります。

三平方の定理を使うのが一番早く、式で考える場合と結局同じになります。
それ以外の方法だと、かえって複雑です。
図形的にはベクトルの辺はA cosθ+A cosθの部分とA cosθの部分に分かれます。

いずれにしても、方向余弦に関しての性質を調べる時には平面の場合は図形的な考察は比較的容易でも、空間の場合では式で取り扱ったほうが見やすい事を示唆しています。

平面の場合は、2つの方向余弦のうち1つはもう片方の角度から見た正弦と実質的には同じです。
平面の場合は図で見ても比較的分かりやすいですが、空間の場合だとやや複雑になる傾向があります。後述していく方向余弦の関係式や公式の証明では基本的に内積などの式による計算を使っています。

公式2:ベクトルの直線に対する射影についての関係式

ベクトル\(\overrightarrow{A}\) =(A,A,Aと始点のみを共有する直線があるとして、
始点からの長さが「その直線への\(\overrightarrow{A}\)の射影に等しい」ベクトルを\(\overrightarrow{B}\) とします。
どちらのベクトルもゼロベクトルではないとします。
その他、次のように設定を考えます。

  • \(\overrightarrow{B}\) =(B,B,Bとします。
  • \(\overrightarrow{A}\)と\(\overrightarrow{B}\) とのなす角をφとします。
  • \(\overrightarrow{A}\)の方向余弦の角度をθ,θ,θとします。
  • \(\overrightarrow{B}\)の方向余弦の角度をω,ω,ωとします。
  • ベクトルの大きさについては\(\left|\overrightarrow{A}\right|=A\)( >0)および \(\left|\overrightarrow{B}\right|=B\)( >0) とおきます。

この時、B=A cosφ ですが、他にも次の公式が成立します。

ベクトルの直線への射影と方向余弦の関係式

上記の設定のもとで、次式が成立します。 $$\large{\cosφ=\cos\theta_x\cos\omega_x+\cos\theta_y\cos\omega_y+\cos\theta_z\cos\omega_z}$$ $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ これらの式が一体何を言っているのかというと、
最初の式は2つのベクトルのなす角の余弦を互いの方向余弦の積の和で表せる事、
2式目は1つのベクトルの大きさを3つの方向余弦と
「射影のもとになっている別のベクトルの成分」で表せるという事です。
また、1式目は2式目を導出するのに使う式でもあります。

複数の方向余弦が取り扱われる時にはl,m,nなどの文字によって方向余弦が書かれる事もありますが、ここでは普通の余弦として表記しています。

証明

第1式の証明は内積を使います。また、第1式から第2式を証明できます。

ベクトルの成分表示を方向余弦を使って書き、内積をとります。

\(\overrightarrow{A}\) =(A,A,A)=A (cosθ,cosθ,cosθ)
\(\overrightarrow{B}\) =(B,B,B)=B (cosω,cosω,cosω)
\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB (cosθcosω+cosθcosω+cosθcosω)

他方で\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB cosφ なので、
AB cosφ=AB (cosθcosω+cosθcosω+cosθcosω)
A>0かつB>0よりAB>0なので
cosφ=cosθcosω+cosθcosω+cosθcosω

次に2式目については、Acosφ=B の関係式に1式目の結果を代入します。
A cosθ=A等の関係を使って途中の変形を行います。

B=Acosφ
=A (cosθcosω+cosθcosω+cosθcosω)
=(A cosθ) cosω+(A cosθ) cosω+(A cosθ) cosω
=Acosω+ A cosω+Acosω

この2式目のほうの式は、次に見て行くように2つの直交座標においてベクトルの成分の変換公式を導出するのに必要です。(直交座標から直交曲線座標への変換も局所的には可です。)

公式3:2つの直交座標系でのベクトル成分の変換公式

原点を共有する2つの異なる直交座標を考えます。1つの直交座標に対して、もう片方の直交座標が原点を共有した状態で回転したような位置関係です。
この時のベクトルの成分に対する座標変換に対して、方向余弦を使う事ができます。

ここで言う「ベクトルの成分に対する座標変換」とは、
1つの直交座標における成分で表されたベクトルが、空間での大きさと向きは同じにしたままで
「別の直交座標から見た時」にはどのような成分で書けるだろうか?という問題です。

得られる公式は形が規則的ではあるのですが、3軸の3軸に対する方向余弦を考える必要があるので合計9個の方向余弦を必要とします。
それらは1~3の番号の組み合わせを使うと処理をしやすい場合もありますが
(線形変換的な式なので、特に行列などを使う場合など)、
ここではx,y,zとX,Y,Zの文字で区別を行う事にします。

原点を共有する2つの直交座標間の変換公式

原点を共有するxyz系とXYZ系の2つの直交座標軸があり、
片方はもう片方に対して原点回りに回転したような位置配置となっているとします。
この時にx,y,zの軸上のベクトルからX,Y,Zの軸への方向余弦を考えます。
x軸上のベクトルに対するY軸への方向余弦を cosθxYのように書く事にすると、
xyz座標系で成分を考えたベクトル\(\overrightarrow{A}\) =(A,A,A)(\(\neq\overrightarrow{0}\))を
XYZ座標系の成分(AX,AY,AX)で書く時の変換の式は次のようになります。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz

また、逆にXYZ座標系の成分で書かれた(AX,AY,AX)を
xyz座標系の成分(A,A,A)で書くには次のような変換をします。

  • A=AXcosθXx +AYcosθYx +AZcosθZx
  • A=AXcosθXy +AYcosθYy +AZcosθZy
  • A=AXcosθXz +AYcosθYz +AZcosθZz

後述しますが、2つの異なるベクトルに対してこの変換を適用した時に
2つのベクトルの内積は変換前と変換後で値は同じ(=不変)になります。
(そこから前提である2つのベクトルの大きさも変換の前後で値は同じという事も見れます。)

ここでも考えているベクトルはゼロベクトルを除いていますが、考えている2つの直交座標系は原点を共有しているという設定なので、原点におけるゼロベクトルはそもそも変換の必要はなくどちらの座標系でも同じ成分(0,0,0)として共有されている事になります。

上記の変換の3式は線形結合の形なので、次のように行列の積で表現する事もできます。
また、方向余弦の添え字が一定の規則性を持つので行と列に上手く対応させる事ができます。 $$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) $$ 3行3列程度ならわざわざ行列にするよりも普通に式で書く方が早いし分かりやすいと見るか、
行列で見たほうが規則性が明らかで書く手間も少し減ると見るかは人それぞれと思われます。

9つの方向余弦の位置関係を表にして整理すると次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へcosθXxcosθYxcosθZx
y軸へcosθXycosθYycosθZy
z軸へcosθXzcosθYzcosθZz
方向余弦の添え字が規則的で、式が線形結合の形なので行列の積で関係式を書く事もできます。また、ここでのアルファベットの添え字を番号に変えると行列の行と列の番号に対応させる事もできます。

余弦が角度のプラスマイナスで同じ値になる事を考えると、これらの方向余弦は「xyz系の軸からXYZ系の軸への方向余弦」を考えた時と同じ値になります。つまり例えば「z軸からY軸への方向余弦」は「Z軸からy軸への方向余弦cosθZy」と同じものを使ってよいという事です。
ただしxyz系の軸からXYZ系変換への公式は導出過程に由来して、
単純にx,y,zとX,Y,Zの置き換えをすればよいわけではなく
「x軸から考えた場合の3つの方向余弦」を使う必要があります。
表で言うと、
XYZ系への変換では1つの変換につき「縦」の3つを使うのに対して、
xyz系への変換では1つの変換につき「横」の3つを使う事になります。

ここで具体的な角度よりも「余弦の値」自体のほうが基本的に重要となる事を考えて、
方向余弦を cosθXy=CXyのように略記すると次のように書けます。

方向余弦X軸からY軸からZ軸から
x軸へCXxCYxCZx
y軸へCXyCYyCZy
z軸へCXzCYzCZz

さらに、添え字をアルファベットではなく1~3の番号だけで書くと次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へC11C12C13
y軸へC21C22C23
z軸へC31C32C33

変換後の式が線形変換の形になっている事に由来して方向余弦の配列を行列として扱う時には、添え字の組み合わせと行・列の番号が一致するので便利な事もあります。また、和をシグマ記号で表したい時も添え字がアルファベットではなく番号になっているほうが便利です。
ただし2種類の添え字を同じ1~3の番号で表すと、どの軸からどの軸への方向余弦を考えているかといった図的な位置関係は少し見えにくくなります。そのため、この記事では番号ではなくアルファベットによる添え字を使用しています。いずれの表示方法でも表現する事自体は同じです。

この公式の変換は原点を始点として考えていますが、任意の点を始点とする場合でもそこを基準に考えるかベクトルを原点に平行移動して考える事によって変換公式を適用する事ができます。直交座標系ではベクトルの向き(および大きさ)を保ったまま平行移動を行っても軸とのなす角は同じ値に保たれます。つまり方向余弦の値も同じものが使えるので、上記の変換公式を適用できます。

証明

変換公式の証明には前述の「ベクトルの直線への射影と方向余弦の関係式」を使います。本質的には、意味を把握しているならその関係式に当てはめる事で変換の式はそのまま導出できます。

(再掲)ベクトルの直線への射影と方向余弦の関係式

前述の公式を書くと次の通りです。
ここでは射影ベクトルの始点からの距離を表すほうの式だけを使います。 $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ 変換公式の証明用に変数を対応させると次のようになります。 $$\large{A_X=A_x\cos\theta_{Xx}+A_y\cos\theta_{Xy}+A_z\cos\theta_{Xz}}$$ 実はこれで変換公式の証明に既になってしまっているのですが、
以下もう少し詳しく説明を加えます。

まず、xyz系からXYZ系への変換を考えたいので
「AをA,A,Aと方向余弦で表す」事を考えます。
そこで、ベクトル\(\overrightarrow{A}\)のXYZ系の各軸への射影を1つずつ考えます。
すると、ベクトルの終点から軸に下ろした垂線の足と始点までの距離は、
実はそれがそのまま「XYZ系における座標成分」になっています。

すると「X軸からのx軸」「X軸からのy軸」「X軸からのz軸」への方向余弦を考えて、公式に当てはめればXYZ系でのベクトル\(\overrightarrow{A}\)の「X成分」が得られるという流れです。
それが AX=AcosθXx +AcosθXy +AzcosθXzの式になります。

Y軸についても同様に「Y軸からのx軸」「Y軸からのy軸」「Y軸からのz軸」への方向余弦を考え、
Z軸についても同様に「Z軸からのx軸」「Z軸からのy軸」「Z軸からのz軸」への方向余弦を考えて
AY=AcosθYx +AcosθYy +AcosθYz および
AZ=AcosθZx +AcosθZy +AcosθZz の式を得ます。

逆変換の式の場合

同じ考え方で、XYZ系の成分で表されたベクトルをxyz系の成分で表す逆変換の式も作れます。
ただし「考え方」が同じでも使う方向余弦が違ってくるので注意も必要です。【余弦の値自体はx軸からY軸の方向余弦はY軸からx軸への方向余弦と同じものを使えます。cosθ=cos(-θ)であるため。】

xyz系からの変換を考える時には、使う方向余弦は次のようになります。

Aを表すために使う方向余弦Aを表すために使う方向余弦Aを表すために使う方向余弦
「x軸からX軸」cosθXx
「x軸からY軸」cosθYx
「x軸からZ軸」cosθZx
「y軸からX軸」cosθXy
「y軸からY軸」cosθYy
「y軸からZ軸」cosθZy
「z軸からX軸」cosθXz
「z軸からY軸」cosθYz
「z軸からZ軸」cosθZz

XYZ系からの変換の時とは微妙に違っていて、各変換の式で使用する方向余弦のうち1つは共通していて残り2つは異なっています。(行列表示で言えばcosθXxなどの対角成分は共通していて、残り2つが違うものになっています。)

式で使うベクトル\(\overrightarrow{A}\)の成分についてはXYZ系での成分であるA,A,Aを使用します。
これらによって、xyz系での成分であるA,A,Aを表す式を得るわけです。

すなわち
A=AXcosθXx +AYcosθYx +AZcosθZx
A=AXcosθXy +AYcosθYy +AZcosθZy
A=AXcosθXz +AYcosθYz +AZcosθZz の3式が導出されます。

局所的には直交曲線座標への変換にも適用可能である件

上記の方向余弦による直交座標間のベクトルの変換公式は、
局所的には極座標や球面座標などの「直交曲線座標」にも適用可能です。
その事についてもここで簡単に触れておきます。

ここで「局所的に」というのは、直交曲線座標においては1つ1つの点において2つまたは3つの座標曲線(極座標だと同心円と放射状に伸びる直線)の接線ベクトルが互いに直交するので、そこに限定して見れば「直交座標とみなせる」という事を指します。

ただし直交曲線座標では一般的に、そのような局所的には直交座標の軸とみなせる接線ベクトルも位置を変えれば向きが変わってしまいます。ですので直交曲線座標においては「向きが異なる局所的な直交座標」が至るところに存在するという感じです。

そのため、直交曲線座標に対して上記の変換公式を使う時には方向余弦を微分や偏微分を使って表します。そのようにする事で、変換の式が座標変数による関数として表せるので、結果的に領域全体での変換を表す事が可能になります。これは微分方程式に対して基本ベクトルを変更する形での極座標変換を行う時などに重要になります。

基本ベクトルを変更しない形での微分方程式の極座法変換もあり、その場合には方向余弦を使った公式は不要になります。
方向余弦を使った変換公式を適用する必要があるのは力ベクトルなども含めたベクトル場の成分をx,y,zではなくr,θ,φで表し、rやθによる変化を考えたい場合です。

直交座標から直交曲線座標へのベクトルの成分の変換を行う時には方向余弦を微分や偏微分によって表す事になります。微積分・ベクトル解析的な考察は多少必要ですが、方向余弦による変換の公式自体は直交座標同士の変換の場合と同じ形で考える事ができます。図で、方向余弦はCの文字と添え字によって略記しています。
直交曲線座標への変換での方向余弦の具体的な関数形は表し方が2通りあり、いずれも微分・偏微分によって表されます。

公式4:直交座標変換における方向余弦の関係式

上記は9つの方向余弦を使った「成分についての座標変換の公式」でしたが、
9つの方向余弦自体に対して成立する関係式も公式として存在します。

直交座標の変換における方向余弦同士の関係式

■ J,K =X,Y,Z のそれぞれ(J≠K)に対して次式が成立します。
$$\large{ \cos\theta_{Jx}\cos\theta_{Kx}+\cos\theta_{Jy}\cos\theta_{Ky}+\cos\theta_{Jz}\cos\theta_{Kz}=0 }$$ ■ j=x,y,z のそれぞれに対して次式が成立します。 $$\large{ \cos^2\theta_{Xj}+\cos^2\theta_{Yj}+\cos^2\theta_{Zj}=1 }$$ ■ j, k = x,y,z のそれぞれ(j≠k)に対して次式が成立します。
【j=kの時は第2式になります。】 $$\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0 }$$ ■J=X,Y,Z のそれぞれに対して次式が成立します。
(第1式の左辺でJ=Kとした時に相当。) $$\large{ \cos^2\theta_{Jx}+\cos^2\theta_{Jy}+\cos^2\theta_{Jz}=1 }$$ J≠Kおよびj≠kのもとで
第1式の意味は「XYZ系の2つの軸からのxyz系の1つの軸への方向余弦の積の和は0になる」
第2式の意味は「xyz系の1つの軸からのXYZ系の各軸への方向余弦の2乗和は1になる」
第3式の意味は「xyz系の2つの軸からのXYZ系の1つの軸への方向余弦の積の和は0になる」
という事になります。
第3式でj=kとした場合が第2式、
第1式でJ=Kとした場合が第4式であり、値が変わる事になります。
(j=kとj≠kおよびJ=KとJ≠Kの場合分けで全体を2式にまとめる事もできます。)
第2式と第4式は、空間内の直交座標系の任意のベクトルに対して「各軸への方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

これらの公式は「暗記」するようなものではなく、このような規則的な関係が成立するという認識のもと、もし必要であれば適宜参照すればよいと考えるべきでしょう。後述する「原点を共有する直交座標間の変換の前後でベクトルの内積は不変である」事の証明ではこれらの関係式の一部を使います。

この図での各方向余弦は、略記で記しています。公式が表す結果で考えると、要するに和を考えると0になる関係式と1になる関係式がそれぞれ2つずつ、計4つ存在します。xyz系の軸とXYK系の軸の対応関係から整理すると比較的見やすいかもしれません。

$$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) =\left(\begin{array}{lcr} C_{11} &C_{12}&C_{13}\\ C_{21} &C_{22}&C_{23}\\ C_{31} &C_{32}&C_{33}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right)$$ のように方向余弦を略記して、さらに行列の要素に対応する番号で表す時には
上記の公式は次のようにも書けます。 $$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$ $$\sum_{n=1}^3(C_{nj})^2=1$$ $$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$ $$\sum_{n=1}^3(C_{Jn})^2=1$$ (J,K=1,2,3は、ここでは行の番号です。j,k=1,2,3はここでは列の番号。)

公式行列要素での表記
 cosθJxcosθKx
+cosθJycosθKy
+cosθJzcosθKz=0
(J≠Kの時)
 cosθXxcosθZx
+cosθXycosθZy
+cosθXzcosθZz=0
【X,Z軸からの方向余弦の積の和】
$$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$
 cosθXj
+cosθYj
+cosθZj=1

(第3式でj=kの時)
 cosθXy
+cosθYy
+cosθZy=1

【y軸への方向余弦の2乗和】
$$\sum_{n=1}^3(C_{nj})^2=1$$
 cosθXjcosθXk
+cosθYjcosθYk
+cosθZjcosθZk=0

(j≠kの時)
 cosθXxcosθXz
+cosθYxcosθYz
+cosθZxcosθZz=0

【x,z軸への方向余弦の積の和】
$$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$
 cosθJx
+cosθJy
+cosθJz=0
(第1式でJ=Kの時)
 cosθZx
+cosθZy
+cosθZz=0

【Z軸からの方向余弦の2乗和】
$$\sum_{n=1}^3(C_{Jn})^2=1$$

証明

証明はいずれも内積計算を使いますが、2乗和の形の式はそれ以外の方法でもできます。
ここで考えるベクトルは任意のベクトルではなく「始点と終点が軸上にあるベクトル」です。
以下、そのようなベクトルを「軸に重なるベクトル」と呼ぶ事にします。
1つの座標系における軸に重なるベクトルであっても、別の座標系から見た成分で書くと通常のベクトルとして扱われる事になり、その事をここでの証明でも使います。

第1式

第1式については、X,Y,Z軸の異なる2つの軸は直交しますから、それらの軸上のベクトル同士の内積は0です。そこで、ベクトルの成分で内積を計算して0に等しいとする事で証明されます。(同じ1つの軸同士【公式でJ=K】であれば当然直交はせず、内積は大きさの2乗になります。それは第4式の証明です。)

J≠Kの時に J 軸と K 軸(例えばX軸とZ軸)は直交するので、
大きさが P(>0)のJ軸上のベクトル\(\overrightarrow{P}\)について成分はxyz系での座標で書ける事に注意すると
\(\overrightarrow{P}\)= P (cosθJx,cosθJy,cosθJz)
同じように大きさがQ(>0)であるK軸に重なるベクトル\(\overrightarrow{Q}\) は次のように書けます。
\(\overrightarrow{Q}\)= Q (cosθKx,cosθKy,cosθKz)
2つのベクトルは直交するので内積は0であり、
\(\overrightarrow{P}\cdot\overrightarrow{Q}\)=PQ(cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz)=0
PQ≠0なので J≠K であれば
cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz=0

第2式

第2式については、xyz系の軸に重なるベクトルから見て考えます。
xyz系のj軸(例えばy軸)に重なる大きさ(p>0)のベクトル\(\overrightarrow{p}\)を考えて、
成分をXYZ系の座標として書きます。
方向余弦はXYZ系からxyz系へのものを選んで使う事ができ、
k軸からX,Y,Zに向かうものを選ぶ事に注意すると次のように書けます。
\(\overrightarrow{p}\)= p (cosθXj,cosθYj,cosθZj)
同じベクトル同士の内積\(\overrightarrow{p}\cdot\overrightarrow{p}\)を考えるか、
成分で計算したベクトルの大きさ=pと考える事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=p(cosθXj+cosθYj+cosθZj)=p
p>0なので
cosθXk+cosθYk+cosθZk=1

この式は第3式でj=kとして考えた場合でもあります。

第3式

第3式はxyz系から見て、第1式の時と同じように考えます。
j,k=x,y,zでj≠kのもとで、p>0およびq>0が大きさである
j軸とk軸に重なる2つのベクトルを考えると、2つのベクトルは直交します。
両者をXYZ系の座標で書き、内積を成分で計算して0になるとおくと結果の式を得ます。
\(\overrightarrow{p}\)= p(cosθXj,cosθYj,cosθZj)
\(\overrightarrow{q}\)= q (cosθXk,cosθYk,cosθZk)
\(\overrightarrow{p}\cdot\overrightarrow{q}\)=pq(cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk)=0

p>0かつq>0なのでj≠kであれば
cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk=0

第4式

第4式は、第1式において大きさがP (>0)の1つのベクトル同士の内積か大きさを成分で計算する事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=P(cosθJx+cosθJy+cosθJz)=P
P>0なので
cosθJx+cosθJy+cosθJz=1

第2式と第3式はxyz系から見て計算を考えましたが、得られた方向余弦の関係式はXYZ系をxyz系に変換する場合でも成立しているので必要があれば使ってもよい事になります。
また、第2式と第4式に関しては成分を考えている座標系だけから見れば「ある1つのベクトル」を考えている事になります。そのため、前述の「方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

方向余弦を使った直交座標の変換の前後において内積は不変である事の証明

座標変換をした時に値が変わらない量(「不変量」)についての考察は数学的に重要で、扱う対象によっては物理学でも重要となる場合もあります。

ところで前述の原点を「共有する直交座標同士のベクトルの成分の変換」は、ベクトル自体はいじっていないはずなので変換前と変換後で大きさは「同じはず」です。もしも、現に計算したらベクトルの大きさの値が変わってしまうなどという結果が出たら整合性がとれず困った事になります。
しかし実際は計算をしてもベクトルの大きさは同じ値に保たれる事が数式でも分かります。
そして実は、変換前と変換後ではベクトルの大きさだけでなく内積が同じ値に保たれているのです。

方向余弦を使った座標変換の前後における内積

2つのベクトルの成分を、原点を共有する2つの直交座標間で変換するとします。
\(\overrightarrow{A}\) =(A,A,A)および\(\overrightarrow{B}\) =(B,B,B)を考えて、
変換後の座標はそれぞれ
(AX,AY,AZ)および(BX,BY,BZ)であるとします。
この時に2つのベクトルの内積\(\overrightarrow{A}\cdot\overrightarrow{B}\) の値は、変換前のxyz系の座標成分で計算しても、
変換後の座標成分で計算しても同じ値になります。 $$\overrightarrow{A}\cdot\overrightarrow{B}=A_xB_x+A_yB_y+A_zB_z=A_XB_X+A_YB_Y+A_ZB_Z$$ 同じベクトル同士の内積を考える事により、
変換の前後でベクトルの大きさも同じ値に保たれる事も確認される事になりす。
(外積ベクトルについては変換によって異なるベクトルに変化してしまいます。)

証明

変換後の成分で内積を計算し、変換前の内積の値に等しくなる事を示します。

2つのベクトルの変換について、使用する方向余弦は「座標軸から座標軸へのもの」なので共通して使う事ができます。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz
  • BX=BcosθXx +BcosθXy +BcosθXz
  • BY=BcosθYx +BcosθYy +BcosθYz
  • BZ=BcosθZx +BcosθZy +BcosθZz

さて、これの内積を計算するとなるとX成分だけで見ても9つの項ができる事になりますが
規則性があるので全体としても3項の和の塊が9つという形です。
さらに前述の座標変換時の方向余弦に関する関係式を使うと、実は多くの部分が0になるのです。

  1. ABcosθXx+ABcosθYx+ABcosθZx=AB
    【∵cosθXx+cosθYx+cosθZx=1】
  2. ABcosθXxcosθXy+ABcosθYxcosθYy+ABcosθZxcosθZy=0
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0】
  3. ABcosθXxcosθXz+ABcosθYxcosθYz+ABcosθZxcosθZz=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0】
  4. ABcosθXy+ABcosθYy+ABcosθZy=AB
    【∵cosθXy+cosθYy+cosθZy=1】
  5. ABcosθXycosθXx+ABcosθYycosθYx+ABcosθZycosθZx
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0(2番目の計算と同じ)】
  6. ABcosθXycosθXz+ABcosθYycosθYz+ABcosθZycosθZz=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0】
  7. ABcosθXzcosθXx+ABcosθYzcosθYx+ABcosθZzcosθZx=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0(3番目の計算と同じ)】
  8. ABcosθXzcosθXy+ABcosθYzcosθYy+ABcosθZzcosθZy=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0(6番目の計算と同じ)】
  9. ABcosθXz+ABcosθYz+ABcosθZz=AB
    【∵cosθXz+cosθYz+cosθZz=1】

ここでは一応全部記してみましたが、
「2番目と5番目」「3番目と7番目」「6番目と8番目」は
掛け合わせる方向余弦の順番が違うだけで実質的に同じ計算であり、しかも値が0になります。
つまり6式については実は3組のほぼ同じ計算の式で、しかも0になって消えるわけです。
残るのは他の3つだけで、それらは方向余弦の部分が上手い具合に1になります。
よって、XYZ系に成分を変換後の内積の値は
AB+AB+ABとなり、
これは変換前の内積の値に一致するわけです。

シグマ記号で計算する場合、1~3の番号を使った処理も可能です。

XYZ系からxyz系への逆変換の式でも、内積の不変性は同様に証明も同様に可能です。

乗じる項の順番が異なるだけで実質的に同じ計算になる2組の箇所が3つあったのはあながち偶然ではなくて、実は行列の非対角部分でC12とC21のような転置の配置にある要素の組がそれらに該当します。
また、計算結果が0にならなかった部分は対角部分の3つです。
ここでの変換の場合に方向余弦が行列の要素に対応するような結果の式であったので、そのような規則性が見れるわけです。

上記の証明について、シグマ記号を使った証明も記します。
番号を使ってやる事も可能ですが、ここではアルファベットのままやる方法を書きます。
方向余弦はcosθXz=CXzのような略記号を使います。$$\large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{J=X,Y,Z}A_JB_J}$$ $$\large{=\sum_{J=X,Y,Z}\left\{\left(\sum_{j=x,y,z}C_{Jj}A_j\right)\left(\sum_{k=x,y,z}C_{Jk}B_k\right)\right\}}$$ $$\large{=\sum_{J=X,Y,Z}\left(\sum_{j,k=x,y,z}C_{Jj}C_{Jk}A_jB_k\right)}$$ $$\large{=\sum_{j,k=x,y,z}\left\{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)\right\}}$$ この式をよく見ると、1つのJを決めてj,k=x,y,zについて加え合わせた時に、
前述の公式によりj=kの場合以外は0になる事が分かります。 $$j\neq kの時、\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0なので、 }$$ $$j\neq kの時、\large{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)=0}$$ よって内積はk=jの項だけ考えればよい事になりますが、
k=jの時は同じ形の式が1になるので結局、方向余弦は全て式から無くなります。
整理すると、次のようになります。 $$ \large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{j=x,y,z}\left\{A_jB_j\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jj}\right)\right\}} $$ $$\large{=\sum_{j=x,y,z}\left(A_jB_j\right)}$$ これによってXYZ系の成分による内積の結果と、
xyz系の成分による内積の結果が等しい事が示されます。

電磁誘導の法則

電磁誘導(「でんじゆうどう」)は「磁場が変化する事で起電力が生じる」事を表す現象で、発電機や変圧器の原理です。電磁誘導の法則はマクスウェル方程式の1つで、数式的には磁場の時間変化と電場の回転を含む式になっています。

電磁誘導の法則は、アンペールの法則と組み合わせて電磁波を表す式を導出するための法則でもあります。また、電磁誘導の法則はマクスウェル方程式の中では電気回路論との直接的な関係が強い法則であるとも言えます。そのため、この記事では電磁誘導に関連した回路論の事項もいくつか含まれます。

電磁誘導を考えるにあたって重要となる「誘導起電力」について、記号はVでもEでもεでも何でもよいのですが、この記事では統一してVeという記号で書いておきます、(それほど深い意味はなく、電場等との記号と混同しないようにという意味合いです。)

この法則はいくつか呼ばれ方があって、
「ファラデーの(電磁誘導)法則」「ノイマンの(電磁誘導)法則」「ファラデー・ノイマンの(電磁誘導)法則」あるいは単に「誘導法則」・・・などとも言います。
このサイトでは「電磁誘導の法則」の名称で統一します。
科学史的には、電磁誘導に関する詳しい実験と基本的なアイデアの提唱を行ったのはファラデーであり、その結果を整理して定式化したのはノイマンだとされています。

電磁誘導という現象

直流電源(起電力の向きが一定)をつないだ回路と電源が無い回路を用意して、電源を入れると電源が無いほうの回路にも一瞬だけ電流が発生します。この現象が電磁誘導です。

この現象は、電源をつないでいない回路に磁石を近づけたり遠ざけたりする時にも起こります。つまり磁場が関係している事が分かります。1つの回路が別の回路に電流を発生させているのは、片方の回路の電流によって発生した磁場であると言えます。

ただし磁場さえあれば同じ現象が起きるかというと実はそうではなく、
磁場の変化」(つまり増加か減少)があるとそのような事が起きます。また、電源をつないでいない回路に発生する電流の大きさは回路の導線の長さ・断面積・材質で変化します。つまり回路の抵抗に依存します。そのため、磁場の変化によって誘起されるのは電流を生じさせる「起電力」(電源としての電位差)であると考えられるわけです。

  • 電磁誘導が起きるのは「磁場の変化」が起きる時
  • 磁場の変化によって誘導されるのは回路全体に電位差を作る「起電力」(回路全体の電圧)

電磁誘導は1つの回路の電流による磁場が、電気的には絶縁されている他の回路に対して誘電起電力および結果としての電流を生じさせています。これについては、切り離された2つの電気回路が磁気回路によって接続されているという見方もできます。確かに直流電流が発生させる誘導起電力は「電源を入れた時と切った時だけ」の一瞬ですが、交流電流であれば継続的な交流の誘導起電力を発生し続ける事ができます。

しかも、次に見て行くように発生する誘導起電力は「磁場の変化」の大小で決定し、直接的には電流の大きさには依存しません。すると、何らかの方法で局所的に磁場の変化量を増やせば回路の電圧の調整が可能になります。(具体的には導線をコイル状にして、さらに中に鉄心を入れます。)それを実用化しているのが変電所等に設置されている変圧器です。電磁誘導は発電機の原理でもありますが、変圧器の原理でもあるわけです。

電流が作る磁場を表すアンペールの法則やビオ・サバールの法則は電磁石の原理です。また、磁場中の電荷や電流が生じている導線が受ける電磁力あるいはローレンツの力は電動機(モーター)の原理です。電動機と発電機は実は構造的には基本的にほぼ同じか非常に似た機械であり、電動と発電という用途の違いで区別がされています。

電磁誘導の法則は数式的には複数の表現方法があり、用途によって使い分けられます。

法則の積分形(固定回路で磁場の時間変動がある時)

電磁誘導の法則は、磁束誘導起電力との関係を表した式です。磁束とは磁場の法線面積分で表される量を言います。(\(\overrightarrow{B}\) を「磁束密度」として考える事があるのは磁束の定義に由来します。ただし当サイトではそれを磁場として扱う方式で記述をしています。)

そして誘電起電力を「電気回路一周分で電荷が受ける事になる仕事」として捉えると、電磁誘導の法則は「電場の回転」と「磁場の時間変化」の関係を表す式であるとみなす事ができます。

他の3つのマクスウェル方程式同様に、電磁誘導の法則にも積分形微分形が存在します。法則の直接的な意味が分かりやすいのは積分形であり、次のようになります。

電磁誘導の法則(積分形・誘電起電力で表す式)

曲面Sに発生する誘電起電力は、磁束の時間変化で表されます。
誘電起電力や磁束はベクトルではなく、スカラー量です。 $$V_e=-\frac{d\Phi}{dt}=-\frac{d}{dt}\int_S \overrightarrow{B}\cdot d\overrightarrow{s}$$ $$\left(V_e=-\frac{\partial\Phi}{\partial t}=-\frac{d\Phi}{dt}と考えても同じです。\right)$$ 特に回路が固定されている時は、
回路が固定されている時には特に磁場の時間変化で表す事ができます。 $$V_e=-\int_S \frac{\partial\overrightarrow{B}}{\partial t}\cdot d\overrightarrow{s}$$ 曲面としては基本的には開曲面を考えます。
磁場の関数形は領域で不連続点が無いものとします。
(数学的に\(\large{\frac{d}{dt}\int_S \overrightarrow{B}\cdot d\overrightarrow{s}=\int_S \frac{\partial\overrightarrow{B}}{\partial t}\cdot d\overrightarrow{s}}\) となるための条件。)

また1変数の微分なのか偏微分なのかの問題については、磁束は曲面に対して想定される量なので「時間だけの関数」であり、1変数の微分で扱えます。積分のほうで見ても、積分した結果を考えれば座標成分の変数は残っていない事になるので時間だけの関数です。
面積分は変数としては座標成分だけが関係するので、被積分関数が領域内で連続であれば時間微分(これは偏微分になります)を積分しても同じ結果を得ます。
また、時間微分というのは基本的に偏微分を考えるものであり、
1変数に関しては∂/∂tもd/dtも同じ事なので∂/∂tで統一しても同じ事になります。

磁束に関しては「閉曲面」に関して任意のものを考えてもよいのですが、それは
「時間変動する磁場の任意の時刻においては静磁場同様に磁場に関するガウスの法則が成立する」のであれば、確かにそう言える事が分かります。
閉曲線Cを外縁として共有する任意の2つの開曲面を考えて、
それらで囲まれる閉曲面内ではどの位置でも磁場の発散が0です。
式で書くと\(\mathrm{div}\overrightarrow{B}=0\) であり、物理的には「湧き出しを持たない」事を意味します。
すると、ガウスの発散定理によって2つの閉曲面上の磁場の法線面積分は等しい値になる事が言えます。すなわち1つの閉曲線Cを外縁として共有している限り、開曲面Sは任意のものを考えても「磁束」\(\large{\int_S\overrightarrow{B}\cdot d\overrightarrow{S}}\) は同じ値になる事が数式的にも保証される事になります。
磁束を考える開曲面の任意性については、てきとうな閉曲面を考える事もできますが磁力線が通過する回路の任意の形状を表すという捉え方もできます。(どちらの捉え方にも意味があります。)

電磁誘導の法則について、発生する誘電起電力の「向き」に着目したものを特にレンツの法則と呼ぶ事もあります。

電磁誘導で発生する誘導起電力の「向き」の規則(レンツの法則)

電磁誘導における誘導起電力は、
「回路を通過する磁束の変化を妨げるような電流を発生させる向き」に生じます。
つまり磁束が増えるなら減らすような磁場を作る電流を発生させる向きに誘電起電力が発生し、磁束が減るなら増やす方向に誘導起電力が発生します。
(ただし、それで実際に電流がどれだけ多く発生するかはまた別問題となります。)

起電力の発生とは回路全体に電位差が生じる事です。その結果として回路には電流が発生します。この時に回路の導線に沿って電場が発生していると考えて、それを特に誘導電場と呼ぶ事があります。

この時に、+1 [C]の電荷を置いてみた時に誘導電場から受ける仕事が「回路全体に生じている電位差」(=起電力)であるので、それは回路1周分の電場(=+1 [C]の電荷が受ける電気力)の接線線積分で表す事ができます。

電磁誘導の法則(積分形・電場で表す形の式)

$$\oint_C\overrightarrow{E}\cdot d\overrightarrow{l}=-\frac{\partial\Phi}{\partial t}\left(=-\frac{d\Phi}{dt}\right)$$ 特に回路が固定されている時は次式です。
マクスウェル方程式の1つとして見る場合は基本的にこの形のものを指します。 $$\oint_C\overrightarrow{E}\cdot d\overrightarrow{l}=-\int_S \frac{\partial\overrightarrow{B}}{\partial t}\cdot d\overrightarrow{s}$$

閉曲線Cは導線でできた回路を考えてもいいし、空間内のてきとうな任意の閉曲線を考えても良い事になります。導線の回路とは無関係に閉曲線を考えた場合でも、磁場の時間変動(および磁束の時間変動)があるなら起電力に相当する電位差は発生していると見るわけです。

回路として導体でできたものを指定しなくても閉曲線として形状さえ指定すればよいという意味では、確かに物理的には「より一般的な式」であるという事は言えそうです。

空間中に導線の回路ではなくてきとうな閉曲線を考える時には、
その空間というのが空気などの電気的に絶縁性の高い物質中であるか、あるいは真空中という事を想定するなら「電位差(=電圧)は発生していても電流は生じない」事になります。(電位が0でない場所には「電場」は発生しています。)
その事は回路論においての電圧と電流の違いという意味でも重要ですし、電磁波が絶縁物中や真空中であっても伝わって進行していくという点でも大事であると思われます。
ただし絶縁物中や真空中で電流は基本的に発生しないという事は、敢えて「誘導起電力」を考える必然性も無い事も意味すると言えます。そのため、そのような場合には電場と磁場の関係で表したほうが良いという捉え方もできそうです。

法則の微分形

電場と磁場の関係で表した電磁誘導の法則の積分形にストークスの定理を適用すると、法則の微分形を得る事ができます。

ストークスの定理を適用するのは、電場のほうの項です。それが循環(周回の接線線積分)の形になっているので、「電場の回転」の法線面積分として書けます。

$$\oint_C\overrightarrow{E}\cdot d\overrightarrow{l}=\int_{S_0}\mathrm{rot}\overrightarrow{E}\cdot d\overrightarrow{s}$$

開曲面をSとしていますがこれは磁場のほうに対する開曲面と同じである必然性がないので予めそう書いただけであり、本質的にはあまり関係ありません。

$$電磁誘導の法則により\oint_C\overrightarrow{E}\cdot d\overrightarrow{l}=-\int_S \frac{\partial\overrightarrow{B}}{\partial t}\cdot d\overrightarrow{s}であるから$$

$$\int_{S_0}\mathrm{rot}\overrightarrow{E}\cdot d\overrightarrow{s}=-\int_S \frac{\partial\overrightarrow{B}}{\partial t}\cdot d\overrightarrow{s}$$

開曲面SとSは任意にとれるので、式が成立するには被積分関数が同一でなければなりません。
よって、電磁誘導の法則の微分形が成立する事になります。

これは他のマクスウェル方程式の積分形から微分形への変形の時と同じやり方です。

電磁誘導の法則(微分形)

$$\mathrm{rot}\overrightarrow{E}=-\frac{\partial\overrightarrow{B}}{\partial t}$$ ナブラで書くと次のようになります。 $$\nabla\times\overrightarrow{E}=-\frac{\partial\overrightarrow{B}}{\partial t}$$ この式の形は、マクスウェル方程式の中で言うとアンペールの法則と対になっています。

電磁誘導の法則の微分形は、
磁場の直接的な時間変化と「電場の回転」を関連付ける式です。
少し妙な結果にも思えるかもしれませんが、この微分形の式は物理的には「局所的には磁場の時間変化により電場の渦ができ、回路全体では誘導起電力の発生を意味する」という解釈ができます。
「渦」のイメージは微小な領域に対して積分形を考えてみると比較的分かりやすいかもしれません。それを1点で考えて数式で表すとこのような微分形の式になるわけです。

電磁波の式を導出する時にマクスウェル方程式を組み合わせる時には、基本的に微分形のほうの式を使います。電磁誘導の法則と組み合わせるのはアンペールの法則の微分形です。

時間変動しない磁場中で回路が動く時の法則の形

ところで各位置における磁場が時間的に一定である時に、回路自体を動かしても「回路を通過する磁束」は変化する事になります。(磁場の分布と運動の仕方によっては変化しない事もありますが、一般的に言えば変化をします。)

実際、そのような場合でも電磁誘導は起きます。ただし、その時に電磁誘導の積分形の見た目が違った形で書かれる事があります。

それは接線線積分で書かれる事になりますが、上述の電磁誘導の法則の積分形をストークスの定理等を使って変換したものとは異なります。

電磁誘導の法則(積分形・時間変動の無い磁場中で回路が動く場合)

時間変動しない磁場中で閉曲線Cを作る回路が運動する時に、
回路の各位置の速度ベクトル(位置の時間変化)を\(\overrightarrow{v}\)とすると $$V_e=\oint_C \left(\overrightarrow{v}\times\overrightarrow{B}\right)\cdot d\overrightarrow{l}$$ $$=-\oint_C \overrightarrow{B}\cdot\left(\overrightarrow{v}\times d\overrightarrow{l}\right)$$ ここで言う回路の運動とは直線運動でも曲線運動でも良くて(瞬間の位置の変化=速度を考えているので)、回転運動も含みます。また、理論的には閉曲線の形状自体が微小変化する場合も含めて成立する式になっています。
式の1段目から2段目の変形は外積ベクトルの公式によります。
2段目の式は法線面積分としても捉える事ができます。ただし実質的にはそれを閉曲線の周に沿ってだけ考えれば十分であるという意味です。

この法則の形は回路が動く場合に必ず適用しないといけないかというと実はそうではなく、磁束の変化を直接計算できるならそっちで考えたほうが早い場合もあります。
例えば交流の起電力を発生させるために回路を回転させる場合などは上記の式で考える事もできますが、最初から磁束を計算したほうが早いです。
(実際の発電機では、回路を回転させるタイプと磁場を発生させる電磁石部分等を回転させるタイプの両方が存在して使い分けられています。)

電磁誘導の法則の積分形の元の形に即して言えば考え方自体は固定された回路において磁場が時間変動する時と同じで、回路を周・外縁とする開曲面の磁束の変化を計算していると見る事ができます。

回路を閉曲線Cとして、それを外縁とする開曲面Sを考えます。

回路が移動あるいは変形すると、そもそもの閉曲線が変わるので開曲面に対する磁束も変化します。(平行移動や回転で開曲面の形状を変えていなくても。)

1つの閉曲線Cに対しては開曲面Sは任意に選べるので、なるべく大きくならないものを選びます。例えば閉曲線の各点を直線で結ぶ事で形成される曲面などです。

最初に存在する閉曲面Sと、移動後の閉曲面Sを考えて、
それと移動の軌跡で作られる側面の閉曲面Sも考えます。
次に、速度ベクトルがSの表面とのなす角が180°以下の時を見てみます。これは速度ベクトルがSの表面側を向いている状況です。

任意の時刻で静磁場に関するガウスの法則が成立しているとすれば、
閉曲面全体での磁場の法線面積分(=磁束)の合計は0です。
(この事は、電磁誘導の積分形のところで触れた「磁束は1つの閉曲線を外縁として共有している条件のもと任意の開曲面で考えても同じ値になる」という話と同じです。)

その内訳を見ると、最初のS1の表面が「閉曲面の裏面」になる事に由来してSに対する磁束Φ1とSに対する磁束Φが互いに異符号で存在します。それと軌跡で作られた側面Sにおける速度ベクトルと接線ベクトルの外積が閉曲線の内側を向いています。

するとΦ-Φ-Φ=0 ⇔ Φ-Φ=Φ です。

非常に短い時間では、Φは「速度ベクトル(どの位置でも同じ)と接線ベクトルが作る平行四辺形」を面積に持つ面積要素ベクトルと、磁場との内積を考えた法線面積分です。

しかしこの時の面積要素ベクトルは「速度ベクトルと接線ベクトルの外積ベクトル」に等しく、それを閉曲線C(最初の位置での閉曲線)において周回ですればよい事になります。上記の式で言う2段目の形です。その式をさらにベクトルの外積の公式で変形すると上記の1段目の形が得られます。

$$移動の軌跡で作られる面の磁束\Phi_d=\int_{S2} \overrightarrow{B}\cdot d\overrightarrow{s}=-\oint_C \overrightarrow{B}\cdot\left(\overrightarrow{v}\times d\overrightarrow{l}\right)$$

$$=\oint_C \left(\overrightarrow{v}\times\overrightarrow{B}\right)\cdot d\overrightarrow{l}$$

曲線の一部だけが移動すると考えれば、
回路の形状が微小に変化する場合にも同様に考える事ができます。

次に、Sの表面と速度ベクトルのなす角が180°を超える時、つまり速度ベクトルがSの裏面側に伸びている状況を考えます。この時は、閉曲面を考える事で表が裏に転じるのはSのほうになります。さらに、速度ベクトルと接線ベクトルの外積は今度は閉曲面の外側(=表側)を向くようになります。

従ってその場合はΦ-Φ+Φ=0となり、
Φ-Φ=-Φ ⇔ Φ-Φ=Φ となって
先ほどと同じ関係式になったので同様に考える事ができます。

この式は物理的には単位電荷が受ける仕事の変化という観点からも見れます
すなわち、導線中に電荷を持った自由電子があるとしてそれを動かす事になるので生じる電磁力(ローレンツの力)が1[C]あたりの電気量で見ると\(\overrightarrow{v}\times\overrightarrow{B}\) となりますが、この力自体は電荷の速度に垂直に生じるので「生じた電磁力がする仕事はゼロ」です。
しかし実際は、何らかの外力で導線の回路を動かした事による仕事はゼロではありません。(導線の質量を考えた通常の力学的な仕事を抜きにして。)
ここで、電磁誘導によって起電力と電流が回路に生じるとすると、その誘導起電力に由来する電流に働く電磁力\(Id\overrightarrow{l}\times\overrightarrow{B}\) が生じます。
(これは電流を電荷の電気量とその速度に分けて、大きさはQv=Idl で回路の接線ベクトルと電荷の速度ベクトルが等しいと考える事によります。)
この電磁誘導に由来する電磁力は、回路の移動を妨げる方向に働きます。
言い換えると、現に回路を動かせたとすれば電磁力に逆らって外力が仕事をした事になり、その仕事が電気エネルギーに変換されたと見る事ができます。
しかし外力と電磁誘導による電磁力は方向は一般的に一致しないので
外力が「単位時間あたりに電磁力に逆らってした仕事」(つまり仕事率)は内積で考えると
\(-\left(Id\overrightarrow{l}\times\overrightarrow{B}\right)\cdot\overrightarrow{v}=I\left(\overrightarrow{v}\times\overrightarrow{B}\right)\cdot d\overrightarrow{l}\)
右辺は左辺を変形したもので、誘電起電力を外積で表した式の微小量にに電流を乗じたものです。
また電流と電圧を乗した量は実は「電力」であって、電気的な「仕事率」の事です。
積分を行うと両辺共に回路全体での「仕事率」です。(左辺は外力、右辺は電荷によるもの。) $$-\oint_C\left(Id\overrightarrow{l}\times\overrightarrow{B}\right)\cdot\overrightarrow{v}=I\oint_C\left(\overrightarrow{v}\times\overrightarrow{B}\right)\cdot d\overrightarrow{l}$$ つまり電流も含めて考えると
「外力が電磁力に逆らって行う仕事率」=「誘電起電力が消費できる電力」
という関係式ができます。
磁場の時間変動がある時と時間変動がない磁場中を回路が動く時とでは、結果は同じでも物理的に誘電起電力の発生の機構が違うという見方と、回路の速度は相対的なものである事も含めて本質的にも同じものであるという見方の両方が存在しているようです。

自己インダクタンスと逆起電力

「1つの回路による電流による磁場の変化が、もう1つの回路に誘導起電力を発生させる」という理論をよく考えてみると、磁場を生じている元の回路を通過する磁場も変化しているはずではないのか?と思えるかもしれません。

そして実はそれは正しくて、一般的に電気回路は
「それ自身に発生している電流による磁場の変化があった時」
にはそれに由来する誘導起電力が発生するのです。
そしてその部類の誘電起電力は特に逆起電力と呼ばれます。
それは直流回路で電源を入れた時などは無視できる大きさですが、交流電気回路では考慮に入れる必要があります。特にコイルがある場合には基本的に無視する事はできない事が多いです。

電磁誘導の法則を思い返してみると、磁束の変化を妨げるような向きに誘導起電力が発生するのでした。
つまり、回路の電流がその回路自体に対して及ぼす誘導起電力はまさに「磁場の発生源である電流を減らそうとする向き」に発生します。それは一般的に電源の起電力によってかかる電圧と逆向きであるので「逆起電力」と呼ぶわけです。

直流回路なら逆起電力は大きさも小さくすぐに消えるので無視できますが、交流回路では逆起電力が継続し続けて大きさも無視できない場合があります。

実験によって(あるいはアンペールの法則やビオ・サバールの法則から)直線電流によって生じる磁場は電流の大きさに比例します。これは交流電流のように電流が時間変化する場合でも、各時刻で考えると同じ事が言えます。

※アンペールの法則で考える変位電流の影響については、コンデンサーにおける場合などは考える意味がありますがここでの考察のようにコイルなどでは無視できる大きさであるとします。

そこで主に逆起電力を考える場合に特に多く使う考え方として、
比例定数Lを使って磁束をΦ=L I と表現する事が多くあります。
この比例定数Lを、考えている回路の自己インダクタンスと呼びます。
この形の磁束の式を使って逆起電力を表す場合の電磁誘導の法則の式を書くと、
Ve=-(dΦ/dt)=-L (dI/dt)となります。

その形の式は、電気回路に限定した議論のように空間的な電場や磁場のベクトルを考えなくてもよい場合によく使われます。回路で考えている場合の電流は時間に依存する事はあっても、空間的な位置座標には依存しません。

逆起電力を表す場合の電磁誘導の法則の式

電気回路中において、誘電起電力として逆起電力を表す場合には
比例定数である自己インダクタンスLを使って次のように書く事ができます。 $$\Phi=LI\hspace{5pt}と電磁誘導の法則を組み合わせる事で、$$ $$V_e=-\frac{d\Phi}{dt}=-L\frac{dI}{dt}$$ ここでのマイナス符号は、回路における電流や電圧の「2方向の向き」を表すものです。
電流の方向と逆向きに逆起電力が発生する事を表します。
この電流や電圧の向きはベクトル的な空間的な電流等の向きにも対応していますが、回路だけを考えるならベクトルとして考えなくても同じ形の式が使えます。
微分については「電位回路中の電流」という条件のもとでは電流は空間的な位置座標の関数ではなく、交流回路において時間のみの関数と考える事がでます。そのため、微分は1変数の微分として考えれば十分です。

他回路に対しても同様に考える時には「相互インダクタンス」を考える時もあります。
ただし、考えているのが1つの回路である事が明確な時には
自己インダクタンスを単に「インダクタンス」と言う事も多くあります。
(「自己」と「相互」をまとめて指す意味でインダクタンスとも言います。)
また、無視できない大きさの自己インダクタンスを持つコイルのような部分を回路素子とみなす時には、それをインダクタと呼ぶことがあります。

自己インダクタンスを使った考え方は回路論以外で使ってはいけないわけでは無いですが、
基本的に「電流が作っている磁場が、その電流が生じている回路に及ぼす誘電起電力(=逆起電力)」
を考えているので必然的に電気回路で使う事が多くなるわけです。

ここで、回路にV sin(ωt)で表される交流電源があって、回路素子としては無視できないインダクタンスを持つコイルだけがある状況を考えてみます。
(全ての導線にもコイルにも抵抗成分は必ずありますが、ここでは簡単のためにそれらは無視できる大きさとして考えます。)

すると、キルヒホッフの法則(回路の電圧降下の合計は起電力に等しいというもの)を考えると
「電源の起電力=逆起電力の大きさ」という事になってV sin(ωt)=L (dI/dt)です。
(向きまで含めて考えれば電源の起電力とここでの逆起電力は符号が異なります。)
このtに関する微分方程式は比較的簡単に解く事ができます。
任意定数が0になるように初期条件を考えると、I=-{1/(Lω)}cos(ωt) となります。
合成関数の微分を考えて(d/dt){cos(ωt)}=-ωsin(ωt)となる事に注意。】

-cos(ωt)=-sin(π/2-ωt)=sin(ωt-π/2)でもあるので、
コイルの端子間電圧(ここでは電源電圧に等しい)V sin(ωt)に対して
コイルに生じている電流は「位相がπ/2遅れている」という表現もされます。これは交流回路論においては割と重要です。

その条件のもとでは電源の起電力と回路の電流の最大値の絶対値だけで関係を見ると
|V|=|I|/(Lω)となっています。
(交流回路では電圧や電流の最大値を2の平方根で割った「実効値」が使われますが、実効値で考えても同じ関係が成立します。)これは交流回路を分析する時に実は便利な関係です。
そこで、角速度(回路論や通信工学などでは角周波数とも言います)も含めたLωという値を改めて誘導リアクタンスと呼ぶ事もあります。
この誘導リアクタンスを使用する場合には、位相の変化も含めて考える必要がある事も多いです。
実はコンデンサーについても同様の考察ができます。一般的に、コイルに対するLωという量と、コンデンサの容量を使って表される1/(Cω)という量を共にまとめて「リアクタンス」と呼び、さらに抵抗成分と合わせたものをインピーダンスと呼びます。

使われ方:1発電機における電磁誘導

電磁誘導を利用して発電を行う発電機にはいくつか種類がありますが、
実はいずれも電動機(モーター)と対になった分類になっています。発電所で従来から使われてきた発電機で多いものは同期発電機(synchronous generator)と呼ばれます。以下、積分などの計算はありませんがいわゆる電気機器・電気機械の理論独特の多少込み入ったな話も一部含まれます。

  • 同期発電機:発電所で多く使われてきた発電機。火力発電などでは一般的に巨大。
  • 直流発電機:交流ではなく直流の電源として使える発電機。
  • 誘導発電機:誘導電動機という種類の電動機を発電機として使ったもの。やや稀なタイプ。

原理的には交流の電源を作るには磁場を回転させてもよいし,

磁場を固定して回路の一部であるコイルのほうを回してもよいのですが、火力発電に使われるような大型の同期発電機では磁場を発生させる電磁石(以下、「磁極」と呼びます)のほうをタービンの軸に接続して回転させます。

発電所の発電機で誘起する電圧は多くの場合には高圧以上の電圧です。
(規格では3300[V], 6600[V]や、それを超えるものなど)
しかも発電所の発電機では、送電の都合上の理由等から位相(正弦波の角度)が異なる3つの交流起電力を発生させる事が多いです。その方式の電線路は三相三線式と呼ばれます。
そしてそのようなものを高速で回すような事はできればしたくないといった事情や、電磁石側のほうが機械的に丈夫に作りやすいといった理由により、容量の大きい同期発電機では多くの場合に電磁石のほうを回転させます。電磁石を作るほうの電源は一般的に低圧です。
電磁誘導の法則を使って発電機という「機械」を作って運用するとなると、電気と磁気に関する事が特に重要ではありますがその他の力学的・機械的な事も多く関わってきます。例えば電磁石を回転させるタイプのものでは、遠心力を抑えるために直径はなるべく小さく抑えて長い円筒形の形状にするといった事です。
また、発電を行っていると「損失としての熱」も多く発生するので冷却という事も考慮に入れる必要が出てきます。

この場合、誘電起電力を発生させるコイルは回転する磁極を囲むようにして固定されます。
磁極は通常の磁石のようにNとSに相当する部分が対になりますが、この対を複数設置して同時回転させる事もできます。火力発電では2極(つまりNとSの1対だけ)の事が多く、小規模の水力発電などでは多くの極(例えば多いものでは48極)などが使われる傾向があります。

発生する起電力の計算に使うのは、
電磁誘導の法則において「磁束の時間変化」を直接使うパターンです。

磁極を回転させる時にはコイル面に対する磁場の垂直成分が理想的には時間を変数として正弦関数と嬉しいのですが、実はコイルの配置などを工夫しないと歪んだ台形のような波形になってしまいます。(周期関数を正弦波の和で表す考え方だと「高調波」成分が多くなる事を意味します。)
ここではそのような工夫が既にされているとして、誘導起電力を発生させるコイルにおける磁場の波形が正弦波に近似できるものとします。また、磁束を考える面は長方形状のコイルの平らな面であるとして、その面積をSとします。

さてそのような時には考察は比較的簡単で、
コイルの面の面積要素ベクトルと磁場のなす角度が回転磁極の角速度ωと時間tの積ωtで表せる事になります。

今、磁場ベクトルの大きさが一定でBであるとします。
コイル面に対する垂直成分Bが正弦波で表されるとすると
=Bsin(ωt)で、ωt=π/2の時に最大値です。
(磁場とコイル面の面積要素ベクトルとのなす角θを使えばB=Bcosθであり、
位置関係としてはθ+ωt=π/2です。)

よってこの時のコイル1巻き分の磁束はΦ=SBsin(ωt)で、1巻きのコイルに対する誘電起電力は
Ve=-(dΦ/dt)=-ωSBcos(ωt)=ωSBsin(π/2-ωt)です。
自己インダクタンスを使った計算時のように合成関数の微分になります。

$$合成関数の微分である事に注意して、V_e=-\frac{d\Phi}{dt}=-\frac{d}{dt}\left\{SB\sin (\omega t)\right\}=-\omega SB\cos (\omega t)$$

速度ではなく周波数f[Hz] で考えるならω=2πfなのでVe=-2πfSBcos(ωt)です。
実効値で考えるのであれば最大値(つまり正弦または余弦が1の時)の絶対値を\(\sqrt{2}\)で割って
V =\(\sqrt{2}\pi\)fSB です。
(SもBも定数であるのでまとめて\(\phi\)=SBとおいてしまう事もあります。)

以上の結果はコイル1巻きに対してなので、n回巻かれていればn倍になります。
その他、導線の結線方法やコイルの巻き方に由来して所定の値や係数が乗じられます。
ただし発電機の誘電起電力は高ければ高いほど良いというものでも無いので、用途に応じて所定の電圧の電源になるように構造が決定されています。

  • 磁場の大きさの波形を正弦波に近付けるために1箇所にコイルの巻きを集中させない方式(分布巻、短節巻等)を使った場合は誘電起電力が理論値より少し減るので巻線係数kを乗じます。
    kは基本的におおよそ0.87~1未満の値です。
    さらに細かく見るとこの巻線係数は別の2つの係数の積です。
  • 3つの正弦波の位相が互いに120°ずれた「三相三線」の線路として出力する場合は、
    2本の導線の「線間電圧」は1相で考えた場合の\(\sqrt{3}\)倍になります。
2極の同期発電機の誘導起電力(実効値)

2極の同期発電機において周波数がf、1つのコイルの巻き数がn、巻き線係数がkであり
コイル面を通過する磁束の最大値\(\phi\)=BSが一定値である時には、
1相ごとの誘導起電力の実効値は次のように表されます。 $$V_e=\sqrt{2}\pi knf\phi\hspace{3pt}≒\hspace{3pt}4.44knf\phi$$ 比例定数の一部を「4.44」という数字でも書いたのはちょっとしたオマケで、
「たまたまそのように特徴的で覚えやすい値である」という意味です。
この式の導出方法は他にもありますが、
ここでは電磁誘導の法則に即して一番簡単と思われる方法での導出を説明しました。

同期発電機にもいくつかタイプがあり、また製造元によっても作りが変わってきたりもします。この図は一例の簡単な説明図です。

使われ方2:変圧器における電磁誘導

変圧器は変電所に設置されている装置であり、電柱の上にも設置されています。
2つの電気回路を接続し、それぞれの接続部分にコイルがあります。電柱に張り巡らされた電線の2線間の電圧は高圧の6600[V] であり、それを家庭で使う100Vに下げます(降圧)。逆に、発電所から鉄塔の送電線に向けては特別高圧の範囲の1万~50万[V] にまで電圧を上げます(昇圧)。

変圧器の原理は発電機と同じく電磁誘導であり、交流回路においてのみ機能します。理論的には前述の逆起電力の考え方が重要な部分の1つでもありますが、変圧に関する結果の式は非常に簡単で2つのコイルの電圧の比は「コイルの巻き数の比に等しい」というものです。

変圧器による変圧について成立する式

変圧器で接続された2つの電気回路のうち電源側のほうの量である事を指して「1次」と言い、もう片方の回路の量である事を指して「2次」と呼ぶ事があります。
今、変圧器の1次側のコイルの巻き数がNで2次側のコイルの巻き数がMである時、1次側のコイルの端子間電圧と2次側の端子間電圧の実効値は次式で表されます。 $$\frac{E_2}{E_1}=\frac{M}{N}$$ これはつまり、例えば電圧を2倍にしたいなら2次側のコイルの巻き数を1次側の巻き数の2倍にすればよいし、逆に降圧を行うのであれば2次側よりも1次側の巻き数を多くすれば良い事になります。

コイルに巻かれた隣り合う導線や導線と鉄心の間は絶縁物による電気的な絶縁を行います。

結果の式は簡単ですが、導出する時には実は少し注意が必要な点もいくつかあります。
以下、導出の概略について説明します。

1次側のコイルによる電誘誘導によって2次側の回路に誘導起電力が生じるわけですが、この時に実は2次側のコイルによる磁束の変化が1次側に逆に影響を及ぼします。
ただし1次側に変化があるのは実は電圧ではなく電流のほうで、2次側からの電磁誘導に由来する電流が逆起電力を発生させて結果的に1次側の電圧の変化を打ち消す仕組みになっています。

そのため、変圧器で2つの回路を接続した時には1次側には2種類の電流があると考えます。「励磁電流」はであり、「1次負荷電流」は2次側のコイルからの電磁誘導に由来する電流です。しかし大きさ的には一般的に後者のほうが大きくなります。

  • 「励磁電流」:2次側の回路に誘導起電力を発生させる電流。大きさ的には小さい。
  • 「1次負荷電流」:2次側のコイルからの電磁誘導に由来する電流。
    ただし逆起電力によって、結果的に1次側のコイルの端子間電圧に基本的に影響を与えない。

1次側の励磁電流によって、1次側のコイルには巻き数Nに比例する磁場が発生します。
そこで、この励磁電流による磁束は励磁電流の大きさと1次コイルの巻き数に比例するとして
Φ=kNI とおけます。

ビオ・サバールの法則を使ってコイルで発生する磁場が「巻き数と電流に比例する事」を比較的簡単に(と言っても割と面倒ですが)導出できるのは、円筒に導線を均一に巻いた模式的なソレノイドにおいてです。
他方で、実際の変圧器の多くは断面が四角形です。
しかし近似的にはソレノイドのように考える事ができます。

ここで、自己インダクタンスLの定義は
「電流が発生させた磁束について」Φ=LIとなるような定数の事でしたが、
電流がコイルの1つ1つの輪に作用して逆起電力を発生させている事を考えると
実はこの場合の磁束は「ΦのN個分の合計」として考える必要があります。
そのために1次コイルのに対して励磁電流が発生させた磁束の合計は Φ=kNI であり、
自己インダクタンスはL=kNとなるのです。

この時に回路の抵抗成分は小さいとすると、逆起電力Vの大きさは電源電圧とほぼ同じになります。(向きは互いに逆です。)
電源の起電力をVsin(ωt)とすると、
Vsin(ωt)=-L(dI/dt)により(あるいはリアクタンスLωを使って)
励磁電流は I=-{Vcos(ωt)}/(Lω)=-V{cos(ωt)}/(kNω)です。
つまり、少し妙な感じもするかもしれませんが
「励磁電流の大きさは1次コイルの巻き数の2乗に反比例する」というわけです。
【逆起電力は、ここでは大きさが電源の起電力に等しく向きが逆でV=-Vsin(ωt)です。】

変圧器回路の一次側の励磁電流の特徴

励磁電流の大きさは変圧器回路の1次コイルの巻き数の2乗に反比例します。

  • 1次コイルの自己インダクタンスを計算するとN(巻き数の2乗)に比例する。
  • 抵抗分が少ないとしてキルヒホッフの法則(ここではオームの法則でも同じ)から励磁電流を計算すると、励磁電流の大きさは1次コイルの自己インダクタンスに反比例する
  • よって、励磁電流の大きさはNに反比例する事になります。

ここで改めて1次コイルが近似的にソレノイド同様の磁場を作ると考えると、先ほどと同じように考えてΦ=kNI=-V{cos(ωt)}/(Nω)の磁束が発生しますが今度はこれは1次コイルではなく2次コイルのほうに作用している状況を考えます。

2次コイルでの誘電起電力Vは電磁誘導の法則により -(dΦ/dt)を計算する式で考えます。
1巻きではNに反比例し、2次コイルでM巻きの導線の輪があるのでM倍します。

つまり、Φ=-V{cos(ωt)}/(Nω)をtで微分して符号を変えてからM倍する事によって、
V=-M(dΦ/dt)=-VM{sin(ωt)}/Nです。
(結果的にωは式から無くなります。)

よって、V≒-VのもとでV/V={-VM{sin(ωt)}/N}/{-V{sin(ωt)}=M/Nとなります。
(実効値をEおよびEとして、E/Eで考えたとしても同じようにE/E=M/Nとなります。)
以上の事は、交流回路における複素数法(交流の電流と電圧は複素数として直流回路同様に計算しても正しい結果を得る)を使うと少しだけ計算は見やすくなります。

ところで磁気的に接続されていても、電気的には接続されていない2つの回路間の電流や電圧についてプラスマイナスの符号での「向き」を比べる意味があるのかという話にもなりますが、これは正弦波の位相で考えると比較的分かりやすいかもしれません。
マイナス符号が付いているという事は正弦波では
「位相が180°(弧度法でπ)ずれている波形」としても表せます。
そのため、交流回路においては電気的には直接接続されていない2つの回路間でも位相の観点からはプラスマイナスの符号の関係も意味を持ち得る事になります。ある時刻で1次側の何らかの量の位相がθの時に、2次側のある量の位相はθ-πで表されるといった事が分かるからです。
1次側・2次側単独で見た場合はプラスマイナスの符号は通常通りの「向き」として見れます。

逆三角関数

逆三角関数とは「三角関数の逆関数」で、正弦、余弦、正接のそれぞれに対して存在し、
それぞれ「逆正弦関数」「逆余弦関数」「逆正接関数」と呼んで Arcsinx,Arccosx,Arctanx
もしくは sin-1x,cos-1x,tan-1x のように書きます。
あるいは arcsinx,arccosxのように書く事もできますが、
それらは記述法によっては Arcsinx等と区別して意味を持たせる事もあります。

逆三角関数が使われる事が比較的多いのは微積分においてです。そのため、この記事の後半では微積分的な内容がやや多くなります。また、どちらかというと数学的な内容が中心になりますが逆三角関数のいくつかの使用例についても説明します。

※三角関数のベキ乗は、習慣的に(sinx)2=sin2xのように書かれます。
しかし、一般的にはsin-1xは逆正弦関数(=正弦関数の逆関数)であって、
1/(sinx)を意味しない事が多いです。
一般的に、三角関数の逆数に関しては1/(sinx)=(sinx)-1(=cosecx) と書き、
負のベキ乗(あるいは逆数のベキ乗)に関しては
{1/(sinx)}2=1/(sin2x)=(sinx)-2(=cosec2x)などのように書きます。
一般的に、f(x)の逆関数はf-1(x)と記します。
表記体系としては一応 sin-1xを1/sinxと勘違いしないようにはなっていますが、
当サイトでは基本的に逆三角関数は Arcsinxや Arccosxの表記を使用しています。

また、「余接(cot)」「正割(sec)」「余割(cosec)」などは三角関数の「逆数」です。
例えばsecθ=1/(cosθ)であって、それらは「逆三角関数」とは別物になります。
余接関数等にも逆関数を考える事はできますが、正弦・余弦・正接の逆三角関数と比べると使用頻度は低いと言えます。

種類と基本的性質

通常の正弦関数y=sinxに対してはxの値を決めればyが定まるわけですが、理論的にはyに対してxの値も計算できるというふうにも見れます。つまりx=f(y) のように考えるわけです。これが一般的な逆関数の考え方ですが、それを三角関数について考えたものが逆三角関数です。

逆三角関数(三角関数の逆関数)
  • y=sin xの時、x=Arcsiny(もしくはsin -1y)と書き、逆正弦関数と呼びます。
  • y=cosxの時、x=Arccosy(もしくはcos-1y)と書き、逆余弦関数と呼びます。
  • y=tanxの時、x=Arctany(もしくはtan-1y)と書き、逆正接関数と呼びます。

Arcsinxと書く場合は、「アークサインエックス」のようにも読む事があります。
同様にArccos, Arctan は「アークコーサイン」「アークタンジェント」と読みます。

例えばy=sinxに対して
x=π/2の時にはy=sin(π/2)=1であるので、π/2=Arcsin1のようになります。
同様に、例えばx=π/4の時にtanx=1なので π/4=Arctan1のようになります。
つまり「三角関数あるいは三角比のある値を与える角度は何か?」
という事を表したのが逆三角関数です。

逆三角関数は通常の三角関数と違って、微積分に関して以外の関係式は多くありません。
例えば加法定理のような関係式は基本的に考えないわけです。(ただし通常の三角関数の加法定理と組み合わせて計算をする事はあります。)
積分の時に一応覚えていると良いかもしれない関係式としては
Arcsinx+Arccosx=π/2があります。
ただしこれは後述するように
逆三角関数の値として「主値」を採用する場合において成立するものです。
すなわち、Arcsinxの値域を [-π/2,π/2]として
Arccosxの値域を [0,π]とした場合に成立する関係式です。

ですので具体的な意味としては実は難しくないのですが、
数学的には注意点は2つほどあります。

逆三角関数についての数学上の重要な注意点
  • 逆三角関数を単独の関数として扱う時は、他の関数と同じく「xを変数として
    y=Arcsinxのように書くのが普通です。(その時、siny=xです。)
    通常の三角関数y=sinxに対して逆正弦関数を考えるならx=Arcsinyとも書きます。
    ただし文字自体は変数をxとしてもyとしても、本質的にはどちらでも変わりません。
  • 三角関数は周期関数なので
    y=sinxなどにおいてyの値に対して複数の(無限個の)xの値があり得ます。
    例えばx=π/4の時にtanx=1となるのは「x=π/4もそうだがx=9π/4もそうである」といった話にもなるという事です。
    そのために逆三角関数を考える時には通常、1周期分だけを考えて
    特に0を含む値域(三角関数で言えば定義域)を単調関数になるように選んで使うのが普通です。逆三角関数がその範囲の値である事を指して主値と呼びます。

yとxの文字の使い分けの関係は混乱を生じやすいかもしれませんが、
何の文字を使っているかに関わらずに Arcsin 等の逆三角関数を使う時には
変数とその定義域は「通常の三角関数の値」であり、
逆三角関数の値とその値域は「角度」を考えています。

多くの場合、三角関数y=sinxなどを使っている中で逆三角関数を考える場合には
変数と関数を表す文字を区別するためにx=Arcsinyのように書いて、
微積分などで単独で逆三角関数を最初から使う時にはy=Arcsinxのように書いたりします。
(後述で少し触れますが同じく逆関数の関係にある指数関数と対数関数の関係と同じように捉えると分かりやすいかもしれません。)

文字としてはxでなくてもθなどを使っても同じです。

逆三角関数の「主値」について

逆三角関数の変数の定義域および値域としての「三角関数の1周期分」については無限個の区間からどこを切り取っても同じですが、普通は逆三角関数が単調増加または単調減少となるように考えます。
例えば sinx に対しては [-π/2,π/2]で考えれば十分とするわけです。(これは三角関数の定義域で、逆三角関数から見れば値域になります。)

また、普通は三角関数の1周期分を0を含む範囲で考えて、先ほども触れましたが逆三角関数の値がそこに含まれる事を指して主値と呼ぶ事があります。例えば sinx=0となるxは0,π、2π、・・・のように無限にあり得るわけですが、主値を使うなら Arcsin0=0です。
何のことわり書きも無ければ、普通は逆三角関数は主値で考えられています。

逆三角関数として「主値以外の一般の値」も含めている場合は 「arcsinx」のように書くと決めている表記法もあります。
ただし逆三角関数と言えば普通は主値を考えるので、どの表記法が正しい間違っているの問題ではありませんが、当サイトでは「断り書きがなければ逆三角関数は主値を考える」ものとして、表記方法は特別な意味をこめずArcsinxのように書くという事にします。

逆三角関数の値域の制限(主値で考えた時)
  • 逆正弦関数 Arcsinx の値域:[-π/2,π/2]
  • 逆正弦関数 Arccosxの値域:[0,π]
  • 逆正接関数 Arctanxの値域:[-π/2,π/2]

他方で、定義域では Arcsinx と Arccosx については [-1,1]であり。

Arctanxの定義域は (-∞,+∞)です。

3つの逆三角関数で共通して主値で値を考える場合には、
同じ三角関数の値x(これは変数ではなく関数値)に対するArcsinxとArccosxについて
sin(Arcsinx)=cos(Arccosx)=sin(π/2-Arccosx)であり、
Arcsinx=π/2-Arccosx ⇔ Arcsinx+Arccosx=π/2の関係式が成立します。
ここで主値におけるArccosxの値域は [0,π]、でArcsinxの値域が [-π/2,π/2]なので
範囲の整合性はとれているわけです。

主値で値域を考える時に成立する式

主値で考える時には次式が成立します。$$\mathrm{Arcsin}x+\mathrm{Arccos}x=\frac{\pi}{2}$$

初等関数としての逆三角関数の位置付け

逆三角関数は、分類としては実は初等関数に含まれます。
少し妙に思えるかもしれませんが、一応それには理由があります。

初等関数とは、程度の低い関数という意味では無くて数学において基礎となっていて非常に多く使う種類の関数をまとめて呼ぶ総称です。そこに実は逆三角関数も含まれるわけです。(初等関数に対する語は「特殊関数」です。多くは積分や級数で表され、ベータ関数、ガンマ関数、ゼータ関数など多数あります。)

具体的には、次の関数およびその四則演算(平方根なども含む)と逆関数、合成関数を指します。

  • 単項式xa(aは実数)
  • 三角関数 sinxなど
  • 指数関数 eなど

さてここで「対数関数」lnx=logexを敢えて入れませんでしたが、対数関数も初等関数の1つです。ただし、対数関数は指数関数の逆関数です。(指数関数が対数関数の逆関数であると言っても正しい。)そのため、同じ初等関数の中でそれら2つは対になっているわけです。
【双曲線関数 sinhxなども初等関数の1つですが、指数関数によって定義されます。】

また、単項式についてもxaとx1/aが互いに逆関数の関係になっています。
例えばx≧0におけるy=xの逆関数はy=x1/2=\(\sqrt{x}\) です。

「逆数」と「逆関数」の違いに注意すると、逆三角関数での話との関連が見えるでしょうか。
y=xの逆数はy=1/x=x-1ですが、逆関数は全く同じ形のy=xです。y=xの逆関数はx≧0の範囲でy=x1/2になりますが、それに対してy=x-2=1/(x)です。
また逆三角関数の値域の話と同様に、
何の条件もなくy=xに対してxについて解くとx=\(\pm\sqrt{y}\) であり、解が2つがあり得るわけですがx≧0のような制限があるとプラスの値だけに決まります。

そこで「じゃあ三角関数の逆関数ってどういうものか?」というところにつながるわけです。

指数関数にも単項式にも逆関数を考える事ができて、それではつまり、初等関数という枠組みで見ると三角関数だけ逆関数を敢えて考えない数学的な理由は無くて、むしろ考えておいたほうが整合性が色々ととれる事になります。

ただし、指数関数と対数関数の関係のように逆三角関数にも単独で積極的に活用できる性質があるのかというと、他の初等関数と比べるとそういう面は「やや弱い」と言えそうです。

確かに逆三角関数の性質として「角度が値として分かる」というのはあるのですが、そもそも角度というものが特別ないくつかの値以外は把握も測定もしづらいところがあるから三角比や三角関数を考えているのでもあります。

しかし次に見るように、微分と積分について考えると少なくとも数学上の活用方法は出てきます。

逆三角関数の微分の公式

値域を主値で考えた時の逆三角関数の微分公式を挙げておきます。(ただし、微分そのものが積極的に使われるというよりは、むしろその逆演算である積分のほうでの使い道がやや多いです。)

Arcsinxの微分などと聞くといかにも面倒くさそうですが、実は三角関数の微分に対して逆関数の微分公式を適用するとすぐに導出できるのです。xやyの変数の扱いにだけ注意すれば意外と難しくないのではないかと思います。

通常の三角関数の微分によって得られる導関数はそれぞれ次のようになります。

  • (d/dx)sinx =cosx
  • (d/dx)cosx=-sinx
  • (d/dx)tanx =1+tanx=1/(cosx)

これらに対して逆関数の微分公式を使うと、変数の表記方法に注意して3つの逆三角関数の微分公式を導出する事ができます。

逆三角関数の微分公式

逆三角関数の値を主値で考えた時、微分による導関数は次のようになります。
■逆正弦関数 Arcsinx の導関数
$$\frac{d}{dx}\mathrm{Arcsin}x=\frac{1}{\sqrt{1-x^2}}$$ ■逆余弦関数 Arccosx の導関数
$$\frac{d}{dx}\mathrm{Arccos}x=-\frac{1}{\sqrt{1-x^2}}$$ ■逆正接関数 Arctanx の導関数
$$\frac{d}{dx}\mathrm{Arctan}x=\frac{1}{1+x^2}$$ ArcsinxとArccosxに関してはx≠-1かつx≠1のもとで考えます。

Arcsinx と Arccosx については定義域は [-1,1]ですが
微分を考える時はx=±1を除いて (-1,1)の範囲だけで考えます。
その範囲内では平方根の中身は必ずプラスの値になります。
また、よく見ると導関数が定義できる範囲でArcsinx と Arctanx の導関数は常にプラスの値で
Arccosx の導関数は逆に常にマイナスの値です。
実際 Arcsinx と Arctanxは主値を考える時の値域[-π/2,π/2]で単調増加関数であり、
逆に Arccosx は主値を考える時の値域[0,π]において単調減少関数です。

これらの公式は比較的簡単な計算により導出できます。
Arcsinx と Arccosxの導関数が符号だけの違いである理由も導出の過程を見ると分かるでしょう。
計算の注意点としては例えば逆正弦関数ではy=Arcsinxとした時、siny=xであるので逆関数の微分公式にもそれを当てはめる必要があるといった事です。

$$\frac{d}{dx}\mathrm{Arcsin}x=\frac{1}{\frac{d}{dy}\sin y}=\frac{1}{\cos y}=\frac{1}{\sqrt{1-\sin ^2y}}=\frac{1}{\sqrt{1-x^2}}$$

$$\frac{d}{dx}\mathrm{Arccos}x=\frac{1}{\frac{d}{dy}\cos y}=-\frac{1}{\sin y}=\frac{1}{\sqrt{1-\cos ^2y}}=\frac{1}{\sqrt{1-x^2}}$$

$$\frac{d}{dx}\mathrm{Arctan}x=\frac{1}{\frac{d}{dy}\tan y}=\frac{1}{1+\tan^2y}=\frac{1}{1+x^2}$$

ArcsinxとArccosxの微分の途中の計算では sinx+cosx=1の関係を使っています。
Arctanxの微分においては、途中計算では微分の公式以外には特に何も使わずに
y=Arctanx から tany=xであるという関係だけを使っています。

この導出の過程でArcsinxの導関数については cosy=\(+\sqrt{1-\sin^2y}\)のように考えています。(マイナスではなくプラスの値としています。)これはArcsinxを主値で考えており、
値域(三角関数から見れば定義域)を [-π/2,π/2]として考えているためです。
その範囲ではcosy≧0となります。(ただしここではxosy=0となる端点を除いています。)
他方でArccosxについては値域を [0,π]として考えているのでその範囲ではsiny≧0です。
(先ほどと同じく実質はsiny>0で考えます。)
ゆえにsiny=\(+\sqrt{1-\cos^2y}\)としています。

逆関数の微分公式

逆三角関数に限らず、逆関数一般について次の関係式が成立します。 $$\frac{dy}{dx}=\frac{1}{\Large{\frac{dx}{dy}}}$$ この式を実際の計算で使う時にはyとxの関係について注意が必要です。
y=Arcsinxの時にはx=sinyですから、yをxで微分した時に逆関数の微分公式での分母は「x=sinyをyで微分した導関数」つまり cosyが入ります。

逆三角関数の積分の公式

さて、微分が分かれば積分のほうも分かる事になりますが、逆三角関数の導関数は意外にも「式としては三角関数が全然関係ない」という形になっています。ですので図形問題や三角関数を考えているわけではなくても積分に使える場合があるのです。

原始関数が逆三角関数で表される不定積分

平方根の中身が0より大きくなる定義域において、次の積分公式が成立します。 $$\int \frac{1}{\sqrt{1-x^2}}dx=\mathrm{Arcsin}x+C$$ $$\int -\frac{1}{\sqrt{1-x^2}}dx=\mathrm{Arccos}x+C$$ $$\int \frac{1}{1+x^2}dx=\mathrm{Arctan}x+C$$ $$\int \sqrt{a^2-x^2}dx=\frac{1}{2}\left(x\sqrt{a^2-x^2}+a^2\mathrm{Arcsin}\frac{x}{a}\right)+C$$ Cは任意の実数定数です。
4番目の式については部分積分の公式を使って導出するもので、実用性は別問題として
「逆三角関数を使って原始関数を表せる」という例です。(置換積分でも計算は可能。)

このような形の関数の積分を考える時には置換積分や部分積分を考える必要はなくて、そのまま逆三角関数を当てはめる事ができます。

これらの積分の式について原始関数が Arcsinxと Arccosxになる2式を特に見比べると、
被積分関数が符号だけの違いとなっています。
ここで「符号が違うだけで積分の結果が変わるものか?」と妙に思えるかもしれませんが、
Arcsinx=-Arccosx+π/2の関係があるので、Arcsinxと Arccosxは互いに変換が可能です。
不定積分においてはπ/2は任意定数に含める事ができるので、Arcsinxのほうの不定積分の式の両辺に-1を乗じた場合には式としてはArccosxのほうの不定積分の式に変える事はできます。

例1:逆正接関数のマクローリン展開と角度計算

逆三角関数はある三角関数の値から角度を逆算できる関数ではありますが、関数としての実態が分からないと結局特別な値以外は簡単には計算できない事になってしまいます。

「それでも別に支障ない」と言ってしまえばそれまでですが一応、マクローリン展開(x=0におけるテイラー展開)を使えば逆三角関数の近似値をxから直接計算する事は可能です。

ただし、計算しやすい形になっているのは逆正接関数Arctanxのマクローリン展開ですので、
それについて説明をします。

展開式(無限級数展開)の内容

Arctanxのマクローリン展開は、意外かもしれませんが正弦関数や余弦関数のマクローリン展開に形は似ていて、式自体はそれほど複雑ではありません。

逆正接関数Arctanxのマクローリン展開

逆正接関数Arctanxはマクローリン展開可能(x=0でテイラー展開可能)であり、
|x|<1において次式で表す事ができます。 $$\mathrm{Arctan}x=x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\frac{x^9}{9}-\frac{x^{11}}{11}+\cdots$$ (x=1においても一応この式は収束します。)

この式で、てきとうにx=1/5などどしてみると、
Arctanx=1/5-1/(5・3)+1/(5・5)-・・・
4項目以降はほぼ0であると考えると、
Arctanx=1/5-1/375+1/15625-・・・≒0.1974≒0.0628π
これは度数法で言うとおおよそですが180×0.06358≒11.3°です。

このような数値の計算は、計算ソフトや関数電卓で直接的に計算できるならそれを使えばよいという話でもあるのですが、一応このように計算もできるという事です。(また、ソフト等を使うにしても逆三角関数によって「角度」を計算できる事は理系の人であれば一応知っておいてもよいのではないかと思います。)参考までにおおよその値の例をいくつか挙げておきます。

tanxArctanx(=弧度法での角度)\(a\pi\)の形で表す時度数法での角度 [ °]
0.990.7800.248\(\pi\)44.71
0.90.7330.233\(\pi\)41.99
0.80.6740.215\(\pi\)38.66
0.70.6110.194\(\pi\)34.99
0.50.4640.148\(\pi\)26.57
0.30.2910.093\(\pi\)16.70
0.10.09970.032\(\pi\)5.711

尚、tan(π/4)=1ですので Arctan1=π/4≒0.786[rad]で、度数法では45°です。

また、0に近い角度であればArctanx≒xとも言えます。
ただし同じくマクローリン展開からsinx≒xも同様に分かるので、0に近い角度であれば通常の正弦関数で考えたほうがむしろ早い事にはなります。

参考までに、Arcsinxのマクローリン展開は |x|<1の範囲で次式のようになります。
これはArcsinxの導関数を2項定理によって展開する事で得られますが、Arctanxと比較して結構面倒な形だと言えそうです。$$\mathrm{Arcsin}x=x+\sum_{n=1}^{\infty}\left(\frac{1\cdot3\cdot5\cdots(2n-1)}{2\cdot4\cdot8\cdots(2n)}\frac{\large{x^{2n+1}}}{2n+1}\right)$$

Arctanxのマクローリン展開の導出

この式は、前述の微分公式を使って普通にマクローリン展開を考えて導出しようとすると、実は結構大変です。というのも、1階と2階の微分はよいとしても、3階、4階・・・と高階微分を計算していくと形が複雑になるためです。

しかし実は、1階の微分後に幾何級数展開(等比級数による展開)する事でArctanxのマクローリン展開は導出できるのです。また、それによって各高階導関数のx=0における微分係数も判明する事になります。(これは、そのように考えてよいという定理があります。)

まず(d/dx)Arctanx=1/(1+x)であるわけですが、
|x|<1であればこれは幾何級数が収束する値として考える事ができて、
具体的には次のようになります。
1-x+x-x+・・・=1+(-x)+(-x)+(-x)+(-x)+・・・
これは、「公比が-xである等比級数」「公比が-xである等比数列の項数を無限大にした極限」と言っても同じです。

よって、|x|<1の範囲では(d/dx)Arctanx=1-x+x-x+・・・

そこで、この関数については項別積分が可能なので(※無限級数に対して項別積分が可能であるのは「収束円の内部においてだけ」という条件が必要なので注意)、|x|<1のもとで各項を積分すると次のようになります。積分変数をtとして、0からxまでの定積分という形にします。

$$\int_0^x\left(\frac{d}{dt}\mathrm{Arctan}t\right)dt=\int_0^x\left(1-t^2+t^4-t^6+\cdots\right)dt$$

$$\mathrm{Arctan}0=0に注意すると\int_0^x\left(\frac{d}{dt}\mathrm{Arctan}t\right)dt=\mathrm{Arctan}xであるので$$

$$\mathrm{Arctan}x=x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\cdots$$

このようにして得られた級数は、実はマクローリン展開に等しくなります。
(無条件にではなく、ここでの場合はそうなります。)

無限級数に対して項別積分が可能であるかの数学的な問題を避けたい場合には、有限の和に対して積分をする方法もここでは適用できます。
S=1+(-x)+(-x)+(-x)+(-x)+・・・+(-x) 
両辺に-xを乗じると次式です。
-xS=(-x)+(-x)+(-x)+(-x)+(-x)5+・・・+(-x)+(-x)n+1
両辺について1式目から2式目を引くと次式です。
(1+x)S=1-(-x)n+1
⇔S=1/(1+x)-(-x)n+1/(1+x)
【そのため、|x|<1であればn→∞でS→1/(1+x)】
ここで、敢えて極限を考えずに式を整理すると有限のnに対して
S+(-x)n+1/(1+x)=1/(1+x)です。
そしてSに対して元の式を代入すると、
1/(1+x)=1+(-x)+(-x)+(-x)+・・・+(-x)+(-x)n+1/(1+x)
これは有限の項の和ですので、項別積分は可能です。
そこで項別積分を実施すると、有限の範囲でのマクローリン公式(x=0におけるテイラー公式)を作れます。その後で、積分型の剰余項の収束について考える必要があります。(結果は剰余項はn→∞で0に収束します。)

例2:ライプニッツ級数の導出

ライプニッツ級数とは、数学的に成立するという事以上の意味はそれほど無いとも言われますが円周率を無限級数で表す式です。さらに、各項は簡単な有理数で表されているという「不思議な式」です。

ライプニッツ級数を導出する方法は複数ありますが、実は逆正接関数を使う方法がその1つです。

ライプニッツ級数

次の無限級数は収束し、値は円周率の1/4倍になります。
$$1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\frac{1}{11}+\cdots=\frac{\pi}{4}$$ これは「近似値」とは少し違うもので、「π/4を極限値として持つ」という意味において成立する「等式」になります。

ところで、この式に非常に似た形の式をこの記事内で先ほど考察していて、
それが逆正接関数 Arctanxのマクローリン展開です。実の所、Arctanxのマクローリン展開で
「x=1と置いたもの」はライプニッツ級数に他なりません。

それは偶然ではなく、きちんと証明できます。ただし Arctanxのマクローリン展開を幾何級数から導出する時には |x|<1の条件をつけていましたから、単純に「x=1を代入」するのは少し危ない操作であると言えます。もしかしたら、x=1では無限級数は無限大に発散するかもしれないからです。

しかし実際は、x→1とした時にもx-x/3+x/5-x/7+・・・は収束します。

ライプニッツ級数が収束する事自体は実は比較的簡単な考察により分かる事で、n項目までの和Sについて奇数番目と偶数番目を分けて考える事で証明できます。

S2n-1に対してS2nはマイナスの項が加わって少し減りますが、S2n+1でまた少し増えます。しかし項の絶対値自体は減り続けるため、S2n-1の値までは戻りません。
よってS2n-1>S2n+1です。
すなわち奇数番目までの和だけに着目すると{S2n-1}は単調減少数列となっています。
逆に遇数番目までの和S2nに着目すると{S2n}は単調増加数列となります。
さらに、プラスとマイナスが交互に現れるので必ずS2n-1>S2nでもある事から
任意の自然数nに対してS2n<S2n-1<S=1により{S2n}は上に有界であり、
S2n-1>S2n>S=2/3であり、{S2n-1}は下に有界です。
つまり両者ともに有界な単調数列なので{S2n-1}と{S2n}はそれぞれ収束し、
さらにS2n-S2n-1を考えてみると各項の絶対値は0に近づいて行くので
n→∞でS2n-S2n-1→0です。
つまりn→∞で{S2n-1}と{S2n}は同じ値に収束します。
すなわち、級数全体も収束する事になります。(ただし、極限値はまだ不明です。)
この事は実はライプニッツ級数に限らず、プラスマイナスが交互に現れる交代級数について「項の絶対値が単調減少でn→∞で0に収束する」という条件があれば級数も収束するという定理があります。(ライプニッツの定理と呼ばれる事があります。)

Arctanx自体はx=1以上でも全実数において値を持ちます。Arctan1=π/4です。
(π/4は度数法で言えば45°の角度です。)

そこで|a| <1に対してπ/4-(a-a/3+a/5-a/7+・・・)を考えます。
Arctan1=π/4であり、
|a| <1に対してはマクローリン展開により、
Arctan a=a-a/3+a/5-a/7+・・・です。
よって、π/4-(a-a/3+a/5-a/7+・・・)=Arctan1-Arctan a となります。

ここでa→1の極限を考えますが、
Arctanxは連続関数なのでa→1の極限ではArctan a→Arctan1です。
それは当然と言えば当然の関係ではあるのですが、
それによってマクローリン展開の式もArctan1に収束する事が分かります。
つまりはa→1で a-a/3+a/5-a/7+・・・→π/4となるわけです。

「Arctanxが連続関数である事」の部分を少し詳しく見ると次のようになります。
まずtanxが連続関数であり、「狭義単調増加(x<wに対してf(x)<f(w)となる)または狭義単調減少であればその逆関数もまた連続であり、x=1においても連続」となります。
今、f(x)=Arctanxとするとx=1で連続であるから
「1を含むある開区間Uがあって、任意の実数ε>0に対してUの区間の長さを十分小さくすれば、Uに含まれる任意の実数xに対して |f(1)-f(x)|<εとなるようにできる」
という事になります。
つまり先ほどの|a| <1であるaについて任意の実数ε>0に対して
|f(1)-f(x)|<εとなる「1を含む開区間U」に含まれているものを選べば、
任意の実数ε>0に対して|f(1)-f(a)|
=|Arctan1-Arctan a|= |π/4-(a-a/3+a/5-a/7+・・・)|< ε
よって、a→1の極限では
a-a/3+a/5-a/7+・・・→ π/4という事になります。

さてここで、「aを1に置き換えて1-1/3+1/5-1/7+・・・=π/4」としても大体合っているのですが、より正確にやるのであればここでは概略だけに留めますが次の定理を使います。おそらく聞き慣れないかもしれませんが、連続性定理とかアーベルの連続性定理などと呼ばれます。

連続性定理

$$(-\rho,\rho)で収束する\sum_{n=0}^{\infty}a_nx^nがある時$$ $$\sum_{n=0}^{\infty}a_n\rho^nも収束する\Rightarrow\lim_{x\to{\rho -0}}\sum_{n=0}^{\infty}a_nx^n=\sum_{n=0}^{\infty}a_n\rho^n$$ ρ( >0)は「収束半径」、開区間(-ρ,ρ)は「収束円」とも言います。
極限「x→ρ-0」は「左極限」(もしくは「左側極限」)を表し、
「ρよりも小さい値として近づく」という意味を持ちます。

この定理は一体何を言っているのかというと、ここでの話で具体的に言うと
まず|x|<1でマクローリン展開により
Arctanx=x-x/3+x/5-x/7+・・・となるのでこの級数は収束しています。
次にx=1の時に相当する式である1-1/3+1/5-1/7+・・・は
収束する事が個別の考察で分かっている状況です。しかし極限値は不明です。
そこで連続性定理によれば
1-1/3+1/5-1/7+・・・の極限値は
x-x/3+x/5-x/7+・・・
の左側極限x→1-0の極限値に等しいという事になります。
そして、x-x/3+x/5-x/7+・・・のx→1-0の時の極限値は
Arctanxの連続性によりArctan1=π/4という事が分かっているので、
1-1/3+1/5-1/7+・・・=π/4という結果を得るという流れです。 $$|x|<1 で\mathrm{Arctan}x=x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\cdotsであり、収束する。$$ $$x=1に相当する1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\frac{1}{11}+\cdotsは収束する事が示されている。$$ $$今、\mathrm{Arctan}xの連続性により\lim_{x\to{1-0}}\left(x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\cdots\right)=\mathrm{Arctan}1=\frac{\pi}{4}$$ $$連続性定理により1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\cdots=\lim_{x\to{1-0}}\left(x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\cdots\right)$$ $$=\mathrm{Arctan}1=\frac{\pi}{4}$$

ライプニッツ級数を導出する他の方法としては、4分円(円の1/4)の面積を積分で計算する方法があります。ただし通常のx軸方向の積分ではなく、y軸を利用した少し工夫が凝らされた計算になります。実はその場合でもArctanxのマクローリン展開を考えた時と同様に幾何級数展開による計算を行います。

例3:マチンの公式による円周率の表現

再び数学的な話ではありますが、円周率を表す式は実は1つではなくたくさんあります。ライプニッツ級数は「その1つ」であり、不思議な式ではありますが「収束の速さが遅い」事でも実は知られています。収束の速さが遅いという事は、直接計算してもなかなか「3.14・・・」が出てこない事を意味します。

他方で収束が速い円周率の公式も知られていて、その1つがマチンの公式という逆三角関数で表されるものです。ここでは通常の三角関数における正接の加法定理を使った証明方法を簡単に説明します。

マチンの公式

次の式で円周率を表せるという事が知られています。 $$4\mathrm{Arctan}\left(\frac{1}{5}\right)-\mathrm{Arctan}\left(\frac{1}{239}\right)=\frac{\pi}{4}$$ これもライプニッツ級数同様に「等式」として成立する関係式であり、
さらにこの式に関しては極限の計算などは特に必要としません。

ここではこの奇怪な式が「確かにπ/4に一致する」事の確認を優先する形で証明を述べます。

最初に結論を言うと、マチンの公式の左辺は正接関数に対する「角度」であり、その角度を持つ正接の値が1になる事で「角度=π/4」という事が言えます。

$$示すべき式:\tan\left(4\mathrm{Arctan}\left(\frac{1}{5}\right)-\mathrm{Arctan}\left(\frac{1}{239}\right)\right)=1$$

普通の角度で考えるなら tan(4θ+θ)=1となる事を証明する事になります。

加法定理を使うと、tan(4θ+θ)={tan(4θ)-tanθ}/[1+{tan(4θ)}(tanθ)}ここで、少し面倒ですが4θに対して倍角の公式(加法定理でも同じ)を2回使います。
tanθ=1/5とすると上手く行くのでその値を代入します。

$$\tan(2\theta_1)=\frac{2\tan\theta_1}{1-\tan^2\theta_1}=\frac{2}{5}\cdot\frac{25}{24}=\frac{5}{12}$$

再度、倍角の公式を使います。具体的な数値を入れます。

$$\tan(4\theta_1)=\frac{2\cdot\frac{5}{12}}{1-\left(\frac{5}{12}\right)}=\frac{5}{6}\cdot\frac{144}{119}=\frac{120}{119}$$

これを、最初のtan(4θ+θ)={tan(4θ)-tanθ}/[1+{tan(4θ)}(tanθ)}に代入します。
θの値は結論から言えば1/239ですが、ちょっとここでは「確かにその値にすればよい」という事を式を解く形で見てみる事にしましょう。
tanθ=Xとおきます。

$$\frac{\frac{120}{119}-X}{1+X\frac{120}{119}}=1\Leftrightarrow\frac{120}{119}-X=1+X\frac{120}{119}$$

$$\Leftrightarrow X\frac{239}{119}=\frac{1}{119}\Leftrightarrow X=\frac{1}{239}$$

これを見ると、「239」という謎の半端な数字が120+119である事が分かります。以上から、結論が完全に分かっている前提での証明でしたが確かにマチンの公式が成立している事が分かります。

$$\frac{\frac{120}{119}-\frac{1}{239}}{1+\frac{1}{239}\frac{120}{119}}=\frac{28680-119}{28441+120}=\frac{28561}{28561}=1$$

$$よって、\tan\left(4\mathrm{Arctan}\left(\frac{1}{5}\right)-\mathrm{Arctan}\left(\frac{1}{239}\right)\right)=1なので$$

$$4\mathrm{Arctan}\left(\frac{1}{5}\right)-\mathrm{Arctan}\left(\frac{1}{239}\right)=\frac{\pi}{4}$$

Arctanxのマクローリン展開からマチンの公式の左辺を計算すると、
おおよそ4×0.1974-1/239≒0.785≒π/4となり、確かに公式の内容が成立している事を見れます。【Arctan(1/239)≒1/239としました。】
しかし上式を見れば分かるようにマチンの公式自体は近似式ではなく「等式」であり、しかも極限を含んでいない事が特徴です。

実は円周率を表す式としては「マチン型」というタイプのものが複数あって、比較的有名なものだとオイラーによるものとガウスによるものがあります。いずれもπ/4を逆正接関数の具体的な値の和や差で表す公式です。

例4:有理関数の積分に関する定理

これもまた数学の理論的な話ではありますが、間接的には応用にも関わる問題として
有理関数(多項式の分数で表される関数)の一般的な積分は原始関数としてどのように表せるか」
というものがあります。

実はそれは初等関数のみで表す事ができ、しかも有理関数、対数関数、逆正接関数とそれらの合成関数さえあれば(理論上は)足りる」という結果を述べる定理があります。
意外かもしれませんが「逆正接関数Arctanx」が必要な関数として入っているわけです。

有理関数の積分

2つの多項式P(x)とQ(x)がある時、P(x)/Q(x)で表される有理関数の不定積分は理論上、次の関数によって表す事ができます。

  • (別の)有理関数V(x)/W(x)
  • 対数関数(底は e)
  • 逆正接関数 Arctanx
  • これら3つの合成関数
また、置換積分を行う事で三角関数で構成される有理関数も。S(t)/T(t)の形の積分にできるので有限回の操作で原始関数を見つける事が理論上は可能です。

ここで「理論上」という語を付したのは「数学的に可能であるという事」と「それが便利であるか・使いやすいか」という事は別の問題である事も多いからです。

しかし理論上の話ではあっても、「原始関数を探す形で積分はどこまで計算できるのか?」という疑問に対して「三角関数の使用も含めて有理関数の範囲では、原始関数は初等関数の組み合わせで必ず導出する事が一応可能である」という一定の答えを述べている定理でもあります。

有理関数とは

有理関数とは例えば次のようなものです。 $$\frac{P(x)}{Q(x)}=\frac{p_0+p_1x+p_2x^2+p_3x^3}{q_0+q_1x+q_2x^2+q_3x^3+q_4x^4}$$ $$具体例:\hspace{5pt}\frac{P(x)}{Q(x)}=\frac{2-x+3x^2+x^3}{1+x+2x^3-x^4}$$ 三角関数の有理関数の例 $$\frac{1-\tan^2x}{1+\tan^2 x}$$

定理の証明の概略を記すと、まず分子の次数のほうが分母よりも大きい場合には多項式の割り算をして、分母の次数のほうが大きい状態にします。

次に分母の多項式を因数分解して、そこから部分分数展開をする事を考えます。

「因数分解と言うができないような多項式だったらどうするのか」と思われるかもしれませんが、実は任意の多項式は何かしらの複素数(実数を含めて)を用いて理論上は因数分解できる事が知られています。それはいわゆる代数学の基本定理による帰結です。

計算をすると、任意の多項式は次の3つの項に分類して分ける事ができます。

  • 分母が定数である(1を含めて)多項式
  • 分母が1次式のベキ乗で分子は定数である項
  • 分母が2次式のベキ乗で分子は1次式である項

因数分解をした時に実数以外の複素数が含まれている場合には共役を上手く使って虚数単位が式に現れないように工夫します。分母が2次式のベキ乗の項にはその意味があります。

さてその段階に至ると原始関数を探す形で積分ができます。この時に、使用する初等関数の種類は理論上3つであるという事が言えるのです。

  • 単項式と多項式および有理関数:
    分母に分母に定数以外が含まれない多項式および1/{(x-a)}【n≧2】、
    分母が2次の項に由来するx/{(x+1)}【n≧2】
  • 対数関数:1/(x-a)および分母が2次の項に由来するx/(1+x)の項
  • 逆正接関数:2次の項に由来する1/(1+x)の項

こうして見ると積分をする時に問題が生じるのが「分母の式」であって、1/(1+x)の項を処理する時にどうしても必要なのが逆正接関数という事になります。
その項の不定積分は前述のように Arctanx+Cです。