行列の基礎知識② 【行列の種類】

このページでは、高校数学程度の行列の知識のうち、特定の種類の行列の呼び名について説明します。

数学で言う行列の定義と行列の演算(足し算、引き算、掛け算)については別途にまとめています。

行列は、行と列の数がそろっているものに限りませんが、多くの行列の用語は行と列の数が等しい正方行列に対してのものが多いです。そのため、このページで扱う行列の多くは正方行列になります。

$$例:3次の正方行列\left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

★ 正方行列の行の数(=列の数)をnとする時、その正方行列をn次の正方行列と呼ぶ事があります。例えば3×3行列は、3次の正方行列です。

★ 行列の中の各数値等を成分と言い、m行n列目の箇所にある成分を(m,n)成分などと言ったりします。

単位行列・零行列・対角行列

ここでは、行列は正方行列とします。

まずは簡単なものから見ていきましょう。

単位行列 ■ 零行列(ゼロ行列) ■ 対角行列
参考:虚数単位の行列表現

単位行列

まず、これは簡単です。ある行列Aに掛け算をした時に、掛け算の結果がAそのものになる行列を単位行列と言います。通常の掛け算で言う1に相当します。

★ 多くの場合、単位行列はIかEで表します。

行列の掛け算を行えるとき、A×I=I×A=Aが成立します。

一応ちょっとした注意点として、「行列の掛け算の定義」を何かてきとうに考えた時に、そのような「単位行列」の存在は必ずしも自明とは言えません。そのような行列が存在する事を示しておく必要があります。

もっとも、そのような単位行列は確かに存在し、次のようなものです。

$$例:3次の単位行列 I=\left(\begin{array}{ccc}
1 & 0 & 0\\
0 & 1 & 0 \\ 0 & 0 & 1\end{array}\right) $$

このように、正方行列の「対角線」に相当するところ(これを対角成分と言います)が全て1であり、残りの成分は全て0である行列が単位行列です。何次の正方行列であっても、単位行列は「対角成分が全て1で、残りの成分は全て0」である行列として表せます。

簡単な計算例を見てみましょう。

$$\left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) \left(\begin{array}{ccc}
1 & 0 & 0\\
0 & 1 & 0 \\ 0 & 0 & 1\end{array}\right) $$

$$= \left(\begin{array}{ccc}
a_{11} \cdot 1+ a_{12} \cdot 0 + a_{13} \cdot 0& a_{11} \cdot 0+ a_{12} \cdot 1 + a_{13} \cdot 0 & a_{11} \cdot 0+ a_{12} \cdot 0 + a_{13} \cdot 1 \\
a_{21} \cdot 1+ a_{22} \cdot 0 + a_{23} \cdot 0 & a_{21} \cdot 0+ a_{22} \cdot 1 + a_{23} \cdot 0 & a_{21} \cdot 0+ a_{22} \cdot 0 + a_{23} \cdot 1 \\ a_{31} \cdot 1+ a_{32} \cdot 0 + a_{33} \cdot 0 & a_{31} \cdot 0+ a_{32} \cdot 1 + a_{33} \cdot 0 & a_{31} \cdot 0+ a_{32} \cdot 0 + a_{33} \cdot 1 \end{array}\right) $$

$$= \left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

掛け算の順番を入れ替えてI×Aを計算しても同様の結果になります。

一般の行列の掛け算では、A×Bは、ものによってB×Aに等しくなる事もあるし、等しくない事もあります。

零行列(ゼロ行列)

零行列とは、行列の全ての要素が0である行列です。これは正方行列でなくてもそのような行列は当然あり得ますが、通常は正方行列を考えます。

★ 零行列の記号は、O(アルファベットの「オー」)で表す事が多いです。

例えば3次の零行列は、次の通りです。

$$例:3次の零行列 O=\left(\begin{array}{ccc}
0 & 0 & 0\\
0 & 0 & 0 \\ 0 & 0 & 0\end{array}\right) $$

零行列については、行列の演算の方法さえ知っていればすぐに分かるかとは思いますが、
A+O=A、A-O=A、A×O=O×A=Oが成立します。

少し気を付ける必要があるのは、行列の場合は仮に2つの行列の掛け算の結果が零行列だったとしても、もとの行列のいずれも零行列だとは限らないという事です。

零行列に関して注意が必要な事

$$AB=O\hspace{5pt}であったとしても、\hspace{5pt}A\neq O\hspace{2pt}かつ\hspace{2pt}B\neq O\hspace{5pt}の場合がある$$

簡単な例として2次の正方行列で、零行列でない2つの行列の掛け算が零行列になる場合を挙げておきます。

$$ \left(\begin{array}{cc}
1& 0 \\
0& 0 \end{array}\right) \left(\begin{array}{cc}
0& 0 \\
0 & 1 \end{array}\right)= \left(\begin{array}{cc}
1\cdot 0+0 \cdot 0& 1 \cdot 0+0 \cdot 1 \\
0 \cdot 0+0 \cdot 0 & 0 \cdot 0+0 \cdot 1 \end{array}\right)=O $$

通常の実数などであれば、ab = 0 ⇒ a = 0 または b = 0 が成立します。
行列の場合にはこの関係が成立しないという事です。

対角行列

単位行列のように対角成分以外の成分は全て0で、対角成分に何らかの数(全て1とか全て0の場合を除く)があるものを対角行列と言います。

これは、具体的には様々なものがあり、総称として対角行列と呼びます。

$$3次の対角行列の例: \left(\begin{array}{ccc}
2 & 0 & 0\\
0 & -1 & 0 \\ 0 & 0 & 4\end{array}\right) $$

この形の行列は、もちろん通常の行列よりも計算が簡単になります。

参考:虚数単位の行列表現

それほど重要ではないので参考程度に述べますが、虚数単位 i に相当する行列も存在します。これを、虚数単位の行列表現と呼ぶ事があります。どういうものかというと、2乗すると単位行列の「-1」倍になる行列という意味です。

$$虚数単位の行列表現:A×A=A^2=-1 を満たすA$$

具体的にはどういうものかというと、2次の正方行列では次のようなものです。

$$A= \left(\begin{array}{cc}
0& 1 \\
-1 & 0 \end{array}\right) $$

試しに2乗を計算してみると、次のようになります。

$$ \left(\begin{array}{cc}
0& 1 \\
-1 & 0 \end{array}\right) \left(\begin{array}{cc}
0& 1 \\
-1 & 0 \end{array}\right) = \left(\begin{array}{cc}
0\cdot 0+ 1\cdot -1 & 0\cdot 1+ 1\cdot 0 \\
-1\cdot 0+ 0\cdot -1 & -1\cdot 1+ 0\cdot 0 \end{array}\right) = \left(\begin{array}{cc}
-1&0 \\
0 & -1 \end{array}\right) =- I $$

関連する事項としては「回転行列」というものがあります。2次の正方行列の要素に三角関数を上手に配置するとうまい具合に加法定理の形になり、「回転」を表せる事に関係します。複素数を極形式で表すと虚数単位 i は複素平面上で「90°回転」を表せるわけですが、その対応として上記の虚数単位に対応する2次の正方行列も回転行列としては90°回転を表すものです。

$$回転行列: \left(\begin{array}{cc}
\cos \theta&\sin \theta \\
-\sin \theta & \cos \theta \end{array}\right) $$

この回転行列で角度部分が90°の時を考えて2乗すれば加法定理によりうまい具合に180°になり、行列としては – I になります。

転置行列・対称行列

続いて、色々な種類の行列を見ていきましょう。

分かりにくい時には具体的な数値を入れてみた行列を考えるとよいと思います。

転置行列 ■ 対称行列 ■ 交代行列と直交行列 

転置行列

ある正方行列の(m,n)成分と、(n, m)成分を全て入れ替えた行列を転置行列(transposed matrix)と言います。ある行列と、その行列の対角成分は全て同じです。

★記号は、行列の左肩にtの文字を書いて表される事が多いです。

3次の場合の例を記すと、次のようになります。

$$A=\left (\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right),\hspace{10pt} ^tA = \left(\begin{array}{ccc}
a_{11} & a_{21} & a_{31}\\
a _{12} & a_{22} & a_{32} \\ a_{13} & a_{23} & a_{33}\end{array}\right) $$

$$B=\left(\begin{array}{ccc}
1 & 0& 3\\
2& 4 & -1\\ -2 & 0 & 1\end{array}\right) ,\hspace{10pt} ^tB = \left(\begin{array}{ccc}
1 & 2 & -2\\
0 & 4 & 0 \\ 3 & -1 & 1\end{array}\right) $$

この転置行列は行列の理論の中の計算上、よく出てくるので名称と記号を設定してあります。

転置行列に関して、少し間違えやすくてしかも重要な公式として、掛け算の形の行列の転置行列を考えた時に次の公式が成立します。

転置行列に関して成立する公式

$$^t(AB)=(^tB)(^tA)$$

ABはA×Bの事です。

行列の積の転置を考えるときには個々の行列の転置行列を掛け算すればよいという事ですが、掛け算する順番がひっくり返る事に注意が必要です。

対称行列

ある正方行列の(m,n)成分と(n, m)成分が同じである行列を対称行列と言います。

例えば次の形の行列です。

$$\left(\begin{array}{ccc}
a_{11} & a & b\\
a & a_{22} & c \\ b & c & a_{33}\end{array}\right)$$

この形の行列も対角行列などと同じく計算が簡単になるので、理論で好んで使われます。

対称行列は、転置行列がもとの行列に等しいものとしても表せます。

$$対称行列の別の表し方:^tA=A を満たす行列$$

交代行列と直交行列

交代行列とは、転置行列がもとの行列の-1倍になる行列です。この行列も、そのような性質を満たす色々な行列の総称ですが、対角成分は全て0になるという特徴があります。

$$交代行列の定義:^tA=-Aを満たす行列$$

同じく転置行列を使って定義される行列として、直交行列があります。これは、もとの行列と転置行列を掛け算すると単位行列になるというものです。これに関しては、掛け算の順序を入れ替えても同じく単位行列になるという条件がつきます。

$$直交行列の定義:(^tA)A=A(^tA)=Iを満たす行列$$

複素行列

行列の成分として複素数も許容するものを複素行列と言い、なおかつ正方行列の場合は複素正方行列などと呼ばれたりします。

これは、高校の範囲では問題として問われたとしても単なる計算問題なのでさほど重要でないと思いますが、物理の量子力学では行列と複素数の両方を考える都合上、このタイプの行列を一応理論上扱う事になります。そのため、物理を学ぶのであれば後々のために知っておいたほうがよいものです。

いくつか重要な用語としての行列の名称を挙げておきます。

複素共役行列 ■ 随伴行列 ■ エルミート行列・ユニタリ行列・正規行列 

複素共役行列

ある複素行列に対して、成分を全て共役複素数にしたものを複素共役行列と呼びます。

記号は、通常の複素数の共役と同様に、文字の上にバーを添えます。

$$A= \left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) \hspace{10pt}\overline{A}= \left(\begin{array}{ccc}
\overline {a_{11}} & \overline {a_{12}} & \overline {a_{13}}\\
\overline {a _{21}} & \overline {a_{22}} & \overline {a_{23}} \\ \overline {a_{31}} & \overline {a_{32}} & \overline {a_{33}}\end{array}\right) $$

手でノートに書くといちいち面倒ですが、意味は難しくないと思います。

随伴行列

複素正方行列に対して、共役と転置を両方考えたものを随伴行列と言います。これは、全て要素を共役にして、(m,n)成分を(n,m)成分と入れ替えるという事です。

随伴行列を表す記号は、行列の右肩にアスタリスク*を添えて表す事が多いです。

$$複素正方行列Aの随伴行列:A^*=^t(\overline{A})$$

エルミート行列・ユニタリ行列・正規行列

随伴行列を使って、いくつかの行列の名称が定義されます。

$$エルミート行列: A^*= Aを満たす行列$$

$$歪エルミート行列: A^*= -Aを満たす行列$$

$$ユニタリ行列: A \hspace{3pt}A ^* = A ^* \hspace{2pt} A= Iを満たす行列$$

$$正規行列: A \hspace{3pt}A ^* = A ^* \hspace{2pt} A を満たす行列$$

定義から、ユニタリ行列は全て正規行列です。
エルミート行列は、エルミット行列などと書かれる事もあり、日本語表記だと多少幅があります。

これらの行列の名称は、量子力学などで使う事があります。

逆行列と可逆行列

正方行列Aに掛け算すると単位行列になる行列を逆行列と言います。この逆行列は、必ず存在するわけではなく、存在しない場合もあります。この逆行列が存在する行列を可逆行列と言います。

記号は、行列を「-1乗」した形として表します。ただし、「割り算」とは言わいません。あくまで、行列の積の逆演算という意味合いです。

$$正方行列A の逆行列A^{-1}:AA^{-1}=A^{-1}A=Iをみたす$$

この他に、1つの正方行列に対して決まる数値(実数や複素数)で重要なものもあります。

例えば、次の3つは数学の理論上も、物理等への応用でも重要になります。

  • 行列式(デターミナント、determinant):行列式が0でなければ正方行列は可逆行列になる
    (※一般のn次の正方行列の行列式の定義は少し面倒)
  • 跡(トレース、trace):正方行列の対角成分を全て合計した値。行列を群としてみなした場合の理論で使ったりする。応用だと量子化学の理論で使う事もある。
  • 固有値:正方行列Aと、列の数が1だけの行列 x(列ベクトルと言います)を使って、Ax = cx を満たす値(実数、複素数)c が存在する時、この c を A の固有値と言う。量子力学でこのタイプの関係式を扱う事があります。

行列の基礎知識① 定義と演算

このページでは「行列」について、高校で教わる内容程度の基礎知識を記します。この知識自体は大学数学や物理等への応用でも使用します。

数学で言う「行列」とは?

行列(英:matrix)は、次のように数を並べたものであって、
後述する所定の計算規則を行う事ができるものを指します。

$$\left(\begin{array}{ccc} 3 & 1 & 4\\ 1 & 2 & 0\\ 5 & 0 & -1\end{array}\right) $$

この「行列」には横方向に3つ、縦方向に3つ数が並んでいるので、
「3×3行列」あるいは「(3,3)型行列」と呼ばれる種類の行列です。

上から何個目かを示す段を(row)と言い、
左から何個目かを示す段を(column)と言います。
上記の行列は、3つの「行」と3つの「列」がある行列です。

数学の行列の「行」と「列」
英語だと行列の「列」の事は column と言い、これは「柱」を連想させるので縦方向のほうの並びを表すものとして、覚えやすい用語になっているように思われます。

行と列が必ず3ずつである必要はなく、2つずつとか4つずつでも、いくつずつでもいいですし、行と列の数が違っていても構いません。

例えば次の行列は2×2行列、4×4行列です。
このようにn×nの形である行列を、特に「正方行列」と言います。

$$\left(\begin{array}{cc} 1 & 2 \\ 5 & 0 \end{array}\right) \hspace{10pt} \left(\begin{array}{cccc} 3 & 1 & 4 & 1\\ 1 & 2 & 0 & 0\\ 5 & 0 & -1 & 1\\ 3 & 1 & 4 & 2\end{array}\right) $$

行と列の数が違う場合は、「行の数」×「列の数」の順番で「2×3行列」「(2,3)型行列」などと表記します。例えば次のようになります。

$$\left(\begin{array}{ccc}
1 & 2 & 0\\
5 & 0 & -1\end{array}\right)$$

行列自体を、1つの文字で表記する事もよくあります。この場合、別に何の文字を使ってもよいのですがアルファベットの大文字(キャピタル)を使う事が多いです。例えば次のように書いたりします。

$$A=\left(\begin{array}{cc} 1 & 2 \\ 5 & 0 \end{array}\right) \hspace{10pt} B=\left(\begin{array}{cccc} 3 & 1 & 4 & 1\\ 1 & 2 & 0 & 0\\ 5 & 0 & -1 & 1\\ 3 & 1 & 4 & 2\end{array}\right) \hspace{10pt} Y=\left(\begin{array}{ccc} 3 & 1 & 4\\ 1 & 2 & 0\\ 5 & 0 & -1\end{array}\right)$$

ここでの例では具体的な数を入れていますが、変数を入れても構いません。
例えばてきとうに、次のような行列を考える事もできます。

$$X=\left(\begin{array}{ccc} x & 1 & 4\\ 1 & y & 0\\ 5 & x & z+1\end{array}\right) $$

行列の演算・・足し算、引き算、割り算

次に、行列同士の演算です。

行列の演算には次の3つがあります。特に重要なのは行列同士の掛け算です。

  • 足し算(加法、和)
  • 引き算(減法、差)
  • 掛け算(乗法、積)

割り算(除法、商)はない事に注意してください。特定の行列の掛け算に対して逆の演算をできる場合もありますが、これは「逆行列」というものを掛け算するという形で行われます。

通常の数の演算のように、足し算引き算には+、-の記号を使い、掛け算は×、・の記号を使うか2つの行列を横に並べる事で表します。

続いて具体的にどういう計算をするのかの定義です。

まず、足し算と引き算については、2つの行列の行と列の数がそろっている場合にのみ考えます。

具体的には、例えば2×3行列同士の足し算は次のようにします。

$$ \left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a_{21} & a_{22} & a_{23}\end{array}\right)+ \left(\begin{array}{ccc}
b_{11} & b_{12} & b_{13}\\
b_{21} & b_{22} & b_{23}\end{array}\right) = \left(\begin{array}{ccc}
a_{11}+b_{11} & a_{12}+ b_{12} & a_{13}+ b_{13} \\
a_{21} + b_{21} & a_{22}+ b_{22} & a_{23}+ b_{23} \end{array}\right) $$

要するに、行と列の対応する数同士を足し合わせるだけという演算です。

引き算の場合も同様です。

$$ \left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a_{21} & a_{22} & a_{23}\end{array}\right)- \left(\begin{array}{ccc}
b_{11} & b_{12} & b_{13}\\
b_{21} & b_{22} & b_{23}\end{array}\right) = \left(\begin{array}{ccc}
a_{11}-b_{11} & a_{12}- b_{12} & a_{13}- b_{13} \\
a_{21}- b_{21} & a_{22}- b_{22} & a_{23}- b_{23} \end{array}\right) $$

次に、掛け算に関しては、A×Bという行列の掛け算を考える時には「行列Aの『列の数』」と「行列Bの『行の数』」が同じであるという条件がある時のみに演算を考えます。

具体的には次のようにします。
2×3行列と、3×3行列の掛け算です。

$$ \left(\begin{array}{ccc}
a_{11} & a_{12} & a_{13}\\
a_{21} & a_{22} & a_{23}\end{array}\right)×\left(\begin{array}{ccc}
b_{11} & b_{12} & b_{13}\\
b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33}\end{array}\right) $$

$$= \left(\begin{array}{ccc}
a_{11}b_{11}+ a_{12} b_{21} + a_{13} b_{31} & a_{11}b_{12}+ a_{12} b_{22} + a_{13} b_{32} & a_{11}b_{13}+ a_{12} b_{23} + a_{13} b_{33} \\
a_{21}b_{11}+ a_{22} b_{21} + a_{23} b_{31} & a_{21}b_{12}+ a_{22} b_{22} + a_{23} b_{32} & a_{21}b_{13}+ a_{22} b_{23} + a_{23} b_{33} \end{array}\right) $$

これは一体どういう計算をやっているのかというと、A×Bの「Aのn行目」と「Bのm列目」について、1つずつ対応する数同士を掛け合わせて加え、「それをn行m列目の数とする」という操作です。

a × b 行列と b × c 行列の掛け算の結果は、必ず a × c 行列になります。上記で言うと、2×3行列と、3×3行列の掛け算の結果は2×3行列になります。

行列の積の計算

この掛け算の定義は一番面倒ですが、行列の計算で一番肝心でもある所です。

行列の掛け算においては、A×BとB×Aは一般には違うものになる(同じ場合もあるが同じになる保証はない)事は、行列の重要な性質の1つです。

n×n行列のような正方行列の場合は、足し算・引き算・掛け算のいずれの場合も必ず計算を行えます。

行列は何のために「定義」している?何に使う?

さて、このように行列というものを「定義」すると、それを何のために定義するのか?定義すると、計算をどういう事に使えるのか?という疑問が沸くでしょう。

特に掛け算の定義は面倒で初見だと分かりにくい部分があると思います。しかし、じつはこの掛け算の計算規則が重要で、この形の積と和の組み合わせの式の形を線型結合と言い、主にそれの計算と理論を扱う数学の領域を線型代数と言います。大学数学の中で言うと、行列は線型代数の領域の中で特に重要な位置を占めている・・という位置付けになります。

また、一般の代数学で行列を扱う事もあり(例えば可逆複素正方行列全体の集合は「群」になるので群論の中で)、その他の分野でも行列を使う事があります。例えば、連立一次方程式を考える時には理論を行列として扱ったほうが便利である事があります。

物理等で行列が直接的に重要になる分野は、例えば量子力学です。これは、先ほど述べた「線型結合」の形によってある種の量が表され、さらに行列の積の形に対応する量も存在する事が大きな理由の1つです。量子化学などの場合は、行列の「群」としての性質を使って物質の構造を調べる手段の1つとして使う場合があります。

掛け算の九九
覚えるのは「9の段まででいい」?

掛け算の「九九」というものを日本の小学校では「暗記」させる慣習になってます。

他方、インドでは9の段までだけではなく11の段、12の段・・も暗記させるという事が一時期話題になりました。(※)

しかし、これに関しては「9の段まででよい」のです。このページではその理由を一緒に考えてみましょう。

(※) この「インド式」の計算が日本で語られたのは、それゆえに彼らはデジタル分野に強い、などといった文脈においてでした。しかし、個人的には理由づけとしてそれは疑問です。また、インドの全ての人がそのような計算の暗記をしているのかというと、必ずしもそうではないようです。

2ケタの数字同士の掛け算

1ケタ×2ケタの数の計算
2ケタの数の掛け算を暗算でやってみる
掛け算の「筆算」の仕組み 

かけ算の暗唱

1ケタ×2ケタの数の計算

4×14といった計算は、電卓を使ってもいいですが暗算でも計算できます。 (「暗記」ではありません。)

答えは56です。

これは簡単な話で、 4×(10+4)=40+16=56のように計算します。

紙に書いて「筆算」でやってももちろん計算できますが、これくらいだったら暗算でできるという人も意外に多くいるかもしれません。

2ケタの数の掛け算を暗算でやってみる

次に、11×12という掛け算を考えてみましょう。答えは、132です。

これはどうやって計算するかというと、

  • 面倒なので電卓を使う。(あるいはソロバンを使う etc.)
  • 「筆算【ひっさん】」を書いて計算する

の、どちらかの場合が多いと思いますが、暗算でやる方法もあります。考え方は上記と同じです。

11=10+1ですから、11×12=(10+1)×12です。

10×12=120で、これはケタが増えるだけなので簡単ですね。(当然、暗記も必要ないです。)

1×12=12でそのままです。

なので、(10+1)×12=120+12=132です。

12=(10+2)と考えても同じようにできます。その場合は11×12=11×(10+2)=110+22=132で、もちろん同じ結果となります。

同様に、14×15=14×(10+5)=140+70=210などの計算ができます。

17×18などになるとちょっと面倒ですが、考え方は同じなのです。
次に述べるように、この考え方は、じつは掛け算の「筆算」の考え方そのものです。

掛け算の筆算の仕組み
紙か何かに書いて筆算を行う事で試験での間違いを減らす事はできると思いますが、
これくらいの計算であれば普通に頭の中で解答を出す事も可能になります。

掛け算の「筆算」の仕組み

さて、紙に書く「筆算」というものがありますが、「書く」事自体は数学的な本質ではなくて、1の倍数、10の倍数、100の倍数、・・ごとに分けて考える事が本質と言えるでしょう。

例えば、324という数は300+20+4です。

324×12といった計算の「筆算」は、次のような計算をしています。

324×12=(300+20+4)×(10+2)=(3000+200+40)+(600+40+8)=3240+648=3888

掛け算の筆算というものは、この計算で各項の計算結果を忘れないように「紙に書く」のと、ケタが多い時に0を書くのが面倒なので「横にずらす」事でそれを簡略化しているという、それだけの技法です。

筆算の時は基本的に縦方向に書くのも、ケタを揃えて見やすくするというだけの理由でやってるものであり、本質的には横に書いても同じ事です。(小学校のテストで間違わないためには、算数の授業で教わってる通り縦書きで書いたほうがいいとは思います。)

中学・高校数学の「式の展開」とのつながり

「式の展開」と見比べてみよう
日本式かインド式か?

「式の展開」と見比べてみよう

さて、上記のような掛け算の計算自体は小学校でやる内容ですが、本質的には中学以降で教わる「式の展開」(その逆が因数分解)と同じ事と言えます。

式の展開とは、例えば

(x+y)(2a+b)=2ax+2ay+bx+by

と、いった計算です。

324×12=(300+20+4)×(10+2)という計算と、同じですね。

足し算・引き算・掛け算・割り算の加減乗除の四則演算は数学的にはこのような計算が可能な種類の演算ですよ、という事を「式の展開」は言っているわけです。

式の展開の考え方は、中学や高校でやって終わりというものではなくて、大学の数学や物理等でも普通に使います。しかし別に高度な事をやってるわけではなくて、本質的には小学校の掛け算とやってる事は同じなのです。

日本式かインド式か?

よほど暗記が得意か暗記が大好きで、覚えれるなら11の段以降も覚えてもよいと思います。(日本の高校生や大学生でも、11×11=121、12×12=144など、特徴的なものを自然に覚えている人は意外と多いと思います。)

しかし上記の通り、結局9の段まで分かっているなら2ケタの数の掛け算は1の位と10の位に分けて足し算すればよいわけですから、別に「暗記しなくても計算できる」わけです。しかも、数学的には式の展開の考え方につながる事から、より本質的であるとさえ言えるとも思います。

そういうわけで、12×13といった掛け算を「暗記」する必要があるか、子供に暗記させる必要があるかというと「ない」と、個人的には明確に思います。

さらにしかし、ではインドよりも日本の学校の方が勉強の教え方が優れていると言えるか?というと、それは全く別の問題です。個人的には、日本の学校の教え方が特別優れたものと言えるかはかなり疑問です。

なぜかというと、教える教員によっても変わると思うので一概には言えない部分も確かにありますが、日本の学校では「筆算の計算は筆算の計算」「式の展開は式の展開」といった具合に別々のものとして教える傾向が強いからです。しかも、個々の計算問題の正答を書けるかという事が重要視されます。

九九の計算にしてもとにかく強引にでも暗記せよという傾向が強くて論理的とは言い難い教育法ですし、高校や大学の教員でも、計算は「体で覚える」などと平気な顔をして言う人間もいるくらいです。(さすがに、大学の教員であれば今すぐにでも改めるべきだと思います・・。)

どういう仕組みで計算をしているのか理解させる事については、一般的な日本の学校とその教員にとっては大変な「苦手科目」であるのかもしれないのです。

最低でもその事を本質的に改善しない限りは、日本の教育のほうが優れているとは一概に言えないのではないでしょうか。

分数の割り算はなぜ分母分子を「ひっくり返して掛け算」になる?

このページでは分数の割り算について述べます。
内容としては小学校でやる算数ですが、計算の仕方の『理由』について分かりやすく述べます。

分数の割り算の計算方法

分数の割り算:ひっくり返して掛け算しよう
ある映画の場面:計算の理由を問いただす少女と、怒りだす姉

分数の割り算:ひっくり返して掛け算しよう

分数の割り算をする時は、分母と分子を入れ替えて掛け算をします。

例えば次のようにします。

$$1 ÷ \frac{1}{3}=1 ×\frac{3}{1}=3$$

$$2 ÷ \frac{2}{3}=2 × \frac{3}{2}=3$$

ある映画の場面:計算の理由を問いただす少女と、怒りだす姉

分数の割り算を質問したら怒られた
分数の割り算を質問したら突然怒られた?

昔、こんなアニメ映画の場面がありました。

小学生の女の子が、姉から算数の勉強を家で教わるのですが、女の子が「分数の割り算は『なぜ』ひっくり返して掛け算になるのか」と問いただし始めます。

その場面で姉の返答はどういうものであったかというと、机を叩き

「ひっくり返して掛け算するって決まってるのよ!!」

その場面は、それで終わりです。ある女性が子供の頃を回想する場面だったと思いますが、結局『なぜ』に対する答えは語られる事のないまま終わります。

ここでは、『なぜ』に対する答えを考えてみましょう。

理由はじつに簡単なもので、駄々をこねた女の子が悪かったのかというとそうではなくて、おそらく女の子も姉も両方とも、あまり良い形で算数や数学を学校で教えてもらっていなかったと解釈できるかもしれません。

考え方①:「1個の中に半分個はいくつありますか。」

1÷1/2 の型の計算
1÷2/3の型の計算

\(1÷\frac{1}{2}\) の型の計算

一番簡単だと思われる考え方は次の通りです。

1個の中に、半分個はいくつあるでしょう。もちろん2個ですね。

これが、1÷(1/2)=2であるという事です。

では、1個の中に3等分した(1/3)個はいくつあるでしょう?もちろん、3個あるのです。
これが 1÷(1/3)=3であるという事です。

もうお分かりかと思いますが、数がいくつでも同じ事であって、例えば1個の中に(1/100)は100個あります。

数がもっと大きくても、中途半端な数でも同じです。

$$1÷\frac{1}{721}=1×721=721$$

つまり、次のように計算してよいわけです:

$$1÷\frac{1}{N}=1×N=N$$

また、1『個』でなくとも、1kgでも1メートルでも、何でも同じ事ですね。

2や3を1/2などの分数で割る時は、例えば 2÷(1/2)については1個の中には半分個が2つあり、それが2個あるのですから 2÷(1/2) =2×2 =4であるわけです。

$$A÷\frac{1}{N}=A×N$$

\(1÷\frac{2}{3}\) の型の計算

では、1を2/3で割る場合はどうでしょうか。

この場合も、計算の工夫をするだけで、考え方は同じなのです。

まず、1を3等分します。すると、1/3は3個あります。これは、前述の1÷(1/3)=3の計算に該当します。

次に、3の中に、2はいくつあるかというと、3/2です。小数で表すならこれは1.5です。

つまり、

$$1÷\frac{2}{3}=1×3÷2=1×\frac{3}{2}= \frac{3}{2} $$

と、いう事です。

計算の途中で、確かに「ひっくり返して掛け算」になっていますね?

ようするに、1÷(2/3)は、「1/3の2倍」が1の中に何個あるかを調べる計算であり、手順としてはまず分母を掛け算し、次に分子で割ればよいという事なのです。

整理すると、次のような形です。

  1. 分母の数で等分する事で、小さいパーツを分母の数だけ作る、→ つまり分母倍する
  2. 分母の数で等分したパーツにそろえているので、それを分子の数で割ればそのまま答えになる。 → 分子で割る
  3. 結果的に、計算は「分母を掛けて」「分子で割る」事で行える → つまり、分母と分子をひっくり返して掛け算すればよい。

割る対象が1ではなくて2や3や他の数でも同じ事で、従って次のように言えるわけです:

$$A÷\frac{M}{N}=A×N÷M= A×\frac{N}{M}$$

割られる数のほうの A も分数や少数であっても構いません。考え方は同じ事です。

考え方②:掛け算と割り算は「逆演算」の関係にある

掛け算と割り算は互いに逆演算の関係
中学・高校的な考え方 

掛け算と割り算は互いに逆演算の関係

別の考え方もあります。こちらのほうが、より「数学」でよくやる考え方です。

分数とは、そもそも割り算であるという事にまず注目します。つまり、例えば1/3を掛けるという事は、3で割る事に他ならないわけです。

分数2/3などを掛ける場合は、3で割って2倍する(2を掛ける)と解釈できます。つまり次のように書けるわけです。

$$1×\frac{2}{3}=1÷3×2$$

ここで、掛け算と割り算は、計算の順番を入れ替えても結果は同じという事は重要です。たとえば、12を2で割って3倍すると18ですが、順番を入れ替えて12を3倍してから2で割っても同じ18になるのです。

$$1×\frac{2}{3}=1÷3×2=1×2÷3$$

さて、分数の割り算ではなくて普通の割り算の時に、?÷3=2という問題で「?」の部分を出すには、3で割って2になる数を見つけるわけです。それは6ですが、これは2を3倍してあげる事で見つける事ができるのです。つまりこのような問題では、割り算の部分を掛け算にする事で「?」の部分の答えが見つかります。

また、今度は掛け算の2×?=6という問題で「?」の部分を見つけるには6を2で割って3であると計算できます。「2を掛けると6になる数を見つける」事と、「6を2で割る」事は計算としては同じ事であるわけです。

次に、分数の割り算 「1を2/3で割る」を考えましょう。 この答えを仮にPとおきましょう。

$$ 1÷\frac{2}{3}=1 ÷( 2÷3)=P$$

すると、 ?÷3=2 という問題で「逆算」して掛け算で「?」の部分を見つけたのと同じ要領で

$$1=P×\frac {2}{3} =P×(2÷3)= P×2÷3 $$

となるのです。これをよく見てみると、1 = P × 2 ÷ 3 という関係になっています。という事は、「?÷3=2」や「 2×?=6」の問題と同じ形です。もう一度逆算してあげると、P の値を表せます。

  1. 1 = P × 2 ÷ 3
  2. 1 × 3 = P × 2
  3. 1 × 3 ÷ 2 = P

つまり、

$$P=1 × 3 ÷ 2 =1×\frac{3}{2}$$

であるという事ですが、もともとは

$$P=1÷\frac{2}{3}$$

だったのですから、

$$1÷\frac{2}{3}= 1×\frac{3}{2} $$

という事です。

掛け算と割り算が逆の演算である関係からは、必然的に「分数による割り算」は「分子と分母を入れ替えた掛け算」になる事を意味しています。

中学・高校的な考え方

やる事は本質的に上記と同じですが、等号で結んだ関係を同じ数で掛けたり割ったりしても等号関係は保たれる事を利用する方法もあります。

$$1÷\frac{2}{3} =P$$

式の左と右の両方の側(両辺)に「2/3」を掛けます。この時、式の左側(左辺)では、 「2/3」 で割って 「2/3」 で割るのですから、その部分は何もしない(1を掛ける)のと同じ事になります。

$$1÷\frac{2}{3}× \frac{2}{3} =P × \frac{2}{3} $$

$$ 1=P × \frac{2}{3} $$

この両辺に、今度は「3/2」を掛けます。

$$ 1×\frac{3}{2}=P × \frac{2}{3} ×\frac{3}{2} =P$$

つまり結果は同じで、分数の割り算は分母分子を入れ替えた掛け算になります。

$$ 1÷\frac{2}{3} = 1×\frac{3}{2} $$

この両辺にさらに、同じ分数を掛け算する形の計算により、一般に次のように言えます。

$$\frac{A}{B}÷\frac{M}{N}= \frac{A}{B} × \frac{N}{M}=\frac{A × N}{B × M} $$

まとめ

逆演算という考え方は、数学的には非常に広い範囲で使われるので考え方としては知っておくと便利です。より一般的には、2を掛けて2で割るといったように、ある演算と逆演算の「積」は1(恒等)、つまり何もしないのと同じになるという考え方をして話を進める事があります。

しかし、単純に普通の分数の計算で「割り算はなぜひっくり返して掛け算なのか」という素朴な疑問に対する答えは前述の「1個の中に半分個は2個ある」の考え方でも良いと思います。どちらにせよ、計算結果は同じになるからです。

もう1つ、そもそもそのように計算を『定義』してしまって、その定義のもとで話を進めているのだとする考え方もあります。特に数学者という人達は具体的な『モノ』を使って説明する事を嫌う傾向にあるので、「なぜですか」と聞かれたら「定義だ」と答える事が多いでしょう。

数学という学問の中での考え方としてはそれは間違っていないのですが、『説明』としては女の子の質問に対して怒りだして暗記を強要する姉とほぼ同じである事には注意が必要かとは思います。

確かに基本的には、計算の結果が合っていれば「説明できる」必要は必ずしもないのです。計算というのは、要するに答えが合っていればよいという考え方もあるからです。しかし、子供が何か疑問に感じた場合にはきちんとそれに答えるという事も算数・数学教育では大事な事だと思います。特に、生徒からの質問に対しては、大人は誠実な気持ちで適切に対応する必要があるでしょう。

虚数単位と複素数【定義と計算】

虚数単位複素数というものについての定義と基本計算を説明します。

複素数は、微分方程式の解法に使う事ができ、また平面図形的に捉える事も可能である事から物理学の一般の力学や流体力学、電磁気学、電気回路論などで使用される事があります。また、量子力学の波動関数(あるいは「状態」)は、本質的に複素数の関数(実関数も含めて)であると考えられています。

BGM:MUSMUS CV:CeVIOさとうささら

定義と基本用語

まず数学的な定義です。

2乗してマイナス1になる数」を定義してみるところから始めます。

複素数と虚数単位の定義

$$i^2=-1$$を満たす「数」を虚数単位(imaginary unit)と言い、
実数 a,b を使って 実数と虚数単位が掛け算や足し算で結びついたような量を考えて、 $$a+bi$$で表される数を複素数)(complex number)と呼びます。

※虚数単位iに対して、定数倍する時には3i,7i といった順番で書く事が多く、
文字式がある場合には同じくbiと書く方法と、意図的にibと書く場合の両方があります。
ibと書いてもbiと書いても、意味はどちらも同じです。
三角関数が虚部にある場合には「i sinΘ」のような順番で書くことが普通です。

◆実数の計算では、
プラス×プラスはプラス、
プラス×マイナスおよびマイナス×プラスはマイナス、
マイナス×マイナスはプラスですので、
これらをどう組み合わせても「2乗してマイナスになる」という場合があり得ないわけです。

複素数を表す文字は何でもいいのですが、z, u , w などが優先して使われる傾向があります。
「複素数 z = a + bi を考えるとき・・・」という具合に使うわけです。
(区別のために実数はa,b,c,・・・で表し、複素数はアルファベットの終わりのz付近のものを使うという単純な理由だと思います。)

複素数の実数だけの部分を実部と言い、虚数単位 i が掛け算されている部分を虚部と呼びます。

複素数zに対して、その実部を Re z と書き、
虚部の虚数単位に掛けられている実数を Im z と書く場合があります。
Re とは real , Im とはimaginary の略です。

$$例えば、z=2+3iに対して \mathrm{Re}\hspace{2pt}z = 2, \mathrm{Im}\hspace{2pt} z = 3 です。$$ 

また、単に「虚数」と言う場合には、
虚数単位を0以外の実数倍したものだけで構成させるbiという形のものを指す事があり、
これを特に純虚数と呼ぶ事もあります。
これは、複素数a+biにおいてa=0かつb≠0の場合を指しているという見方もできます。
あるいは、「実部が0で、かつ虚部が0でない形で単独で存在する場合を純虚数と呼ぶ事がある」とも言えます。

$$純虚数とは:b\neq 0 として、bi という虚部だけの形で表される複素数$$

虚数、あるいは純虚数という(同じものを指す)呼び方は英名の場合も同じで、
それぞれ imaginary number, purely imaginary number のように言ったりします。

複素数を変数とする関数は複素関数と呼ばれる事があり、その場合の変数となる複素数をzとする時には、そのzを構成する実部と虚部も変数である事からz=x+yiのように書く事もあります。 xとyという2つの実数の変数で決まる関数なので、複素関数は多変数の関数の1つです。

電磁気学や電気回路論では電流を i で表す事があって紛らわしいという理由で、
複素数を使う場合には虚数単位を j で表す事があります。

a + bi において b= 0 の時には複素数は通常の実数 a になるので、数学では「実数全体」という集合が「複素数全体」という集合に含まれている、と考えます。

集合の記号で書くとき、
実数全体の集合を \(\mathbb{R}\) 、複素数全体の集合を \(\mathbb{C}\) と書きます。
(これらの記号はそれぞれ、real と complex に由来します。)
複素数全体は実数全体を含みますので、次のような包含関係があります。 $$\mathbb{R}\subset\mathbb{C}$$

◆補足として、
有理数全体の集合 \(\mathbb{Q}\) と整数全体の集合\(\mathbb{Z}\)、自然数全体の集合\(\mathbb{N}\)も含めて包含関係を書くと次のようになります。 $$\mathbb{N}\subset\mathbb{Z}\subset\mathbb{Q}\subset\mathbb{R}\subset\mathbb{C}$$

共役複素数と複素数の絶対値

複素数 a+bi に対して、 a-bi を共役(「きょうやく」)な複素数、あるいは共役複素数と呼びます。

共役複素数の定義

$$z=a+bi に対する「共役複素数」\bar{z}=a-bi$$ 文字の上に横線を引きます。

この「共役」という用語は、一般的には複素数に限定されたものではなく、
代数学においてより広い意味を持ちます。

また、a+bi に対して、次の量をその複素数の絶対値と言います。
記号では、実数の絶対値記号と同じものを使います。

複素数の「絶対値」の定義

$$z=a+biの「絶対値」:|z|=|a+bi|=\sqrt{a^2+b^2}$$これは必ず正の実数です。

複素数の絶対値は r などの文字で表す事もあります。

複素数と共役複素数の積は、その複素数の絶対値の2乗に等しくなります。
複素数の絶対値は必ず実数ですから、2つの複素数から実数を確実に作る方法の1つになります。
この性質は結構重要で、式で書くと次のようになります。

$$任意の複素数 z に対して、z\bar{z}=|z|^2$$

この式の証明は、後述する複素数の計算規則を使いますが簡単に行えます。

$$(証明)z=a+biとして、z\bar{z}=(a+bi)(a-bi)=a^2-abi+abi-bi^2=a^2+b^2=|z|^2$$

この簡易的な証明を見ても分かる通り、\(z\bar{z}=|z|^2\) という関係式は、複素数が実数である場合や純虚数である場合にも成立します。

複素数の絶対値の考え方は、複素平面というものを考えるとじつは見やすくて、「実部を底辺、虚部を高さとする直角三角形」の斜辺の長さ、あるいは2点間の距離として捉えらる事ができるのです。
つまり、複素数の絶対値の定義式の「2乗して加えたものの平方根」とは一体何なのかというと、イメージとしては三平方の定理なのです。これは偶然似ているというだけではなくて、割と本質的なものであり理論的にも重要です。

尚、虚部が0の時には複素数は実数になるわけですが、
その時の「複素数の絶対値記号」は実数の絶対値記号としてもきちんと機能するのです。そのために同じ「絶対値」という用語を使い、記号も同じであると考えてもよいでしょう。

複素数の計算方法

2つの複素数 u と w は、
実部同士が等しく、かつ虚部の実数同士が等しい時に限って、
2つの複素数は等しいと呼んで u = w であると書きます。

$$u=a+bi, \hspace{5pt}w=c+di\hspace{5pt}のとき、a=cかつb=dの時、u=w \hspace{5pt} です。$$

★「2つの複素数が等しい」ためにの条件は、じつは定義としなくても計算で「導出」する事が可能です。後述します。

複素数は、実数と同様に加減乗除の計算の中に組み込む事ができて、
式の展開や因数分解などもできます。

複素数の計算をする時には、次の事を踏まえたうえで実数の時と同じように計算します。

  • 足し算と引き算の計算では、実部同士だけ、虚部同士だけで必ず行う。
    (混ぜ合わせないようにします。)
  • 掛け算と割り算の計算では、虚数単位 i は実数にくっついた係数であるようにして扱う。
  • 計算の際に i の2乗が現れたらそこは -1 に置き換える。 (それによって、計算途中で実部と虚部が入れ替わる事もあります。)

いくつか簡単な計算の具体例を記すと、次のような感じです。

$$加算(足し算):(1+i)+(2+3i)=3+4i$$

$$減算(引き算):(1+i)-(2-3i)=1-2+i(1+3)=-1+4i$$

$$乗算(掛け算):(1+i)(2+3i)=2+3i+2i+3i^2=2+3i+2i-3=-1+5i$$

$$除算(割り算):\frac{2+3i}{1+i}=\frac{(2+3i)(1-i)}{(1+i)(1-i)}=\frac{2-2i+3i-3i^2}{1-i^2}=\frac{2-2i+3i+3}{1+1}=\frac{5+i}{2}$$

4番目の割り算のところはうまく分母と分子に (1-i) を掛けて、分母を実数だけにしています。「複素数と共役複素数の積はその複素数の絶対値の2乗に等しい」という性質を使って、数式上「分母の虚数単位iを消す」という事をしています。この手法は、複素数の微積分を論じる時などにもよく使われます。

ところで、これらの計算を使って、
「2つの複素数が等しいための条件は『実部同士が等しく、かつ虚部同士も等しい』事である」
という命題の「証明」を、次のように行う事ができます。

$$a+bi=c+di$$

であるとすると、

$$a-c=i(d-b)$$

両辺を2乗すると、

$$(a-c)^2=-(d-b)^2\Leftrightarrow(a-c)^2+(d-b)^2=0$$

これを満たすためには a = c かつ b = d という事になります。

変分の計算

物理の理論では、微分とは少し意味合いが異なる変分という計算が行われる事があります。

変分とは?例①:光の屈折

汎関数という考え方 ■ 2点間を進むための最小時間と光の屈折 ■ 変分の記号と計算 

汎関数という考え方

ある関数 y = F(x) があった時、それをグラフに描いたとして、グラフの「弧長」sを決定する事ができます。この弧長sは、もちろん関数によって異なります。2端点が決まっている場合、 y = F(x) が どのような関数であるかに依存してsが決まるわけで、s=s(y) という関数であると考える事もできるわけです。このようなタイプの関数を汎関数と言います。

関数は通常F(x) などのように書きますが、汎関数である事を強調する場合には F[y] のように書かれる場合もあります。

2点間を進むための最小時間と光の屈折

通常の空間(ユークリッド空間)で2点を結ぶ最短距離は、2点間を結ぶ直線の距離です。同じ速さの物体を考える時にも、2点間を進むときの最短の時間となるのは直線軌道を通る時です。

しかし、領域によって速さが変わってしまう場合などは、じつは最短の時間となるのは直線軌道ではなく、折れ曲がったような経路になってしまいます。

どのような折れ線になるのかという問題自体は、普通の微分法で解く事ができます。ただし直交座標の平面を設定して軌道を関数と捉えた場合は関数形が変化して最短距離が決定すると見なせる事が重要で、それが変分の基本的な考え方であるというわけです。

光の屈折は、この問題の結果として表されると考えられています。
【※相対性理論で光線の軌道が曲がるという考え方は、これとはまた少し違った理論なので注意。】

変分の記号と計算

変分を表す時には、δ(デルタ)という記号を使います。これは、微分を表すためにdという記号を使うのと区別する意味があります。

ある汎関数I[y] があった時、 その変分 δ I[y] は、
δ I[y] = I[y+δy]-I[y] で表されます。
(この定義の仕方で考えられた変分を、特に「第1変分」とも言います。)
δy は様々な形の任意の(微小な)関数です。

変分の定義(「第1変分」)

汎関数 \(I[y]\) に対して $$δ I[y] = I[y+δy]-I[y]$$ \(\delta y\) は様々な形の任意の(微小な)関数。

変分の定義から、例えば2つの汎関数の和ついては
δ( I[y]+J[y] ) = ( I[y+δy]+J[y+δy] ) - ( I[y]+J[y] )= I[y+δy]-I[y] + ( J[y+δy]-J[y] )=δI+δJ
が成立します。差についても同様です。

これらの定義や考え方は、もともとの意味での「微分」がdF(x)=F(x+dx)-F(x) で表される事と似ています。

ただし、微分の場合のdxが(小さい)実数であるのに対して、変分の場合の δy は様々な形の任意の(微小な)関数であり、yと全然違う形の関数も含めて考えているという点が異なります。その意味で、変分と微分は違うものである事は強調されるのです。

一度計算を始めて変化させる関数yを通常の実変数として動かすとみなしてよい状態に持ち込んだ時には微分計算と同じ事ができるという特徴があります。ただし、通常の1変数の微分ではなく、基本的には多変数関数の偏微分を含んだ全微分の計算になる点に注意する必要があります。

例②:解析力学 定積分に対する変分計算

問題の設定 ■ 計算の詳細 ■ オイラー・ラグランジュ方程式 

問題の設定

汎関数 I[y] が、次の形

$$I[y]=\int_a^bF(x,y,y^{\prime})dx$$

$$条件:端点 x=a, x=b でyについての変分\delta y=0$$

で表される場合を考えます。y は x の関数であるとします。

積分などがあるといかにも話が複雑になりそうですが、じつは「部分積分」を使って式を簡単にするなど、計算上の利点も一部存在します。

このとき、I[y]の変分 δI[y] は次のように計算します。

計算の詳細

まず定義に従って、 \( δ I[y] = I[y+δy]-I[y]\) ですが、この先がまず第一のポイントで、積分の中身の \(F( x,y,y^{\prime}) )\) については、xは動かさずに、yだけ変化すると考えます。さらに、この時にyの導関数は 「δy に対する導関数」の分だけ増減、つまり (δy)’ だけ増減します。

$$ δ I[y] = I[y+δy]-I[y] = \int_a^b F(x,y+\delta y,y^{\prime}+\delta y^{\prime} ) -F(x,y,y^{\prime})dx $$

続いて、yを通常の実数変数同様に扱えると考えて、積分の中身を全微分と同様に扱えるとみなします。この場合、xは動かしていませんのでdxに相当する項は0になります。

$$ F(x,y+\delta y,y^{\prime}+(\delta y)^{\prime} ) -F(x,y,y^{\prime}) =\delta y \frac{\partial F}{\partial y}+ (\delta y)^{\prime} \frac {\partial F}{\partial y ^{\prime} } $$

$$ δ I[y] = \int_a^b \delta y\frac{\partial F}{\partial y}+ (\delta y)^{\prime} \frac {\partial F}{\partial y ^{\prime} } dx= \int_a^b \delta y \frac{\partial F}{\partial y}dx + \int_a^b (\delta y)^{\prime} \frac {\partial F}{\partial y ^{\prime} } dx $$

次に、yの導関数に対する変分の項について、xに関して部分積分を行います。

$$(\delta y)’ =\frac{d}{dx}(\delta y)$$ 

の箇所に対して部分積分を適用するという事です。
【このような事ができるのはδyが「関数」であるからという事には一応注意。】

$$2番目の項について: \int_a^b (\delta y)^{\prime} \frac{\partial F}{\partial y ^{\prime} } dx =\left[ \delta y \frac{\partial F}{\partial y ^{\prime} } \right]_a^b- \int_a^b \delta y \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime} } dx =\hspace{5pt} – \int_a^b \delta y \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime} } dx $$

$$ 【∵\hspace{5pt}x=a,x=b で\delta y=0 という前提条件】$$

端点でδyが0になるという条件をつけているので部分積分した後の第1項は0になって消えます。この条件は、要するに端点は固定して関数形を変化させるという意味です。

これにより、δIを改めて書くと次のようになります。

$$\delta I = \int_a^b \delta y \frac{\partial F}{\partial y}dx – \int_a^b \delta y \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime} } dx $$

$$= \int_a^b \delta y\left(\frac{\partial F}{\partial y} – \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime} }\right) dx $$

さて、物理で使う場合は「ここまで変形できればじゅうぶん」という考え方をします。

オイラー・ラグランジュ方程式

上記の条件での汎関数 I[y] に対する変分 δI[y] が0になる条件を考えると、積分の中身の

$$ \frac{\partial F}{\partial y} – \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime}} $$

という部分が0であればよい事が分かります。(δyは「任意の」(微小な)関数である事に少し注意。)

そこで、

$$ \frac{\partial F}{\partial y} – \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime}} =0$$

という形の微分方程式が成立すればよいという事ですが、これは解析力学では座標系によらずこの形で使用できる運動方程式の形として知られていて、少し長ったらしい名称ですが「オイラー・ラグランジュ方程式」あるいは「オイラーの微分方程式」などとも呼ばれます。

通常のF=ma の形の運動方程式はシンプルな形ではありますが、じつは直線直交座標を特別扱いしていて、座標系を例えば極座標に変換しただけで結構面倒で汚い形にと変わってしまいます。

これに対して上記の形の運動方程式は任意の座標系に対してこの形のまま話を進められるという事で、理論的な扱いとしては便利である場合があります。

例③:相対性理論、リーマン幾何学

一般相対性理論、リーマン幾何学で変分を使う例もあります。

1つの例は「測地線」という、曲面上の2点を「曲面に沿って最短経路で」結ぶ曲線に対して成立する式の導出です。この場合、弧長に相当する次の形の汎関数を考えます。

$$ \int_a^b \sqrt{\sum_{i,j=0}^3g_{ij}\frac{dx_i}{dr}\frac{dx_j}{dr}}dr $$

これを直接変分して計算を進めたものを0とおくか、
あるいは積分の中身の関数を上記で得られた微分方程式

$$ \frac{\partial F}{\partial y} – \frac{d}{dx}\frac {\partial F}{\partial y ^{\prime}} =0$$

に代入して計算を進めるかで、結論の式を得ます。どちらの場合も、最初一般の媒介変数rで計算しておいて、途中でrがsに比例するかr=sとおいて式を簡単にする工夫が行われます。