方向余弦の定義と公式

方向余弦(direction cosine)とはベクトルに対して考えられる補助的な量で、ベクトルの大きさに乗じる事で各成分の値になるような余弦(コーサイン、cos)を指します。(空間ベクトルの平面への射影を考える時の余弦とは一般的に異なるものです。)

この方向余弦の応用として特に重要であるの直交座標同士の座標変換です。
(局所的には直交座標から直交曲線座標への変換もできます。)

■関連記事:ベクトルの内積

■応用例:直交曲線座標系の成分にベクトルを変換する方法

「方向余弦」の定義

方向余弦とは、ベクトルと座標軸とのなす角に対して考える余弦であり、xyzの空間での直交座標なら1つのベクトルに対して3つ定義されます。平面であれば2つです。

方向余弦の定義

大きさが0でないベクトル\(\overrightarrow{A}\) =(A,A,A)に対して
\(\left|\overrightarrow{A}\right|=A\) ( >0)とおくとして、
\(A\cos\theta_x=A_1\),  \(A\cos\theta_y=A_2\),  \(A\cos\theta_z=A_3\) である時、
余弦 cosθ,cosθ,cosθ を特に「方向余弦」と呼ぶことがあります。
本質的に関数としては普通の余弦 cosθと同じものではありますが、
ベクトルに関する性質と組み合わせる事で特有の関係式がいくつか成立するものになります。

「おおきさが0でないベクトル」という条件を付しているのは、ゼロベクトルに対して方向余弦の定義を適用するとベクトルの大きさも0ですが、成分も全て0なので方向余弦は「任意の角度の余弦」であってもよい事になってしまうからです。
そのため、定義自体をできないわけではありませんがゼロベクトルに対する方向余弦は
「あまり意味のないもの」になってしまうので、ここでは除外して考えるという事です。

方向余弦をベクトルの大きさに乗じる事で、ベクトルの成分が計算されます。
具体的で簡単な数値で考えてみると、例えば(1,1,1)のようなベクトルなら
ベクトルの大きさは\(\sqrt{3}\)なので、各軸に対する方向余弦は3つとも等しく1/\(\sqrt{3}\)になります。
\(\sqrt{3}\cdot\frac{1}{\large{\sqrt{3}}}=1\)であり、大きさ×方向余弦=成分となっています。

この時に、具体的な角度の値は必ずしも分かっていなくてもよい事も多くあります。
cosθ=1/\(\sqrt{3}\)に対しては角度は約54.7°、弧度法で0.955≒0.3πとも書けますが、
角度の値よりも「余弦の値」のほうが重要である場合も少なからずあります。
(特にこの記事で見て行く方向余弦の公式や諸性質・応用ではその傾向があります。)

このように方向余弦の定義自体は比較的簡単なものですが、
注意すべき点があるとすれば方向余弦は3次元の空間の場合には一般的に
「ベクトルをxy平面やxz平面に射影する余弦とは異なる」という事です。
平面であれば、方向余弦はx軸あるいはy軸に対してベクトルを射影する余弦でもあります。
空間の場合でも確かに「軸に対する射影」を行うベクトルであるとは言えますが、それはxy平面等の「平面に対する射影」とは異なるのです。

図で見ると、一般的に3次元空間でのベクトルの方向余弦はxy平面等に対して「斜めになった平面」における直角三角形の1つの角に対する余弦となります。

公式1:方向余弦の2乗和に対する公式

方向余弦は普通の余弦と同じく三角比や三角関数の公式が使えますが、特に方向余弦に対して成立する公式として「3つの方向余弦(平面であれば2つ)の2乗の和は1になる」というものがあります。

方向余弦の2乗和に対して成立する公式

3次元空間における3つの方向余弦に対しては次式が成立します。 $$\large{\cos^2\theta_x+\cos^2\theta_y+\cos^2\theta_z=1}$$ 平面では次式です。
(空間で1つの方向余弦だけが0と考えても同じ。) $$\large{\cos^2\theta_x+\cos^2\theta_y=1}$$ この公式は「方向余弦」について成立するものであり、
一般の余弦 cosθで成り立つものではありません。
平面の場合では図を見ると実質的には sinθ+cosθ=1 と同じである事も分かるでしょう。

この公式は式で考えても導出できますし、図による平面幾何的な導出も可能です。
(式で考えたほうが、実はやや簡単かもしれません。)

証明

式で見る場合には、ベクトルの大きさ(の2乗)を成分で敢えて表してみると公式がすぐに出ます。(同じベクトルでの内積で考えても同じです。)

ベクトルの大きさをAとすると方向余弦を使った成分は
(A cosθ,A cosθ,A cosθです。ここでA>0であるとします。
成分を使って敢えて大きさの2乗を計算すると
A cosθ+A cosθ+A cosθです。
しかし考えているベクトルの大きさは A なのですから、その式の値はAです。
A cosθ+A cosθ+A cosθ=A
A>0なので
cosθ+cosθ+ cosθ=1となり、公式が導出されます。

図で見る場合は、平面だと分かりやすくて式で見る場合と同じように三平方の定理で斜辺の長さを見れば数式だけで考えた時と同じ式を得ます。

また、同じ角度で三角比の意味での余弦を2回考えるという方法も可能です。
すなわち長さ A の斜辺に対して A cosθ を考えて、さらにそこを斜辺とする線分を探します。
するとベクトルが作る直角三角形において直角の頂点から斜辺に垂線を下ろした時に、
そこを境にA cosθの長さの部分とA cosθの長さに分かれる部分となる事が分かります。

空間の場合も似た考察ができますが、平面と比べるとどうしても単純さが失われる傾向があります。

三平方の定理を使うのが一番早く、式で考える場合と結局同じになります。
それ以外の方法だと、かえって複雑です。
図形的にはベクトルの辺はA cosθ+A cosθの部分とA cosθの部分に分かれます。

いずれにしても、方向余弦に関しての性質を調べる時には平面の場合は図形的な考察は比較的容易でも、空間の場合では式で取り扱ったほうが見やすい事を示唆しています。

平面の場合は、2つの方向余弦のうち1つはもう片方の角度から見た正弦と実質的には同じです。
平面の場合は図で見ても比較的分かりやすいですが、空間の場合だとやや複雑になる傾向があります。後述していく方向余弦の関係式や公式の証明では基本的に内積などの式による計算を使っています。

公式2:ベクトルの直線に対する射影についての関係式

ベクトル\(\overrightarrow{A}\) =(A,A,Aと始点のみを共有する直線があるとして、
始点からの長さが「その直線への\(\overrightarrow{A}\)の射影に等しい」ベクトルを\(\overrightarrow{B}\) とします。
どちらのベクトルもゼロベクトルではないとします。
その他、次のように設定を考えます。

  • \(\overrightarrow{B}\) =(B,B,Bとします。
  • \(\overrightarrow{A}\)と\(\overrightarrow{B}\) とのなす角をφとします。
  • \(\overrightarrow{A}\)の方向余弦の角度をθ,θ,θとします。
  • \(\overrightarrow{B}\)の方向余弦の角度をω,ω,ωとします。
  • ベクトルの大きさについては\(\left|\overrightarrow{A}\right|=A\)( >0)および \(\left|\overrightarrow{B}\right|=B\)( >0) とおきます。

この時、B=A cosφ ですが、他にも次の公式が成立します。

ベクトルの直線への射影と方向余弦の関係式

上記の設定のもとで、次式が成立します。 $$\large{\cosφ=\cos\theta_x\cos\omega_x+\cos\theta_y\cos\omega_y+\cos\theta_z\cos\omega_z}$$ $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ これらの式が一体何を言っているのかというと、
最初の式は2つのベクトルのなす角の余弦を互いの方向余弦の積の和で表せる事、
2式目は1つのベクトルの大きさを3つの方向余弦と
「射影のもとになっている別のベクトルの成分」で表せるという事です。
また、1式目は2式目を導出するのに使う式でもあります。

複数の方向余弦が取り扱われる時にはl,m,nなどの文字によって方向余弦が書かれる事もありますが、ここでは普通の余弦として表記しています。

証明

第1式の証明は内積を使います。また、第1式から第2式を証明できます。

ベクトルの成分表示を方向余弦を使って書き、内積をとります。

\(\overrightarrow{A}\) =(A,A,A)=A (cosθ,cosθ,cosθ)
\(\overrightarrow{B}\) =(B,B,B)=B (cosω,cosω,cosω)
\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB (cosθcosω+cosθcosω+cosθcosω)

他方で\(\overrightarrow{A}\cdot\overrightarrow{B}\)=AB cosφ なので、
AB cosφ=AB (cosθcosω+cosθcosω+cosθcosω)
A>0かつB>0よりAB>0なので
cosφ=cosθcosω+cosθcosω+cosθcosω

次に2式目については、Acosφ=B の関係式に1式目の結果を代入します。
A cosθ=A等の関係を使って途中の変形を行います。

B=Acosφ
=A (cosθcosω+cosθcosω+cosθcosω)
=(A cosθ) cosω+(A cosθ) cosω+(A cosθ) cosω
=Acosω+ A cosω+Acosω

この2式目のほうの式は、次に見て行くように2つの直交座標においてベクトルの成分の変換公式を導出するのに必要です。(直交座標から直交曲線座標への変換も局所的には可です。)

公式3:2つの直交座標系でのベクトル成分の変換公式

原点を共有する2つの異なる直交座標を考えます。1つの直交座標に対して、もう片方の直交座標が原点を共有した状態で回転したような位置関係です。
この時のベクトルの成分に対する座標変換に対して、方向余弦を使う事ができます。

ここで言う「ベクトルの成分に対する座標変換」とは、
1つの直交座標における成分で表されたベクトルが、空間での大きさと向きは同じにしたままで
「別の直交座標から見た時」にはどのような成分で書けるだろうか?という問題です。

得られる公式は形が規則的ではあるのですが、3軸の3軸に対する方向余弦を考える必要があるので合計9個の方向余弦を必要とします。
それらは1~3の番号の組み合わせを使うと処理をしやすい場合もありますが
(線形変換的な式なので、特に行列などを使う場合など)、
ここではx,y,zとX,Y,Zの文字で区別を行う事にします。

原点を共有する2つの直交座標間の変換公式

原点を共有するxyz系とXYZ系の2つの直交座標軸があり、
片方はもう片方に対して原点回りに回転したような位置配置となっているとします。
この時にx,y,zの軸上のベクトルからX,Y,Zの軸への方向余弦を考えます。
x軸上のベクトルに対するY軸への方向余弦を cosθxYのように書く事にすると、
xyz座標系で成分を考えたベクトル\(\overrightarrow{A}\) =(A,A,A)(\(\neq\overrightarrow{0}\))を
XYZ座標系の成分(AX,AY,AX)で書く時の変換の式は次のようになります。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz

また、逆にXYZ座標系の成分で書かれた(AX,AY,AX)を
xyz座標系の成分(A,A,A)で書くには次のような変換をします。

  • A=AXcosθXx +AYcosθYx +AZcosθZx
  • A=AXcosθXy +AYcosθYy +AZcosθZy
  • A=AXcosθXz +AYcosθYz +AZcosθZz

後述しますが、2つの異なるベクトルに対してこの変換を適用した時に
2つのベクトルの内積は変換前と変換後で値は同じ(=不変)になります。
(そこから前提である2つのベクトルの大きさも変換の前後で値は同じという事も見れます。)

ここでも考えているベクトルはゼロベクトルを除いていますが、考えている2つの直交座標系は原点を共有しているという設定なので、原点におけるゼロベクトルはそもそも変換の必要はなくどちらの座標系でも同じ成分(0,0,0)として共有されている事になります。

上記の変換の3式は線形結合の形なので、次のように行列の積で表現する事もできます。
また、方向余弦の添え字が一定の規則性を持つので行と列に上手く対応させる事ができます。 $$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) $$ 3行3列程度ならわざわざ行列にするよりも普通に式で書く方が早いし分かりやすいと見るか、
行列で見たほうが規則性が明らかで書く手間も少し減ると見るかは人それぞれと思われます。

9つの方向余弦の位置関係を表にして整理すると次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へcosθXxcosθYxcosθZx
y軸へcosθXycosθYycosθZy
z軸へcosθXzcosθYzcosθZz
方向余弦の添え字が規則的で、式が線形結合の形なので行列の積で関係式を書く事もできます。また、ここでのアルファベットの添え字を番号に変えると行列の行と列の番号に対応させる事もできます。

余弦が角度のプラスマイナスで同じ値になる事を考えると、これらの方向余弦は「xyz系の軸からXYZ系の軸への方向余弦」を考えた時と同じ値になります。つまり例えば「z軸からY軸への方向余弦」は「Z軸からy軸への方向余弦cosθZy」と同じものを使ってよいという事です。
ただしxyz系の軸からXYZ系変換への公式は導出過程に由来して、
単純にx,y,zとX,Y,Zの置き換えをすればよいわけではなく
「x軸から考えた場合の3つの方向余弦」を使う必要があります。
表で言うと、
XYZ系への変換では1つの変換につき「縦」の3つを使うのに対して、
xyz系への変換では1つの変換につき「横」の3つを使う事になります。

ここで具体的な角度よりも「余弦の値」自体のほうが基本的に重要となる事を考えて、
方向余弦を cosθXy=CXyのように略記すると次のように書けます。

方向余弦X軸からY軸からZ軸から
x軸へCXxCYxCZx
y軸へCXyCYyCZy
z軸へCXzCYzCZz

さらに、添え字をアルファベットではなく1~3の番号だけで書くと次のようになります。

方向余弦X軸からY軸からZ軸から
x軸へC11C12C13
y軸へC21C22C23
z軸へC31C32C33

変換後の式が線形変換の形になっている事に由来して方向余弦の配列を行列として扱う時には、添え字の組み合わせと行・列の番号が一致するので便利な事もあります。また、和をシグマ記号で表したい時も添え字がアルファベットではなく番号になっているほうが便利です。
ただし2種類の添え字を同じ1~3の番号で表すと、どの軸からどの軸への方向余弦を考えているかといった図的な位置関係は少し見えにくくなります。そのため、この記事では番号ではなくアルファベットによる添え字を使用しています。いずれの表示方法でも表現する事自体は同じです。

この公式の変換は原点を始点として考えていますが、任意の点を始点とする場合でもそこを基準に考えるかベクトルを原点に平行移動して考える事によって変換公式を適用する事ができます。直交座標系ではベクトルの向き(および大きさ)を保ったまま平行移動を行っても軸とのなす角は同じ値に保たれます。つまり方向余弦の値も同じものが使えるので、上記の変換公式を適用できます。

証明

変換公式の証明には前述の「ベクトルの直線への射影と方向余弦の関係式」を使います。本質的には、意味を把握しているならその関係式に当てはめる事で変換の式はそのまま導出できます。

(再掲)ベクトルの直線への射影と方向余弦の関係式

前述の公式を書くと次の通りです。
ここでは射影ベクトルの始点からの距離を表すほうの式だけを使います。 $$\large{B=A_x\cos\omega_x+A_y\cos\omega_y+A_z\cos\omega_z}$$ 変換公式の証明用に変数を対応させると次のようになります。 $$\large{A_X=A_x\cos\theta_{Xx}+A_y\cos\theta_{Xy}+A_z\cos\theta_{Xz}}$$ 実はこれで変換公式の証明に既になってしまっているのですが、
以下もう少し詳しく説明を加えます。

まず、xyz系からXYZ系への変換を考えたいので
「AをA,A,Aと方向余弦で表す」事を考えます。
そこで、ベクトル\(\overrightarrow{A}\)のXYZ系の各軸への射影を1つずつ考えます。
すると、ベクトルの終点から軸に下ろした垂線の足と始点までの距離は、
実はそれがそのまま「XYZ系における座標成分」になっています。

すると「X軸からのx軸」「X軸からのy軸」「X軸からのz軸」への方向余弦を考えて、公式に当てはめればXYZ系でのベクトル\(\overrightarrow{A}\)の「X成分」が得られるという流れです。
それが AX=AcosθXx +AcosθXy +AzcosθXzの式になります。

Y軸についても同様に「Y軸からのx軸」「Y軸からのy軸」「Y軸からのz軸」への方向余弦を考え、
Z軸についても同様に「Z軸からのx軸」「Z軸からのy軸」「Z軸からのz軸」への方向余弦を考えて
AY=AcosθYx +AcosθYy +AcosθYz および
AZ=AcosθZx +AcosθZy +AcosθZz の式を得ます。

逆変換の式の場合

同じ考え方で、XYZ系の成分で表されたベクトルをxyz系の成分で表す逆変換の式も作れます。
ただし「考え方」が同じでも使う方向余弦が違ってくるので注意も必要です。【余弦の値自体はx軸からY軸の方向余弦はY軸からx軸への方向余弦と同じものを使えます。cosθ=cos(-θ)であるため。】

xyz系からの変換を考える時には、使う方向余弦は次のようになります。

Aを表すために使う方向余弦Aを表すために使う方向余弦Aを表すために使う方向余弦
「x軸からX軸」cosθXx
「x軸からY軸」cosθYx
「x軸からZ軸」cosθZx
「y軸からX軸」cosθXy
「y軸からY軸」cosθYy
「y軸からZ軸」cosθZy
「z軸からX軸」cosθXz
「z軸からY軸」cosθYz
「z軸からZ軸」cosθZz

XYZ系からの変換の時とは微妙に違っていて、各変換の式で使用する方向余弦のうち1つは共通していて残り2つは異なっています。(行列表示で言えばcosθXxなどの対角成分は共通していて、残り2つが違うものになっています。)

式で使うベクトル\(\overrightarrow{A}\)の成分についてはXYZ系での成分であるA,A,Aを使用します。
これらによって、xyz系での成分であるA,A,Aを表す式を得るわけです。

すなわち
A=AXcosθXx +AYcosθYx +AZcosθZx
A=AXcosθXy +AYcosθYy +AZcosθZy
A=AXcosθXz +AYcosθYz +AZcosθZz の3式が導出されます。

局所的には直交曲線座標への変換にも適用可能である件

上記の方向余弦による直交座標間のベクトルの変換公式は、
局所的には極座標や球面座標などの「直交曲線座標」にも適用可能です。
その事についてもここで簡単に触れておきます。

ここで「局所的に」というのは、直交曲線座標においては1つ1つの点において2つまたは3つの座標曲線(極座標だと同心円と放射状に伸びる直線)の接線ベクトルが互いに直交するので、そこに限定して見れば「直交座標とみなせる」という事を指します。

ただし直交曲線座標では一般的に、そのような局所的には直交座標の軸とみなせる接線ベクトルも位置を変えれば向きが変わってしまいます。ですので直交曲線座標においては「向きが異なる局所的な直交座標」が至るところに存在するという感じです。

そのため、直交曲線座標に対して上記の変換公式を使う時には方向余弦を微分や偏微分を使って表します。そのようにする事で、変換の式が座標変数による関数として表せるので、結果的に領域全体での変換を表す事が可能になります。これは微分方程式に対して基本ベクトルを変更する形での極座標変換を行う時などに重要になります。

基本ベクトルを変更しない形での微分方程式の極座法変換もあり、その場合には方向余弦を使った公式は不要になります。
方向余弦を使った変換公式を適用する必要があるのは力ベクトルなども含めたベクトル場の成分をx,y,zではなくr,θ,φで表し、rやθによる変化を考えたい場合です。

直交座標から直交曲線座標へのベクトルの成分の変換を行う時には方向余弦を微分や偏微分によって表す事になります。微積分・ベクトル解析的な考察は多少必要ですが、方向余弦による変換の公式自体は直交座標同士の変換の場合と同じ形で考える事ができます。図で、方向余弦はCの文字と添え字によって略記しています。
直交曲線座標への変換での方向余弦の具体的な関数形は表し方が2通りあり、いずれも微分・偏微分によって表されます。

公式4:直交座標変換における方向余弦の関係式

上記は9つの方向余弦を使った「成分についての座標変換の公式」でしたが、
9つの方向余弦自体に対して成立する関係式も公式として存在します。

直交座標の変換における方向余弦同士の関係式

■ J,K =X,Y,Z のそれぞれ(J≠K)に対して次式が成立します。
$$\large{ \cos\theta_{Jx}\cos\theta_{Kx}+\cos\theta_{Jy}\cos\theta_{Ky}+\cos\theta_{Jz}\cos\theta_{Kz}=0 }$$ ■ j=x,y,z のそれぞれに対して次式が成立します。 $$\large{ \cos^2\theta_{Xj}+\cos^2\theta_{Yj}+\cos^2\theta_{Zj}=1 }$$ ■ j, k = x,y,z のそれぞれ(j≠k)に対して次式が成立します。
【j=kの時は第2式になります。】 $$\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0 }$$ ■J=X,Y,Z のそれぞれに対して次式が成立します。
(第1式の左辺でJ=Kとした時に相当。) $$\large{ \cos^2\theta_{Jx}+\cos^2\theta_{Jy}+\cos^2\theta_{Jz}=1 }$$ J≠Kおよびj≠kのもとで
第1式の意味は「XYZ系の2つの軸からのxyz系の1つの軸への方向余弦の積の和は0になる」
第2式の意味は「xyz系の1つの軸からのXYZ系の各軸への方向余弦の2乗和は1になる」
第3式の意味は「xyz系の2つの軸からのXYZ系の1つの軸への方向余弦の積の和は0になる」
という事になります。
第3式でj=kとした場合が第2式、
第1式でJ=Kとした場合が第4式であり、値が変わる事になります。
(j=kとj≠kおよびJ=KとJ≠Kの場合分けで全体を2式にまとめる事もできます。)
第2式と第4式は、空間内の直交座標系の任意のベクトルに対して「各軸への方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

これらの公式は「暗記」するようなものではなく、このような規則的な関係が成立するという認識のもと、もし必要であれば適宜参照すればよいと考えるべきでしょう。後述する「原点を共有する直交座標間の変換の前後でベクトルの内積は不変である」事の証明ではこれらの関係式の一部を使います。

この図での各方向余弦は、略記で記しています。公式が表す結果で考えると、要するに和を考えると0になる関係式と1になる関係式がそれぞれ2つずつ、計4つ存在します。xyz系の軸とXYK系の軸の対応関係から整理すると比較的見やすいかもしれません。

$$ \left(\begin{array}{c} A_X\\ A_Y\\ A_Z\end{array}\right) = \left(\begin{array}{lcr} \cos\theta_{Xx} &\cos\theta_{Xy}&\cos\theta_{Xz}\\ \cos\theta_{Yx} &\cos\theta_{Yy}&\cos\theta_{Zy}\\ \cos\theta_{Zx} &\cos\theta_{Yz}&\cos\theta_{Zz}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right) =\left(\begin{array}{lcr} C_{11} &C_{12}&C_{13}\\ C_{21} &C_{22}&C_{23}\\ C_{31} &C_{32}&C_{33}\end{array}\right) \left(\begin{array}{c} A_x\\ A_y\\ A_z\end{array}\right)$$ のように方向余弦を略記して、さらに行列の要素に対応する番号で表す時には
上記の公式は次のようにも書けます。 $$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$ $$\sum_{n=1}^3(C_{nj})^2=1$$ $$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$ $$\sum_{n=1}^3(C_{Jn})^2=1$$ (J,K=1,2,3は、ここでは行の番号です。j,k=1,2,3はここでは列の番号。)

公式行列要素での表記
 cosθJxcosθKx
+cosθJycosθKy
+cosθJzcosθKz=0
(J≠Kの時)
 cosθXxcosθZx
+cosθXycosθZy
+cosθXzcosθZz=0
【X,Z軸からの方向余弦の積の和】
$$\sum_{n=1}^3C_{Jn}C_{Kn}=0\hspace{5pt}(J\neq K)$$
 cosθXj
+cosθYj
+cosθZj=1

(第3式でj=kの時)
 cosθXy
+cosθYy
+cosθZy=1

【y軸への方向余弦の2乗和】
$$\sum_{n=1}^3(C_{nj})^2=1$$
 cosθXjcosθXk
+cosθYjcosθYk
+cosθZjcosθZk=0

(j≠kの時)
 cosθXxcosθXz
+cosθYxcosθYz
+cosθZxcosθZz=0

【x,z軸への方向余弦の積の和】
$$\sum_{N=1}^3C_{Nj}C_{Nk}=0\hspace{5pt}(j\neq k)$$
 cosθJx
+cosθJy
+cosθJz=0
(第1式でJ=Kの時)
 cosθZx
+cosθZy
+cosθZz=0

【Z軸からの方向余弦の2乗和】
$$\sum_{n=1}^3(C_{Jn})^2=1$$

証明

証明はいずれも内積計算を使いますが、2乗和の形の式はそれ以外の方法でもできます。
ここで考えるベクトルは任意のベクトルではなく「始点と終点が軸上にあるベクトル」です。
以下、そのようなベクトルを「軸に重なるベクトル」と呼ぶ事にします。
1つの座標系における軸に重なるベクトルであっても、別の座標系から見た成分で書くと通常のベクトルとして扱われる事になり、その事をここでの証明でも使います。

第1式

第1式については、X,Y,Z軸の異なる2つの軸は直交しますから、それらの軸上のベクトル同士の内積は0です。そこで、ベクトルの成分で内積を計算して0に等しいとする事で証明されます。(同じ1つの軸同士【公式でJ=K】であれば当然直交はせず、内積は大きさの2乗になります。それは第4式の証明です。)

J≠Kの時に J 軸と K 軸(例えばX軸とZ軸)は直交するので、
大きさが P(>0)のJ軸上のベクトル\(\overrightarrow{P}\)について成分はxyz系での座標で書ける事に注意すると
\(\overrightarrow{P}\)= P (cosθJx,cosθJy,cosθJz)
同じように大きさがQ(>0)であるK軸に重なるベクトル\(\overrightarrow{Q}\) は次のように書けます。
\(\overrightarrow{Q}\)= Q (cosθKx,cosθKy,cosθKz)
2つのベクトルは直交するので内積は0であり、
\(\overrightarrow{P}\cdot\overrightarrow{Q}\)=PQ(cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz)=0
PQ≠0なので J≠K であれば
cosθJxcosθKx+cosθJycosθKy+cosθJzcosθKz=0

第2式

第2式については、xyz系の軸に重なるベクトルから見て考えます。
xyz系のj軸(例えばy軸)に重なる大きさ(p>0)のベクトル\(\overrightarrow{p}\)を考えて、
成分をXYZ系の座標として書きます。
方向余弦はXYZ系からxyz系へのものを選んで使う事ができ、
k軸からX,Y,Zに向かうものを選ぶ事に注意すると次のように書けます。
\(\overrightarrow{p}\)= p (cosθXj,cosθYj,cosθZj)
同じベクトル同士の内積\(\overrightarrow{p}\cdot\overrightarrow{p}\)を考えるか、
成分で計算したベクトルの大きさ=pと考える事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=p(cosθXj+cosθYj+cosθZj)=p
p>0なので
cosθXk+cosθYk+cosθZk=1

この式は第3式でj=kとして考えた場合でもあります。

第3式

第3式はxyz系から見て、第1式の時と同じように考えます。
j,k=x,y,zでj≠kのもとで、p>0およびq>0が大きさである
j軸とk軸に重なる2つのベクトルを考えると、2つのベクトルは直交します。
両者をXYZ系の座標で書き、内積を成分で計算して0になるとおくと結果の式を得ます。
\(\overrightarrow{p}\)= p(cosθXj,cosθYj,cosθZj)
\(\overrightarrow{q}\)= q (cosθXk,cosθYk,cosθZk)
\(\overrightarrow{p}\cdot\overrightarrow{q}\)=pq(cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk)=0

p>0かつq>0なのでj≠kであれば
cosθXjcosθXk+cosθYjcosθYk+cosθZjcosθZk=0

第4式

第4式は、第1式において大きさがP (>0)の1つのベクトル同士の内積か大きさを成分で計算する事で結果の式を得ます。
\(\overrightarrow{P}\cdot\overrightarrow{P}\)=P(cosθJx+cosθJy+cosθJz)=P
P>0なので
cosθJx+cosθJy+cosθJz=1

第2式と第3式はxyz系から見て計算を考えましたが、得られた方向余弦の関係式はXYZ系をxyz系に変換する場合でも成立しているので必要があれば使ってもよい事になります。
また、第2式と第4式に関しては成分を考えている座標系だけから見れば「ある1つのベクトル」を考えている事になります。そのため、前述の「方向余弦の2乗和は1になる」という公式と実は同じものであるという見方もできます。

方向余弦を使った直交座標の変換の前後において内積は不変である事の証明

座標変換をした時に値が変わらない量(「不変量」)についての考察は数学的に重要で、扱う対象によっては物理学でも重要となる場合もあります。

ところで前述の原点を「共有する直交座標同士のベクトルの成分の変換」は、ベクトル自体はいじっていないはずなので変換前と変換後で大きさは「同じはず」です。もしも、現に計算したらベクトルの大きさの値が変わってしまうなどという結果が出たら整合性がとれず困った事になります。
しかし実際は計算をしてもベクトルの大きさは同じ値に保たれる事が数式でも分かります。
そして実は、変換前と変換後ではベクトルの大きさだけでなく内積が同じ値に保たれているのです。

方向余弦を使った座標変換の前後における内積

2つのベクトルの成分を、原点を共有する2つの直交座標間で変換するとします。
\(\overrightarrow{A}\) =(A,A,A)および\(\overrightarrow{B}\) =(B,B,B)を考えて、
変換後の座標はそれぞれ
(AX,AY,AZ)および(BX,BY,BZ)であるとします。
この時に2つのベクトルの内積\(\overrightarrow{A}\cdot\overrightarrow{B}\) の値は、変換前のxyz系の座標成分で計算しても、
変換後の座標成分で計算しても同じ値になります。 $$\overrightarrow{A}\cdot\overrightarrow{B}=A_xB_x+A_yB_y+A_zB_z=A_XB_X+A_YB_Y+A_ZB_Z$$ 同じベクトル同士の内積を考える事により、
変換の前後でベクトルの大きさも同じ値に保たれる事も確認される事になりす。
(外積ベクトルについては変換によって異なるベクトルに変化してしまいます。)

証明

変換後の成分で内積を計算し、変換前の内積の値に等しくなる事を示します。

2つのベクトルの変換について、使用する方向余弦は「座標軸から座標軸へのもの」なので共通して使う事ができます。

  • AX=AcosθXx +AcosθXy +AcosθXz
  • AY=AcosθYx +AcosθYy +AcosθYz
  • AZ=AcosθZx +AcosθZy +AcosθZz
  • BX=BcosθXx +BcosθXy +BcosθXz
  • BY=BcosθYx +BcosθYy +BcosθYz
  • BZ=BcosθZx +BcosθZy +BcosθZz

さて、これの内積を計算するとなるとX成分だけで見ても9つの項ができる事になりますが
規則性があるので全体としても3項の和の塊が9つという形です。
さらに前述の座標変換時の方向余弦に関する関係式を使うと、実は多くの部分が0になるのです。

  1. ABcosθXx+ABcosθYx+ABcosθZx=AB
    【∵cosθXx+cosθYx+cosθZx=1】
  2. ABcosθXxcosθXy+ABcosθYxcosθYy+ABcosθZxcosθZy=0
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0】
  3. ABcosθXxcosθXz+ABcosθYxcosθYz+ABcosθZxcosθZz=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0】
  4. ABcosθXy+ABcosθYy+ABcosθZy=AB
    【∵cosθXy+cosθYy+cosθZy=1】
  5. ABcosθXycosθXx+ABcosθYycosθYx+ABcosθZycosθZx
    【∵cosθXxcosθXy+cosθYxcosθYy+cosθZxcosθZy=0(2番目の計算と同じ)】
  6. ABcosθXycosθXz+ABcosθYycosθYz+ABcosθZycosθZz=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0】
  7. ABcosθXzcosθXx+ABcosθYzcosθYx+ABcosθZzcosθZx=0
    【∵cosθXxcosθXz+cosθYxcosθYz+cosθZxcosθZz=0(3番目の計算と同じ)】
  8. ABcosθXzcosθXy+ABcosθYzcosθYy+ABcosθZzcosθZy=0
    【∵cosθXycosθXz+cosθYycosθYz+cosθZycosθZz=0(6番目の計算と同じ)】
  9. ABcosθXz+ABcosθYz+ABcosθZz=AB
    【∵cosθXz+cosθYz+cosθZz=1】

ここでは一応全部記してみましたが、
「2番目と5番目」「3番目と7番目」「6番目と8番目」は
掛け合わせる方向余弦の順番が違うだけで実質的に同じ計算であり、しかも値が0になります。
つまり6式については実は3組のほぼ同じ計算の式で、しかも0になって消えるわけです。
残るのは他の3つだけで、それらは方向余弦の部分が上手い具合に1になります。
よって、XYZ系に成分を変換後の内積の値は
AB+AB+ABとなり、
これは変換前の内積の値に一致するわけです。

シグマ記号で計算する場合、1~3の番号を使った処理も可能です。

XYZ系からxyz系への逆変換の式でも、内積の不変性は同様に証明も同様に可能です。

乗じる項の順番が異なるだけで実質的に同じ計算になる2組の箇所が3つあったのはあながち偶然ではなくて、実は行列の非対角部分でC12とC21のような転置の配置にある要素の組がそれらに該当します。
また、計算結果が0にならなかった部分は対角部分の3つです。
ここでの変換の場合に方向余弦が行列の要素に対応するような結果の式であったので、そのような規則性が見れるわけです。

上記の証明について、シグマ記号を使った証明も記します。
番号を使ってやる事も可能ですが、ここではアルファベットのままやる方法を書きます。
方向余弦はcosθXz=CXzのような略記号を使います。$$\large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{J=X,Y,Z}A_JB_J}$$ $$\large{=\sum_{J=X,Y,Z}\left\{\left(\sum_{j=x,y,z}C_{Jj}A_j\right)\left(\sum_{k=x,y,z}C_{Jk}B_k\right)\right\}}$$ $$\large{=\sum_{J=X,Y,Z}\left(\sum_{j,k=x,y,z}C_{Jj}C_{Jk}A_jB_k\right)}$$ $$\large{=\sum_{j,k=x,y,z}\left\{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)\right\}}$$ この式をよく見ると、1つのJを決めてj,k=x,y,zについて加え合わせた時に、
前述の公式によりj=kの場合以外は0になる事が分かります。 $$j\neq kの時、\large{ \cos\theta_{Xj}\cos\theta_{Xk}+\cos\theta_{Yj}\cos\theta_{Yk}+\cos\theta_{Zj}\cos\theta_{Zk}=0なので、 }$$ $$j\neq kの時、\large{A_jB_k\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jk}\right)=0}$$ よって内積はk=jの項だけ考えればよい事になりますが、
k=jの時は同じ形の式が1になるので結局、方向余弦は全て式から無くなります。
整理すると、次のようになります。 $$ \large{\overrightarrow{A}\cdot\overrightarrow{B}=\sum_{j=x,y,z}\left\{A_jB_j\left(\sum_{J=X,Y,Z}C_{Jj}C_{Jj}\right)\right\}} $$ $$\large{=\sum_{j=x,y,z}\left(A_jB_j\right)}$$ これによってXYZ系の成分による内積の結果と、
xyz系の成分による内積の結果が等しい事が示されます。

【群論】可解群の性質

可解群(solvable group)とは、群に対して交換子群列を作った時に
(G)={e}【単位元だけからなる】となる自然数kが存在する群Gの事です。以下、D(G)(=D(G))はGの交換子群で、D(G)=D(D(G))、D(G)=D(D(G))、・・・等とします。

◆可解群に関しては、次の定義をする事もあります:
群Gに対して有限個の正規部分群の列Hがあり【jは自然数、H=G】、次のようにGの正規部分群同士でもHはHj-1の正規部分群になっているものとする。$$G=H_0\triangleright H_1 \triangleright H_2\triangleright H_3\triangleright \cdots\triangleright H_{n-1} \triangleright H_n=\{e\}$$さらに剰余群Hj-1/Hは可換であるとする。このような時、Gを可解群と呼ぶ。
この定義は、実は交換子群を使った方の定義と同等のものです。以下の議論では交換子群を使ったほうの定義で話を進めていきます。

可解群の性質7つ

可解群のいくつかの重要な性質をまとめると次のようになります。

可解群とその性質

交換子群列を作った時に$$G\supset D_1(G)\supset D_2(G)\supset D_3(G)\supset \cdots\supset D_k(G)=\{e\}$$ となる自然数kが存在する時にGを可解群と言い、次の性質があります。

  • 可換である群は全て可解群である。
  • 可解群の部分群も可解群である。
  • 可解群の剰余群も可解群である。
  • Gの正規部分群Nに対して、Nと剰余群G/Nが共に可解群ならばGも可解群となる。
  • Gの正規部分群Nに対して、剰余群G/Nが可換群になる必要十分条件は、NがD(G)を含む事【N⊃D(G)】である。
  • 可解群の交換子群列のうち、隣り合うもの同士の剰余群Dj-1(G)/D(G)
    【D(G)/D(G)等】は可換群である。
  • 可換群を交換子群列で定義したものとGの正規部分群の列で定義したものは、必要十分条件で結ばれるので互いに同等である。

言葉として「可換」と「可解」が似ていて紛らわしいので注意。

以下、証明をしていきます。

①可換である群は全て可解群

まず最初は簡単です。
{e}の交換子を作ってもeにしかならないので、交換子群列は一度{e}になるとその先の交換子群はずっと{e}です。可換群はそもそも任意の交換子が単位元eであるわけですから、「可換群は可解群である」と言えます。

②可解群の部分群も可解群

2番目については集合としての包含関係を丁寧に見て行きます。
交換子についてHがGの部分群であれば、Gの交換子群にはHの元で作った交換子も全て含まれるので、D(G)⊃D(H)です。【交換子群列の中ではこれはD(G)およびD(H)】
すると、今度はD(G)の交換子群とD(H)の交換子群についても同じ事が言えるわけですから、D(G)⊃D(H)です。
以下同様にして任意の自然数jについてD(G)⊃D(H)です。
ここで、Gが可解群であればD(G)={e}となるkが存在するので、
その番号において{e}⊃D(H)であり、
それを満たせるのは同じく単位元だけからなる群しかないのでD(H)={e}であり、従ってHも可解群である事を意味します。

③可解群の剰余群も可解群

3番目は、剰余類と剰余群の性質を丁寧に扱う必要があります。
次にNをGの正規部分群として剰余群G/Nの交換子を考えます。
Gの元xとyを使って、交換子群D(G/N)の元は
(Nx)-1(Ny)-1(Nx)(Ny)=N(x-1-1xy) と書けます。
【D(G/N)もまた剰余類を元とする群であり、N=Neを単位元とする。】
ここで2つの元の積を元とする別の群ND(G)={nb|n∈N,b∈D(G)}を考えると、
これはNを正規部分群に持つ群となりNによる剰余群を定義できます。
【※一般に、HがGの部分群で\(G\triangleright N\)である時、NはNHの部分群であり、任意のs∈NH(⊂G)に対してsN=Nsとなる(任意のt∈Gに対してそうだから)ので、NはNHの正規部分群。
このタイプの群に対する剰余群は、(NH)/Nの事をNH/Nのように書きます。】
剰余群ND(G)/Nの元はN(nb)=(Nn)bですが、
Nが群でn∈Nに対してNnは集合としてはNとして全く同じ物になるので、N(nb)=Nb=N(x-1-1xy)
よって、全く同じ元を持つのでD(G/N)=ND(G)/N
他方、D(G/N)の元uとwを使うとD(G/N)=N(u-1-1uw) ですが、
剰余群ND(G)/Nの元は先ほどと同じくn∈Nを考えると
N(nu-1-1uw)=(Nn)(u-1-1uw)=N(u-1-1uw) となり、
(G/N)=ND(G)/N という事にもなります。
全く同じ論法で、任意の自然数jに対してD(G/N)=ND(G)/N が成立します。
すると D(G)={e}となるkにおいて、
ND(G)/N の元はN(ne)=Ne=N【剰余群の単位元】ただ1つという事になり、
(G/N)=ND(G)/N=N となってG/Nも可解群であるという結果になります。

④正規部分群Nと剰余群G/Nが共に可解群 ⇒ Gも可解群

次に4番目の性質ですが、これも1つ1つの式を丁寧に紐解きます。
G/NとNが共に可解群である場合には、
①:Dk1(G/N)=Ne=N かつ
②:Dk2(N)={e}
となる自然数kとkが存在します。
この時、前述において示した事からDk1(G/N)=NDk1(G)/N であるわけですが、
k1(G/N)=NですからN=NDk1(G)/Nという事になり、
実はDk1(G)⊂Nが成立しています。
【※n∈Nおよびb∈Dk1(G)として、NDk1(G)/Nの元N(nb)=Nb は集合としてNに等しくならないといけないので、bはNの元である必要があります。それがDk1(G)⊂Nの意味です。】
すると、Dk2(N)⊃Dk2(Dk1(G)) です。
ここで、Dk2(Dk1(G))とは
「すでにGから始めてk回交換子を作る演算を行ってできた交換子群に対し、
そこを起点として改めてk回交換子を作る演算を行ってできた交換子群」です。
従って、Gから始めて(k+k)回の交換子を作る演算を行ったDk1+k2(G)に等しいという事です。
よってDk2(N)⊃Dk2(Dk1(G))=Dk1+k2(G)であり、
k2(N)={e}でしたから、{e}⊃Dk1+k2(G) であり、
これを満たすにはDk1+k2(G)={e}しかあり得ず、それを満たす自然数k+kが存在する事になります。よって、おおもとの群Gも可解群である事になります。

この4番目の性質について、特に次のような特別な場合には1つの命題が成立します。
以下、Hは群であるとします。

$$H_n\triangleright H_{n-1}\triangleright H_{n-2} \triangleright \cdots H_3\triangleright H_2\triangleright H_1\triangleright \{e\}$$

ここで、もし\(H_{j+1}\triangleright H_j\) が任意の自然数jについて成立し、剰余群Hj+1/Hが可解群であり、
またHも可解群であったとしましょう。

そのような特別な場合が発生する時、Hが可解群であり、H/Hも可解群ですからHも可解群です。
そしてH/Hも可解群なので、Hも可解群です。
同様にして、任意の自然数jについてHは可解群という事になります。
より具体的には、例えば剰余群Hj+1/Hが巡回群であれば可換群ですから可解群という事にもなります。そのようなタイプの群は、ベキ根で解ける多項方程式のガロア群を論じる時に出てきたりします。

⑤剰余群G/Nが可換群 ⇔ NがD(G)を含む事

【これは交換子群一般について言えます。性質として特に可解群に関係が深いです。】
5番目の性質については、まずG/Nの元の積を順番を変えて書いてみます。
xとyをGの元として、
(Nx)(Ny)=N(xy) と(Ny)(Nx)=N(yx) の2パターンありますが、
もしN(xy)=N(yx)であるのなら
【※ここでの括弧は分かりすくするためにつけているだけで、Nxy=Nyxと書いても同じ】
-1-1を右から乗じる事によって
N(xyy-1-1)=N(yxy-1-1) ⇔ N=N(yxy-1-1)
これが成立するためには、yxy-1-1がNの元でなければなりませんが、
yxy-1-1はGの交換子です。
【yxy-1-1の逆元はxyx-1-1
よって、G/Nが可換という事は任意のD(G)の元が例外なくNの元でもある事、
つまりD(G)⊂Nを意味します。
逆にD(G)⊂Nならば
N=N(yxy-1-1) ⇔ N(xyy-1-1)=N(yxy-1-1) のように逆にたどって、
右側からxyを乗じればN(xy)=N(yx)となり、剰余群G/Nは可換である事になります。

⑥交換子群列の隣り合う交換子群の剰余群は可換

6番目の性質については、交換子群列において例えばD(G)⊃D(G)のような包含関係があり、
しかもそれらは群と正規部分群の関係にあって\(D_2(G)\triangleright D_3(G)\) のようになっています。
そこで剰余群D(G)/D(G)の可換性を調べてみると、
(G)とは「D(G)の交換子群」なのでD(G)=D(D(G)) とも書けます。
集合が(群も含めて)等号で結ばれるという事は
「D(G)⊃D(D(G))かつD(G)⊂D(D(G))」という事ですから、
【上述の5番目の性質により】D(G)⊃D(D(G)) ⇔「D(G)/D(G) は可換である」事になります。
同じように任意の自然数jとj+1の交換子群についても
(G)=D(Dj+1(G)) ⇒ D(G)⊃D(Dj+1(G))
⇔「D(G)/Dj+1(G) は可換である」という事が言えます。
可解群の場合、最後{e}になっている部分についても同様に
{e}=D(Dk-1(G)) からDk-1(G)/{e}=Dk-1(G) が可換であるという事が言えます。
【{e}=D(Dk-1(G))という事自体から、
交換子群の性質によりDk-1(G)の任意の要素は可換であるとも言えます。】

あるいは、交換子群の性質により「G/D(G)は可換である」と言えるので、
これをD(G)/Dj+1(G)にも適用して示す事もできます。本質的に同じ証明です。

⑦2つの定義は同等である事

最後に7番目の性質として、2つの定義が同等である事を示します。
まず、交換子群列のほうの定義の場合での性質からDj+1(G)はD(G)の正規部分群であり、
剰余群D(G)/Dj+1(G)は可換であると言えるわけですから、
そのような部分群の列が存在するので
「交換子群列の定義 ⇒ 正規部分群と剰余群の可換性のみの定義」が言えます。

次に逆の場合です。$$G=H_0\triangleright H_1 \triangleright H_2\triangleright H_3\triangleright \cdots\triangleright H_{n-1} \triangleright H_n={e}$$の関係のもとで剰余群Hj-1/Hが可換であったとします。
この時には「G/Nが可換群 ⇔ D(G)⊂N」【上記5番目の性質】である事を思い出すと、
「G/Hが可換」なのでD(G)=D(G)⊂Hという事が言えます。
この時D(D(G))⊂D(H) ⇔ D(H)⊃D(G)でもあります。
【A⊂B ⇒ D(A)⊂D(B) 】
同様に「H/Hが可換」なのでD(H)⊂Hであり、先ほどのD(H)⊃D(G)と合わせると
⊃D(H)⊃D(G)が成立します。
以下、同様にH⊃D(G)、H⊃D(G)⊃D(G)⊃D(G)・・・・と続きます。
最後の部分でD(G)⊂H={e}となりますが、これはD(G)={e}を意味します。
よって、交換子群列の中で{e}となる交換子群が存在するので
「正規部分群と剰余群の可換性のみの定義 ⇒ 交換子群列の定義」が言えます。
よって、2つの定義は必要十分条件で結ばれるので同等な定義である事になります。

【群論】交換子・交換子群・交換子群列

交換子群は多項方程式の可解性(ベキ根で解ける事)との関連性が非常に深い群です。

交換子と交換子群

Gがあって、xとyがその元であるとします。
この時、xyとyxは等しいとは限りません。

他方で、x-1-1xy という4つの元の積からなる別の元を考えてみて、
これを [x,y] と書く事にして「交換子」(commutator)と呼ぶ事にすると、
[x,y][y,x]=[y,x][x,y]=e【単位元】となります。
【[y,x]=y-1-1yxで、[x,y][y,x]=x-1-1xyy-1-1yx=e】
つまり、任意の群の交換子[x,y]と[y,x]は互いに逆元の関係にあなります。

また、次のような性質もあります。
yx[x,y]=xyであり、
xy[x,y]-1=yx 【2番目の式はxy[y,x]=yx でも同じ】
であるという関係式が成立します。
【群の逆元の演算規則により、(x-1-1xy)-1=y-1-1yxである事に注意】
つまり、右から乗じる(逆元の形も含めて)事で任意の積の順序が入れ替わる作用も持ちます。

ここで、交換子が「単位元eに等しい」という場合があり、次の事が成立します。

群の任意の元に対してx-1-1xy=eならばxy=yxです。
つまり、群の任意の交換子が単位元に等しいならば群は可換である という事です。
(逆に、群が可換であれば任意の2つの元で作る交換子は単位元に等しい。)
◆証明:
両辺にyxを左から乗じて、x-1-1xy=e ⇒ xy=yx
両辺に (yx)-1=x-1-1 を左から乗じて、xy=yx ⇒ x-1-1xy=e
∴ x-1-1xy=e ⇔ xy=yx

実際、もとから可換であれば xy=yxなので当然xye=yxという、
一般の交換子が持つ作用と同じ形の関係式が成立するわけです。

そのような交換子の形をした元から成る群(これはGの部分群になる)を交換子群と言います。
D(G)={x-1-1xy|x∈G,y∈G}です。

Gの2つの部分群の元を使った交換子群を考える場合には括弧積 [ ] を使った書き方もします。
[A,B]={a-1-1ab|a∈A,b∈B}【A⊂G,B⊂G】

交換子群の性質

交換子群については、群Gの部分群としていくつかの性質があります。

交換子群の性質
  • 交換子群D(G)はGの正規部分群
    \(G\triangleright D(G)\)
  • 剰余群G/D(G)【D(G)が正規部分群なので定義できる】は可換
  • Gの正規部分群Nに対して剰余群G/Nが可換ならば、D(G)はNの部分集合となる。
    \(G\triangleright N \Rightarrow D(G)\subset N\)
  • 交換子群は可換な剰余群を作る正規部分群としては最小のものとなる。

正規部分群とは、Gの任意の元に対してtN=Nt【集合として同じものになる】
が成立するGの部分群Nの事であり、
剰余群とはGが正規部分群Nを持つ時に定義されるもので、Gの元に対する剰余類を元とする群です。
Nx、Nyを考えた時に、剰余群の積は(Nx)(Ny)=N(xy) 、逆元は(Nx)-1=N(x-1)と定義します。

◆交換子群の性質の証明:
tをGの任意の元とします。すると
t(x-1-1xy)t=(t-1-1t)(t-1-1t)(t-1xt)(t-1yt)
=(t-1xt)-1(t-1yt)-1(t-1xt)(t-1yt)∈D(G)
【t-1xtの形の元は交換子の形になっているため】
であり、tD(G)t-1⊂D(G)
【これはD(G)がG正規部分群であるために十分な条件。】
∴\(G\triangleright D(G)\)

次に、剰余群G/D(G)を考えると剰余類【これが剰余群の元】はD(G)x、D(G)yなどと書けますが、
G/D(G)の交換子を考えると
(D(G)x)(D(G)y)=D(G)(xy)【これが剰余群の演算の定義】
また、剰余群の逆元についても同様に考えると、
(D(G)x)-1(D(G)y)-1=(D(G)x-1)(D(G)y-1)=D(G)(x-1-1)
という事は、剰余群G/D(G)に対する「交換子」は
(D(G)x)-1(D(G)y)-1(D(G)x)(D(G)y)=D(G)(x-1-1xy)
しかしx-1-1xy∈D(G)なので、
集合としてD(G)(x-1-1xy)はD(G)に一致します。
D(G)そのものは剰余類としてはD(G)e 【eはGの単位元】であるから、
(D(G)x)-1(D(G)y)-1(D(G)x)(D(G)y)=D(G)e 【D(G)e=D(G)はG/D(G)の単位元】
∴任意の元で作った交換子が単位元に等しいのでG/D(G)は可換。

剰余群G/Hが可換であるなら剰余類【剰余群の元】について
H=He=H(x-1xy-1y)=H(x-1-1xy)【xとyはGの元】
つまり、H(x-1-1xy)は集合としてHに等しく、
Gの交換子群の任意の元はHの要素となるため、D(G)⊂H

Gの交換子群でない任意の可換な正規部分群は交換子群を含むので、交換子群よりも小さな正規部分群は他にはない。交換子群も可換な正規部分群なので、可換な正規部分群のうち最小のものという事になります。

交換子群列

交換子の理論の中でも、特に多項方程式の可解性に関わるのが交換子群列です。

Gの交換子群をD(G)とし、D(G)の交換子群をさらにD(G)とします。そしてさらにD(G)の交換子群を考えてD(G)とし、さらにD(G)の交換子群をD(G)とします。
・・・そういう感じでD(G)の交換子群をDk+1(G)という形で定義していくと、\(D_k(G)\triangleright D_{k+1}(G)\) となるような群の列ができます。その列を交換子群列と言います。

交換子群列

交換子群列とは、交換子群によって作る次のような列の事です。 $$G=D_0\supset D_1(G)\supset D_2(G)\supset D_3(G)\supset D_4(G)\cdots$$ $$D_{k+1}(G)はD_1(k)の交換子群$$

ところで、そのように交換子群列を次々に続けていった時に、無限に続くのか有限で終わるのかという話があります。これは、続けて行った時に単位元のみからなる{e}が現れた時を「終わり」という事にすると、有限で終わるものとそうでないものがあります。

(G)={e}となる自然数kが存在する時、おおもとの群Gを特に可解群と言います。
なぜそのように呼ぶのかというと、その大きな理由は「多項方程式が『ベキ根で解ける』時、解による拡大のガロア群の交換子群列は有限回で{e}で終わる(=可解群である)」という性質によります。

ところが、5次以上の多項方程式においてそのガロア群は対称群(置換群)であり【正確にはそれと同型】、
実は5次以上の対称群は可解群にならないのです。よって、一般の5次以上の多項方程式は「ベキ根で解ける(=係数とベキ根を使った解の公式が存在する)」部類の多項方程式に属さない、という命題が成立します。
一般の1~4次方程式のガロア群は可解群になります。

$$可解群:D_k(G)={e}となるようなkが存在する群G$$

平行四辺形の面積【ベクトルでの公式】

平行四辺形の面積は「底辺×高さ」です。(参考:台形の面積公式と同じ考え方)
他方で、「直交座標上の2つのベクトルが作る平行四辺形」の面積を、
「ベクトルの大きさと内積」あるいは「ベクトルの成分」で表す方法と公式があります。

(ベクトルが作る「三角形」の面積については、単純に平行四辺形の面積を半分個を考えます。)

ベクトルが作る平行四辺形の面積

原点を始点とする2つのベクトル\(\overrightarrow{a}=(a_1,a_2)\) と \(\overrightarrow{b}=(b_1,b_2)\) があり、なす角度がθであるという。
その時に、2つのベクトルを組み合わせて作られる平行四辺形の面積Sは次の公式で計算できます: $$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}=|a_1b_2-a_2b_1|$$

後述するように、考え方は3次元での2つの空間ベクトルが作る平行四辺形にも適用できます。

平面ベクトルの場合

まず、考え方としては単純に「底辺×高さ」で行きます。

そして、「底辺」の長さについては1つのベクトルの大きさを使います。

次に、もう1つのベクトルの大きさの正弦が「高さ」になるのです。

そこで、三角比の公式 sinθ+cosθ=1を使って正弦を余弦で表します。
(この公式は三角関数の範囲の一般角でも成立します。)

$$底辺:|\overrightarrow{a}|$$

$$高さ:|\overrightarrow{b}|\sin\theta$$

$$公式から【0<\theta <\piの時】:\sin\theta=\sqrt{1-\cos^2\theta}$$

$$\left(-\pi<\theta <0の時は\sin\theta=-\sqrt{1-\cos^2\theta}ですが、面積を考える時はその絶対値を考えます\right)$$

平面ベクトルが作る平行四辺形の面積

さらに余弦をベクトルの内積と大きさで表せる事に注意すると、
平行四辺形の面積を「ベクトルの大きさと内積」だけで表せます。ここで、もし2ベクトルが成す角が直角であれば直ちに長方形で面積は確定するので、直角でない時を考えます。

$$\overrightarrow{a}\cdot\overrightarrow{b}=|\overrightarrow{a}||\overrightarrow{b}|\cos\theta$$

$$\cos\theta=\frac{\overrightarrow{a}\cdot\overrightarrow{b}}{|\overrightarrow{a}||\overrightarrow{b}|}$$

以上の事を代入しながら繋げていって、平行四辺形の面積を計算できるわけです。
一見すると無理やり計算しても滅茶苦茶な式になってしまいそうですが、実は分母と分子がうまく噛み合って比較的単純な形になります。(sinθが負になる場合も考慮して絶対値の|sinθ|を考えますが、要するにプラスの値だけ考えるという意味になります。)

$$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|=|\overrightarrow{a}||\overrightarrow{b}|\sqrt{1-\cos^2\theta}$$

$$=|\overrightarrow{a}||\overrightarrow{b}|\sqrt{1-\frac{(\overrightarrow{a}\cdot\overrightarrow{b})^2}{|\overrightarrow{a}|^2|\overrightarrow{b}|^2}}=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2\left(1-\frac{(\overrightarrow{a}\cdot\overrightarrow{b})^2}{|\overrightarrow{a}|^2|\overrightarrow{b}|^2}\right)}$$

$$=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}$$

平方根の根号(√)の中にベクトルの大きさを2乗の形で入れてしまう事で、このようになるわけです。
この式は、平面でも3次元の空間でも成立します。

ここで、さらにベクトルの成分を使うと別の公式を導出できます。

$$\overrightarrow{a}=(a_1,a_2)\hspace{10pt}\overrightarrow{b}=(b_1,b_2)のもとで、$$

$$|\overrightarrow{a}|^2|\overrightarrow{b}|^2=(a_1\hspace{2pt}^2+a_2\hspace{2pt}^2)(b_1\hspace{2pt}^2+b_2\hspace{2pt}^2)=(a_1b_1)^2+(a_1b_2)^2+(a_2b_1)^2+(a_2b_2)^2$$

$$(\overrightarrow{a}\cdot\overrightarrow{b})^2=(a_1b_1+a_2b_2)^2=(a_1b_1)^2+(a_2b_2)^2+2a_1b_1a_2b_2$$

一見ちょっと面倒な形になっていますが、引き算するとなくなる項が出てきます。

$$|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2=(a_1b_1)^2+(a_2b_1)^2-2a_1b_1a_2b_2=(a_1b_2-a_2b_1)^2$$

このように上手く2乗の形になるので、平行四辺形の面積は次のようにも書けるわけです。

$$S=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}=\sqrt{(a_1b_2-a_2b_1)^2}=|a_1b_2-a_2b_1|$$

最後に絶対値記号をつけているのはabーabという値がプラスかマイナスかはその時々によって違うので、どちらにせよ絶対値を考えれば面積になるという意味です。

この公式は、重積分の変数変換の公式の中で使ったりもします。

空間ベクトルの場合

3次元の空間ベクトルの場合でも、同じくベクトルの成分で平行四辺形の面積を表せます。
この場合にはまとめ方がちょっと面倒で、2乗の形の3つの式の和が平方根の中に入る形になります。

$$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|が空間ベクトルでも成立する事に注意して、$$

$$\overrightarrow{a}=(a_1,a_2,a_3)\hspace{10pt}\overrightarrow{b}=(b_1,b_2,b_3)のもとでは、$$

$$S=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}$$

$$=\sqrt{(a_1b_2)^2+(b_1a_2)^2+(a_1b_3)^2+(b_3a_1)^2+(a_2b_3)^2+(a_3b_2)^2-2(a_1b_1a_2b_2+a_1b_1a_3b_3+a_2b_2a_3b_3)}$$

$$=\sqrt{(a_1b_2-b_1a_2)^2+(a_1b_3-b_3a_1)^2+(a_2b_3-a_3b_2)^2}$$

この表示は、3次元ベクトルの外積(ベクトル積、クロス積)を使用する時に使う場合もあります。

◆外積の計算で使う場合には、上記の面積の式は$$S=\sqrt{(a_2b_3-a_3b_2)^2+(a_1b_3-b_3a_1)^2+(a_1b_2-b_1a_2)^2}$$のように順番だけ並び替えたほうが外積ベクトルの成分との対応が明確になります。
平方根の中の2乗になっているそれぞれの項が、実は2次元平面上の「平行四辺形」の形になっている事に注意。これは、3次元空間の中でのちゃんとした幾何的な意味も持っていて、外積ベクトルを使う計算で重要になります。

3次元空間での平行四辺形の面積

体の拡大

代数学での「体」【たい】の拡大という考え方について説明します。

英:拡大体 extension field 部分体 subfield
【体:field 日本語訳は、おそらくドイツ語での名称から。 】

「体」の拡大とは?

実数に対してi=-1となるiを導入して複素数a+biを考える事や、
有理数に対して平方根などを使ってp+q\(\sqrt{2}\) を考える事を、「拡大」と言います。
実数や有理数は「体」(たい)という構造の集合に分類され、拡大を行う事で別の体である「拡大体」という集合ができると解釈します。逆に、拡大した体の側から見た時、もとの体は「部分体」であると言います。

より一般的には、2つの体KとLがあるとしてLがKの拡大体である時、その「拡大」自体の事を記号でL/Kと書きます。この表記を使うと、例えば実数から複素数への拡大は\(\mathbb{C}\)/\(\mathbb{R}\)と表されるわけです。
もちろんこの記号は、対象のKとLが体である時に限って体の拡大としての意味を持ちます。
【通常の数や関数についてはx/yは割り算で、対象が群ならG/Hは剰余群、環であれば剰余環、特に指定のない集合に対しては差集合を表します。】

体の「拡大」
  • \(\mathbb{C}\)は\(\mathbb{R}\)の「拡大体」
  • \(\mathbb{R}\)は\(\mathbb{C}\)の「部分体」
  • 記号では、実数体→複素数体への「拡大」を \(\mathbb{C}\)/\(\mathbb{R}\) と書く。

複素数に関しては複素関数論などでも詳しく扱われるので、ここでは有理数に対するp+q\(\sqrt{2}\)の形の数を元に持つ集合\(\mathbb{Q}\left(\sqrt{2}\right)\)などについて具体例として詳しく見てみます。

平方根の計算を行う時、例えば$$(1+2\sqrt{2}+\sqrt{3})+(2-\sqrt{2}+3\sqrt{3})$$ $$=(1+2)+(2-1)\sqrt{2}+(3+1)\sqrt{3}$$ $$=3+\sqrt{2}+4\sqrt{3} $$のように、「有理数だけの項」「2の平方根の項」「3の平方根の項」ごとに分けて加算や減算を行います。平方根でなくても3乗根でも4乗根でもよく、要するに無理数があれば同じように計算します。

このような時、有理数全体\(\mathbb{Q}\)の元に対して、何か有理数でない別の元を組み合わせて計算を行っているわけです。2+3\(\sqrt{2}\) のような数は「実数」の元であると言うのはもちろん正しい表現ですが、この形の元に限ったものだけを集めて「体」の構造を保つようにしたものは有理数の「拡大体」と見なすことができ、\(\mathbb{Q}\left(\sqrt{2}\right)\) のように書きます。実数に対する複素数と同様に考えるという事です。

$$\mathbb{Q}(\sqrt{2})=\{p+q\sqrt{2}|p,q\in\mathbb{Q}\}$$

このようなものを考える時は、3の平方根などの他の無理数は考えずにp+q\(\sqrt{2}\) の形の数同士の加減乗除の計算を考えます。この時、q=0とすれば通常の有理数になるので、集合として、\(\mathbb{Q}\subset\mathbb{Q}\left(\sqrt{2}\right)\) のような包含関係になります。2の平方根を添加した拡大体のほうが、もとの有理数全体よりも大きい集合です。

この場合の加減乗除の計算自体は通常の平方根を含む計算と全く同じですが、複素数の計算との類似性に注意すると共通点が見えてくるかと思います。

$$(p_1 +q_1\sqrt{2})\pm (p_2 +q_2\sqrt{2})=(p_1\pm p_2)+(q_1\pm q_2)\sqrt{2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

$$(p_1 +q_1\sqrt{2})(p_2 +q_2\sqrt{2})=(p_1p_2+2q_1q_2)+(p_1q_2+p_2q_1)\sqrt{2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

$$\frac{1}{p +q\sqrt{2}}=\frac{p -q\sqrt{2}}{(p +q\sqrt{2})(p -q\sqrt{2})}=\frac{p -q\sqrt{2}}{p^2 -2q^2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

商のところに関しては、1を割ったものだけ考えれば一般の商はそれとの積と考えられるので分子を1としています。このように、加減乗除の計算の計算結果後も\(\mathbb{Q}\left(\sqrt{2}\right)\)の集合に属するので、このような時に体\(\mathbb{Q}\left(\sqrt{2}\right)\)は加減乗除の計算に関して「閉じている」と言います。

\(\mathbb{Q}\left(\sqrt{3}\right)\) や \(\mathbb{Q}\left(\sqrt{5}\right)\)のような拡大体でも事情は同じで、加減乗除の計算に関して閉じています。

ここで、p+q\(\sqrt{2}\) +r\(\sqrt{3}\) のような形の場合には拡大体として見る場合には注意が必要で、記号としては\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\) のように書きますが、実際のところは \(\sqrt{6}\) も含まれます。これは、積や商の計算で\(\sqrt{2}×\sqrt{3}=\sqrt{6}\) が発生するためです。つまり実質的には、この拡大体は次のような形をしています。

$$\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)=\{p+q\sqrt{2}+r\sqrt{3}+s\sqrt{6}|p,q,r,s\in\mathbb{Q}\}$$

$$例えば、1+3\sqrt{2}+\frac{\sqrt{3}}{2}+2\sqrt{6}\in \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)$$

この場合、(\(\sqrt{6}\))=6、\(\sqrt{2}×\sqrt{6}=2\sqrt{3}\)、\(\sqrt{3}×\sqrt{6}=3\sqrt{2}\) となるので2、3,6以外の平方根は加減乗除の計算で発生しません。

同じような注意点は、3乗根による有理数体の拡大を考える時にも発生します。

一見違うように見える拡大体が、実際は同一の集合である場合もあります。
\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\) と少し似た\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\) という拡大を考えると、一見別の体になる?ようにも見えますが、
じつは\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\)=\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\)です。

$$p+q(\sqrt{2}+\sqrt{3})$$

$$(\sqrt{2}+\sqrt{3})^2=5+2\sqrt{6},(\sqrt{2}+\sqrt{3})^3=2\sqrt{2}+6\sqrt
{3}+9\sqrt{2}+3\sqrt{3}=11\sqrt{2}+9\sqrt{3}$$

2乗のほうの形に注目すると、まず\(\sqrt{6}\)単独を\(\left(\sqrt{2}+\sqrt{3}\right)\)で表す事ができ、
3乗のほうの形に注目すると\(\sqrt{2}\)や\(\sqrt{3}\)単独を、\(\left(\sqrt{2}+\sqrt{3}\right)\)の加減乗除で表せます。

$$(\sqrt{2}+\sqrt{3})^3-9(\sqrt{2}+\sqrt{3})=2\sqrt{2},\hspace{15pt}(\sqrt{2}+\sqrt{3})^3-11(\sqrt{2}+\sqrt{3})=-2\sqrt{3}$$

$$p+q\sqrt{2}+r\sqrt{3}+s\sqrt{6}=p+q\frac{(\sqrt{2}+\sqrt{3})^3-9(\sqrt{2}+\sqrt{3})}{2}-r\frac{(\sqrt{2}+\sqrt{3})^3-11(\sqrt{2}+\sqrt{3})}{3}+\sqrt{6}$$

$$=p-\frac{5}{2}+\left(\frac{11r}{3}-\frac{9q}{2}\right)(\sqrt{2}+\sqrt{3})+\frac{s}{2}(\sqrt{2}+\sqrt{3})^2+\left(\frac{q}{2}-\frac{r}{3}\right)(\sqrt{2}+\sqrt{3})^3$$

\(\left(\sqrt{2}+\sqrt{3}\right)\)を4乗すると再び2、3,6の平方根が出てくるので4以上のベキ乗を考える必要はなく、有理数全体を動く独立変数が4つありますので、少々汚い形ですがこれは\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\)と同じ集合になります。

この例はちょっとめんどくさい計算でしたが、より簡単な例では実数体→複素数体の拡大の中にも見られます。実数を複素数に拡大する時はi=-1となるiを考えました。では、\(\alpha\)=-1となるような「別の実数で無い数?」を考えると別の拡大が可能でしょうか?

じつのところ、\(\alpha\)=-1となる\(\alpha\)は、複素数で表せてしまいます。理屈は簡単で、ドモアブルの定理を使えばcos(\(\pi\)/3)+isin(\(\pi\)/3), cos(2\(\pi\)/3)+isin(2\(\pi\)/3), -1の3つが該当します。(よく考えてみると当然ですが、これらの1つは実数です。)同様に、\(\alpha\)=-1を満たす\(\alpha\)を使って実数体の拡大を考えても、全て集合としては「複素数」と同じになってしまうわけです。
【ただし、それらの拡大を実数体ではなく有理数体の拡大として考えると話は変わってきます。】

では、実数については複素数以外の拡大はあり得ないのかというと、結論は「あります」。例えば複素数体の拡大として「四元数体」と呼ばれるものが該当します。さらに八元数と呼ばれるものを考える事も可能ですが、これは積の結合法則が成立しないものなので「体」には含まれません。

多項方程式の解による体の拡大【用語の整理】

体論の基本的な理論の中で重要な拡大の1つは、多項方程式の解による拡大です。キーワードはいくつかあるので整理しましょう。1つ1つの意味は大した事ないのですが、これらをごちゃごちゃに文章の中で使われると結構混乱する人も多いと思います。

「既約」 ■ 「モニック」 ■ 「体上の多項式」 ■ 「最小多項式」 ■ 「共役」 

「既約」

多項式が既約であるとは、簡単に言うとそれ以上「因数分解できない」という意味です。

これは「どの体で考えているか」によってどの式が既約かそうでないかが変わってくる事に注意が必要です。

例えば、x-2は、実数の範囲では因数分解可能ですが、有理数に限定した場合はそうではありません。そのためこの式は「有理数体上で既約である」あるいは「\(\mathbb{Q}\)上で既約である」と、代数学では表現します。

同様に、x+2は複素数の範囲では因数分解可能ですが実数の範囲では因数分解できないので、「\(\mathbb{R}\)上で既約」であり、\(\mathbb{C}\)上では既約ではないと表現します。

「モニック」

「モニック」とは、多項式の最大の次数(ベキ乗の数)の項の係数が1であるという事です。
これは、意味自体は簡単な事で、大げさな事ではありません。
【「モノ」とは単一とか1を表す語で「モノクロ」とか「モノラル」等の「モノ」です。】

-2x+1, x+x, x+1, x+3x+2などの多項式はみな「モニック」です。

2x-2x+1, 3x+1, -x+3x+2などの多項式はモニックではありません。

「体上の多項式」

係数は全て体Kの元である多項式を「K上の多項式」と言います。
例えば、x-2x+1などの実数係数の多項式は「\(\mathbb{R}\)上の多項式」の1つです。x-2ix+1などは、実数で表せないiが係数に入っていますので「\(\mathbb{C}\)上の多項式」(のうち\(\mathbb{R}\)上の多項式を含まないもの)の1つです。

「最小多項式」

\(\alpha\)∊Lと、ある体KがあってK上の多項式でf(\(\alpha\))=0となるもののうち「既約」で「モニック」で「次数が最小のもの」を特に「最小多項式」と言います。

例えば、x+1はi∊\(\mathbb{C}\)の\(\mathbb{R}\)上の最小多項式です。
-2は\(\sqrt{2}\)∊\(\mathbb{R}\)の\(\mathbb{Q}\)上の最小多項式です。
ここで、もし\(\sqrt{2}\)∊\(\mathbb{R}\)に対して\(\mathbb{R}\)上の最小多項式を考えるなら、それは1次式x-\(\sqrt{2}\)になります。

ちょっと整理すると次のようになります。

「\(\alpha\)∊LのK上の『最小多項式』」とは:

LはKの拡大体であるとして、
体Kの元を係数とする多項式、つまり「K上の多項式」のうち、
次のものを\(\alpha\)∊LのK上の最小多項式と言います。

  • \(\alpha\)∊Lを代入すると0になる【f(\(\alpha\))=0となる】
  • そのうち次数(xのn)が最小のもの
  • 既約である
  • モニックである

具体的な数に対する最小多項式を導出する時には計算の工夫が必要な場合もあります。
例えば \(\alpha=\sqrt{2}+\sqrt{3}\) の「\(\mathbb{Q}\)上の最小多項式」が具体的にどんなものかを知りたい場合には、
まず式を変形してから \(\alpha -\sqrt{2}=\sqrt{3}\) の両辺を2乗します。$$\alpha^2-2\sqrt{2}\alpha+2=3$$$$\Leftrightarrow \alpha^2-1=2\sqrt{2}\alpha$$2乗した後にさらに変形した後の式の両辺を、さらに2乗します。$$\alpha^4-2\alpha^2+1=8\alpha^2\Leftrightarrow \alpha^4-10\alpha^2+1=0$$ このように、2段階に分けて平方根の部分を有理数にしています。
\(\alpha=\sqrt{2}+\sqrt{3}の\mathbb{Q}\)上の最小多項式はx-10x+1です。【係数は確かに有理数。】

「共役」

複素数で「共役複素数」というものがありますが、これはより一般的に言うと、L上のある元\(\alpha\)に対するK上の最小多項式f(x)に対して、\(\alpha\)以外でf(x)の根になる【f(x)=0の解になる】\(\alpha\)以外の他のLの元の事を指します。

複素数で言うと、1+iの共役複素数1-iはともにx+2x+2=0の解ですが、この左辺の多項式は「1+iの\(\mathbb{R}\)上の最小多項式」です。1-iは1+iの「\(\mathbb{R}\)上の共役」であると言います。

この意味では、共役というものは1つだけではなくもっと多くある事もあり得ます。x-2は\(\sqrt{2}\)∊\(\mathbb{R}\)の\(\mathbb{Q}\)上の最小多項式ですが、\(\sqrt{2}\)∊\(\mathbb{C}\)と考えると、x-2=0を満たす別の2解が存在します。それらが\(\sqrt{2}\)∊\(\mathbb{C}\)の\(\mathbb{Q}\)上の共役になります。

「代数拡大」

変数は複素数範囲、係数は実数である多項方程式(\(\mathbb{R}\)上の多項式)があったとしましょう。
【上記の通り、係数が全て体Kの元である多項式が「K上の多項式」です。】

任意の複素数xに対して、そのxが解となる実数係数の多項式は存在し、
そのような時に実数から複素数への拡大\(\mathbb{C}\) /\(\mathbb{R}\)は「代数拡大」と呼ばれます。

例えばてきとうな実数係数の多項式 x+x+\(\sqrt{2}\)x-x+1=0 などを考えると、
これを満たすx∊\(\mathbb{C}\)は必ず存在します【代数学の基本定理】。
現にこの多項方程式の解となるx=\(\alpha\) に対して、「\(\alpha\)∊\(\mathbb{C}\)は \(\mathbb{R}\) 上『代数的』である」という表現をします。

この「代数的」という語を使う時には、必ずL/Kという拡大があって、
「拡大体Lのほうの元」に対して、「K上」代数的であると言います。

これを一般の体K、Lについて置き換えると、\(\alpha\)∊Lに対して係数a~a∊Kが存在して
\(\alpha\)+a\(\alpha\)n-1+・・・+an-1\(\alpha\)+a=0となる時、\(\alpha\)∊L はK上で「代数的である」と言い、
任意のx∊LについてxがK上代数的である時、KからLへの拡大L/Kは「代数拡大」であると言います。

任意のx∊Lについて表現する用語なので、L/Kは「K上の代数拡大」という具合に言えばよい事になります。\(\mathbb{C}\)/\(\mathbb{R}\)は「\(\mathbb{R}\)上の代数拡大」である(単に拡大である事に加えて)という表現の仕方になります。

特に、K上の任意の多項式f(x)に対してf(\(\alpha\))=0となるような\(\alpha\)∊Kが存在する時、
Kは「代数閉体」であると言います。複素数体は代数閉体であり、実数体や有理数体は代数閉体ではありません。【例えばf(x)=x+1などを考えれば、これをゼロにするxはx=+i,-iなので。】

ここで、体の拡大L/Kがあって拡大体Lのほうが代数閉体である時には「LはKの『代数閉包』である」と言います。

この手の数学の分野は、上記のように様々な用語が出てきてややこしい事は間違いないのですが、意味や具体例を考えながら整理していくと意外と面白いかもしれない分野です。

部分群

群【ぐん】を作る集合の部分集合で、それ自体でも群を作るものを部分群と言います。

英:部分群 subgroup 正規部分群 normal subgroup

考え方と具体例

簡単な例で言うと、加群としての整数全体の部分集合のうち「偶数である整数の全体(負の数と0含める)」もそれ自体で加法に関して群を作るので部分群であるという事になります。

これに対して、「奇数である整数の全体(負の数含む)」は整数全体の部分集合ではありますが、加法について単位元となるべき0を含まない、奇数+奇数=偶数になる等の理由により加法について群になりません。そのため、加法に関して言えば「部分群では無い」という判定になります。

また、他に重要な例としてはn次の置換全体を表す群(対称群)に対して、n次の偶置換全体を表す群(交代群)も部分群になります。

部分群の例
  • 0を除く実数全体に対して、0を除く有理数全体は乗法に関して部分群になる。
    【無理数全体は実数全体の部分集合だが部分群にならない】
  • 有理数全体に対して、整数全体は加法に関して部分群になる。
  • 整数全体に対して集合{2n | nは整数}は加法に関して部分群になる。
    【集合{2n+1|nは整数}は整数全体の部分集合だが部分群にならない】
  • n次の置換全体Sに対してn次の偶置換全体Aや、
    1文字だけ固定してn-1次の置換全体Snー1同様に考えた集合は部分群になる。
    【Sの部分群を一般に「置換群」と呼びます。】
3次の対称群は3つの番号(あるいは文字)を入れ替える方法を元とする群です。

このように具体例で見るとそれほど難しいものではないのですが、代数学の群論ではもう少し抽象的なレベルでの部分群についての性質が重要になります。

式での定義と性質

部分群である事の定義を記号で書くと次のようになります。

部分群の定義

群Gの部分集合Hが次の2条件をともに満たす時、Hを「部分群」と呼びます。

  1. a∊Hかつb∊H ⇒ ab∊H
  2. a∊H ⇒ a-1∊H

Gが群でG⊃Hですから、元同士の積が行える事や逆元の存在自体は前提になっています。
群Gに対してG自身や単位元だけからなる集合{e}も部分群になります。それらを除いた部分群を特に「真部分群」と言う事もあります。

部分群に関する重要な最初の性質として、
「部分群Hが存在する時、Gの単位元は必ずHに含まれている」という事が言えます。

単位元と部分群に関する性質 群Gの部分群Hが存在する時、群Gの単位元はHの元となる。
「eが群Gの単位元」⇔「eは部分群Hの単位元」
(GとHとで別々の単位元を持つ事はなく、共通の単位元を必ず持つ。)

【証明】定義の2番目の条件により「a∊H ⇒ a-1∊H」であり、
定義の1番目の条件により「a∊Hかつb∊H ⇒ ab∊H」なので
「a∊Hかつa-1∊H」であるから「aa-1=∊H ⇔ e∊H」と言える事によります。
逆にeがHの単位元であれば、そのeがGの単位元ではないとするとHの外にGの単位元e’ がある事になりますが、先に示した事からそのe’ は部分群Hの単位元でなくてはなりません。しかしこれは、任意の群の単位元は一意性と矛盾します。よってeがHの単位元であればGの単位元でもあります。

さらに、定義から少し計算をすると「部分群である事」を次のように言い換える事もできます。

部分群であるための必要十分条件

次の関係が成立します。
「群Gの部分集合HがGの部分群である」⇔「a∊Hかつb∊H ⇒ ab-1∊H」
【証明の中で示されるように、「a∊Hかつb∊H ⇒ ab-1∊H」が成立するならa-1∊Hとb-1∊Hも成立します。ただ、例えばある部分集合が部分群になっている事を示すには「a∊Hかつb∊H ⇒ ab-1∊H」であるかを調べれば十分という事です。】

この必要十分条件の関係は自明ではないので証明が必要です。ただ、理屈自体は非常に単純です。

まず、「群Gの部分集合HがGの部分群である」ならば、
定義から「『a∊Hかつb∊H ⇒ ab∊H』かつ『a∊H ⇒ a-1∊H』」ですから、
b∊Hよりb-1∊Hであり、「a∊Hかつb-1∊H」であるから 「ab-1∊H」となります。
この時「a∊Hかつb∊H ⇒ ab-1∊H」の関係が確かに成立しており、
「群Gの部分集合HがGの部分群である」⇒「a∊Hかつb∊H ⇒ ab-1∊H」が成立します。

次に、「a∊Hかつb∊H ⇒ ab-1∊H」であるとすると、
「a∊Hかつa∊H」【b=aの時に相当】は常に成立するので、aa-1∊H ⇔ e∊Hであり、
「e∊Hかつa∊H」であるからea-1∊H ⇔ a-1∊H となるので、
この時「a∊H ⇒ a-1∊H」が確かに成立しています。
なおかつ、e∊Hが示されているので「e∊Hかつb∊H」も成立し、
aの場合と同様にeb-1∊H ⇔ b-1∊Hとなり、
「a∊Hかつb-1∊H」も成立するのでa(b-1)-1∊H ⇔ ab∊Hも成立します。
つまり「a∊Hかつb∊H ⇒ ab-1∊H」⇒「群Gの部分集合HがGの部分群である」が成立しています。

これらの証明は「確かにそうなるという事の保証」のようなもので、結果のほうが重要です。

部分群についての他の基本的性質としては、次のようなものがあります。

部分群の性質
  1. 群Gに対して2つの異なる部分群HとKがある時、
    その共通部分H∩Kも1つの部分群になる。
    【Gの単位元はH∩Kに含まれる事になります。】
  2. 群Gに属するが部分群Hに属しない元c対して、
    部分群Hに属する元aとの積acはGに含まれHには含まれない。$$【Gが群、Hがその部分群の時、c\in Gかつc\notin H かつ a\in H\Rightarrow ac\notin H】$$
  3. 群Gに属するが部分群Hに属しない2つの元bとc対して、
    積bcはHに含まれる場合・含まれない場合両方ともあり得る。

【証明】
■1番目の性質:a∊H∩Kかつb∊H∩Kとすると、
a∊Hかつb∊Hなので ab-1∊Hであり、
a∊Kかつb∊Kなので ab-1∊Kであるから、
ab-1はHの元でもあり、同時にKの元でもある、
つまりab-1∊H∩Kとなるので、 部分群であるための必要十分条件により示されます。

■2番目の性質:\(c\in Gかつc\notin H かつ a\in H\) のとき、ac∊Hとすると、
-1∊Hなのでa-1ac∊H ⇔ c∊H
しかしcはHに含まれないはずだったので、これは矛盾です。
あるいは、c∊Gとa∊Hに対してa-1(ac)=c\(\notin\)Hなので、
c\(\notin\)Hならa-1∊Hであるからac\(\notin\)Hとなる、とも言えます。

ここでの3番目の性質は一体何を言っているのかというと、加群で考えると比較的分かりやすいでしょう。
整数全体に対して3の倍数(0と負の数含む)を考えます。この時に、3n+1や3n+2で表されるものはもちろん3の倍数になりませんが、その和(群論一般で言うとこれが「積」に該当)は3n+3=3(n+1)ですから3の倍数になります。
他方、3n+1で表されるもの同士の和は3n+2の形ですから、3の倍数にはなりません。おおもとの群の元であって部分群の外にあるもの同士の積(加群だと「和」)は、部分群の元になる時もあるし、そうでない事も両方あり得るという事です。

このため、部分群Hの元aとその外にあるおおもとの群Gの元cの積acはHに含まれませんが、さらにその積同士を考えると部分群の中に戻る事もあります。例えばa∊Hのもとでacとc-1aがともにHに含まれない場合でも、その積はacc-1a=aaですからこれはHの元になります。

巡回部分群

群Gがあるとき、a∊Gに対して実数等との時の感覚でaa=a、aaa=a、a-1-1=a-2、a-1-1-1=a-3、・・のように書きます。実数等との時と全く同じ感覚でこれらをaの「べき」とか「べき乗」と言います。

この時、次の部分集合H={a|a∊G, nは整数}を考えます。
何かてきとうなGの元に対して、そのべき乗を集めるという事です。
例えばGが0以外の実数・演算は乗法であるとして、てきとうに「3」を選んでH={1,3,3,3,3,・・・,3-1,3-2,3-3,3-4,・・・}を考えるという事です。【3=1, 3=3】

この時、Gが群であれば、H={a|a∊G, nは整数}は必ず部分群になります。これは、定義から示してもよいですが前述の「部分群であるための必要十分条件」を考えるとより簡単であり、a∊Hかつa∊Hのもとでa-m=an-m∊Hとなるので確かに部分であるという事になります。a=a(=an+m)なので、これは可換群です。このような部分群Hを、特に「巡回部分群」と呼び、H=<a>と書く事があります。この場合にaを「Hの生成元」と言う事もあります。

巡回部分群

Gが群の時、H={a|a∊G, nは整数}を「巡回部分群」と呼びます。

  • H=<a>とも書く
  • aを「生成元」とも言う
  • 可換群である

加群の場合には、特に<a>={na|a∊G, nは整数}と書けます。

【★ 似た用語として、置換の1つの種類として「巡回置換」がありますが区別する必要があります。】

G自体が{a|a∊G, nは整数}として表される時にはGを「巡回群」と呼びます。

正規部分群

群Gに対して部分群Sがあったとき、t∊G【Sに含まれていてもそうでなくてもよい】とs∊Sを組み合わせたt-1stという積を考えます。これを元とする集合も部分群になり「Sに共役な部分群」と言います。

「共役な部分群」

Gが群、SがGの部分群でt∊G, s∊Sのとき、次の集合を「Sに共役な部分群」と言います。
-1St={t-1st |t∊G, s∊S }

これが本当に部分群になるかは、再び
「『群Gの部分集合HがGの部分群である』⇔『a∊Hかつb∊H ⇒ ab-1∊H』」
の、部分群であるための必要十分条件の関係から見るとすぐに示せます。

s∊Sかつu∊Sのもとで、
(t-1st)(t-1ut)-1=(t-1st)(t-1-1t)=t-1stt-1-1t=t-1(su-1)t∊S
よって、集合{t-1st |t∊G, s∊S }はGの部分群です。
【Sは部分群なので、u∊H ⇒ u―1∊H(上記で証明済です)なのでsu―1∊Sです。
また、群の元に関する公式 (ab)-1=b-1-1の関係に注意。】

さて、群Gに対して部分群Nがあれば「Nに共役な部分群」も必ずある事になりますが、この「Nに共役な部分群」がN自身であり、しかもN自身以外にはありえない時はNをGの「正規部分群」と呼びます。

「正規部分群」 Gが群、NがGの部分群でt∊G, n∊Nのとき、
「『Nに共役な部分群』(必ず存在)がN自身しかない」 時、NをGの「正規部分群」と呼びます。
式で書くと、任意のt∊Gに対し{-1nt|n∊N}=N,
もしくは-1Nt=N
もしくはtN=Ntなどと表されます。
ここでt-1Nt=NもしくはtN=Ntとは、左辺と右辺が集合として等しくなるという意味で、必ずしもNが可換であるという事ではありません。【tn=ntという意味でもないので注意。】

tがGの要素でNの要素でない時、n∊Nに対してt-1n\(\notin\)Nかつnt\(\notin\)Nです。
しかしそれらとtやt-1の積の(t-1n)t=t-1(nt)=t-1ntはNの元になり得ます。
Nが群Gの正規部分群である時は、t-1ntがNの元であり、かつnをNの中全体に渡って動かした時にNの中の全ての元になっている事を意味します。

少し理屈が込み入るようですが、この「正規部分群」とは具体例を探すと割と多くあるもので、
例えば「可換群の部分群」は全て正規部分群です。
【∵任意のn∊Nに対してt-1nt=nt-1t=nより、t-1Nt=N】
群Gに対するG自身や単位元だけの群{e}も正規部分群に該当し、「自明な正規部分群」と言います。
Gの正規部分群がこの「自明な正規部分群」しか存在しない時、Gを「単純群」と呼ぶ事があります。

「では非可換な群の部分群で、うまい具合にt-1Nt=Nなどという関係になるものがあるのか?」

結論を言うと、あります。非可換な群で重要なものとして置換全体から成る群がありますが、n次(n個の番号が対象)の置換全体に対して「n次の偶置換(操作回数が偶数回)全体の群」は正規部分群です。
また、4次の置換全体に対してはそれとは別の1つの正規部分群が存在します。
その他に、群Gの元a、bに対してa-1-1abを考え、これを元とする「交換子群」も正規部分群になります(Gが可換か非可換かに関わらず)。

この正規部分群というのは群論の基礎理論のなかで重要な役割を持っています。

行列式の基本公式

行列式について成立する基本公式をまとめてます。
一般のn次の行列式の定義だけでも大変面倒であるわけですが、ここで述べる公式によって特定の条件のもとでの行列式の値を計算するのが容易になる、行列式を含む理論計算が簡易になる等の利点があります。

行列式については、次のような基本性質が成立します。扱う行列は全て正方行列とします。

  1. 列ベクトルに対する線型性
    1. 1つの列ベクトルが和・差の形の行列の行列式は和・差の形に分解できる。
    2. 行列式の1つの列に定数を乗じたものは全体にその定数を乗じた値に等しい。
    3. 2つ以上の列における和・差・定数倍に関しても所定の規則で行列式を分割できる。
  2. 列の置換に関する性質
    1. 列を置換した行列の行列式は、もとの行列式にその置換の符号を乗じたものに等しい。
    2. 行列式の中に全く同じ要素が並ぶ列が2つあれば行列式は0になる。
  3. 積に関する性質
    1. 行列の積に対する行列式は、個々の行列の行列式の積になる。
    2. 逆行列の行列式と、もとの行列の行列式の積は1に等しい。

(これらのうち、列に関する性質は行についても同様に成立します。)

尚、高校数学の範囲や、行列の理論を限定的にのみ使う工学等の分野で2次の正方行列や3次の正方行列のみを扱う場合には、上記の公式は全て行列の成分の直接計算で示す事ができます。(2次の場合は計算は簡単ですが、一般性は分かりにくいでしょう。)

よく使われる行列の簡易表記として、行列の列の部分を一括して「列ベクトル」とみなすやり方があります。例えば3次の正方行列であれば次のように表す感じです。

$$\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) =(\overrightarrow{a_1},\overrightarrow{a_2},\overrightarrow{a_3})$$

$$\overrightarrow{a_1}=\left(\begin{array}{ccc} a_{11} \\ a_{21}\\ a_{31} \end{array}\right),\hspace{10pt} \overrightarrow{a_2}=\left(\begin{array}{ccc} a_{12} \\ a_{22}\\ a_{32} \end{array}\right),\hspace{10pt}\overrightarrow{a_3}=\left(\begin{array}{ccc} a_{13} \\ a_{23}\\ a_{33} \end{array}\right)$$

以下、証明も含めて詳しく見てみきましょう。

列ベクトルに対する線型性

式による表現(1つの列の場合) ■ 証明 ■ 一般の列ベクトルに対する線型性 

式による表現(1つの列の場合)

次のように、行列式の「列ベクトルに関する線型性」が成立します。c は定数(実数、複素数)とします。

$$A=(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots\overrightarrow{a_n})\hspace{5pt}のとき、$$

行列式の列ベクトルに対する線型性
  1. 列ベクトルが和・差の形の行列の行列式は和・差の形に分解できる。$$\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k}+\overrightarrow{b_k},\cdots\overrightarrow{a_n})=\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})+\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_k},\cdots ,\overrightarrow{a_n})$$
  2. 行列式の1つの列に定数を乗じたものは全体にその定数を乗じた値に等しい。$$\mathrm{det}(\overrightarrow{a_1},\cdots ,c\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})=c\hspace{3pt}\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})=c\hspace{3pt}\mathrm{det}A$$

和と差に関する性質のところは、「もとの行列と『1つの列だけ』別の列ベクトルに入れ替えた行列」の
行列式の和や差になるという事です。

列ごとの和になっているとか列ごと定数倍になっているとかいうのは、具体的には3次の正方行列で言うと次のような事です。

$$\mathrm{det}\left(\begin{array}{ccc} a_{11}+1 & a_{12} & a_{13}\\ a_{21} +3 & a_{22}& a_{23} \\ a_{31}-2 & a_{32} & a_{33}\end{array}\right) =\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) +\mathrm{det}\left(\begin{array}{ccc} 1 & a_{12} & a_{13}\\ 3 & a_{22} & a_{23} \\ -2 & a_{32} & a_{33}\end{array}\right) $$

$$\mathrm{det}\left(\begin{array}{ccc} a_{11} & 4a_{12} & a_{13}\\ a_{21}& 4a_{22}& a_{23} \\ a_{31} & 4a_{32} & a_{33}\end{array}\right) =4\hspace{3pt}\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

証明

列ベクトルに関する線型性は、要するに行列式を構成する各項には1つの列の要素が必ず入っている事に起因します。

$$\mathrm{det}A = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{i=1}^na_{\sigma(i)i}\right) $$

行列式は行列の成分を使うとこのように表せるので、式で示す場合には次のようになります。

まず和・差のほうから見ると、あるk列目のそれぞれの行の成分に何らかの数が加えられている状況なので、積になっている部分のk番目のところだけを和の形にすればよい事になります。
すると全体を2つの和に分けて、それぞれ行列式の形になるというわけです。

$$\sum_{\sigma}\left\{\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots (a_{\sigma(k)k}+b_{\sigma(k)k})\cdots a_{\sigma(n)n}\right\}$$

$$=\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots a_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)+\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots b_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)$$

結果の式では、積のk番目のところだけが別々になって2つの和になっています。
(積の部分は、積の記号\(\Pi\)を使用せずに直接各項を書き下す形にしています。省略部分「・・・」のところは掛け算が続きます。)

定数倍のほうも同じで、積のk番目のところがc倍で、これは和全体に乗じられる定数倍とみなせます。

$$\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots ca_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)=c \sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots a_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)$$

一般の列ベクトルに対する線型性

1箇所の列ベクトルについて和や定数倍の項が増えた時には線型性の式を繰り返し使って、
シグマ記号を使って1つにまとめる事もできます。
これは、1つの列のところについて \(c_1\overrightarrow{a}+c_2\overrightarrow{b}+c_3\overrightarrow{d}\) のようになっている場合です。

2箇所以上の列ベクトルで和や差の形になっている場合は少し注意が必要です。1箇所だけのときの証明のやり方を見てもらうと分かりやすいと思うのですが、2箇所ある場合には行列式は2項に分かれるのではなく、2×2=4項に分かれます。n箇所に2項ずつある場合には2項に分かれます。これを直接書くのは大変面倒ですが、シグマ記号を使うとより簡潔に表せます。

行列式の線型性・一般の場合
  1. 1つの列ベクトルにおける一般の場合:$$\mathrm{det}\left( \overrightarrow{a_1},\cdots ,\sum_{j=1}^m(c_j\overrightarrow{b_j}),\cdots\overrightarrow{a_n} \right)=\sum_{j=1}^mc_j \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_j}\cdots ,\overrightarrow{a_n})$$
  2. 2つ以上の列ベクトルにおける一般の場合 $$\mathrm{det} \left( \overrightarrow{a_1},\cdots ,\sum_{i=1}^{m1}(c_{pi}\overrightarrow{b_{pi}}),\cdots ,\sum_{j=1}^{m2}(c_{sj}\overrightarrow{b_{sj}}),\cdots ,\sum_{k=1}^{m3}(c_{tk}\overrightarrow{b_{tk}}),\cdots\overrightarrow{a_n} \right)$$ $$=\sum_{i,j,k \cdots =1}^{m1,m2,m3,\cdots}c_{ki}c_{pj}c_{tk} \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_{pi}},\cdots ,\overrightarrow{b_{sj}},\cdots,\overrightarrow{b_{tk}},\cdots,\overrightarrow{a_n})$$

2番目のほうの式の和の記号のところは、i,j,k,・・のそれぞれについて、
1~m、1~m、1~m、・・まで動かすという意味です。
そのため、和の項数は合計でそれぞれを掛け合わせたm・・個 になります。

一般的に手計算では手に負えない事は見て明白だと思うので、「形」を把握しましょう。

例として、2箇所の列ベクトルについて2項ずつの和になっている時は、要するに行列式を表す積の中の2箇所で (a+b)(a+c)=a+ab+ac+bcの形になるので4つに分割されるという事です。
もし3箇所の列ベクトルについて2項の和になっているのであれば2=8つに分割されます。

2箇所の場合について証明の式を具体的に書くと次のようになります。
途中で「・・・」で略してる部分は全て掛け算が続いています。

$$\sum_{\sigma}\left\{\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots (a_{\sigma(k)k}+b_{\sigma(k)k})\cdots(a_{\sigma(m)m}+d_{\sigma(m)m})\cdots a_{\sigma(n)n}\right\}$$

$$=\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots a_{\sigma(k)k}\cdots a_{\sigma(m)m}\cdots a_{\sigma(n)n}\right) +\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots b_{\sigma(k)k}\cdots a_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)$$

$$+\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots a_{\sigma(k)k}\cdots d_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)+\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots b_{\sigma(k)k}\cdots d_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)$$

このように、4つに分割されるわけです。

列の置換に対する性質

式による表現 ■ 証明(列の置換) ■ 証明(同一の列が2つ以上の時) 

式による表現

行列の特定の列と別の要素を入れ替えたり、列の順番を並び替えたした行列の行列式は、もとの行列の行列式と絶対値は必ず同じであり符号だけが異なるという結論になります。

その性質の派生物として、行列内の2つの列ベクトルの要素の値が全く等しい場合には行列式の値は必ずゼロになるという結果も示せます。

列の置換に関連する行列式の性質
  1. 列を置換 \(\tau\) によって並び替えた行列の行列式は、
    もとの行列式にその置換の符号 \(\mathrm{sgn}(\tau )\) を乗じたものに等しい。 $$\mathrm{det}(\overrightarrow{a}_{\large{\tau (1)}},\cdots ,\overrightarrow{a}_{\large{\tau (k)}},\cdots\overrightarrow{a}_{\large{\tau (n)}}) =\mathrm{sgn}(\tau) \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})$$
  2. 正方行列の異なる2つの列ベクトルについて \(\overrightarrow{a_k}=\overrightarrow{a_m}\) となるk、mが存在するならば
    その行列式の値は必ず0になる。 $$A=(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_m},\cdots,\overrightarrow{a_n})で、\overrightarrow{a_k}=\overrightarrow{a_m}となる時$$ $$\mathrm{det}=0$$

これは理屈としては難しくないのですが、式による証明では少々込み入ります。ここで挙げている行列式の公式の証明の中では最も難しく、しかし重要(積に関する性質の証明に必要なため)という厄介な箇所です。

例えば、1列目と2列目を入れ替えた場合、互換の符号はマイナスなので行列式は「もとの行列式にマイナス符号をつけたもの」になります。

$$\mathrm{det}\left(\begin{array}{ccc} a_{12} & a_{11} & a_{13}\\ a_{22} & a_{21} & a_{23} \\ a_{32} & a_{31} & a_{33}\end{array}\right) =-\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

2つの列の要素が全く同じ場合とは、2つの列について1行目の値が互いに同じ、2行目の値も互いに同じ、・・・以下、何行目であっても全部互いに等しいという事です。この時、行列式の値はゼロになります。証明を見ると分かる通り、じつはこの性質は列ベクトルの置換に関係します。

$$\mathrm{det}\left(\begin{array}{ccc} 2 & 2 & a_{13}\\ 5 & 5 & a_{23} \\ 1 &1 & a_{33}\end{array}\right)=0 $$

証明(列の置換)

置換 \(\tau\) によって列ベクトルの要素が並び替えされている時、逆置換(より一般的には逆写像)に相当する \(\tau\)-1 を考える事が1つの重要ポイントです。
これは、例えば(1→2, 2→3, 3→1)という置換を逆にたどった(2→1, 3→2, 1→3)の事です。

【1つの例】
\(\tau\) :1→2, 2→3, 3→1
\(\tau\)-1:2→1, 3→2, 1→3

さてしかし、そんなものをなぜ唐突に考えるのかというと、もちろん理由はあります。

まず、\(\tau\) によって列の配列が変わっている行列A’ の成分をbijとおきます。
この置き換えの文字を使うと、行列式はとりあえず通常の形で表せます。
この段階では置換\(\tau\) はまだ式の中には出てきません。

$$\mathrm{det}A^{\prime} = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\sigma (j)j}\right)$$

ここで、列だけ入れ替えて行はいじっていないという設定なので、行列成分bijの添え字の列部分だけを 置換\(\tau\) で変化させるともとの行列成分の形に直す事が可能で、次のように表せます。

$$\large{b_{\sigma (j)j}=a_{\sigma (j)\tau (j)}}$$

これは例えば1列目と2列目が入れ替わっていて、入れ替えたあとの2行1列目を考える時、そこにある要素をbijで表すとb21ですがもとのaijで表すなら列が入れ替わってますからa12になるという意味です。今の例ではb21=a12 であり、\(\tau\)(1)=2です。

式で表すとかなり分かりにくいかと思いますが、bijの積をaijで表した時に、
「列の順番が左から1,2,3・・になるように」書き換える事ができます。
例えば、a223113という積はa312213と書いても同じ値であるという意味です。

つまり、\(\large{b_{\sigma (j)j}=a_{\sigma (j)\tau (j)}}\) において、
「積の並び替え」をする事で \(\tau (j)\) の部分はjに書き換える事が可能である「はず」です。

列を順序通りに「並び替え」するという事は「列の番号の置換」を行うと見なす事もできます。
しかもここでは「置換\(\tau\)」によって配列が変わったものを「もとに戻しているという」操作に相当するので、
積の順序並び替えに相当する置換は列に関しては \(\tau\) の逆置換である \(\tau\)-1になるのです。

しかしその場合、行の番号はどう表すのかという話になります。これは、次のようにします。

ijの列の番号から\(\tau\)-1でbijの列の番号をたどり、そこに\(\sigma\)を作用させて行の番号を得ます。
ijで見た時の列の番号がkのとき、これのもとになっていたbijの列の番号は\(\tau\)-1(k) ですが、
行の番号はそれをさらに置換 \(\sigma\) で変えて \(\sigma\)( \(\tau\)-1(k) ) = \(\sigma\) \(\tau\)-1(k) となるという事です。

少し分かりにくいパズルかもしれませんが、\(\large{b_{\sigma (j)j}}\) の行部分は、列の番号を基準にして何に置き換わったかを指しています。例えばb22に対してb32のようなものを考えるわけです。

つまり、bijの列の番号が分かればi= \(\sigma\)(j) という具合に行の番号が判明します。
ijとbijとでは列の置換だけがなされて行はいじっていないのでbijのほうの行の番号が分かればそれがaijの行の番号に一致する、という事です。

そこで、行列式は次のように変形できるという事になります。

$$\mathrm{det}A^{\prime} = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\sigma (j)j}\right)=\sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^na_{\sigma \tau ^{-1}(j)j}\right)$$

ここで、sgn(\(\sigma\))=sgn(\(\sigma \tau ^{-1}\tau\))=sgn(\(\sigma \tau ^{-1}\))sgn(\(\tau\)) と変形できる事に注意します。

また、\(\sigma \tau ^{-1}\) という写像も置換であり(\(\sigma \) を動かす事で)n次の置換の要素全てに対応しています。
という事は、次のようにもとの行列Aの行列式を含んだ形に式を変形できるという事です。

$$\mathrm{det}A^{\prime} =\sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\large{\sigma \tau ^{-1}(j)j}}\right)=\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn}(\sigma \tau ^{-1})\mathrm{sgn}(\tau)\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\mathrm{sgn}(\tau)\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn}(\sigma \tau ^{-1})\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\mathrm{sgn}(\tau)\mathrm{det}A$$

和の記号の中で\(\sigma\) は置換全体を動かしますが、\(\tau\) はある特定の「1つの置換」です。
(例えば前述の例のように\(\tau\):1→2, 2→3, 3→1)
そのため、sgn(\(\tau\) ) はシグマ記号に乗じる形にできて、残った部分は(合計で)Aの行列式に等しくなります。

証明(同一の列が2つ以上の時)

上記の関係式が成立するのであれば、もしも互いに一致する列ベクトルが2つ以上あった場合には行列式の値が0になる事を示せます。

k列目とm列目が等しくなる時、この2列だけを入れ替えた行列式は、もとの行列式にマイナス符号をつけたものになります。(互換の符号はマイナス。)

$$すると、\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_m},\cdots\overrightarrow{a_n})=-\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_m},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})より、$$

$$\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})=-\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})$$

$$\Leftrightarrow \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})=0$$

ここで使っているのは、実数(あるいは複素数でも)について符号がプラスでもマイナスでも同じ値になる数、「x=-x」が成立する数は0だけであるという事を使っています。

積に関する性質

式による表現 ■ 証明(行列の積に対する行列式) ■ 証明(逆行列の行列式) 

式による表現

2つの行列AとBの積ABに対して、行列式 det(AB) はどのような値になるでしょう?普通に考えるといかにも収拾のつかない複雑な式になりそうですが(実際、直接計算すると手に負えません)、これはAの行列式とBの行列式の積になるのです。

その結論の派生物の1つとして、『逆行列の行列式』=1/『もとの行列式』という公式を導出できます。また、逆行列の存在の可否と行列式の値の関係の一部についても分かります。

積に関する行列式の性質
  1. 行列の積に対する行列式は、個々の行列の行列式の積になる。 $$\mathrm{det}(AB)=(\mathrm{det}A)\hspace{3pt}(\mathrm{det}B)$$
  2. 逆行列の行列式と、もとの行列の行列式の積は1に等しい。 $$\mathrm{det}A\hspace{3pt}\mathrm{det}(A^{-1})=1$$

2番目のほうの性質は「Aの逆行列が存在するならば」という前提です。
(最後に触れますが、そもそも逆行列が存在しない場合があり得るためです。)

結果自体はシンプルですが、証明はやや込み入ります。
ただし、前述の列ベクトルの線型性や、置換に関して成立する関係式を使うと証明可能です。

証明(行列の積に対する行列式)

「行列の積に対する行列式」の状況を調べる時、定義通りに要素の計算をすると一般のn次の正方行列に対しては非常に面倒な式になってしまうので工夫が必要です。

ABの1行1列目の要素はa1111+a1221+a1331+・・・+a1nn1 で、2行1列目の要素はa2111+a2221+a2331+・・・+a2nn1のようになりますが、同一の列で見た場合、Bの要素の1列目は共通して使い回されています。これを利用して、まずABの要素を列ごとに整理します。

ABの1列目の要素を列ベクトルで表す事ができて、次のようになります。

$$b_{11}\left(\begin{array}{ccc} a_{11} \\ a_{21}\\\cdots\\ a_{n1} \end{array}\right)+b_{21}\left(\begin{array}{ccc} a_{12} \\ a_{22}\\\cdots\\ a_{n2} \end{array}\right)+\cdots +b_{n1}\left(\begin{array}{ccc} a_{1n} \\ a_{2n}\\\cdots\\ a_{nn} \end{array}\right) =b_{11}\overrightarrow{a_1}+b_{21}\overrightarrow{a_2}+\cdots +b_{n1}\overrightarrow{a_3}=\sum_{j=1}^{n}(b_{j1}\overrightarrow{a_j})$$

そこで、AB全体を列ベクトル表記すると次のようになります。
省略している「・・・」の部分にもシグマ記号で表された各列ベクトルがあります。

$$AB=\left(\sum_{j=1}^{n}(b_{j1}\overrightarrow{a_j}),\hspace{5pt}\sum_{k=1}^{n}(b_{k2}\overrightarrow{a_k}),\cdots,\hspace{5pt}\sum_{z=1}^{n}(b_{zn}\overrightarrow{a_z})\right)$$

これの行列式を、一般の場合の列ベクトルの線型性によって分割します。

この場合には、各列に関して「全く同じ要素を持つ列」になる項が含まれます。
例えば、上記でj=1のときとk=1のときでは全く同じ形の \(\overrightarrow{a_1}\) の形が1列目と2列目に生じます。
(定数倍は行列式全体に掛ける形になるので、この件に関して影響を与えません。)
すると、その部分の行列式の項は0になります。
そのため、和の記号のj, k, ・・・,zの部分は、必ずそれぞれ違う番号を代入した項だけが残るわけです。
j, k, ・・・,zのそれぞれは1~nの範囲を動く事は共通しており、
j, k, ・・・,zの個数自体もn個ある事に注意します。
すると、j, k, ・・・,zの中身は、1~nの番号を置換したものになるのです。
これは、和をとるときに各々1~nではなく、
j, k, ・・・,z全体で「1~nの番号の『置換』」に渡って動くと捉えてよい事を意味します。

具体的に、n=4の場合、各列のシグマ記号の変数について例えば(i,j,k,z)=(2,3,4,1) のような組み合わせの項だけが残ります。(i,j,k,z)=(3,3,4,1)のようになる場合は、その行列式の項は0になるので考えなくていいという事です。

すると、上式の行列式は次のように書けるのです。

$$\mathrm{det}(AB)=\large{ \sum_{j,k,\cdots z=1}^{それぞれnまで} \left\{ b_{j1}b_{k2}\cdots b_{zn}\mathrm{det}(\overrightarrow{a_j},\overrightarrow{a_k},\cdots,\overrightarrow{a_z}) \right\} }$$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{det} (\overrightarrow{a}_{\sigma (1)} , \overrightarrow{a}_{\sigma (2)} , \overrightarrow{a}_{\sigma (3)} , \cdots , \overrightarrow{a}_{\sigma (n)}) \right\} } $$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{sgn}(\sigma) \mathrm{det} (\overrightarrow{a}_1 , \overrightarrow{a}_2 , \overrightarrow{a}_3 , \cdots , \overrightarrow{a}_n) \right\} }$$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{sgn}(\sigma) \mathrm{det}A \right\} }$$

$$=\large{ (\mathrm{det}A) \sum_{\sigma} \left\{ \mathrm{sgn}(\sigma) \left( \prod_i^n b_{\sigma (i)i} \right) \right\} }$$

$$=\large{ (\mathrm{det}A)( \mathrm{det}B) }$$

このようにして det(AB)=(detA) (detB) が確かに成立する事になります。

証明(逆行列の行列式)

上記の性質を単位行列に適用する事で、逆行列に関する行列式の関係式も分かります。

すなわち、単位行列IはI=A(A-1)と表せて、単位行列の行列式の値は1になるので detI=det{A(A-1)}= det A det A-1 ⇔ 1=det A det A-1

このとき、もちろん行列式が0でないという前提はあります。
あるいはむしろ、
ある行列が可逆(逆行列が存在する)ならば、
I=A(A-1) ⇔ 1=det A det A-1
となるので必ず det A≠0である、と言う事もできます。
「正方行列Aが可逆である(逆行列が存在する) ⇒ det A≠0」という事です。
その対偶命題をとると、
「detA=0ならば行列Aは可逆でない(逆行列は存在しない)」という事も分かります。

では「detA≠0ならばAは可逆で逆行列が存在する」という命題はどうかというと、結論から言うとこれも成立しますがこれまでの議論ではここまではまだ示せません。(もう一工夫必要で、余因子行列というものと行列式の関係を調べる事で証明できます。)

逆行列と可逆性の関係

結論を言うと次の同値関係が成立します。
「detA≠0 ⇔ 正方行列Aは可逆で、逆行列A-1が存在する。」
(detA=0ならばAは可逆でなく、逆行列は存在しない。)

行列式の定義

行列式(英:determinant)の定義を述べます。これは、正方行列に対して定まる実数(複素行列であれば複素数)を指します。

行列自体の定義や計算については別途に詳しくまとめています。

定義の式

行列がAだとすると、行列式は |A| あるいは det Aなどと記します。

式で書いた場合の行列式の定義

n次の正方行列A=(\(a_{ij}\))に対して行列式 det Aは次のように定義されます。 $$\mathrm{det}A = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{i=1}^na_{\sigma(i)i}\right) $$ ここで \(\sigma\) は1~nの番号の並びに対する「置換」の1つで、
和は置換全体【n!個ある】に対してとるとする。
\(\sigma\)(\(i\)) は番号\(i\) が置換 \(\sigma\) によって変わった後の番号。
【例えば番号1が3に変わるなら sgn(1)=3】
\(a_{\sigma(i)i}\) は具体的には \(a_{11}\) や \(a_{23}\) などを指す。
【「行」の番号のところに置換された数字を入れる。】
sgn(\(\sigma\)) は置換の「符号」と言い、+1か-1の値だけをとり、次式で定義される: $$\mathrm{sgn}(\sigma)=\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}$$

これが一般の行列式の定義ですが、文章で書いても数式で書いても複雑に見えるかもしれません。

そこでこの行列式の定義は一体何を言ってるのかという事を、1つ1つの特徴や具体例を見ながら確認していきましょう。

定義の説明図
行列の要素を選び出して積の形にして、プラスかマイナスの符号を定めて、n!個加え上げる(マイナス符号の部分は引き算)というのが「行列式」の定義の内容です。置換は順列とも言います。

特徴と具体例

行列式の定義式について、どのような特徴があるのかを見てみましょう。
まず、①正方行列について定義され、②実数や複素数などの「値」であり、③何次の行列式かによって構成の仕方が異なる という特徴があるのです。

行列式の特徴①
  • 正方行列にのみ定義される
  • 0、-1、1+i といった実数や複素数などの「値」である
    (適用する理論によっては関数を考えますが、とにかく「行列」ではないという事です。)
  • 正方行列によって2次、3次、4次・・の行列式の構成は異なる
    (統一的な規則は一応あり)
3次の行列式
3次の行列式には6つの項があり、それぞれの項は行列の3つの要素の積です。

行列式は、行列の要素を組み合わせて掛け算を作り、それを1つの項として複数足したり引いたりする事で定義します。この時、対象の行列が何次であるかによって項の数が変わります。

結論を言うとn次の行列式は「n!(nの階乗)個」の数の項の足し算・引き算で構成されます。
これは、n個の数の並び替え方(順列・置換)の総数という事です。
そして行列式の中のそれぞれの項は、行列の中のn個の要素の掛け算で構成されます。

行列式の特徴②
  • n次の正方行列の行列式の項数はn!個である。
    【n個の数の並べ方の総数】
  • 行列式の各項は、行列の要素によるn個の数の掛け算で構成されている。
    例えばa211233
  • 基本的にはa211233のように「列」の番号は(1,2,3)の順番で並べて、
    「行」の部分に置換によって入れ替えた番号を入れる。
    【この場合は(2,1,3)】

項数がn!個という事は5次の正方行列の場合には5!=120個の項があるという事で、
もちろんこれは一般的には手計算で扱うものではありません。

とりあえず、まずここまで性質を見たところで、具体的な行列式を見てみましょう。ただし、行列の要素はa12のように、まだ具体的な値ではなく一般的な表記としておきます。

$$A_2=\left(\begin{array}{ccc} a_{11} & a_{12} \\ a _{21} & a_{22}\end{array}\right) \hspace{10pt}A_3=\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) \hspace{10pt}A_4=\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}& a_{14}\\ a _{21} & a_{22} & a_{23}& a_{24} \\ a_{31} & a_{32} & a_{33}& a_{34}\\a _{41} & a_{42} & a_{43}& a_{44} \end{array}\right)$$

の時、行列式は次のようになります。

2次の行列式

$$\mathrm{det}A_2=a_{11}a_{22}-a_{21}a_{12}$$

3次の行列式

$$\mathrm{det}A_3=a_{11}a_{22}a_{33}-a_{11}a_{32}a_{23}+a_{21}a_{32}a_{13}-a_{21}a_{12}a_{33}+a_{31}a_{12}a_{23}-a_{31}a_{22}a_{13}$$

4次の行列式

$$\mathrm{det}A_4$$ $$=a_{11}a_{22}a_{33}a_{44}-a_{11}a_{22}a_{43}a_{34}+a_{11}a_{32}a_{43}a_{24}-a_{11}a_{42}a_{33}a_{24}+a_{11}a_{42}a_{23}a_{34}-a_{11}a_{32}a_{23}a_{44}$$ $$+a_{21}a_{32}a_{13}a_{44}-a_{21}a_{12}a_{33}a_{44}+a_{21}a_{12}a_{43}a_{34}-a_{21}a_{32}a_{43}a_{14}+a_{21}a_{42}a_{33}a_{14}-a_{21}a_{42}a_{13}a_{34}$$ $$+a_{31}a_{42}a_{13}a_{24}-a_{31}a_{42}a_{23}a_{14}+a_{31}a_{22}a_{43}a_{14}-a_{31}a_{22}a_{13}a_{44}+a_{31}a_{12}a_{23}a_{44}-a_{31}a_{12}a_{43}a_{24}$$ $$+a_{41}a_{12}a_{33}a_{24}-a_{41}a_{12}a_{33}a_{24}+a_{41}a_{32}a_{13}a_{24}-a_{41}a_{32}a_{23}a_{14}+a_{41}a_{22}a_{33}a_{44}-a_{41}a_{22}a_{43}a_{34}$$

これを見ると、手計算で具体的に式を書いて扱ってもよいのはせいぜい3次までという事はおおよそ分かるかと思います。4次の行列式の項数は4!=24個で、見ての通り書き下すと結構長い式になってしまいます。

5次の場合は120項あるので、ここに書くのはやめます。

いずれにしても、行列式とはどういうものなのかは、これで大体の雰囲気はつかめるかと思います。このように、一定の規則に基づいて行列の要素の積を足し算引き算で連結したものなのです。

置換の符号に対するプラスマイナスの決め方

具体的な書き下された行列式を見ると、各項のプラスマイナスの符号が入れ替わっている事が目につくと思います。これはどういう基準で決めているのでしょうか?

その決め方は、次のようになります。

行列式を構成する項のプライスマイナスの符号の決定
  • 112233のように行列の要素を掛け算の形で並べておく。
  • 行列の要素の「列」の番号は固定して
    「行」の番号(つまり添え字の1番目)だけの並び替えを考える
  • 順番通りに並んだ(1,2,3,・・・,n)の並びの場合、符号はプラス(+)とする。
    112233 の符号はプラスになる。
  • (1,2,3,・・・,n)の2つの数を入れ替える【「互換」を行う】と
    符号が反転し、マイナス(-)になるとする。
    例えばa112233の符号はプラスなので、
    行部分の添え字の2と3を入れ替えた a113223 の符号はマイナスです。
    行列式の中ではa112233-a113223+・・・のように続ける事になります。
  • 以降、「行」の数の入れ替えを行う(互換を行う)ごとに符号は反転する。

この規則を、より一般的に書くと次のようになります。
冒頭の「定義」に段々と近づく表記になります。

行列式の各項の符号の決め方(置換による表現)

一般に、(1,2,3,・・・,n)の配列に対して、
奇数回の互換を行った並び替えの配列(「奇置換」)の符号はマイナスであり、
偶数回の互換を行った並び替えの配列(「偶置換」)の符号はプラスになる。
(恒等置換は0回の互換であるとして偶置換であると考えます。)

冒頭の定義では「置換の『符号』」sgn(σ) というものが書かれ計算式が定義されていましたが、これは上記のプラスマイナスの符号の決め方を式だけで書くとあのようになるという事です。いまいちど sgn(σ) の定義式を見てみましょうか。

置換の「符号」の定義式の意味

ある置換σに対する「符号」sgn(σ) の定義式を改めて記すと次のようになります: $$\mathrm{sgn}(\sigma)=\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}$$ n=3の場合に(1,2,3)→(2,3,1)なるσについて具体的に計算してみると、 $$\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}=\frac{1-2}{3-1}\cdot \frac{1-3}{3-2}\cdot\frac{3-2}{2-1}=+1$$

sgn(σ) の定義式において分母の値には次の特徴があります。

  • i<j という条件があるのでj-i>0 ・・分母は必ずプラスの値になる。
    つまり全体の積の符号に対して分母は影響を与えない。
  • 絶対値としては分子に必ず同じ大きさのものが積の中に1つ含まれており、
    分母分子で打ち消し合って積全体の絶対値は必ず1にする。

置換の符号に対しては、さらに次の2つの公式が成立します。

置換の符号 sgn(σ) に対して成立する公式
  1. 任意の互換τに対して sgn(τ)=-1
  2. 任意の2つの置換 σ と σ に対して、sgn(σσ)=sgn(σ)sgn(σ)

σσ は、σを行った後にσを行う置換です。
sgn(σ)sgn(σ)は、2つの符号の積です。

恒等置換に対する符号は+になるので、1回互換をすると-になり、上記の2つ目の公式によりもう1度別の互換をすると+に転じます。

要するに結果は「偶置換の時プラス符号、奇置換の時マイナス符号」という事で、その事を式で表現したいがために上記 sgn(σ) の定義式を考えていたというわけです。

偶置換と奇置換の符号

置換の符号 sgn(σ) について、次の事が成立します。

  1. σ が偶置換の時、sgn(σ)=+1 【恒等置換も含める】
  2. σ が奇置換の時、sgn(σ)=-1

行列式は、一般の連立一次方程式や、抽象化された一般の体積を考える時など、線形結合で表される式を複雑に組み合わせる時に式を整理するのに役立ちます。ただし2次や3次の行列に関しては普通に行列内の要素ごとの計算を考えたほうが速い場合もあり、行列式を使える場面であっても使ったほうが良いかどうかは考察の対象によって異なってきます。

群の定義と基本性質

数学での「群(ぐん)」の定義と基本的性質を説明します。

数学での「群」とはどのようなもの?

まず始めに、数学で「群」(英:group)と呼ばれるものは、具体的なものとしてはじつに初歩的な対象が多く含まれます。

例えば、通常の実数や複素数は、積や和に関して「群」になります。(このように、何らかの演算に関してある集合が群になる・ならないといった表現をします。積について見る場合、0を除く事になります。)

特定の平面図形を「60°ずつ回転させる」といった操作も「群」としての性質を満たします。これは具体的操作としてはただ三角形や四角形を回してるだけですから、もちろん何ら難しい操作ではありません。他に図形をある軸に対してひっくり返す「鏡映」の操作なども加わる事もあります。

問題は次のようになります:

  • これらに共通する数学的性質は何か?
  • その抽象的な性質を前提にすると、どのような事が言えるのか?

群論ではこれを数学的な視点から整理し、理論を組み立てていく事になります。

「群」の定義

数学での「群」とは、1つの前提条件と、3つの公理を満たす集合を言います。

まず、前提条件として演算が定義される事です。それは、集合Gの元【げん】a、bに対して別の元「ab」が決定するというものであり、このabという新しい元もまたGの元である事が要請されます。群の場合、この演算の事を「積」と呼ぶ事が多いですが、いわゆる加法が該当する場合があります。

前提条件 任意のa,b ∊ G について ab=c ∊ G となる「演算」abが定義できる事。
「群」の定義 「演算」が定義されている前提で、次の3つを満たす集合Gを群と呼びます。
  1. 結合律の成立:任意の3つの元a,b,c∊Gについて、(ab)c=a(bc)となる。
  2. 単位元の存在:任意の元a∊Gに対してae=ea=aとなるe∊Gが存在する。
  3. 逆元の存在:任意の元a∊Gに対してaa-1=a-1a=eを満たすa-1∊Gが存在。

二番目の条件の単位元は、例えば実数では積に関しては1、和に関しては0が該当します。
三番目の条件の逆元は、例えば実数では2に対する1/2が該当します。(※この時、0では割れないので、積に関しては「0以外の実数」が「群」に当てはまるのです。)

定義
結合律の事は「結合法則」などとも言います。

単位元と逆元以外の一般の交換律ab=baは、群によって成立するものもあれば成立しないものもあり、成立するものは特に「可換群」と言います。

0を除く実数r、sについて、もちろんその積rsは実数であり、r・1=rとなる「1」が存在し、0を除いているので任意の要素についてr・(1/r)=1となる逆元も存在します。よって積に関して「群」である・・という判定をします。
この場合、任意の実数に対してrs=srですから、群としては可換群になります。こういった感じで分類をしていくわけです。

他方で、「実数のうち無理数だけからなる集合」は、2の平方根の2乗が有理数になってしまいますから、積に関して群を作らない事になります。

実数が和に関して群を作る事は、r+sは必ず実数、r+0=rとなる0が単位元として存在する、r+(-r)=0となる逆元が必ず存在する、という事から和に関して群である事が分かります。この場合は0を除かないわけです。このタイプの群は特に加群と呼ぶ事があります。

図形を回転させるような操作は、例えば「60°回転させる操作」をてきとうに文字でおきます。何でもよいのですがギリシャ文字の σ(シグマ)を使う事が多いようです。この時、120°回転を σ の2回分の操作とみなして σと表したりします。そして、0°回転つまり「何もしない」操作をeと書く事にします。

そのように定義したうえで、操作 σ自体を要素とみなし、 集合{e, σ, σ, σ}を考えます。すると、この集合はここで定義している操作の「積」に関して群を作るというわけです。この時、σ=eであるために、任意の2つの要素の積はこの集合の要素に必ずなります。逆元に関しては、例えばσに対してはσが該当するのです。この例では、操作自体を集合の要素とみなしています。

群の基本性質

さて、数学の理論として群論を考える時には「定義」をしてそれで終わるのではなく、むしろその先が大事です。つまりそのような定義をすると、どのような事が言えるのか・成立するのか?といった事が重要です。

ここでは、定義から直結する性質をいくつか述べます。

単位元の一意性

定義においては、単位元が「存在すればいい」という要請を出しているだけで、これだけではもしかすると「1」に相当する元がもう1つある可能性も匂わせます。しかし、実際はそのような事は起き得ない事を示せるのです。

このような場合、まずeとe’ の2つの単位元を仮定して、e=e’ を示すというのが1つの常套手段です。

定義から、e’e=e’です。(ce=cと同じ理屈です。)

他方、e’も単位元であるのですから、ee’=eでもあります。
単位元に関しては順序を問わないという定義の要請があるので、ee’=e’eです。

という事は、e’e=e’=eを意味します。これで証明終りというわけです。

このような単位元の定義(およびそれを満たすと言える集合)では、必然的にそのような単位元は1つだけ定まるという意味です。

逆元の一意性

では、逆元については一意性は成立するでしょうか?

aa-1=eで、これに左側から仮定している別の逆元(a-1)’ をかけると、
(a-1)'(aa-1)=(a-1)’e=(a-1)’
同時に、(a-1)’a=eにより、(a-1)'(aa-1)=((a-1)’a)a-1=a-1
ゆえにa-1=(a-1)’

よって、上記定義のもとで逆元も一意的に決まるという事です。この計算では、公理の1つめの「結合律」も前提として使用しています。言い換えると、結合律が成立していないと厳密にはこういった計算もできないという事です。

群の逆元の一意性

簡約律

ax=ay ⇒ x=y の事です。

これは単純にaの逆元を左側からかければ終わる話ですが、やはり結合律が成立しているのでそのように計算できるという事が一応重要です。

ax=ay ⇒ a-1(ax)=a-1(ay) ⇔ (a-1a)x=(a-1a)y ⇔ x=y

積の形の逆元

次のように、積の形全体の逆元は個々の逆元の積になるのですが、順番が逆になるというものです。

(abcd)-1=d-1-1-1-1

これは、
abcd(d-1-1-1-1)=e かつ (d-1-1-1-1)abcd=e
である事から示されます。dd-1=e、aa-1=eなどの関係でどんどん消していけばよいのです。

ただし、交換可能である群の場合は最初の形をひっくり返せる事からこれについては気にしなくていい事になります。実際、実数などでの割り算ではこのような「順番」については気にしなくてよいわけです。

   

4次方程式の解の公式

4次方程式の「解の公式」の導出方法を説明します。

公式の導出の流れ

3次方程式同様に公式自体は複雑で、理論の中ですらあまり計算の役に立ちません。そのため覚える事は一般に不要ですが、4解を必ず「係数のベキ根で表せる」という事が数学的な事実として重要な位置付けなのです。「4次」までは方程式の係数を使った解の公式が存在するという事です。

解法の手順は多少3次方程式の場合に似ていて、いくつかのステップを経て下位の次数の方程式に変形できる事が、公式を導出できる根拠になります。

  1. 方程式の各項を左右の辺に分けて平方の形を作る事を考える
  2. 方程式の解とは別の未知数yを考え、加える事で「平方=平方」の形になるyの条件を考える
  3. 結果:yは3次方程式の解になり、もとの方程式の係数のベキ根の組み合わせで書く事ができる。よって、もとの方程式の解xを表す「公式」を得る。

公式の導出

4次と3次の項と、その他の項を両辺に分けます。

$$x^4+ax^3+bx^2+cx+d=0$$

$$\Leftrightarrow x^4+ax^3=-(bx^2+cx+d)$$

左辺を平方の形にする事を考えます。そのために、両辺に2次の項を加えるのです。

4次方程式の解の公式の導出①

$$両辺に\frac{ax^2}{4}を加えます。$$

$$x^4+ax^3+\frac{ax^2}{4}=-(bx^2+cx+d)+\frac{ax^2}{4}$$

$$\Leftrightarrow \left(x^2+\frac{ax}{2}\right)^2=\left(\frac{ax^2}{4}-b\right)x^2-cx-d$$

右辺は2次式なので、何かの項を加えれば強引に平方の形にできます。
しかし、ここでは左辺も平方の形である事を保ちたいのです。そのため、少々工夫をします。

今のこの状態で左辺は平方の形である事がポイントで、ある別の未知数yを使った次の項を両辺に加えます。

$$\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}を両辺に加えます。$$

$$\left(x^2+\frac{ax}{2}\right)^2+\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}=\left(\frac{ax^2}{4}-b\right)x^2-cx-d+\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}$$

$$\Leftrightarrow \left(x^2+\frac{ax}{2}+\frac{y}{2}\right)^2=\left(\frac{ax^2}{4}-b+y\right)x^2+\left(\frac{ay}{2}-c\right)x+\frac{y^2}{4}-d$$

左辺は再び平方の形であり、右辺はyという未知数を含んだ2次式です。

yという数を加える前との違いは、それを加える前の各係数は所定の(任意の)係数ですので値を自由にいじれませんが、yというのは変数であるこの段階では任意ですので調整がきくという事です。次に問題となっていくのは、右辺を平方の形するためのyを、「もとの方程式の係数a、b、cで表せるか?」という事です。

4次方程式の解の公式の導出②

この段階で、右辺を平方の形にする事を考えましょう。これは、一般の2次関数をそのような形にするのと全く同じ要領です。式の形だけが多少込み入るので、右辺の式の係数をそれぞれA,B、Cと置いておきます。

$$右辺=Ax^2+Bx+Cと置きます。$$

$$Ax^2+Bx+C=A\left(x+\frac{B}{2A}\right)^2-\frac{B^2}{4A}+C=0$$

$$よって、-\frac{B^2}{4A}+C=0\Leftrightarrow B^2-4AC=0となればよい。$$

この計算自体は、2次関数や2次方程式をいじくる時のものと全く同じですね。ここで、A,B、Cをもとの形に戻して必要な条件を眺めてみましょう。

$$B^2-4AC=0\Leftrightarrow \left(\frac{ay}{2}-c\right)^2-4\left(\frac{ax^2}{4}-b+y\right)\left(\frac{y^2}{4}-d\right)=0$$

これが成立すればよいのですが、これを満たすyが存在するかという話です。式をよく見ると、これはyに関する3次方程式で、しかも係数はもとの4次方程式の係数a、b、cの組み合わせで構成されている事がポイントです。3次方程式ですから、これは「解の公式」が存在しますからyに関して解く事ができて、しかももとの4次方程式の係数a、b、cで表す事ができるのです。

その条件をyが満たすものとすると、もとの4次方程式は「平方=平方」の形になりますから、これは2乗の形をはずす事ができます。その時に、もちろん正負の2つの外し方があります。

$$\left(x^2+\frac{ax}{2}+\frac{y}{2}\right)^2=A\left(x+\frac{B}{2A}\right)^2$$

$$\Leftrightarrow x^2+\frac{ax}{2}+\frac{y}{2}=\pm \sqrt{A}\left(x+\frac{B}{2A}\right)$$

$$A=\frac{ax^2}{4}-b+y,\hspace{5pt}B=\frac{ay}{2}-c$$

つまり、xに関する「2つの2次方程式」ができます。もちろん、これはxについてさらに解く事ができるのです。また、解の個数は最高で2×2=4個という事も分かります。すなわち、4次方程式の「解の公式」も方程式の係数を使って表す事ができるという事が示された事を意味します。

ただしこれまでの経緯を見て分かる通り、まずyに関して3次方程式を解き、その解を係数として組み合わせた2次方程式をさら解くという作業があります。ですので、「4次方程式の解の公式」というのは少なくとも手計算では「使いたくない公式」である事はよく分かるかと思います。

2次方程式の解の公式も決してきれいな形ではないですが、あれはまだ一応手計算で「使える」公式であるという事が対比して分かると言えるかもしれません。

代数学の中での位置付け

さて問題は続き、「では公式の複雑さは度外視して、5次方程式も同じように『解の公式』を出せるのか」という話になります。結論は次の通りです:

  • 1~4次方程式と同じ要領で、同じ意味での5次以上の方程式の「解の公式」を構成する事はできない。(それが数学的に正しい答えである)
  • その事を数学的に証明するには、視点を変えたより抽象的な考察が必要である。

言ってみれば、3次方程式や4次方程式の解の公式の導出は、多少計算が複雑だったり工夫が必要だったりするものの、やる事自体は「高校数学」の範囲で理解可能であるものなのです。

他方で、「視点を変えてみた抽象的な考察」というのが、大学以上の授業で言う「代数学」の分野の内容だと捉えればよいと思います。数学史的には、19世紀以降に西欧で考察されるようになった数学の分野です。

言い換えるとそれは西欧でもその時期になって初めて本格的に研究されるようになった事案であって、言われなければ普通は気付かないし、言われずに気付いたとしても分かりやすい理論として即座にまとめるのは至難の業である事が反映されているように思えます。しかし簡単な事項から少しずつ整理すれば、もちろん誰にでも理解する事は可能です。