【群論】可解群の性質

可解群(solvable group)とは、群に対して交換子群列を作った時に
(G)={e}【単位元だけからなる】となる自然数kが存在する群Gの事です。以下、D(G)(=D(G))はGの交換子群で、D(G)=D(D(G))、D(G)=D(D(G))、・・・等とします。

◆可解群に関しては、次の定義をする事もあります:
群Gに対して有限個の正規部分群の列Hがあり【jは自然数、H=G】、次のようにGの正規部分群同士でもHはHj-1の正規部分群になっているものとする。$$G=H_0\triangleright H_1 \triangleright H_2\triangleright H_3\triangleright \cdots\triangleright H_{n-1} \triangleright H_n=\{e\}$$さらに剰余群Hj-1/Hは可換であるとする。このような時、Gを可解群と呼ぶ。
この定義は、実は交換子群を使った方の定義と同等のものです。以下の議論では交換子群を使ったほうの定義で話を進めていきます。

可解群の性質7つ

可解群のいくつかの重要な性質をまとめると次のようになります。

可解群とその性質

交換子群列を作った時に$$G\supset D_1(G)\supset D_2(G)\supset D_3(G)\supset \cdots\supset D_k(G)=\{e\}$$ となる自然数kが存在する時にGを可解群と言い、次の性質があります。

  • 可換である群は全て可解群である。
  • 可解群の部分群も可解群である。
  • 可解群の剰余群も可解群である。
  • Gの正規部分群Nに対して、Nと剰余群G/Nが共に可解群ならばGも可解群となる。
  • Gの正規部分群Nに対して、剰余群G/Nが可換群になる必要十分条件は、NがD(G)を含む事【N⊃D(G)】である。
  • 可解群の交換子群列のうち、隣り合うもの同士の剰余群Dj-1(G)/D(G)
    【D(G)/D(G)等】は可換群である。
  • 可換群を交換子群列で定義したものとGの正規部分群の列で定義したものは、必要十分条件で結ばれるので互いに同等である。

言葉として「可換」と「可解」が似ていて紛らわしいので注意。

以下、証明をしていきます。

①可換である群は全て可解群

まず最初は簡単です。
{e}の交換子を作ってもeにしかならないので、交換子群列は一度{e}になるとその先の交換子群はずっと{e}です。可換群はそもそも任意の交換子が単位元eであるわけですから、「可換群は可解群である」と言えます。

②可解群の部分群も可解群

2番目については集合としての包含関係を丁寧に見て行きます。
交換子についてHがGの部分群であれば、Gの交換子群にはHの元で作った交換子も全て含まれるので、D(G)⊃D(H)です。【交換子群列の中ではこれはD(G)およびD(H)】
すると、今度はD(G)の交換子群とD(H)の交換子群についても同じ事が言えるわけですから、D(G)⊃D(H)です。
以下同様にして任意の自然数jについてD(G)⊃D(H)です。
ここで、Gが可解群であればD(G)={e}となるkが存在するので、
その番号において{e}⊃D(H)であり、
それを満たせるのは同じく単位元だけからなる群しかないのでD(H)={e}であり、従ってHも可解群である事を意味します。

③可解群の剰余群も可解群

3番目は、剰余類と剰余群の性質を丁寧に扱う必要があります。
次にNをGの正規部分群として剰余群G/Nの交換子を考えます。
Gの元xとyを使って、交換子群D(G/N)の元は
(Nx)-1(Ny)-1(Nx)(Ny)=N(x-1-1xy) と書けます。
【D(G/N)もまた剰余類を元とする群であり、N=Neを単位元とする。】
ここで2つの元の積を元とする別の群ND(G)={nb|n∈N,b∈D(G)}を考えると、
これはNを正規部分群に持つ群となりNによる剰余群を定義できます。
【※一般に、HがGの部分群で\(G\triangleright N\)である時、NはNHの部分群であり、任意のs∈NH(⊂G)に対してsN=Nsとなる(任意のt∈Gに対してそうだから)ので、NはNHの正規部分群。
このタイプの群に対する剰余群は、(NH)/Nの事をNH/Nのように書きます。】
剰余群ND(G)/Nの元はN(nb)=(Nn)bですが、
Nが群でn∈Nに対してNnは集合としてはNとして全く同じ物になるので、N(nb)=Nb=N(x-1-1xy)
よって、全く同じ元を持つのでD(G/N)=ND(G)/N
他方、D(G/N)の元uとwを使うとD(G/N)=N(u-1-1uw) ですが、
剰余群ND(G)/Nの元は先ほどと同じくn∈Nを考えると
N(nu-1-1uw)=(Nn)(u-1-1uw)=N(u-1-1uw) となり、
(G/N)=ND(G)/N という事にもなります。
全く同じ論法で、任意の自然数jに対してD(G/N)=ND(G)/N が成立します。
すると D(G)={e}となるkにおいて、
ND(G)/N の元はN(ne)=Ne=N【剰余群の単位元】ただ1つという事になり、
(G/N)=ND(G)/N=N となってG/Nも可解群であるという結果になります。

④正規部分群Nと剰余群G/Nが共に可解群 ⇒ Gも可解群

次に4番目の性質ですが、これも1つ1つの式を丁寧に紐解きます。
G/NとNが共に可解群である場合には、
①:Dk1(G/N)=Ne=N かつ
②:Dk2(N)={e}
となる自然数kとkが存在します。
この時、前述において示した事からDk1(G/N)=NDk1(G)/N であるわけですが、
k1(G/N)=NですからN=NDk1(G)/Nという事になり、
実はDk1(G)⊂Nが成立しています。
【※n∈Nおよびb∈Dk1(G)として、NDk1(G)/Nの元N(nb)=Nb は集合としてNに等しくならないといけないので、bはNの元である必要があります。それがDk1(G)⊂Nの意味です。】
すると、Dk2(N)⊃Dk2(Dk1(G)) です。
ここで、Dk2(Dk1(G))とは
「すでにGから始めてk回交換子を作る演算を行ってできた交換子群に対し、
そこを起点として改めてk回交換子を作る演算を行ってできた交換子群」です。
従って、Gから始めて(k+k)回の交換子を作る演算を行ったDk1+k2(G)に等しいという事です。
よってDk2(N)⊃Dk2(Dk1(G))=Dk1+k2(G)であり、
k2(N)={e}でしたから、{e}⊃Dk1+k2(G) であり、
これを満たすにはDk1+k2(G)={e}しかあり得ず、それを満たす自然数k+kが存在する事になります。よって、おおもとの群Gも可解群である事になります。

この4番目の性質について、特に次のような特別な場合には1つの命題が成立します。
以下、Hは群であるとします。

$$H_n\triangleright H_{n-1}\triangleright H_{n-2} \triangleright \cdots H_3\triangleright H_2\triangleright H_1\triangleright \{e\}$$

ここで、もし\(H_{j+1}\triangleright H_j\) が任意の自然数jについて成立し、剰余群Hj+1/Hが可解群であり、
またHも可解群であったとしましょう。

そのような特別な場合が発生する時、Hが可解群であり、H/Hも可解群ですからHも可解群です。
そしてH/Hも可解群なので、Hも可解群です。
同様にして、任意の自然数jについてHは可解群という事になります。
より具体的には、例えば剰余群Hj+1/Hが巡回群であれば可換群ですから可解群という事にもなります。そのようなタイプの群は、ベキ根で解ける多項方程式のガロア群を論じる時に出てきたりします。

⑤剰余群G/Nが可換群 ⇔ NがD(G)を含む事

【これは交換子群一般について言えます。性質として特に可解群に関係が深いです。】
5番目の性質については、まずG/Nの元の積を順番を変えて書いてみます。
xとyをGの元として、
(Nx)(Ny)=N(xy) と(Ny)(Nx)=N(yx) の2パターンありますが、
もしN(xy)=N(yx)であるのなら
【※ここでの括弧は分かりすくするためにつけているだけで、Nxy=Nyxと書いても同じ】
-1-1を右から乗じる事によって
N(xyy-1-1)=N(yxy-1-1) ⇔ N=N(yxy-1-1)
これが成立するためには、yxy-1-1がNの元でなければなりませんが、
yxy-1-1はGの交換子です。
【yxy-1-1の逆元はxyx-1-1
よって、G/Nが可換という事は任意のD(G)の元が例外なくNの元でもある事、
つまりD(G)⊂Nを意味します。
逆にD(G)⊂Nならば
N=N(yxy-1-1) ⇔ N(xyy-1-1)=N(yxy-1-1) のように逆にたどって、
右側からxyを乗じればN(xy)=N(yx)となり、剰余群G/Nは可換である事になります。

⑥交換子群列の隣り合う交換子群の剰余群は可換

6番目の性質については、交換子群列において例えばD(G)⊃D(G)のような包含関係があり、
しかもそれらは群と正規部分群の関係にあって\(D_2(G)\triangleright D_3(G)\) のようになっています。
そこで剰余群D(G)/D(G)の可換性を調べてみると、
(G)とは「D(G)の交換子群」なのでD(G)=D(D(G)) とも書けます。
集合が(群も含めて)等号で結ばれるという事は
「D(G)⊃D(D(G))かつD(G)⊂D(D(G))」という事ですから、
【上述の5番目の性質により】D(G)⊃D(D(G)) ⇔「D(G)/D(G) は可換である」事になります。
同じように任意の自然数jとj+1の交換子群についても
(G)=D(Dj+1(G)) ⇒ D(G)⊃D(Dj+1(G))
⇔「D(G)/Dj+1(G) は可換である」という事が言えます。
可解群の場合、最後{e}になっている部分についても同様に
{e}=D(Dk-1(G)) からDk-1(G)/{e}=Dk-1(G) が可換であるという事が言えます。
【{e}=D(Dk-1(G))という事自体から、
交換子群の性質によりDk-1(G)の任意の要素は可換であるとも言えます。】

あるいは、交換子群の性質により「G/D(G)は可換である」と言えるので、
これをD(G)/Dj+1(G)にも適用して示す事もできます。本質的に同じ証明です。

⑦2つの定義は同等である事

最後に7番目の性質として、2つの定義が同等である事を示します。
まず、交換子群列のほうの定義の場合での性質からDj+1(G)はD(G)の正規部分群であり、
剰余群D(G)/Dj+1(G)は可換であると言えるわけですから、
そのような部分群の列が存在するので
「交換子群列の定義 ⇒ 正規部分群と剰余群の可換性のみの定義」が言えます。

次に逆の場合です。$$G=H_0\triangleright H_1 \triangleright H_2\triangleright H_3\triangleright \cdots\triangleright H_{n-1} \triangleright H_n={e}$$の関係のもとで剰余群Hj-1/Hが可換であったとします。
この時には「G/Nが可換群 ⇔ D(G)⊂N」【上記5番目の性質】である事を思い出すと、
「G/Hが可換」なのでD(G)=D(G)⊂Hという事が言えます。
この時D(D(G))⊂D(H) ⇔ D(H)⊃D(G)でもあります。
【A⊂B ⇒ D(A)⊂D(B) 】
同様に「H/Hが可換」なのでD(H)⊂Hであり、先ほどのD(H)⊃D(G)と合わせると
⊃D(H)⊃D(G)が成立します。
以下、同様にH⊃D(G)、H⊃D(G)⊃D(G)⊃D(G)・・・・と続きます。
最後の部分でD(G)⊂H={e}となりますが、これはD(G)={e}を意味します。
よって、交換子群列の中で{e}となる交換子群が存在するので
「正規部分群と剰余群の可換性のみの定義 ⇒ 交換子群列の定義」が言えます。
よって、2つの定義は必要十分条件で結ばれるので同等な定義である事になります。

【群論】交換子・交換子群・交換子群列

交換子群は多項方程式の可解性(ベキ根で解ける事)との関連性が非常に深い群です。

交換子と交換子群

Gがあって、xとyがその元であるとします。
この時、xyとyxは等しいとは限りません。

他方で、x-1-1xy という4つの元の積からなる別の元を考えてみて、
これを [x,y] と書く事にして「交換子」(commutator)と呼ぶ事にすると、
[x,y][y,x]=[y,x][x,y]=e【単位元】となります。
【[y,x]=y-1-1yxで、[x,y][y,x]=x-1-1xyy-1-1yx=e】
つまり、任意の群の交換子[x,y]と[y,x]は互いに逆元の関係にあなります。

また、次のような性質もあります。
yx[x,y]=xyであり、
xy[x,y]-1=yx 【2番目の式はxy[y,x]=yx でも同じ】
であるという関係式が成立します。
【群の逆元の演算規則により、(x-1-1xy)-1=y-1-1yxである事に注意】
つまり、右から乗じる(逆元の形も含めて)事で任意の積の順序が入れ替わる作用も持ちます。

ここで、交換子が「単位元eに等しい」という場合があり、次の事が成立します。

群の任意の元に対してx-1-1xy=eならばxy=yxです。
つまり、群の任意の交換子が単位元に等しいならば群は可換である という事です。
(逆に、群が可換であれば任意の2つの元で作る交換子は単位元に等しい。)
◆証明:
両辺にyxを左から乗じて、x-1-1xy=e ⇒ xy=yx
両辺に (yx)-1=x-1-1 を左から乗じて、xy=yx ⇒ x-1-1xy=e
∴ x-1-1xy=e ⇔ xy=yx

実際、もとから可換であれば xy=yxなので当然xye=yxという、
一般の交換子が持つ作用と同じ形の関係式が成立するわけです。

そのような交換子の形をした元から成る群(これはGの部分群になる)を交換子群と言います。
D(G)={x-1-1xy|x∈G,y∈G}です。

Gの2つの部分群の元を使った交換子群を考える場合には括弧積 [ ] を使った書き方もします。
[A,B]={a-1-1ab|a∈A,b∈B}【A⊂G,B⊂G】

交換子群の性質

交換子群については、群Gの部分群としていくつかの性質があります。

交換子群の性質
  • 交換子群D(G)はGの正規部分群
    \(G\triangleright D(G)\)
  • 剰余群G/D(G)【D(G)が正規部分群なので定義できる】は可換
  • Gの正規部分群Nに対して剰余群G/Nが可換ならば、D(G)はNの部分集合となる。
    \(G\triangleright N \Rightarrow D(G)\subset N\)
  • 交換子群は可換な剰余群を作る正規部分群としては最小のものとなる。

正規部分群とは、Gの任意の元に対してtN=Nt【集合として同じものになる】
が成立するGの部分群Nの事であり、
剰余群とはGが正規部分群Nを持つ時に定義されるもので、Gの元に対する剰余類を元とする群です。
Nx、Nyを考えた時に、剰余群の積は(Nx)(Ny)=N(xy) 、逆元は(Nx)-1=N(x-1)と定義します。

◆交換子群の性質の証明:
tをGの任意の元とします。すると
t(x-1-1xy)t=(t-1-1t)(t-1-1t)(t-1xt)(t-1yt)
=(t-1xt)-1(t-1yt)-1(t-1xt)(t-1yt)∈D(G)
【t-1xtの形の元は交換子の形になっているため】
であり、tD(G)t-1⊂D(G)
【これはD(G)がG正規部分群であるために十分な条件。】
∴\(G\triangleright D(G)\)

次に、剰余群G/D(G)を考えると剰余類【これが剰余群の元】はD(G)x、D(G)yなどと書けますが、
G/D(G)の交換子を考えると
(D(G)x)(D(G)y)=D(G)(xy)【これが剰余群の演算の定義】
また、剰余群の逆元についても同様に考えると、
(D(G)x)-1(D(G)y)-1=(D(G)x-1)(D(G)y-1)=D(G)(x-1-1)
という事は、剰余群G/D(G)に対する「交換子」は
(D(G)x)-1(D(G)y)-1(D(G)x)(D(G)y)=D(G)(x-1-1xy)
しかしx-1-1xy∈D(G)なので、
集合としてD(G)(x-1-1xy)はD(G)に一致します。
D(G)そのものは剰余類としてはD(G)e 【eはGの単位元】であるから、
(D(G)x)-1(D(G)y)-1(D(G)x)(D(G)y)=D(G)e 【D(G)e=D(G)はG/D(G)の単位元】
∴任意の元で作った交換子が単位元に等しいのでG/D(G)は可換。

剰余群G/Hが可換であるなら剰余類【剰余群の元】について
H=He=H(x-1xy-1y)=H(x-1-1xy)【xとyはGの元】
つまり、H(x-1-1xy)は集合としてHに等しく、
Gの交換子群の任意の元はHの要素となるため、D(G)⊂H

Gの交換子群でない任意の可換な正規部分群は交換子群を含むので、交換子群よりも小さな正規部分群は他にはない。交換子群も可換な正規部分群なので、可換な正規部分群のうち最小のものという事になります。

交換子群列

交換子の理論の中でも、特に多項方程式の可解性に関わるのが交換子群列です。

Gの交換子群をD(G)とし、D(G)の交換子群をさらにD(G)とします。そしてさらにD(G)の交換子群を考えてD(G)とし、さらにD(G)の交換子群をD(G)とします。
・・・そういう感じでD(G)の交換子群をDk+1(G)という形で定義していくと、\(D_k(G)\triangleright D_{k+1}(G)\) となるような群の列ができます。その列を交換子群列と言います。

交換子群列

交換子群列とは、交換子群によって作る次のような列の事です。 $$G=D_0\supset D_1(G)\supset D_2(G)\supset D_3(G)\supset D_4(G)\cdots$$ $$D_{k+1}(G)はD_1(k)の交換子群$$

ところで、そのように交換子群列を次々に続けていった時に、無限に続くのか有限で終わるのかという話があります。これは、続けて行った時に単位元のみからなる{e}が現れた時を「終わり」という事にすると、有限で終わるものとそうでないものがあります。

(G)={e}となる自然数kが存在する時、おおもとの群Gを特に可解群と言います。
なぜそのように呼ぶのかというと、その大きな理由は「多項方程式が『ベキ根で解ける』時、解による拡大のガロア群の交換子群列は有限回で{e}で終わる(=可解群である)」という性質によります。

ところが、5次以上の多項方程式においてそのガロア群は対称群(置換群)であり【正確にはそれと同型】、
実は5次以上の対称群は可解群にならないのです。よって、一般の5次以上の多項方程式は「ベキ根で解ける(=係数とベキ根を使った解の公式が存在する)」部類の多項方程式に属さない、という命題が成立します。
一般の1~4次方程式のガロア群は可解群になります。

$$可解群:D_k(G)={e}となるようなkが存在する群G$$

平行四辺形の面積【ベクトルでの公式】

平行四辺形の面積は「底辺×高さ」です。(参考:台形の面積公式と同じ考え方)
他方で、「直交座標上の2つのベクトルが作る平行四辺形」の面積を、
「ベクトルの大きさと内積」あるいは「ベクトルの成分」で表す方法と公式があります。

(ベクトルが作る「三角形」の面積については、単純に平行四辺形の面積を半分個を考えます。)

ベクトルが作る平行四辺形の面積

原点を始点とする2つのベクトル\(\overrightarrow{a}=(a_1,a_2)\) と \(\overrightarrow{b}=(b_1,b_2)\) があり、なす角度がθであるという。
その時に、2つのベクトルを組み合わせて作られる平行四辺形の面積Sは次の公式で計算できます: $$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}=|a_1b_2-a_2b_1|$$

後述するように、考え方は3次元での2つの空間ベクトルが作る平行四辺形にも適用できます。

平面ベクトルの場合

まず、考え方としては単純に「底辺×高さ」で行きます。

そして、「底辺」の長さについては1つのベクトルの大きさを使います。

次に、もう1つのベクトルの大きさの正弦が「高さ」になるのです。

そこで、三角比の公式 sinθ+cosθ=1を使って正弦を余弦で表します。
(この公式は三角関数の範囲の一般角でも成立します。)

$$底辺:|\overrightarrow{a}|$$

$$高さ:|\overrightarrow{b}|\sin\theta$$

$$公式から【0<\theta <\piの時】:\sin\theta=\sqrt{1-\cos^2\theta}$$

$$\left(-\pi<\theta <0の時は\sin\theta=-\sqrt{1-\cos^2\theta}ですが、面積を考える時はその絶対値を考えます\right)$$

平面ベクトルが作る平行四辺形の面積

さらに余弦をベクトルの内積と大きさで表せる事に注意すると、
平行四辺形の面積を「ベクトルの大きさと内積」だけで表せます。ここで、もし2ベクトルが成す角が直角であれば直ちに長方形で面積は確定するので、直角でない時を考えます。

$$\overrightarrow{a}\cdot\overrightarrow{b}=|\overrightarrow{a}||\overrightarrow{b}|\cos\theta$$

$$\cos\theta=\frac{\overrightarrow{a}\cdot\overrightarrow{b}}{|\overrightarrow{a}||\overrightarrow{b}|}$$

以上の事を代入しながら繋げていって、平行四辺形の面積を計算できるわけです。
一見すると無理やり計算しても滅茶苦茶な式になってしまいそうですが、実は分母と分子がうまく噛み合って比較的単純な形になります。(sinθが負になる場合も考慮して絶対値の|sinθ|を考えますが、要するにプラスの値だけ考えるという意味になります。)

$$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|=|\overrightarrow{a}||\overrightarrow{b}|\sqrt{1-\cos^2\theta}$$

$$=|\overrightarrow{a}||\overrightarrow{b}|\sqrt{1-\frac{(\overrightarrow{a}\cdot\overrightarrow{b})^2}{|\overrightarrow{a}|^2|\overrightarrow{b}|^2}}=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2\left(1-\frac{(\overrightarrow{a}\cdot\overrightarrow{b})^2}{|\overrightarrow{a}|^2|\overrightarrow{b}|^2}\right)}$$

$$=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}$$

平方根の根号(√)の中にベクトルの大きさを2乗の形で入れてしまう事で、このようになるわけです。
この式は、平面でも3次元の空間でも成立します。

ここで、さらにベクトルの成分を使うと別の公式を導出できます。

$$\overrightarrow{a}=(a_1,a_2)\hspace{10pt}\overrightarrow{b}=(b_1,b_2)のもとで、$$

$$|\overrightarrow{a}|^2|\overrightarrow{b}|^2=(a_1\hspace{2pt}^2+a_2\hspace{2pt}^2)(b_1\hspace{2pt}^2+b_2\hspace{2pt}^2)=(a_1b_1)^2+(a_1b_2)^2+(a_2b_1)^2+(a_2b_2)^2$$

$$(\overrightarrow{a}\cdot\overrightarrow{b})^2=(a_1b_1+a_2b_2)^2=(a_1b_1)^2+(a_2b_2)^2+2a_1b_1a_2b_2$$

一見ちょっと面倒な形になっていますが、引き算するとなくなる項が出てきます。

$$|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2=(a_1b_1)^2+(a_2b_1)^2-2a_1b_1a_2b_2=(a_1b_2-a_2b_1)^2$$

このように上手く2乗の形になるので、平行四辺形の面積は次のようにも書けるわけです。

$$S=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}=\sqrt{(a_1b_2-a_2b_1)^2}=|a_1b_2-a_2b_1|$$

最後に絶対値記号をつけているのはabーabという値がプラスかマイナスかはその時々によって違うので、どちらにせよ絶対値を考えれば面積になるという意味です。

この公式は、重積分の変数変換の公式の中で使ったりもします。

空間ベクトルの場合

3次元の空間ベクトルの場合でも、同じくベクトルの成分で平行四辺形の面積を表せます。
この場合にはまとめ方がちょっと面倒で、2乗の形の3つの式の和が平方根の中に入る形になります。

$$S=|\overrightarrow{a}||\overrightarrow{b}||\sin\theta|が空間ベクトルでも成立する事に注意して、$$

$$\overrightarrow{a}=(a_1,a_2,a_3)\hspace{10pt}\overrightarrow{b}=(b_1,b_2,b_3)のもとでは、$$

$$S=\sqrt{|\overrightarrow{a}|^2|\overrightarrow{b}|^2-(\overrightarrow{a}\cdot\overrightarrow{b})^2}$$

$$=\sqrt{(a_1b_2)^2+(b_1a_2)^2+(a_1b_3)^2+(b_3a_1)^2+(a_2b_3)^2+(a_3b_2)^2-2(a_1b_1a_2b_2+a_1b_1a_3b_3+a_2b_2a_3b_3)}$$

$$=\sqrt{(a_1b_2-b_1a_2)^2+(a_1b_3-b_3a_1)^2+(a_2b_3-a_3b_2)^2}$$

この表示は、3次元ベクトルの外積(ベクトル積、クロス積)を使用する時に使う場合もあります。

◆外積の計算で使う場合には、上記の面積の式は$$S=\sqrt{(a_2b_3-a_3b_2)^2+(a_1b_3-b_3a_1)^2+(a_1b_2-b_1a_2)^2}$$のように順番だけ並び替えたほうが外積ベクトルの成分との対応が明確になります。
平方根の中の2乗になっているそれぞれの項が、実は2次元平面上の「平行四辺形」の形になっている事に注意。これは、3次元空間の中でのちゃんとした幾何的な意味も持っていて、外積ベクトルを使う計算で重要になります。

3次元空間での平行四辺形の面積

体の拡大

代数学での「体」【たい】の拡大という考え方について説明します。

英:拡大体 extension field 部分体 subfield
【体:field 日本語訳は、おそらくドイツ語での名称から。 】

「体」の拡大とは?

実数に対してi=-1となるiを導入して複素数a+biを考える事や、
有理数に対して平方根などを使ってp+q\(\sqrt{2}\) を考える事を、「拡大」と言います。
実数や有理数は「体」(たい)という構造の集合に分類され、拡大を行う事で別の体である「拡大体」という集合ができると解釈します。逆に、拡大した体の側から見た時、もとの体は「部分体」であると言います。

より一般的には、2つの体KとLがあるとしてLがKの拡大体である時、その「拡大」自体の事を記号でL/Kと書きます。この表記を使うと、例えば実数から複素数への拡大は\(\mathbb{C}\)/\(\mathbb{R}\)と表されるわけです。
もちろんこの記号は、対象のKとLが体である時に限って体の拡大としての意味を持ちます。
【通常の数や関数についてはx/yは割り算で、対象が群ならG/Hは剰余群、環であれば剰余環、特に指定のない集合に対しては差集合を表します。】

体の「拡大」
  • \(\mathbb{C}\)は\(\mathbb{R}\)の「拡大体」
  • \(\mathbb{R}\)は\(\mathbb{C}\)の「部分体」
  • 記号では、実数体→複素数体への「拡大」を \(\mathbb{C}\)/\(\mathbb{R}\) と書く。

複素数に関しては複素関数論などでも詳しく扱われるので、ここでは有理数に対するp+q\(\sqrt{2}\)の形の数を元に持つ集合\(\mathbb{Q}\left(\sqrt{2}\right)\)などについて具体例として詳しく見てみます。

平方根の計算を行う時、例えば$$(1+2\sqrt{2}+\sqrt{3})+(2-\sqrt{2}+3\sqrt{3})$$ $$=(1+2)+(2-1)\sqrt{2}+(3+1)\sqrt{3}$$ $$=3+\sqrt{2}+4\sqrt{3} $$のように、「有理数だけの項」「2の平方根の項」「3の平方根の項」ごとに分けて加算や減算を行います。平方根でなくても3乗根でも4乗根でもよく、要するに無理数があれば同じように計算します。

このような時、有理数全体\(\mathbb{Q}\)の元に対して、何か有理数でない別の元を組み合わせて計算を行っているわけです。2+3\(\sqrt{2}\) のような数は「実数」の元であると言うのはもちろん正しい表現ですが、この形の元に限ったものだけを集めて「体」の構造を保つようにしたものは有理数の「拡大体」と見なすことができ、\(\mathbb{Q}\left(\sqrt{2}\right)\) のように書きます。実数に対する複素数と同様に考えるという事です。

$$\mathbb{Q}(\sqrt{2})=\{p+q\sqrt{2}|p,q\in\mathbb{Q}\}$$

このようなものを考える時は、3の平方根などの他の無理数は考えずにp+q\(\sqrt{2}\) の形の数同士の加減乗除の計算を考えます。この時、q=0とすれば通常の有理数になるので、集合として、\(\mathbb{Q}\subset\mathbb{Q}\left(\sqrt{2}\right)\) のような包含関係になります。2の平方根を添加した拡大体のほうが、もとの有理数全体よりも大きい集合です。

この場合の加減乗除の計算自体は通常の平方根を含む計算と全く同じですが、複素数の計算との類似性に注意すると共通点が見えてくるかと思います。

$$(p_1 +q_1\sqrt{2})\pm (p_2 +q_2\sqrt{2})=(p_1\pm p_2)+(q_1\pm q_2)\sqrt{2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

$$(p_1 +q_1\sqrt{2})(p_2 +q_2\sqrt{2})=(p_1p_2+2q_1q_2)+(p_1q_2+p_2q_1)\sqrt{2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

$$\frac{1}{p +q\sqrt{2}}=\frac{p -q\sqrt{2}}{(p +q\sqrt{2})(p -q\sqrt{2})}=\frac{p -q\sqrt{2}}{p^2 -2q^2}\in\mathbb{Q}\left(\sqrt{2}\right)$$

商のところに関しては、1を割ったものだけ考えれば一般の商はそれとの積と考えられるので分子を1としています。このように、加減乗除の計算の計算結果後も\(\mathbb{Q}\left(\sqrt{2}\right)\)の集合に属するので、このような時に体\(\mathbb{Q}\left(\sqrt{2}\right)\)は加減乗除の計算に関して「閉じている」と言います。

\(\mathbb{Q}\left(\sqrt{3}\right)\) や \(\mathbb{Q}\left(\sqrt{5}\right)\)のような拡大体でも事情は同じで、加減乗除の計算に関して閉じています。

ここで、p+q\(\sqrt{2}\) +r\(\sqrt{3}\) のような形の場合には拡大体として見る場合には注意が必要で、記号としては\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\) のように書きますが、実際のところは \(\sqrt{6}\) も含まれます。これは、積や商の計算で\(\sqrt{2}×\sqrt{3}=\sqrt{6}\) が発生するためです。つまり実質的には、この拡大体は次のような形をしています。

$$\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)=\{p+q\sqrt{2}+r\sqrt{3}+s\sqrt{6}|p,q,r,s\in\mathbb{Q}\}$$

$$例えば、1+3\sqrt{2}+\frac{\sqrt{3}}{2}+2\sqrt{6}\in \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)$$

この場合、(\(\sqrt{6}\))=6、\(\sqrt{2}×\sqrt{6}=2\sqrt{3}\)、\(\sqrt{3}×\sqrt{6}=3\sqrt{2}\) となるので2、3,6以外の平方根は加減乗除の計算で発生しません。

同じような注意点は、3乗根による有理数体の拡大を考える時にも発生します。

一見違うように見える拡大体が、実際は同一の集合である場合もあります。
\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\) と少し似た\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\) という拡大を考えると、一見別の体になる?ようにも見えますが、
じつは\(\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\)=\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\)です。

$$p+q(\sqrt{2}+\sqrt{3})$$

$$(\sqrt{2}+\sqrt{3})^2=5+2\sqrt{6},(\sqrt{2}+\sqrt{3})^3=2\sqrt{2}+6\sqrt
{3}+9\sqrt{2}+3\sqrt{3}=11\sqrt{2}+9\sqrt{3}$$

2乗のほうの形に注目すると、まず\(\sqrt{6}\)単独を\(\left(\sqrt{2}+\sqrt{3}\right)\)で表す事ができ、
3乗のほうの形に注目すると\(\sqrt{2}\)や\(\sqrt{3}\)単独を、\(\left(\sqrt{2}+\sqrt{3}\right)\)の加減乗除で表せます。

$$(\sqrt{2}+\sqrt{3})^3-9(\sqrt{2}+\sqrt{3})=2\sqrt{2},\hspace{15pt}(\sqrt{2}+\sqrt{3})^3-11(\sqrt{2}+\sqrt{3})=-2\sqrt{3}$$

$$p+q\sqrt{2}+r\sqrt{3}+s\sqrt{6}=p+q\frac{(\sqrt{2}+\sqrt{3})^3-9(\sqrt{2}+\sqrt{3})}{2}-r\frac{(\sqrt{2}+\sqrt{3})^3-11(\sqrt{2}+\sqrt{3})}{3}+\sqrt{6}$$

$$=p-\frac{5}{2}+\left(\frac{11r}{3}-\frac{9q}{2}\right)(\sqrt{2}+\sqrt{3})+\frac{s}{2}(\sqrt{2}+\sqrt{3})^2+\left(\frac{q}{2}-\frac{r}{3}\right)(\sqrt{2}+\sqrt{3})^3$$

\(\left(\sqrt{2}+\sqrt{3}\right)\)を4乗すると再び2、3,6の平方根が出てくるので4以上のベキ乗を考える必要はなく、有理数全体を動く独立変数が4つありますので、少々汚い形ですがこれは\(\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right)\)と同じ集合になります。

この例はちょっとめんどくさい計算でしたが、より簡単な例では実数体→複素数体の拡大の中にも見られます。実数を複素数に拡大する時はi=-1となるiを考えました。では、\(\alpha\)=-1となるような「別の実数で無い数?」を考えると別の拡大が可能でしょうか?

じつのところ、\(\alpha\)=-1となる\(\alpha\)は、複素数で表せてしまいます。理屈は簡単で、ドモアブルの定理を使えばcos(\(\pi\)/3)+isin(\(\pi\)/3), cos(2\(\pi\)/3)+isin(2\(\pi\)/3), -1の3つが該当します。(よく考えてみると当然ですが、これらの1つは実数です。)同様に、\(\alpha\)=-1を満たす\(\alpha\)を使って実数体の拡大を考えても、全て集合としては「複素数」と同じになってしまうわけです。
【ただし、それらの拡大を実数体ではなく有理数体の拡大として考えると話は変わってきます。】

では、実数については複素数以外の拡大はあり得ないのかというと、結論は「あります」。例えば複素数体の拡大として「四元数体」と呼ばれるものが該当します。さらに八元数と呼ばれるものを考える事も可能ですが、これは積の結合法則が成立しないものなので「体」には含まれません。

多項方程式の解による体の拡大【用語の整理】

体論の基本的な理論の中で重要な拡大の1つは、多項方程式の解による拡大です。キーワードはいくつかあるので整理しましょう。1つ1つの意味は大した事ないのですが、これらをごちゃごちゃに文章の中で使われると結構混乱する人も多いと思います。

「既約」 ■ 「モニック」 ■ 「体上の多項式」 ■ 「最小多項式」 ■ 「共役」 

「既約」

多項式が既約であるとは、簡単に言うとそれ以上「因数分解できない」という意味です。

これは「どの体で考えているか」によってどの式が既約かそうでないかが変わってくる事に注意が必要です。

例えば、x-2は、実数の範囲では因数分解可能ですが、有理数に限定した場合はそうではありません。そのためこの式は「有理数体上で既約である」あるいは「\(\mathbb{Q}\)上で既約である」と、代数学では表現します。

同様に、x+2は複素数の範囲では因数分解可能ですが実数の範囲では因数分解できないので、「\(\mathbb{R}\)上で既約」であり、\(\mathbb{C}\)上では既約ではないと表現します。

「モニック」

「モニック」とは、多項式の最大の次数(ベキ乗の数)の項の係数が1であるという事です。
これは、意味自体は簡単な事で、大げさな事ではありません。
【「モノ」とは単一とか1を表す語で「モノクロ」とか「モノラル」等の「モノ」です。】

-2x+1, x+x, x+1, x+3x+2などの多項式はみな「モニック」です。

2x-2x+1, 3x+1, -x+3x+2などの多項式はモニックではありません。

「体上の多項式」

係数は全て体Kの元である多項式を「K上の多項式」と言います。
例えば、x-2x+1などの実数係数の多項式は「\(\mathbb{R}\)上の多項式」の1つです。x-2ix+1などは、実数で表せないiが係数に入っていますので「\(\mathbb{C}\)上の多項式」(のうち\(\mathbb{R}\)上の多項式を含まないもの)の1つです。

「最小多項式」

\(\alpha\)∊Lと、ある体KがあってK上の多項式でf(\(\alpha\))=0となるもののうち「既約」で「モニック」で「次数が最小のもの」を特に「最小多項式」と言います。

例えば、x+1はi∊\(\mathbb{C}\)の\(\mathbb{R}\)上の最小多項式です。
-2は\(\sqrt{2}\)∊\(\mathbb{R}\)の\(\mathbb{Q}\)上の最小多項式です。
ここで、もし\(\sqrt{2}\)∊\(\mathbb{R}\)に対して\(\mathbb{R}\)上の最小多項式を考えるなら、それは1次式x-\(\sqrt{2}\)になります。

ちょっと整理すると次のようになります。

「\(\alpha\)∊LのK上の『最小多項式』」とは:

LはKの拡大体であるとして、
体Kの元を係数とする多項式、つまり「K上の多項式」のうち、
次のものを\(\alpha\)∊LのK上の最小多項式と言います。

  • \(\alpha\)∊Lを代入すると0になる【f(\(\alpha\))=0となる】
  • そのうち次数(xのn)が最小のもの
  • 既約である
  • モニックである

具体的な数に対する最小多項式を導出する時には計算の工夫が必要な場合もあります。
例えば \(\alpha=\sqrt{2}+\sqrt{3}\) の「\(\mathbb{Q}\)上の最小多項式」が具体的にどんなものかを知りたい場合には、
まず式を変形してから \(\alpha -\sqrt{2}=\sqrt{3}\) の両辺を2乗します。$$\alpha^2-2\sqrt{2}\alpha+2=3$$$$\Leftrightarrow \alpha^2-1=2\sqrt{2}\alpha$$2乗した後にさらに変形した後の式の両辺を、さらに2乗します。$$\alpha^4-2\alpha^2+1=8\alpha^2\Leftrightarrow \alpha^4-10\alpha^2+1=0$$ このように、2段階に分けて平方根の部分を有理数にしています。
\(\alpha=\sqrt{2}+\sqrt{3}の\mathbb{Q}\)上の最小多項式はx-10x+1です。【係数は確かに有理数。】

「共役」

複素数で「共役複素数」というものがありますが、これはより一般的に言うと、L上のある元\(\alpha\)に対するK上の最小多項式f(x)に対して、\(\alpha\)以外でf(x)の根になる【f(x)=0の解になる】\(\alpha\)以外の他のLの元の事を指します。

複素数で言うと、1+iの共役複素数1-iはともにx+2x+2=0の解ですが、この左辺の多項式は「1+iの\(\mathbb{R}\)上の最小多項式」です。1-iは1+iの「\(\mathbb{R}\)上の共役」であると言います。

この意味では、共役というものは1つだけではなくもっと多くある事もあり得ます。x-2は\(\sqrt{2}\)∊\(\mathbb{R}\)の\(\mathbb{Q}\)上の最小多項式ですが、\(\sqrt{2}\)∊\(\mathbb{C}\)と考えると、x-2=0を満たす別の2解が存在します。それらが\(\sqrt{2}\)∊\(\mathbb{C}\)の\(\mathbb{Q}\)上の共役になります。

「代数拡大」

変数は複素数範囲、係数は実数である多項方程式(\(\mathbb{R}\)上の多項式)があったとしましょう。
【上記の通り、係数が全て体Kの元である多項式が「K上の多項式」です。】

任意の複素数xに対して、そのxが解となる実数係数の多項式は存在し、
そのような時に実数から複素数への拡大\(\mathbb{C}\) /\(\mathbb{R}\)は「代数拡大」と呼ばれます。

例えばてきとうな実数係数の多項式 x+x+\(\sqrt{2}\)x-x+1=0 などを考えると、
これを満たすx∊\(\mathbb{C}\)は必ず存在します【代数学の基本定理】。
現にこの多項方程式の解となるx=\(\alpha\) に対して、「\(\alpha\)∊\(\mathbb{C}\)は \(\mathbb{R}\) 上『代数的』である」という表現をします。

この「代数的」という語を使う時には、必ずL/Kという拡大があって、
「拡大体Lのほうの元」に対して、「K上」代数的であると言います。

これを一般の体K、Lについて置き換えると、\(\alpha\)∊Lに対して係数a~a∊Kが存在して
\(\alpha\)+a\(\alpha\)n-1+・・・+an-1\(\alpha\)+a=0となる時、\(\alpha\)∊L はK上で「代数的である」と言い、
任意のx∊LについてxがK上代数的である時、KからLへの拡大L/Kは「代数拡大」であると言います。

任意のx∊Lについて表現する用語なので、L/Kは「K上の代数拡大」という具合に言えばよい事になります。\(\mathbb{C}\)/\(\mathbb{R}\)は「\(\mathbb{R}\)上の代数拡大」である(単に拡大である事に加えて)という表現の仕方になります。

特に、K上の任意の多項式f(x)に対してf(\(\alpha\))=0となるような\(\alpha\)∊Kが存在する時、
Kは「代数閉体」であると言います。複素数体は代数閉体であり、実数体や有理数体は代数閉体ではありません。【例えばf(x)=x+1などを考えれば、これをゼロにするxはx=+i,-iなので。】

ここで、体の拡大L/Kがあって拡大体Lのほうが代数閉体である時には「LはKの『代数閉包』である」と言います。

この手の数学の分野は、上記のように様々な用語が出てきてややこしい事は間違いないのですが、意味や具体例を考えながら整理していくと意外と面白いかもしれない分野です。

部分群

群【ぐん】を作る集合の部分集合で、それ自体でも群を作るものを部分群と言います。

英:部分群 subgroup 正規部分群 normal subgroup

考え方と具体例

簡単な例で言うと、加群としての整数全体の部分集合のうち「偶数である整数の全体(負の数と0含める)」もそれ自体で加法に関して群を作るので部分群であるという事になります。

これに対して、「奇数である整数の全体(負の数含む)」は整数全体の部分集合ではありますが、加法について単位元となるべき0を含まない、奇数+奇数=偶数になる等の理由により加法について群になりません。そのため、加法に関して言えば「部分群では無い」という判定になります。

また、他に重要な例としてはn次の置換全体を表す群(対称群)に対して、n次の偶置換全体を表す群(交代群)も部分群になります。

部分群の例
  • 0を除く実数全体に対して、0を除く有理数全体は乗法に関して部分群になる。
    【無理数全体は実数全体の部分集合だが部分群にならない】
  • 有理数全体に対して、整数全体は加法に関して部分群になる。
  • 整数全体に対して集合{2n | nは整数}は加法に関して部分群になる。
    【集合{2n+1|nは整数}は整数全体の部分集合だが部分群にならない】
  • n次の置換全体Sに対してn次の偶置換全体Aや、
    1文字だけ固定してn-1次の置換全体Snー1同様に考えた集合は部分群になる。
    【Sの部分群を一般に「置換群」と呼びます。】
3次の対称群は3つの番号(あるいは文字)を入れ替える方法を元とする群です。

このように具体例で見るとそれほど難しいものではないのですが、代数学の群論ではもう少し抽象的なレベルでの部分群についての性質が重要になります。

式での定義と性質

部分群である事の定義を記号で書くと次のようになります。

部分群の定義

群Gの部分集合Hが次の2条件をともに満たす時、Hを「部分群」と呼びます。

  1. a∊Hかつb∊H ⇒ ab∊H
  2. a∊H ⇒ a-1∊H

Gが群でG⊃Hですから、元同士の積が行える事や逆元の存在自体は前提になっています。
群Gに対してG自身や単位元だけからなる集合{e}も部分群になります。それらを除いた部分群を特に「真部分群」と言う事もあります。

部分群に関する重要な最初の性質として、
「部分群Hが存在する時、Gの単位元は必ずHに含まれている」という事が言えます。

単位元と部分群に関する性質 群Gの部分群Hが存在する時、群Gの単位元はHの元となる。
「eが群Gの単位元」⇔「eは部分群Hの単位元」
(GとHとで別々の単位元を持つ事はなく、共通の単位元を必ず持つ。)

【証明】定義の2番目の条件により「a∊H ⇒ a-1∊H」であり、
定義の1番目の条件により「a∊Hかつb∊H ⇒ ab∊H」なので
「a∊Hかつa-1∊H」であるから「aa-1=∊H ⇔ e∊H」と言える事によります。
逆にeがHの単位元であれば、そのeがGの単位元ではないとするとHの外にGの単位元e’ がある事になりますが、先に示した事からそのe’ は部分群Hの単位元でなくてはなりません。しかしこれは、任意の群の単位元は一意性と矛盾します。よってeがHの単位元であればGの単位元でもあります。

さらに、定義から少し計算をすると「部分群である事」を次のように言い換える事もできます。

部分群であるための必要十分条件

次の関係が成立します。
「群Gの部分集合HがGの部分群である」⇔「a∊Hかつb∊H ⇒ ab-1∊H」
【証明の中で示されるように、「a∊Hかつb∊H ⇒ ab-1∊H」が成立するならa-1∊Hとb-1∊Hも成立します。ただ、例えばある部分集合が部分群になっている事を示すには「a∊Hかつb∊H ⇒ ab-1∊H」であるかを調べれば十分という事です。】

この必要十分条件の関係は自明ではないので証明が必要です。ただ、理屈自体は非常に単純です。

まず、「群Gの部分集合HがGの部分群である」ならば、
定義から「『a∊Hかつb∊H ⇒ ab∊H』かつ『a∊H ⇒ a-1∊H』」ですから、
b∊Hよりb-1∊Hであり、「a∊Hかつb-1∊H」であるから 「ab-1∊H」となります。
この時「a∊Hかつb∊H ⇒ ab-1∊H」の関係が確かに成立しており、
「群Gの部分集合HがGの部分群である」⇒「a∊Hかつb∊H ⇒ ab-1∊H」が成立します。

次に、「a∊Hかつb∊H ⇒ ab-1∊H」であるとすると、
「a∊Hかつa∊H」【b=aの時に相当】は常に成立するので、aa-1∊H ⇔ e∊Hであり、
「e∊Hかつa∊H」であるからea-1∊H ⇔ a-1∊H となるので、
この時「a∊H ⇒ a-1∊H」が確かに成立しています。
なおかつ、e∊Hが示されているので「e∊Hかつb∊H」も成立し、
aの場合と同様にeb-1∊H ⇔ b-1∊Hとなり、
「a∊Hかつb-1∊H」も成立するのでa(b-1)-1∊H ⇔ ab∊Hも成立します。
つまり「a∊Hかつb∊H ⇒ ab-1∊H」⇒「群Gの部分集合HがGの部分群である」が成立しています。

これらの証明は「確かにそうなるという事の保証」のようなもので、結果のほうが重要です。

部分群についての他の基本的性質としては、次のようなものがあります。

部分群の性質
  1. 群Gに対して2つの異なる部分群HとKがある時、
    その共通部分H∩Kも1つの部分群になる。
    【Gの単位元はH∩Kに含まれる事になります。】
  2. 群Gに属するが部分群Hに属しない元c対して、
    部分群Hに属する元aとの積acはGに含まれHには含まれない。$$【Gが群、Hがその部分群の時、c\in Gかつc\notin H かつ a\in H\Rightarrow ac\notin H】$$
  3. 群Gに属するが部分群Hに属しない2つの元bとc対して、
    積bcはHに含まれる場合・含まれない場合両方ともあり得る。

【証明】
■1番目の性質:a∊H∩Kかつb∊H∩Kとすると、
a∊Hかつb∊Hなので ab-1∊Hであり、
a∊Kかつb∊Kなので ab-1∊Kであるから、
ab-1はHの元でもあり、同時にKの元でもある、
つまりab-1∊H∩Kとなるので、 部分群であるための必要十分条件により示されます。

■2番目の性質:\(c\in Gかつc\notin H かつ a\in H\) のとき、ac∊Hとすると、
-1∊Hなのでa-1ac∊H ⇔ c∊H
しかしcはHに含まれないはずだったので、これは矛盾です。
あるいは、c∊Gとa∊Hに対してa-1(ac)=c\(\notin\)Hなので、
c\(\notin\)Hならa-1∊Hであるからac\(\notin\)Hとなる、とも言えます。

ここでの3番目の性質は一体何を言っているのかというと、加群で考えると比較的分かりやすいでしょう。
整数全体に対して3の倍数(0と負の数含む)を考えます。この時に、3n+1や3n+2で表されるものはもちろん3の倍数になりませんが、その和(群論一般で言うとこれが「積」に該当)は3n+3=3(n+1)ですから3の倍数になります。
他方、3n+1で表されるもの同士の和は3n+2の形ですから、3の倍数にはなりません。おおもとの群の元であって部分群の外にあるもの同士の積(加群だと「和」)は、部分群の元になる時もあるし、そうでない事も両方あり得るという事です。

このため、部分群Hの元aとその外にあるおおもとの群Gの元cの積acはHに含まれませんが、さらにその積同士を考えると部分群の中に戻る事もあります。例えばa∊Hのもとでacとc-1aがともにHに含まれない場合でも、その積はacc-1a=aaですからこれはHの元になります。

巡回部分群

群Gがあるとき、a∊Gに対して実数等との時の感覚でaa=a、aaa=a、a-1-1=a-2、a-1-1-1=a-3、・・のように書きます。実数等との時と全く同じ感覚でこれらをaの「べき」とか「べき乗」と言います。

この時、次の部分集合H={a|a∊G, nは整数}を考えます。
何かてきとうなGの元に対して、そのべき乗を集めるという事です。
例えばGが0以外の実数・演算は乗法であるとして、てきとうに「3」を選んでH={1,3,3,3,3,・・・,3-1,3-2,3-3,3-4,・・・}を考えるという事です。【3=1, 3=3】

この時、Gが群であれば、H={a|a∊G, nは整数}は必ず部分群になります。これは、定義から示してもよいですが前述の「部分群であるための必要十分条件」を考えるとより簡単であり、a∊Hかつa∊Hのもとでa-m=an-m∊Hとなるので確かに部分であるという事になります。a=a(=an+m)なので、これは可換群です。このような部分群Hを、特に「巡回部分群」と呼び、H=<a>と書く事があります。この場合にaを「Hの生成元」と言う事もあります。

巡回部分群

Gが群の時、H={a|a∊G, nは整数}を「巡回部分群」と呼びます。

  • H=<a>とも書く
  • aを「生成元」とも言う
  • 可換群である

加群の場合には、特に<a>={na|a∊G, nは整数}と書けます。

【★ 似た用語として、置換の1つの種類として「巡回置換」がありますが区別する必要があります。】

G自体が{a|a∊G, nは整数}として表される時にはGを「巡回群」と呼びます。

正規部分群

群Gに対して部分群Sがあったとき、t∊G【Sに含まれていてもそうでなくてもよい】とs∊Sを組み合わせたt-1stという積を考えます。これを元とする集合も部分群になり「Sに共役な部分群」と言います。

「共役な部分群」

Gが群、SがGの部分群でt∊G, s∊Sのとき、次の集合を「Sに共役な部分群」と言います。
-1St={t-1st |t∊G, s∊S }

これが本当に部分群になるかは、再び
「『群Gの部分集合HがGの部分群である』⇔『a∊Hかつb∊H ⇒ ab-1∊H』」
の、部分群であるための必要十分条件の関係から見るとすぐに示せます。

s∊Sかつu∊Sのもとで、
(t-1st)(t-1ut)-1=(t-1st)(t-1-1t)=t-1stt-1-1t=t-1(su-1)t∊S
よって、集合{t-1st |t∊G, s∊S }はGの部分群です。
【Sは部分群なので、u∊H ⇒ u―1∊H(上記で証明済です)なのでsu―1∊Sです。
また、群の元に関する公式 (ab)-1=b-1-1の関係に注意。】

さて、群Gに対して部分群Nがあれば「Nに共役な部分群」も必ずある事になりますが、この「Nに共役な部分群」がN自身であり、しかもN自身以外にはありえない時はNをGの「正規部分群」と呼びます。

「正規部分群」 Gが群、NがGの部分群でt∊G, n∊Nのとき、
「『Nに共役な部分群』(必ず存在)がN自身しかない」 時、NをGの「正規部分群」と呼びます。
式で書くと、任意のt∊Gに対し{-1nt|n∊N}=N,
もしくは-1Nt=N
もしくはtN=Ntなどと表されます。
ここでt-1Nt=NもしくはtN=Ntとは、左辺と右辺が集合として等しくなるという意味で、必ずしもNが可換であるという事ではありません。【tn=ntという意味でもないので注意。】

tがGの要素でNの要素でない時、n∊Nに対してt-1n\(\notin\)Nかつnt\(\notin\)Nです。
しかしそれらとtやt-1の積の(t-1n)t=t-1(nt)=t-1ntはNの元になり得ます。
Nが群Gの正規部分群である時は、t-1ntがNの元であり、かつnをNの中全体に渡って動かした時にNの中の全ての元になっている事を意味します。

少し理屈が込み入るようですが、この「正規部分群」とは具体例を探すと割と多くあるもので、
例えば「可換群の部分群」は全て正規部分群です。
【∵任意のn∊Nに対してt-1nt=nt-1t=nより、t-1Nt=N】
群Gに対するG自身や単位元だけの群{e}も正規部分群に該当し、「自明な正規部分群」と言います。
Gの正規部分群がこの「自明な正規部分群」しか存在しない時、Gを「単純群」と呼ぶ事があります。

「では非可換な群の部分群で、うまい具合にt-1Nt=Nなどという関係になるものがあるのか?」

結論を言うと、あります。非可換な群で重要なものとして置換全体から成る群がありますが、n次(n個の番号が対象)の置換全体に対して「n次の偶置換(操作回数が偶数回)全体の群」は正規部分群です。
また、4次の置換全体に対してはそれとは別の1つの正規部分群が存在します。
その他に、群Gの元a、bに対してa-1-1abを考え、これを元とする「交換子群」も正規部分群になります(Gが可換か非可換かに関わらず)。

この正規部分群というのは群論の基礎理論のなかで重要な役割を持っています。

行列式の基本公式

行列式について成立する基本公式をまとめてます。
一般のn次の行列式の定義だけでも大変面倒であるわけですが、ここで述べる公式によって特定の条件のもとでの行列式の値を計算するのが容易になる、行列式を含む理論計算が簡易になる等の利点があります。

行列式については、次のような基本性質が成立します。扱う行列は全て正方行列とします。

  1. 列ベクトルに対する線型性
    1. 1つの列ベクトルが和・差の形の行列の行列式は和・差の形に分解できる。
    2. 行列式の1つの列に定数を乗じたものは全体にその定数を乗じた値に等しい。
    3. 2つ以上の列における和・差・定数倍に関しても所定の規則で行列式を分割できる。
  2. 列の置換に関する性質
    1. 列を置換した行列の行列式は、もとの行列式にその置換の符号を乗じたものに等しい。
    2. 行列式の中に全く同じ要素が並ぶ列が2つあれば行列式は0になる。
  3. 積に関する性質
    1. 行列の積に対する行列式は、個々の行列の行列式の積になる。
    2. 逆行列の行列式と、もとの行列の行列式の積は1に等しい。

(これらのうち、列に関する性質は行についても同様に成立します。)

尚、高校数学の範囲や、行列の理論を限定的にのみ使う工学等の分野で2次の正方行列や3次の正方行列のみを扱う場合には、上記の公式は全て行列の成分の直接計算で示す事ができます。(2次の場合は計算は簡単ですが、一般性は分かりにくいでしょう。)

よく使われる行列の簡易表記として、行列の列の部分を一括して「列ベクトル」とみなすやり方があります。例えば3次の正方行列であれば次のように表す感じです。

$$\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) =(\overrightarrow{a_1},\overrightarrow{a_2},\overrightarrow{a_3})$$

$$\overrightarrow{a_1}=\left(\begin{array}{ccc} a_{11} \\ a_{21}\\ a_{31} \end{array}\right),\hspace{10pt} \overrightarrow{a_2}=\left(\begin{array}{ccc} a_{12} \\ a_{22}\\ a_{32} \end{array}\right),\hspace{10pt}\overrightarrow{a_3}=\left(\begin{array}{ccc} a_{13} \\ a_{23}\\ a_{33} \end{array}\right)$$

以下、証明も含めて詳しく見てみきましょう。

列ベクトルに対する線型性

式による表現(1つの列の場合) ■ 証明 ■ 一般の列ベクトルに対する線型性 

式による表現(1つの列の場合)

次のように、行列式の「列ベクトルに関する線型性」が成立します。c は定数(実数、複素数)とします。

$$A=(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots\overrightarrow{a_n})\hspace{5pt}のとき、$$

行列式の列ベクトルに対する線型性
  1. 列ベクトルが和・差の形の行列の行列式は和・差の形に分解できる。$$\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k}+\overrightarrow{b_k},\cdots\overrightarrow{a_n})=\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})+\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_k},\cdots ,\overrightarrow{a_n})$$
  2. 行列式の1つの列に定数を乗じたものは全体にその定数を乗じた値に等しい。$$\mathrm{det}(\overrightarrow{a_1},\cdots ,c\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})=c\hspace{3pt}\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})=c\hspace{3pt}\mathrm{det}A$$

和と差に関する性質のところは、「もとの行列と『1つの列だけ』別の列ベクトルに入れ替えた行列」の
行列式の和や差になるという事です。

列ごとの和になっているとか列ごと定数倍になっているとかいうのは、具体的には3次の正方行列で言うと次のような事です。

$$\mathrm{det}\left(\begin{array}{ccc} a_{11}+1 & a_{12} & a_{13}\\ a_{21} +3 & a_{22}& a_{23} \\ a_{31}-2 & a_{32} & a_{33}\end{array}\right) =\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) +\mathrm{det}\left(\begin{array}{ccc} 1 & a_{12} & a_{13}\\ 3 & a_{22} & a_{23} \\ -2 & a_{32} & a_{33}\end{array}\right) $$

$$\mathrm{det}\left(\begin{array}{ccc} a_{11} & 4a_{12} & a_{13}\\ a_{21}& 4a_{22}& a_{23} \\ a_{31} & 4a_{32} & a_{33}\end{array}\right) =4\hspace{3pt}\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

証明

列ベクトルに関する線型性は、要するに行列式を構成する各項には1つの列の要素が必ず入っている事に起因します。

$$\mathrm{det}A = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{i=1}^na_{\sigma(i)i}\right) $$

行列式は行列の成分を使うとこのように表せるので、式で示す場合には次のようになります。

まず和・差のほうから見ると、あるk列目のそれぞれの行の成分に何らかの数が加えられている状況なので、積になっている部分のk番目のところだけを和の形にすればよい事になります。
すると全体を2つの和に分けて、それぞれ行列式の形になるというわけです。

$$\sum_{\sigma}\left\{\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots (a_{\sigma(k)k}+b_{\sigma(k)k})\cdots a_{\sigma(n)n}\right\}$$

$$=\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots a_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)+\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots b_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)$$

結果の式では、積のk番目のところだけが別々になって2つの和になっています。
(積の部分は、積の記号\(\Pi\)を使用せずに直接各項を書き下す形にしています。省略部分「・・・」のところは掛け算が続きます。)

定数倍のほうも同じで、積のk番目のところがc倍で、これは和全体に乗じられる定数倍とみなせます。

$$\sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots ca_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)=c \sum_{\sigma}\left(\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots a_{\sigma(k)k}\cdots a_{\sigma(n)n}\right)$$

一般の列ベクトルに対する線型性

1箇所の列ベクトルについて和や定数倍の項が増えた時には線型性の式を繰り返し使って、
シグマ記号を使って1つにまとめる事もできます。
これは、1つの列のところについて \(c_1\overrightarrow{a}+c_2\overrightarrow{b}+c_3\overrightarrow{d}\) のようになっている場合です。

2箇所以上の列ベクトルで和や差の形になっている場合は少し注意が必要です。1箇所だけのときの証明のやり方を見てもらうと分かりやすいと思うのですが、2箇所ある場合には行列式は2項に分かれるのではなく、2×2=4項に分かれます。n箇所に2項ずつある場合には2項に分かれます。これを直接書くのは大変面倒ですが、シグマ記号を使うとより簡潔に表せます。

行列式の線型性・一般の場合
  1. 1つの列ベクトルにおける一般の場合:$$\mathrm{det}\left( \overrightarrow{a_1},\cdots ,\sum_{j=1}^m(c_j\overrightarrow{b_j}),\cdots\overrightarrow{a_n} \right)=\sum_{j=1}^mc_j \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_j}\cdots ,\overrightarrow{a_n})$$
  2. 2つ以上の列ベクトルにおける一般の場合 $$\mathrm{det} \left( \overrightarrow{a_1},\cdots ,\sum_{i=1}^{m1}(c_{pi}\overrightarrow{b_{pi}}),\cdots ,\sum_{j=1}^{m2}(c_{sj}\overrightarrow{b_{sj}}),\cdots ,\sum_{k=1}^{m3}(c_{tk}\overrightarrow{b_{tk}}),\cdots\overrightarrow{a_n} \right)$$ $$=\sum_{i,j,k \cdots =1}^{m1,m2,m3,\cdots}c_{ki}c_{pj}c_{tk} \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{b_{pi}},\cdots ,\overrightarrow{b_{sj}},\cdots,\overrightarrow{b_{tk}},\cdots,\overrightarrow{a_n})$$

2番目のほうの式の和の記号のところは、i,j,k,・・のそれぞれについて、
1~m、1~m、1~m、・・まで動かすという意味です。
そのため、和の項数は合計でそれぞれを掛け合わせたm・・個 になります。

一般的に手計算では手に負えない事は見て明白だと思うので、「形」を把握しましょう。

例として、2箇所の列ベクトルについて2項ずつの和になっている時は、要するに行列式を表す積の中の2箇所で (a+b)(a+c)=a+ab+ac+bcの形になるので4つに分割されるという事です。
もし3箇所の列ベクトルについて2項の和になっているのであれば2=8つに分割されます。

2箇所の場合について証明の式を具体的に書くと次のようになります。
途中で「・・・」で略してる部分は全て掛け算が続いています。

$$\sum_{\sigma}\left\{\mathrm{sgn(\sigma)}\cdot a_{\sigma(1)1}a_{\sigma(2)2}\cdots (a_{\sigma(k)k}+b_{\sigma(k)k})\cdots(a_{\sigma(m)m}+d_{\sigma(m)m})\cdots a_{\sigma(n)n}\right\}$$

$$=\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots a_{\sigma(k)k}\cdots a_{\sigma(m)m}\cdots a_{\sigma(n)n}\right) +\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots b_{\sigma(k)k}\cdots a_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)$$

$$+\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots a_{\sigma(k)k}\cdots d_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)+\sum_{\sigma}\left(\mathrm{sgn(\sigma)} a_{\sigma(1)1}\cdots b_{\sigma(k)k}\cdots d_{\sigma(m)m}\cdots a_{\sigma(n)n}\right)$$

このように、4つに分割されるわけです。

列の置換に対する性質

式による表現 ■ 証明(列の置換) ■ 証明(同一の列が2つ以上の時) 

式による表現

行列の特定の列と別の要素を入れ替えたり、列の順番を並び替えたした行列の行列式は、もとの行列の行列式と絶対値は必ず同じであり符号だけが異なるという結論になります。

その性質の派生物として、行列内の2つの列ベクトルの要素の値が全く等しい場合には行列式の値は必ずゼロになるという結果も示せます。

列の置換に関連する行列式の性質
  1. 列を置換 \(\tau\) によって並び替えた行列の行列式は、
    もとの行列式にその置換の符号 \(\mathrm{sgn}(\tau )\) を乗じたものに等しい。 $$\mathrm{det}(\overrightarrow{a}_{\large{\tau (1)}},\cdots ,\overrightarrow{a}_{\large{\tau (k)}},\cdots\overrightarrow{a}_{\large{\tau (n)}}) =\mathrm{sgn}(\tau) \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_n})$$
  2. 正方行列の異なる2つの列ベクトルについて \(\overrightarrow{a_k}=\overrightarrow{a_m}\) となるk、mが存在するならば
    その行列式の値は必ず0になる。 $$A=(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots ,\overrightarrow{a_m},\cdots,\overrightarrow{a_n})で、\overrightarrow{a_k}=\overrightarrow{a_m}となる時$$ $$\mathrm{det}=0$$

これは理屈としては難しくないのですが、式による証明では少々込み入ります。ここで挙げている行列式の公式の証明の中では最も難しく、しかし重要(積に関する性質の証明に必要なため)という厄介な箇所です。

例えば、1列目と2列目を入れ替えた場合、互換の符号はマイナスなので行列式は「もとの行列式にマイナス符号をつけたもの」になります。

$$\mathrm{det}\left(\begin{array}{ccc} a_{12} & a_{11} & a_{13}\\ a_{22} & a_{21} & a_{23} \\ a_{32} & a_{31} & a_{33}\end{array}\right) =-\mathrm{det}\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) $$

2つの列の要素が全く同じ場合とは、2つの列について1行目の値が互いに同じ、2行目の値も互いに同じ、・・・以下、何行目であっても全部互いに等しいという事です。この時、行列式の値はゼロになります。証明を見ると分かる通り、じつはこの性質は列ベクトルの置換に関係します。

$$\mathrm{det}\left(\begin{array}{ccc} 2 & 2 & a_{13}\\ 5 & 5 & a_{23} \\ 1 &1 & a_{33}\end{array}\right)=0 $$

証明(列の置換)

置換 \(\tau\) によって列ベクトルの要素が並び替えされている時、逆置換(より一般的には逆写像)に相当する \(\tau\)-1 を考える事が1つの重要ポイントです。
これは、例えば(1→2, 2→3, 3→1)という置換を逆にたどった(2→1, 3→2, 1→3)の事です。

【1つの例】
\(\tau\) :1→2, 2→3, 3→1
\(\tau\)-1:2→1, 3→2, 1→3

さてしかし、そんなものをなぜ唐突に考えるのかというと、もちろん理由はあります。

まず、\(\tau\) によって列の配列が変わっている行列A’ の成分をbijとおきます。
この置き換えの文字を使うと、行列式はとりあえず通常の形で表せます。
この段階では置換\(\tau\) はまだ式の中には出てきません。

$$\mathrm{det}A^{\prime} = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\sigma (j)j}\right)$$

ここで、列だけ入れ替えて行はいじっていないという設定なので、行列成分bijの添え字の列部分だけを 置換\(\tau\) で変化させるともとの行列成分の形に直す事が可能で、次のように表せます。

$$\large{b_{\sigma (j)j}=a_{\sigma (j)\tau (j)}}$$

これは例えば1列目と2列目が入れ替わっていて、入れ替えたあとの2行1列目を考える時、そこにある要素をbijで表すとb21ですがもとのaijで表すなら列が入れ替わってますからa12になるという意味です。今の例ではb21=a12 であり、\(\tau\)(1)=2です。

式で表すとかなり分かりにくいかと思いますが、bijの積をaijで表した時に、
「列の順番が左から1,2,3・・になるように」書き換える事ができます。
例えば、a223113という積はa312213と書いても同じ値であるという意味です。

つまり、\(\large{b_{\sigma (j)j}=a_{\sigma (j)\tau (j)}}\) において、
「積の並び替え」をする事で \(\tau (j)\) の部分はjに書き換える事が可能である「はず」です。

列を順序通りに「並び替え」するという事は「列の番号の置換」を行うと見なす事もできます。
しかもここでは「置換\(\tau\)」によって配列が変わったものを「もとに戻しているという」操作に相当するので、
積の順序並び替えに相当する置換は列に関しては \(\tau\) の逆置換である \(\tau\)-1になるのです。

しかしその場合、行の番号はどう表すのかという話になります。これは、次のようにします。

ijの列の番号から\(\tau\)-1でbijの列の番号をたどり、そこに\(\sigma\)を作用させて行の番号を得ます。
ijで見た時の列の番号がkのとき、これのもとになっていたbijの列の番号は\(\tau\)-1(k) ですが、
行の番号はそれをさらに置換 \(\sigma\) で変えて \(\sigma\)( \(\tau\)-1(k) ) = \(\sigma\) \(\tau\)-1(k) となるという事です。

少し分かりにくいパズルかもしれませんが、\(\large{b_{\sigma (j)j}}\) の行部分は、列の番号を基準にして何に置き換わったかを指しています。例えばb22に対してb32のようなものを考えるわけです。

つまり、bijの列の番号が分かればi= \(\sigma\)(j) という具合に行の番号が判明します。
ijとbijとでは列の置換だけがなされて行はいじっていないのでbijのほうの行の番号が分かればそれがaijの行の番号に一致する、という事です。

そこで、行列式は次のように変形できるという事になります。

$$\mathrm{det}A^{\prime} = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\sigma (j)j}\right)=\sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^na_{\sigma \tau ^{-1}(j)j}\right)$$

ここで、sgn(\(\sigma\))=sgn(\(\sigma \tau ^{-1}\tau\))=sgn(\(\sigma \tau ^{-1}\))sgn(\(\tau\)) と変形できる事に注意します。

また、\(\sigma \tau ^{-1}\) という写像も置換であり(\(\sigma \) を動かす事で)n次の置換の要素全てに対応しています。
という事は、次のようにもとの行列Aの行列式を含んだ形に式を変形できるという事です。

$$\mathrm{det}A^{\prime} =\sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^nb_{\large{\sigma \tau ^{-1}(j)j}}\right)=\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn(\sigma)}\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn}(\sigma \tau ^{-1})\mathrm{sgn}(\tau)\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\mathrm{sgn}(\tau)\sum_{\large{\sigma \tau ^{-1}}}\mathrm{sgn}(\sigma \tau ^{-1})\left(\prod_{j=1}^na_{\large{\sigma \tau ^{-1}(j)j}}\right)$$

$$=\mathrm{sgn}(\tau)\mathrm{det}A$$

和の記号の中で\(\sigma\) は置換全体を動かしますが、\(\tau\) はある特定の「1つの置換」です。
(例えば前述の例のように\(\tau\):1→2, 2→3, 3→1)
そのため、sgn(\(\tau\) ) はシグマ記号に乗じる形にできて、残った部分は(合計で)Aの行列式に等しくなります。

証明(同一の列が2つ以上の時)

上記の関係式が成立するのであれば、もしも互いに一致する列ベクトルが2つ以上あった場合には行列式の値が0になる事を示せます。

k列目とm列目が等しくなる時、この2列だけを入れ替えた行列式は、もとの行列式にマイナス符号をつけたものになります。(互換の符号はマイナス。)

$$すると、\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_m},\cdots\overrightarrow{a_n})=-\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_m},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})より、$$

$$\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})=-\mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})$$

$$\Leftrightarrow \mathrm{det}(\overrightarrow{a_1},\cdots ,\overrightarrow{a_k},\cdots \overrightarrow{a_k},\cdots\overrightarrow{a_n})=0$$

ここで使っているのは、実数(あるいは複素数でも)について符号がプラスでもマイナスでも同じ値になる数、「x=-x」が成立する数は0だけであるという事を使っています。

積に関する性質

式による表現 ■ 証明(行列の積に対する行列式) ■ 証明(逆行列の行列式) 

式による表現

2つの行列AとBの積ABに対して、行列式 det(AB) はどのような値になるでしょう?普通に考えるといかにも収拾のつかない複雑な式になりそうですが(実際、直接計算すると手に負えません)、これはAの行列式とBの行列式の積になるのです。

その結論の派生物の1つとして、『逆行列の行列式』=1/『もとの行列式』という公式を導出できます。また、逆行列の存在の可否と行列式の値の関係の一部についても分かります。

積に関する行列式の性質
  1. 行列の積に対する行列式は、個々の行列の行列式の積になる。 $$\mathrm{det}(AB)=(\mathrm{det}A)\hspace{3pt}(\mathrm{det}B)$$
  2. 逆行列の行列式と、もとの行列の行列式の積は1に等しい。 $$\mathrm{det}A\hspace{3pt}\mathrm{det}(A^{-1})=1$$

2番目のほうの性質は「Aの逆行列が存在するならば」という前提です。
(最後に触れますが、そもそも逆行列が存在しない場合があり得るためです。)

結果自体はシンプルですが、証明はやや込み入ります。
ただし、前述の列ベクトルの線型性や、置換に関して成立する関係式を使うと証明可能です。

証明(行列の積に対する行列式)

「行列の積に対する行列式」の状況を調べる時、定義通りに要素の計算をすると一般のn次の正方行列に対しては非常に面倒な式になってしまうので工夫が必要です。

ABの1行1列目の要素はa1111+a1221+a1331+・・・+a1nn1 で、2行1列目の要素はa2111+a2221+a2331+・・・+a2nn1のようになりますが、同一の列で見た場合、Bの要素の1列目は共通して使い回されています。これを利用して、まずABの要素を列ごとに整理します。

ABの1列目の要素を列ベクトルで表す事ができて、次のようになります。

$$b_{11}\left(\begin{array}{ccc} a_{11} \\ a_{21}\\\cdots\\ a_{n1} \end{array}\right)+b_{21}\left(\begin{array}{ccc} a_{12} \\ a_{22}\\\cdots\\ a_{n2} \end{array}\right)+\cdots +b_{n1}\left(\begin{array}{ccc} a_{1n} \\ a_{2n}\\\cdots\\ a_{nn} \end{array}\right) =b_{11}\overrightarrow{a_1}+b_{21}\overrightarrow{a_2}+\cdots +b_{n1}\overrightarrow{a_3}=\sum_{j=1}^{n}(b_{j1}\overrightarrow{a_j})$$

そこで、AB全体を列ベクトル表記すると次のようになります。
省略している「・・・」の部分にもシグマ記号で表された各列ベクトルがあります。

$$AB=\left(\sum_{j=1}^{n}(b_{j1}\overrightarrow{a_j}),\hspace{5pt}\sum_{k=1}^{n}(b_{k2}\overrightarrow{a_k}),\cdots,\hspace{5pt}\sum_{z=1}^{n}(b_{zn}\overrightarrow{a_z})\right)$$

これの行列式を、一般の場合の列ベクトルの線型性によって分割します。

この場合には、各列に関して「全く同じ要素を持つ列」になる項が含まれます。
例えば、上記でj=1のときとk=1のときでは全く同じ形の \(\overrightarrow{a_1}\) の形が1列目と2列目に生じます。
(定数倍は行列式全体に掛ける形になるので、この件に関して影響を与えません。)
すると、その部分の行列式の項は0になります。
そのため、和の記号のj, k, ・・・,zの部分は、必ずそれぞれ違う番号を代入した項だけが残るわけです。
j, k, ・・・,zのそれぞれは1~nの範囲を動く事は共通しており、
j, k, ・・・,zの個数自体もn個ある事に注意します。
すると、j, k, ・・・,zの中身は、1~nの番号を置換したものになるのです。
これは、和をとるときに各々1~nではなく、
j, k, ・・・,z全体で「1~nの番号の『置換』」に渡って動くと捉えてよい事を意味します。

具体的に、n=4の場合、各列のシグマ記号の変数について例えば(i,j,k,z)=(2,3,4,1) のような組み合わせの項だけが残ります。(i,j,k,z)=(3,3,4,1)のようになる場合は、その行列式の項は0になるので考えなくていいという事です。

すると、上式の行列式は次のように書けるのです。

$$\mathrm{det}(AB)=\large{ \sum_{j,k,\cdots z=1}^{それぞれnまで} \left\{ b_{j1}b_{k2}\cdots b_{zn}\mathrm{det}(\overrightarrow{a_j},\overrightarrow{a_k},\cdots,\overrightarrow{a_z}) \right\} }$$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{det} (\overrightarrow{a}_{\sigma (1)} , \overrightarrow{a}_{\sigma (2)} , \overrightarrow{a}_{\sigma (3)} , \cdots , \overrightarrow{a}_{\sigma (n)}) \right\} } $$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{sgn}(\sigma) \mathrm{det} (\overrightarrow{a}_1 , \overrightarrow{a}_2 , \overrightarrow{a}_3 , \cdots , \overrightarrow{a}_n) \right\} }$$

$$=\large{ \sum_{\sigma} \left\{ \left(\prod_i^n b_{\sigma (i)i}\right) \mathrm{sgn}(\sigma) \mathrm{det}A \right\} }$$

$$=\large{ (\mathrm{det}A) \sum_{\sigma} \left\{ \mathrm{sgn}(\sigma) \left( \prod_i^n b_{\sigma (i)i} \right) \right\} }$$

$$=\large{ (\mathrm{det}A)( \mathrm{det}B) }$$

このようにして det(AB)=(detA) (detB) が確かに成立する事になります。

証明(逆行列の行列式)

上記の性質を単位行列に適用する事で、逆行列に関する行列式の関係式も分かります。

すなわち、単位行列IはI=A(A-1)と表せて、単位行列の行列式の値は1になるので detI=det{A(A-1)}= det A det A-1 ⇔ 1=det A det A-1

このとき、もちろん行列式が0でないという前提はあります。
あるいはむしろ、
ある行列が可逆(逆行列が存在する)ならば、
I=A(A-1) ⇔ 1=det A det A-1
となるので必ず det A≠0である、と言う事もできます。
「正方行列Aが可逆である(逆行列が存在する) ⇒ det A≠0」という事です。
その対偶命題をとると、
「detA=0ならば行列Aは可逆でない(逆行列は存在しない)」という事も分かります。

では「detA≠0ならばAは可逆で逆行列が存在する」という命題はどうかというと、結論から言うとこれも成立しますがこれまでの議論ではここまではまだ示せません。(もう一工夫必要で、余因子行列というものと行列式の関係を調べる事で証明できます。)

逆行列と可逆性の関係

結論を言うと次の同値関係が成立します。
「detA≠0 ⇔ 正方行列Aは可逆で、逆行列A-1が存在する。」
(detA=0ならばAは可逆でなく、逆行列は存在しない。)

行列式の定義

「行列式」(英:determinant)の定義を述べます。

これはそもそも一体何かというと、じつは「特定の規則を持った、数の掛け算と足し算の組み合わせ」を「行列式」と呼ぶ事にする、としか言いようがない面があります。しかもその定義の方法自体が結構分かりにくいという大変クセの悪いものですが、理論上重要なので見ておきましょう。

行列自体の定義や計算については別途に詳しくまとめています。

定義の式

行列がAだとすると、行列式は |A| あるいは det Aなどと記します。

まず、結論の式を最初に書きましょう。

式で書いた場合の行列式の定義

n次の正方行列A=(\(a_{ij}\))に対して行列式 det Aは次のように定義されます。 $$\mathrm{det}A = \sum_{\sigma}\mathrm{sgn(\sigma)}\left(\prod_{i=1}^na_{\sigma(i)i}\right) $$ ここで \(\sigma\) は1~nの番号の並びに対する「置換」の1つで、
和は置換全体【n!個ある】に対してとるとする。
\(\sigma\)(\(i\)) は番号\(i\) が置換 \(\sigma\) によって変わった後の番号。【例えば番号1が3に変わるなら sgn(1)=3】
\(a_{\sigma(i)i}\) は具体的には \(a_{11}\) や \(a_{23}\) などを指す。【「行」の番号のところに置換された数字を入れる。】
sgn(\(\sigma\)) は置換の「符号」と言い、+1か-1の値だけをとり、次式で定義される: $$\mathrm{sgn}(\sigma)=\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}$$

はい、これが一般の行列式の定義なのですけれど、これでは何が何だか分かりませんね。そこで、この行列式の定義は一体何を言ってるのかという事を、1つ1つの特徴や具体例を見ながら確認していきましょう。

定義の説明図
行列の要素を選び出して積の形にして、プラスかマイナスの符号を定めて、n!個加え上げる(マイナス符号の部分は引き算)というのが「行列式」の定義の内容です。置換は順列とも言います。

特徴と具体例

行列式の定義式について、どのような特徴があるのかを見てみましょう。
まず、①正方行列について定義され、②実数や複素数などの「値」であり、③何次の行列式かによって構成の仕方が異なる という特徴があるのです。

行列式の特徴①
  • 正方行列にのみ定義される
  • 0、-1、1+i といった実数や複素数などの「値」である
    (適用する理論によっては関数を考えますが、とにかく「行列」ではないという事です。)
  • 正方行列によって2次、3次、4次・・の行列式の構成は異なる
    (統一的な規則は一応あり)
3次の行列式
3次の行列式には6つの項があり、それぞれの項は行列の3つの要素の積です。

行列式は、行列の要素を組み合わせて掛け算を作り、それを1つの項として複数足したり引いたりする事で定義します。この時、対象の行列が何次であるかによって項の数が変わります。

結論を言うとn次の行列式は「n!(nの階乗)個」の数の項の足し算・引き算で構成されます。
これは、n個の数の並び替え方(順列・置換)の総数という事です。
そして行列式の中のそれぞれの項は、行列の中のn個の要素の掛け算で構成されます。

行列式の特徴②
  • n次の正方行列の行列式の項数はn!個である。【n個の数の並べ方の総数】
  • 行列式の各項は、行列の要素によるn個の数の掛け算で構成されている。例えばa211233
  • 基本的にはa211233のように「列」の番号は(1,2,3)の順番で並べて、「行」の部分に置換によって入れ替えた番号を入れる。【この場合は(2,1,3)】

項数がn!個という事は5次の正方行列の場合には5!=120個の項があるという事で、
もちろんこれは一般的には手計算で扱うものではありません。

とりあえず、まずここまで性質を見たところで、具体的な行列式を見てみましょう。ただし、行列の要素はa12のように、まだ具体的な値ではなく一般的な表記としておきます。

$$A_2=\left(\begin{array}{ccc} a_{11} & a_{12} \\ a _{21} & a_{22}\end{array}\right) \hspace{10pt}A_3=\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a _{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) \hspace{10pt}A_4=\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13}& a_{14}\\ a _{21} & a_{22} & a_{23}& a_{24} \\ a_{31} & a_{32} & a_{33}& a_{34}\\a _{41} & a_{42} & a_{43}& a_{44} \end{array}\right)$$

の時、行列式は次のようになります。

2次の行列式

$$\mathrm{det}A_2=a_{11}a_{22}-a_{21}a_{12}$$

3次の行列式

$$\mathrm{det}A_3=a_{11}a_{22}a_{33}-a_{11}a_{32}a_{23}+a_{21}a_{32}a_{13}-a_{21}a_{12}a_{33}+a_{31}a_{12}a_{23}-a_{31}a_{22}a_{13}$$

4次の行列式

$$\mathrm{det}A_4=a_{11}a_{22}a_{33}a_{44}-a_{11}a_{22}a_{43}a_{34}+a_{11}a_{32}a_{43}a_{24}-a_{11}a_{42}a_{33}a_{24}+a_{11}a_{42}a_{23}a_{34}-a_{11}a_{32}a_{23}a_{44}$$ $$+a_{21}a_{32}a_{13}a_{44}-a_{21}a_{12}a_{33}a_{44}+a_{21}a_{12}a_{43}a_{34}-a_{21}a_{32}a_{43}a_{14}+a_{21}a_{42}a_{33}a_{14}-a_{21}a_{42}a_{13}a_{34}$$ $$+a_{31}a_{42}a_{13}a_{24}-a_{31}a_{42}a_{23}a_{14}+a_{31}a_{22}a_{43}a_{14}-a_{31}a_{22}a_{13}a_{44}+a_{31}a_{12}a_{23}a_{44}-a_{31}a_{12}a_{43}a_{24}$$ $$+a_{41}a_{12}a_{33}a_{24}-a_{41}a_{12}a_{33}a_{24}+a_{41}a_{32}a_{13}a_{24}-a_{41}a_{32}a_{23}a_{14}+a_{41}a_{22}a_{33}a_{44}-a_{41}a_{22}a_{43}a_{34}$$

これを見ると、手計算で具体的に式を書いて扱ってもよいのはせいぜい3次までという事はおおよそ分かるかと思います。4次の行列式の項数は4!=24個で、見ての通り書き下すと結構長い式になってしまいます。

5次の場合は120項あるので、ここに書くのはやめます。

いずれにしても、行列式とはどういうものなのかは、これで大体の雰囲気はつかめるかと思います。このように、一定の規則に基づいて行列の要素の積を足し算引き算で連結したものなのです。

置換の符号に対するプラスマイナスの決め方

具体的な書き下された行列式を見ると、各項のプラスマイナスの符号が入れ替わっている事が目につくと思います。これはどういう基準で決めているのでしょうか?

その決め方は、次のようになります。

行列式を構成する項のプライスマイナスの符号の決定
  • 112233のように行列の要素を掛け算の形で並べておく。
  • 行列の要素の「列」の番号は固定して「行」(つまり添え字の1番目)だけの並び替えを考える
  • 順番通りに並んだ(1,2,3,・・・,n)の並びの場合、符号はプラス(+)とする。
    112233 の符号はプラスになる。
  • (1,2,3,・・・,n)の2つの数を入れ替える【「互換」を行う】と
    符号が反転し、マイナス(-)になるとする。
    例えばa112233の符号はプラスなので、
    行部分の添え字の2と3を入れ替えた a113223 の符号はマイナスです。
    行列式の中ではa112233-a113223+・・・のように続ける事になります。
  • 以降、「行」の数の入れ替えを行う(互換を行う)ごとに符号は反転する。

この規則を、より一般的に書くと次のようになります。
冒頭の「定義」に段々と近づく表記になります。

行列式の各項の符号の決め方(置換による表現)

一般に、(1,2,3,・・・,n)の配列に対して、
奇数回の互換を行った並び替えの配列(「奇置換」)の符号はマイナスであり、
偶数回の互換を行った並び替えの配列(「偶置換」)の符号はプラスになる。
(恒等置換は0回の互換であるとして偶置換であると考えます。)

冒頭の定義では「置換の『符号』」sgn(σ) というものが書かれ計算式が定義されていましたが、これは上記のプラスマイナスの符号の決め方を式だけで書くとあのようになるという事です。いまいちど sgn(σ) の定義式を見てみましょうか。

置換の「符号」の定義式の意味

ある置換σに対する「符号」sgn(σ) の定義式を改めて記すと次のようになります: $$\mathrm{sgn}(\sigma)=\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}$$ n=3の場合に(1,2,3)→(2,3,1)なるσについて具体的に計算してみると、 $$\prod_{i<j}\frac{\sigma (j)-\sigma (i)}{j-i}=\frac{1-2}{3-1}\cdot \frac{1-3}{3-2}\cdot\frac{3-2}{2-1}=+1$$

sgn(σ) の定義式において分母の値には次の特徴があります。

  • i<j という条件があるのでj-i>0 ・・分母は必ずプラスの値になる。
    つまり全体の積の符号に対して分母は影響を与えない。
  • 絶対値としては分子に必ず同じ大きさのものが積の中に1つ含まれており、
    分母分子で打ち消し合って積全体の絶対値は必ず1にする。

置換の符号に対しては、さらに次の2つの公式が成立します。

置換の符号 sgn(σ) に対して成立する公式
  1. 任意の互換τに対して sgn(τ)=-1
  2. 任意の2つの置換 σ と σ に対して、sgn(σσ)=sgn(σ)sgn(σ)

σσ は、σを行った後にσを行う置換です。
sgn(σ)sgn(σ)は、2つの符号の積です。

恒等置換に対する符号は+になるので、1回互換をすると-になり、上記の2つ目の公式によりもう1度別の互換をすると+に転じます。

要するに結果は「偶置換の時プラス符号、奇置換の時マイナス符号」という事で、その事を式で表現したいがために上記 sgn(σ) の定義式を考えていたというわけです。

偶置換と奇置換の符号

置換の符号 sgn(σ) について、次の事が成立します。

  1. σ が偶置換の時、sgn(σ)=+1 【恒等置換も含める】
  2. σ が奇置換の時、sgn(σ)=-1

このように行列式は「定義」されるわけですが、それにしても決して分かりやすいものではないという事は重々承知されているようで、手計算で行列式を考えるうえでの計算の工夫や、特定の行列式をいくらか簡単にできる公式もいくつかあります。

この行列式を「何に使う」のかという疑問も必ず出てくるかと思いますが、線型代数の理論の中だと一般の連立1次方程式の解を構成するクラメルの公式で使用されます(解法としてあまり実用的でない場合がありますが)。他に、重積分の変数変換の理論における関数行列式、連立の常微分方程式の解法に一部使える行列式などが存在します。

いずれの応用や適用においても、具体的な行列式の値を知りたい場合にはnが大きい値の場合には手計算では手に負えないという事実は何ら覆りません。そのため、コンピュータに計算させる、行列式の計算が楽になる特別な場合を考える、行列式を使わずに済む理論を別途に考える、手計算の理論ではnが大きい場合を具体例としては極力考えない・・といった事が現実的な対処としては多いようです。

群の定義と基本性質

数学での「群(ぐん)」の定義と基本的性質を説明します。

数学での「群」とはどのようなもの?

まず始めに、数学で「群」(英:group)と呼ばれるものは、具体的なものとしてはじつに初歩的な対象が多く含まれます。

例えば、通常の実数や複素数は、積や和に関して「群」になります。(このように、何らかの演算に関してある集合が群になる・ならないといった表現をします。積について見る場合、0を除く事になります。)

特定の平面図形を「60°ずつ回転させる」といった操作も「群」としての性質を満たします。これは具体的操作としてはただ三角形や四角形を回してるだけですから、もちろん何ら難しい操作ではありません。他に図形をある軸に対してひっくり返す「鏡映」の操作なども加わる事もあります。

問題は次のようになります:

  • これらに共通する数学的性質は何か?
  • その抽象的な性質を前提にすると、どのような事が言えるのか?

群論ではこれを数学的な視点から整理し、理論を組み立てていく事になります。

「群」の定義

数学での「群」とは、1つの前提条件と、3つの公理を満たす集合を言います。

まず、前提条件として演算が定義される事です。それは、集合Gの元【げん】a、bに対して別の元「ab」が決定するというものであり、このabという新しい元もまたGの元である事が要請されます。群の場合、この演算の事を「積」と呼ぶ事が多いですが、いわゆる加法が該当する場合があります。

前提条件 任意のa,b ∊ G について ab=c ∊ G となる「演算」abが定義できる事。
「群」の定義 「演算」が定義されている前提で、次の3つを満たす集合Gを群と呼びます。
  1. 結合律の成立:任意の3つの元a,b,c∊Gについて、(ab)c=a(bc)となる。
  2. 単位元の存在:任意の元a∊Gに対してae=ea=aとなるe∊Gが存在する。
  3. 逆元の存在:任意の元a∊Gに対してaa-1=a-1a=eを満たすa-1∊Gが存在。

二番目の条件の単位元は、例えば実数では積に関しては1、和に関しては0が該当します。
三番目の条件の逆元は、例えば実数では2に対する1/2が該当します。(※この時、0では割れないので、積に関しては「0以外の実数」が「群」に当てはまるのです。)

定義
結合律の事は「結合法則」などとも言います。

単位元と逆元以外の一般の交換律ab=baは、群によって成立するものもあれば成立しないものもあり、成立するものは特に「可換群」と言います。

0を除く実数r、sについて、もちろんその積rsは実数であり、r・1=rとなる「1」が存在し、0を除いているので任意の要素についてr・(1/r)=1となる逆元も存在します。よって積に関して「群」である・・という判定をします。
この場合、任意の実数に対してrs=srですから、群としては可換群になります。こういった感じで分類をしていくわけです。

他方で、「実数のうち無理数だけからなる集合」は、2の平方根の2乗が有理数になってしまいますから、積に関して群を作らない事になります。

実数が和に関して群を作る事は、r+sは必ず実数、r+0=rとなる0が単位元として存在する、r+(-r)=0となる逆元が必ず存在する、という事から和に関して群である事が分かります。この場合は0を除かないわけです。このタイプの群は特に加群と呼ぶ事があります。

図形を回転させるような操作は、例えば「60°回転させる操作」をてきとうに文字でおきます。何でもよいのですがギリシャ文字の σ(シグマ)を使う事が多いようです。この時、120°回転を σ の2回分の操作とみなして σと表したりします。そして、0°回転つまり「何もしない」操作をeと書く事にします。

そのように定義したうえで、操作 σ自体を要素とみなし、 集合{e, σ, σ, σ}を考えます。すると、この集合はここで定義している操作の「積」に関して群を作るというわけです。この時、σ=eであるために、任意の2つの要素の積はこの集合の要素に必ずなります。逆元に関しては、例えばσに対してはσが該当するのです。この例では、操作自体を集合の要素とみなしています。

群の基本性質

さて、数学の理論として群論を考える時には「定義」をしてそれで終わるのではなく、むしろその先が大事です。つまりそのような定義をすると、どのような事が言えるのか・成立するのか?といった事が重要です。

ここでは、定義から直結する性質をいくつか述べます。

単位元の一意性

定義においては、単位元が「存在すればいい」という要請を出しているだけで、これだけではもしかすると「1」に相当する元がもう1つある可能性も匂わせます。しかし、実際はそのような事は起き得ない事を示せるのです。

このような場合、まずeとe’ の2つの単位元を仮定して、e=e’ を示すというのが1つの常套手段です。

定義から、e’e=e’です。(ce=cと同じ理屈です。)

他方、e’も単位元であるのですから、ee’=eでもあります。
単位元に関しては順序を問わないという定義の要請があるので、ee’=e’eです。

という事は、e’e=e’=eを意味します。これで証明終りというわけです。

このような単位元の定義(およびそれを満たすと言える集合)では、必然的にそのような単位元は1つだけ定まるという意味です。

逆元の一意性

では、逆元については一意性は成立するでしょうか?

aa-1=eで、これに左側から仮定している別の逆元(a-1)’ をかけると、
(a-1)'(aa-1)=(a-1)’e=(a-1)’
同時に、(a-1)’a=eにより、(a-1)'(aa-1)=((a-1)’a)a-1=a-1
ゆえにa-1=(a-1)’

よって、上記定義のもとで逆元も一意的に決まるという事です。この計算では、公理の1つめの「結合律」も前提として使用しています。言い換えると、結合律が成立していないと厳密にはこういった計算もできないという事です。

群の逆元の一意性

簡約律

ax=ay ⇒ x=y の事です。

これは単純にaの逆元を左側からかければ終わる話ですが、やはり結合律が成立しているのでそのように計算できるという事が一応重要です。

ax=ay ⇒ a-1(ax)=a-1(ay) ⇔ (a-1a)x=(a-1a)y ⇔ x=y

積の形の逆元

次のように、積の形全体の逆元は個々の逆元の積になるのですが、順番が逆になるというものです。

(abcd)-1=d-1-1-1-1

これは、
abcd(d-1-1-1-1)=e かつ (d-1-1-1-1)abcd=e
である事から示されます。dd-1=e、aa-1=eなどの関係でどんどん消していけばよいのです。

ただし、交換可能である群の場合は最初の形をひっくり返せる事からこれについては気にしなくていい事になります。実際、実数などでの割り算ではこのような「順番」については気にしなくてよいわけです。

   

4次方程式の解の公式

4次方程式の「解の公式」の導出方法を説明します。

公式の導出の流れ

3次方程式同様に公式自体は複雑で、理論の中ですらあまり計算の役に立ちません。そのため覚える事は一般に不要ですが、4解を必ず「係数のベキ根で表せる」という事が数学的な事実として重要な位置付けなのです。「4次」までは方程式の係数を使った解の公式が存在するという事です。

解法の手順は多少3次方程式の場合に似ていて、いくつかのステップを経て下位の次数の方程式に変形できる事が、公式を導出できる根拠になります。

  1. 方程式の各項を左右の辺に分けて平方の形を作る事を考える
  2. 方程式の解とは別の未知数yを考え、加える事で「平方=平方」の形になるyの条件を考える
  3. 結果:yは3次方程式の解になり、もとの方程式の係数のベキ根の組み合わせで書く事ができる。よって、もとの方程式の解xを表す「公式」を得る。

公式の導出

4次と3次の項と、その他の項を両辺に分けます。

$$x^4+ax^3+bx^2+cx+d=0$$

$$\Leftrightarrow x^4+ax^3=-(bx^2+cx+d)$$

左辺を平方の形にする事を考えます。そのために、両辺に2次の項を加えるのです。

4次方程式の解の公式の導出①

$$両辺に\frac{ax^2}{4}を加えます。$$

$$x^4+ax^3+\frac{ax^2}{4}=-(bx^2+cx+d)+\frac{ax^2}{4}$$

$$\Leftrightarrow \left(x^2+\frac{ax}{2}\right)^2=\left(\frac{ax^2}{4}-b\right)x^2-cx-d$$

右辺は2次式なので、何かの項を加えれば強引に平方の形にできます。
しかし、ここでは左辺も平方の形である事を保ちたいのです。そのため、少々工夫をします。

今のこの状態で左辺は平方の形である事がポイントで、ある別の未知数yを使った次の項を両辺に加えます。

$$\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}を両辺に加えます。$$

$$\left(x^2+\frac{ax}{2}\right)^2+\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}=\left(\frac{ax^2}{4}-b\right)x^2-cx-d+\left(x^2+\frac{ax}{2}\right)y+\frac{y^2}{4}$$

$$\Leftrightarrow \left(x^2+\frac{ax}{2}+\frac{y}{2}\right)^2=\left(\frac{ax^2}{4}-b+y\right)x^2+\left(\frac{ay}{2}-c\right)x+\frac{y^2}{4}-d$$

左辺は再び平方の形であり、右辺はyという未知数を含んだ2次式です。

yという数を加える前との違いは、それを加える前の各係数は所定の(任意の)係数ですので値を自由にいじれませんが、yというのは変数であるこの段階では任意ですので調整がきくという事です。次に問題となっていくのは、右辺を平方の形するためのyを、「もとの方程式の係数a、b、cで表せるか?」という事です。

4次方程式の解の公式の導出②

この段階で、右辺を平方の形にする事を考えましょう。これは、一般の2次関数をそのような形にするのと全く同じ要領です。式の形だけが多少込み入るので、右辺の式の係数をそれぞれA,B、Cと置いておきます。

$$右辺=Ax^2+Bx+Cと置きます。$$

$$Ax^2+Bx+C=A\left(x+\frac{B}{2A}\right)^2-\frac{B^2}{4A}+C=0$$

$$よって、-\frac{B^2}{4A}+C=0\Leftrightarrow B^2-4AC=0となればよい。$$

この計算自体は、2次関数や2次方程式をいじくる時のものと全く同じですね。ここで、A,B、Cをもとの形に戻して必要な条件を眺めてみましょう。

$$B^2-4AC=0\Leftrightarrow \left(\frac{ay}{2}-c\right)^2-4\left(\frac{ax^2}{4}-b+y\right)\left(\frac{y^2}{4}-d\right)=0$$

これが成立すればよいのですが、これを満たすyが存在するかという話です。式をよく見ると、これはyに関する3次方程式で、しかも係数はもとの4次方程式の係数a、b、cの組み合わせで構成されている事がポイントです。3次方程式ですから、これは「解の公式」が存在しますからyに関して解く事ができて、しかももとの4次方程式の係数a、b、cで表す事ができるのです。

その条件をyが満たすものとすると、もとの4次方程式は「平方=平方」の形になりますから、これは2乗の形をはずす事ができます。その時に、もちろん正負の2つの外し方があります。

$$\left(x^2+\frac{ax}{2}+\frac{y}{2}\right)^2=A\left(x+\frac{B}{2A}\right)^2$$

$$\Leftrightarrow x^2+\frac{ax}{2}+\frac{y}{2}=\pm \sqrt{A}\left(x+\frac{B}{2A}\right)$$

$$A=\frac{ax^2}{4}-b+y,\hspace{5pt}B=\frac{ay}{2}-c$$

つまり、xに関する「2つの2次方程式」ができます。もちろん、これはxについてさらに解く事ができるのです。また、解の個数は最高で2×2=4個という事も分かります。すなわち、4次方程式の「解の公式」も方程式の係数を使って表す事ができるという事が示された事を意味します。

ただしこれまでの経緯を見て分かる通り、まずyに関して3次方程式を解き、その解を係数として組み合わせた2次方程式をさら解くという作業があります。ですので、「4次方程式の解の公式」というのは少なくとも手計算では「使いたくない公式」である事はよく分かるかと思います。

2次方程式の解の公式も決してきれいな形ではないですが、あれはまだ一応手計算で「使える」公式であるという事が対比して分かると言えるかもしれません。

代数学の中での位置付け

さて問題は続き、「では公式の複雑さは度外視して、5次方程式も同じように『解の公式』を出せるのか」という話になります。結論は次の通りです:

  • 1~4次方程式と同じ要領で、同じ意味での5次以上の方程式の「解の公式」を構成する事はできない。(それが数学的に正しい答えである)
  • その事を数学的に証明するには、視点を変えたより抽象的な考察が必要である。

言ってみれば、3次方程式や4次方程式の解の公式の導出は、多少計算が複雑だったり工夫が必要だったりするものの、やる事自体は「高校数学」の範囲で理解可能であるものなのです。

他方で、「視点を変えてみた抽象的な考察」というのが、大学以上の授業で言う「代数学」の分野の内容だと捉えればよいと思います。数学史的には、19世紀以降に西欧で考察されるようになった数学の分野です。

言い換えるとそれは西欧でもその時期になって初めて本格的に研究されるようになった事案であって、言われなければ普通は気付かないし、言われずに気付いたとしても分かりやすい理論として即座にまとめるのは至難の業である事が反映されているように思えます。しかし簡単な事項から少しずつ整理すれば、もちろん誰にでも理解する事は可能です。

3次方程式の解の公式

3次方程式の「解の公式」の導出方法について説明します。「公式」の導出は、2段階に分けて行います。

一見複雑に見える箇所もあるかもしれませんが、必要な知識は基本的には中学~高校数学程度の式変形です。

①3次方程式の2次の項を、変数の置き換えで消去する

まず、任意の3次方程式は、変数の置き換えによって、ある特別な形の3次方程式に「必ず」変形できる事を示します。(「必ず」というのがポイントです。)

3次方程式の解法①

3次の項の係数はそれで式の両辺を割って1にできるのでその後の事を考えます。

$$x^3+ax^2+bx+c=0$$は変数の置き換えにより必ず$$X^3+Ax=B$$の形変形できる。

要するに「2次の項は必ず消せる」という意味です。

x = X + C とします。X に関しても3次方程式になるという形を保つために、X は x に関する一次式である必要があります。

$$x^3=X^3+3X^2C+3XC^2+C^3,\hspace{10pt}ax^2=a(X^2+2XC+C^2) ,\hspace{10pt} bx=b(X+C)$$

2次の項の係数が0であるとすると、

$$3C+a=0\Leftrightarrow C=-\frac{a}{3}$$

とおけば成立します。

$$x^3+ax^2+bx+c=0, \hspace{10pt} x= X-\frac{a}{3} とすると、$$

$$ \left(X-\frac{a}{3}\right) ^3+a \left(X-\frac{a}{3}\right) ^2+b \left(X-\frac{a}{3}\right) +c=0$$

$$ \left(X^3-X^2a+X \frac{a^2}{3}- \frac{a^3}{27} \right) +a \left(X^2-X\frac{2a}{3}+ \frac{a^2}{9} \right) +b \left(X-\frac{a}{3}\right) +c=0$$

$$X^3+X \left( -\frac{a^2}{3}+b \right)+ \frac{2a^3}{27}-\frac{ab}{3} +c=0 $$

ここで、Xに関する係数部分がごちゃごちゃしてるので別の記号AとBで表します。

$$ A=-\frac{a^2}{3} +b , \hspace{10pt} B= -\frac{2a^3}{27} +\frac{ab}{3} -c $$

このように置く事で、

$$X^3+Ax=B$$

の形として方程式を考察できるわけです。

② 3乗の展開式を利用して、解く

さてしかし、この形にしたからといってうまく「解ける」のかという話になります。

これは、じつは3乗に関する展開式についての簡単な式変形によって解く事ができます。

3次方程式の解法②

任意の2つの実数(複素数でも可)T,Uに対して

$$(T-U)^3=T^3-3T^2U+3TU^2-U^3$$

$$\Leftrightarrow (T-U)^3+3TU(T-U)=T^3-U^3 $$

この式は、恒等式です。つまり、いつでも成立している関係式です。

これは一体何を意味するのでしょうか?
これは、「次の関係が成立すれば」左辺と右辺が必ず等しくなるわけですから「方程式が成立する」という事です。

$$X=T-U$$

$$A=3TU$$

$$B=T^3-U^3$$

すなわち、これらの関係を満たす X が3次方程式の解になるという事なのです。

もっと具体的には、TとUをAとBだけで表し、X=T-Uに代入すれば XをAとBだけで表せて、それによっておおもとの x が係数 a, b, c のみで表せる・・つまり「解の公式」が得られる、というパズルです。

しかし、上の式を見るとBとT、Uの関係には3乗が入ってます。3次方程式の解の公式が得られていない条件でこれをうまく解けるのかというと、じつは解けます。

$$U=\frac{A}{3T}$$

$$B=T^3-\frac{A^3}{27T^3}$$

$$\Leftrightarrow (T^3)^2-B(T^3)-\frac{A^3}{27}=0$$

このように、「『Tの3乗』の2次方程式」ができるので、これは(無理やり)解く事ができるのです。

結果は、次のようになります。

$$T^3=\frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}}$$

$$U^3=T^3-B= -\frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}}$$

$$X=T-U= \hspace{5pt} ^3\sqrt{ \frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}} }- \hspace{5pt} ^3\sqrt{ -\frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}} }$$

$$x= X-\frac{a}{3}= \hspace{5pt}^3\sqrt{ \frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}} }- \hspace{5pt} ^3\sqrt{ -\frac{B}{2}\pm \sqrt{\frac{B^2}{4}+\frac{A^3}{27}} } -\frac{a}{3} $$

ただし、ここでの3乗根の記号は複素数の範囲も含めた3つの数を取りえるものとします。3次方程式は、複素数範囲まで考え、重解を2解と数えると必ず3解を持ちます。 その事が、3乗根によっても表現されるわけです。

■ 補足:
尚、A=3TU の関係も成立していますから、T か U のどちらかが決定すればもう片方も決定します。これによって、「3×3=9通り?」の解ではなくて、確かに「3通り」の解が存在する事が公式でも表せているというわけです。3解のうち2つが重解として等しい値になる場合は、上記で『Tの3乗』に関する2次方程式が重解を持つ場合に対応します。

3次方程式の解の公式を知る意味:数学史的な価値

さて、このようにして「解ける」事は確かに言えるわけですが、色々置き換えがあって、公式としては代入するだけでもすごく面倒ですね。そういうわけで、物理や工学で仮に3次方程式を解く場面があったとしても、できる事ならこの公式使いたくないわけです。実質的には「手計算で解くなら2次方程式まで」と、基本的には思ってよい理由です。

このように、公式が存在する事と、それが応用の場面等で使いやすいものか・便利なものかという事は、別問題である事もあるわけです。

では、純粋数学的に考察した場合はどうかというと、この3次方程式の解法は、4次方程式については似た事ができます。しかし、5次以降は使えないのです。つまり、「3次や4次については適用できる」という特別なものになります。多項方程式について純粋数学的に一般的に考察する時は、より抽象的な考察が必要であるという事です。

この3次方程式の「解の公式」の解法の話は、大学数学においてはむしろ数学史の中で扱われる事が多いです。というのも、西欧で「複素数」というものが考察されるきっかけになったのがこの3次方程式の解法であると言われているからです。(※2次方程式ではなく3次方程式の解法というところに、数学史的に指摘しておくべきポイントがあるという事です。)

ちなみに数学史的には、この3次方程式の解の公式が「発見」されたのは16世紀という意外に遅い時期であり、しかし4次方程式の解の公式はその後に割とすぐ見つけられて、その後「5次方程式の解を一般的に係数のベキ根によって表す事はできない」という事が示されたのは19世紀まで飛びます。
歴史というか数学の研究史としては、そのような事も1つの教養的知識として多少知っておいてもよいのではないかと思います。

また、数学史的な事についてもう1点補足しますと、16世紀に「解の公式」が見出された時には、解法の流れは上記の方法と同じですが考え方として別の考察の仕方をしていました。それは、上記のように式を展開して関係式を導出するよりも、図形的な考察から関係式を導出していたという点です。

この場合、図形は図形でも、平面図ではなく立体の体積に関する考察です。立体ですから、体積に関して3乗を使うというわけです。参考までに、次図を記しておきます。

この図で大きい立方体の体積がTの3乗、小さい立方体の体積がUの3乗です。
直方体部分は、TU(T-U)などによっても計算できます。