Kezdőlap


Cím:	Az algebra alaptétele II.
Szerző(k):	Fried Ervin
Füzet:	2006/február, 73 - 79. oldal	PDF \| MathML
Témakör(ök):	Egyéb írások

A szöveg csak Firefox böngészőben jelenik meg helyesen. Használja a fenti PDF file-ra mutató link-et a letöltésre.

1. Komplex számok, mint valós elemű mátrixok

A cikk első részében megmutattuk, hogy adott

K

test esetén tetszőleges

K

-beli együtthatós és felette irreducibilis

n

-edfokú

f (x)

polinomhoz található olyan

n \times n

-es

A

mátrix, amely az

f (x)

-nek gyöke. (A skalár együtthatók helyébe a megfelelő skalármátrixokat kell írni!) Az is igaz, hogy

A

-nak a

K

-beli együtthatós polinomjai testet alkotnak, és e test minden eleme egyértelműen írható fel, mint

A

-nak legfeljebb

(n - 1)

-edfokú polinomja.
A továbbiakban azt az esetet nézzük, amikor a kiinduló test a valós számok

V

teste. Ez a test (amit a számegyenesen szoktunk ábrázolni) a következő jellemző tulajdonságokkal rendelkezik (a szóbanforgó elemek mind

V

-beliek):

(1)	Minden $a$ , $b$ elemhez van olyan $c$ , amire $c^{2} = a^{2} + b^{2}$ .

(2)	Ha az $a$ elemhez nincs olyan $b$ , amire $a = b^{2}$ , akkor van olyan $c$ , amire $a = - c^{2}$ .

(3)	$a = b^{2} = - c^{2}$ pontosan az $a = 0$ esetben lehet.

(4)	Tetszőleges valós együtthatós páratlan fokú (normált) polinomnak van valós gyöke.

(5)	Minden valós együtthatós (normált) polinom felbontható legfeljebb másodfokú polinomok szorzatára.

Annak a bizonyítása, hogy a valós számtest rendelkezik ezekkel a tulajdonságokkal, felhasználja (4)-nél a folytonosságot. Ezen kívül van még nagyon sok test, ami rendelkezik a fenti tulajdonságokkal. Valójában az (5) tulajdonság következik a többiből, de a ,,trükkös'' bizonyításhoz sok, viszonylag bonyolult algebrai összefüggést kell ismerni. Mindenesetre világos, hogy az

a^{2}

alakú elemek pozitívak, illetve ezeket ,,tekinthetjük'' pozitívnak (

a \neq 0

).
A

V

valós test esetében (5) miatt egy irreducibilis polinom legfeljebb másodfokú. Elsőfokú polinomnak természetesen van gyöke

V

-ben (ez a gyök persze egyértelmű). De van olyan másodfokú polinom, amelynek nincs valós gyöke. Ilyen például az

x^{2} + 1

, mert ha ennek az

a

valós szám gyöke lenne, akkor az

a^{2} = - 1 = - 1^{2}

összefüggésből (3) szerint

1 = 0

következne, ami nem igaz.
A z

x^{2} + 1

polinom (valamelyik) gyökét

i

-vel jelölik, és képzetes egységnek nevezik. A másik gyök persze

- i

. Közöttük algebrai szempontból nincs különbség.
A valós számok felsorolt tulajdonságaiból könnyen kaphatjuk, hogy bármely másodfokú, valós együtthatós polinomnak van

a + b i

alakú, úgynevezett komplex szám gyöke. Ugyanennek a polinomnak van egy másik gyöke is, az

a - b i

. Az ilyen alakú párokat egymás konjugáltjának nevezzük.
A komplex számokról a következőket tudjuk:

A komplex számok testet alkotnak. Minden komplex szám egyértelműen felírható

a + b i

alakba, ahol

a

b

valós számok és

i^{2} = - 1

².
Összeadásuk és szorzásuk a következőképpen végezhető:

\begin{matrix} (a + b i) + (c + d i) = (a + c) + (b + d) i és (a + b i) \cdot (c + d i) = (a c - b d) + (a d + b c) i . \end{matrix}

α = a + b i

és

\bar{α} = a - b i

konjugáltak szorzata

a^{2} + b^{2}

pozitív, ha

α \neq 0

, ennek (pozitív) négyzetgyöke az

α

abszolút értéke (a megfelelő vektor hossza):

\begin{matrix} \bar{α + β} = \bar{α} + \bar{β}, \bar{α \cdot β} = \bar{α} \cdot \bar{β} . \end{matrix}

Minden komplex együtthatós normált polinomnak van komplex gyöke, ezért annyi elsőfokú polinom szorzatára bontható, amennyi a foka.

Cikkünk első részében a gyököket ,,mátrixalakban'' adtuk meg. Így az

x^{2} + 1

(valós) polinom gyöke a

J = [\begin{matrix} 0 & - 1 \\ 1 & 0 \end{matrix}]

mátrix. Négyzetre emelve azt kapjuk, hogy

{[\begin{matrix} 0 & - 1 \\ 1 & 0 \end{matrix}]}^{2} = [\begin{matrix} - 1 & 0 \\ 0 & - 1 \end{matrix}]

, ami valóban a (

- 1

)-nek megfelelő skalármátrix. Ennek alapján az

a + b i

komplex számnak az

[\begin{matrix} a & - b \\ b & a \end{matrix}]

felel meg.

2. Komplex számok a síkgeometriában

Az első részben említettük, hogy a mátrixok homogén lineáris transzformációkat írnak le. Mindenekelőtt felhívjuk a figyelmet arra, hogy különböző méretű mátrixok is összeszorozhatók, ha nem négyzetesek. A ,,szorzási eljárás'' elvégzéséhez az szükséges, hogy az első mátrix oszlopainak a száma megegyezzék a második mátrix sorainak a számával. Mielőtt erre példát mutatnánk előrebocsátjuk a következőket.
Az origóból a sík

(x; y)

koordinátájú pontjába mutató

v

vektort a

[\begin{matrix} x \\ y \end{matrix}]

mátrixszal adjuk meg. Ezt az

[\begin{matrix} a & b \\ c & d \end{matrix}]

mátrixszal (balról) szorozva azt kapjuk, hogy:

\begin{matrix} [\begin{matrix} a & b \\ c & d \end{matrix}] \cdot [\begin{matrix} x \\ y \end{matrix}] = [\begin{matrix} a x + b y \\ c x + d y \end{matrix}] . \end{matrix}

Eredményünket úgy értelmezhetjük, hogy a fenti mátrixszal jellemzett

φ

(homogén lineáris) transzformáció a

v

vektort az

(a x + b y; c x + d y)

koordinátájú pontba mutató

φ (v)

vektorba viszi át.

Megjegyzés. Érdemes meggondolni az alábbiakat:
1. Legyen

e

(1; 0)

és

f

(0; 1)

koordinátájú pontba mutató vektor. Hova mutat

φ (e)

és

φ (f)

? És

φ (v)

?
2. Ha

ε

E

mátrixszal jellemzett függvény, akkor világos, hogy mi lesz

ε (v)

. De mi lesz

α (v)

, ha

α

,,mátrixa''

I

? Értelmezzük ezt geometriailag.
3. Milyen alakú az

a E + b I

mátrix? És az

a E - b I

? Milyen alakú ezek szorzata? Mutassuk meg, hogy ha

a ε + b α

egyetlen nem nulla vektort is nullába visz, akkor minden vektort

0

-ba visz.
4. Milyen alakú az

a E + b I

mátrix, ha

a^{2} + b^{2} = 1

? Ekkor mi lesz

a ε + b α

hatása?
5. ,,Olvassuk le''

a ε + b α

hatását általában.

Az eddigi eredményeket úgy foghatjuk fel, hogy a valós számok ismeretében megalkottuk a komplex számokat ‐ pontosabban szólva egy modellt alkottunk a komplex számokra, egy olyan testet, amely úgy viselkedik, ahogy a komplex számoktól³ ,,elvárjuk''.

3. Kvaterniók

Az algebra alaptétele szerint minden komplex együtthatós polinomnak van komplex gyöke. (Mi ugyan nem ebben az alakban adtuk meg, de könnyen látható, hogy ez ugyanazt jelenti.) Vegyük most a

2 \times 2

-es alakú mátrixok elemeit a komplex számok

C

testéből. Mivel az

x^{2} + 1

polinomnak van gyöke, azért ha a

J

mátrixot

C

feletti mátrixnak fogjuk fel, akkor az

α E + β J

(

α, β \in C

) alakú mátrixok nem alkotnak testet. Ugyanis az (

α E + β J) (α E - β J) = (α^{2} + β^{2}) E

szorzat

O

lesz, ha

β = i α

, noha egyik tényező sem

0

. Ezekkel tehát nem lehet osztani (mint az I. részben láttuk).
Igaz, hogy két komplex szám négyzetösszege lehet

0

, de normájuk összege

α \bar{α} + β \bar{β}

csak akkor, ha

α = β = 0

. Kiséreljük meg az egyik tényezőt ,,átváltani'' a konjugáltjára!
A szóbajövő mátrix

[\begin{matrix} α & - β \\ β & α \end{matrix}]

. Kézenfekvő megoldás, hogy a második sorban minden elem helyébe a konjugáltját írjuk:

[\begin{matrix} α & - β \\ \bar{β} & \bar{α} \end{matrix}]

.
Az világos, hogy két ilyen alakú mátrix összege is ilyen alakú. A szorzat esetében ezt ellenőrizni kell:

\begin{matrix} [\begin{matrix} α & - β \\ \bar{β} & \bar{α} \end{matrix}] \cdot [\begin{matrix} γ & - δ \\ \bar{δ} & \bar{γ} \end{matrix}] = [\begin{matrix} α γ - β \bar{δ} & - α δ - β \bar{γ} \\ \bar{β} γ + \bar{α} \bar{δ} & - \bar{β} δ + \bar{α} \bar{γ} \end{matrix}] . \end{matrix}

Eszerint az adott alakú mátrixok gyűrűt alkotnak, mert a figyelembe veendő azonosságok mind teljesülnek ‐ kivéve persze a szorzat kommutativitását. Attól eltekintve, hogy ez ‐ az előzőekben megállapítottak következtében ‐ nem is lehetne igaz, lássuk be. Ahelyett, hogy ezt ,,általában'' bizonyítanánk, elég egy ellenpéldát adni. Az alábbi ellenpéldára a későbbiekben szükségünk is lesz. Legyen

\begin{matrix} I = [\begin{matrix} i & 0 \\ 0 & - i \end{matrix}] és J = [\begin{matrix} 0 & - 1 \\ 1 & 0 \end{matrix}] . \end{matrix}

Ekkor ezek szorzata

\begin{matrix} K = I J = [\begin{matrix} 0 & - i \\ - i & 0 \end{matrix}], míg J I = [\begin{matrix} 0 & i \\ i & 0 \end{matrix}] = - K . \end{matrix}

Ennek ellenére elképzelhető, hogy a fenti alakú mátrixok körében elvégezhető az osztás. Természetesen itt beszélhetünk ,,balosztásról'' és ,,jobbosztásról'' is. Ez azt jelenti, hogy adott

A \neq O

és

B

elemhez keresünk olyan hasonló alakú

X

és

Y

mátrixokat, amelyekre

X A = A Y = B

. Tekintettel arra, hogy az

E

egységmátrix minden mátrixszal felcserélhető, elegendő a

B = E

eset vizsgálata. Ha viszont minden

A \neq O

mátrixhoz van olyan

X

, amelyre

X A = E

, akkor

X \neq O

, tehát van olyan

Z

, hogy

Z X = E

; így:

\begin{matrix} A X = E (A X) = (Z X) (A X) = Z (X (A X)) = Z ((X A) X) = Z (E X) = Z X = E . \end{matrix}

Eszerint

A X = E

is igaz. Természetesen

A Y = E

esetén

Y A = E

is teljesül. Elég tehát az ,,egyik oldali'' osztással foglalkozni. Keresünk tehát adott

U = [\begin{matrix} α & - β \\ \bar{β} & \bar{α} \end{matrix}]

mátrixhoz olyan (hasonló alakú)

V

mátrixot, amelyre

U V = E

. Könnyen ellenőrizhető, hogy ez a következőket jelenti: Adott

α

és

β

komplex számokhoz (amelyek nem mindketten egyenlők

0

-val) olyan

γ

és

δ

komplex számokat keresünk, amelyekre

α δ + β \bar{γ} = 0

és

\bar{α} \bar{γ} - \bar{β} δ = 1

teljesül. Az első egyenlőséget

\bar{β}

-tal, a másodikat

α

-val szorozva és összeadva azt kapjuk, hogy

(β \bar{β} + α \bar{α}) \bar{γ} = 1

. Mivel a bal oldalon levő első tényező nem

0

γ

és (analóg módon)

δ

is meghatározható. Behelyettesítéssel meggyőződhetünk arról, hogy a kapott két elem teljesíti a kirótt feltételt.
Beláttuk tehát, hogy az

[\begin{matrix} α & - β \\ \bar{β} & \bar{α} \end{matrix}]

alakú komplex elemű mátrixok halmaza az összeadás és szorzás (mátrix)műveletekre majdnem úgy viselkedik mint egy test, csupán a szorzás kommutativitása hiányzik. Ilyen esetekben ferdetestről beszélünk. Ma már az algebra sok ágában ezek nagyon fontosak. Ezért ezeket nevezik testnek, és ha a szorzás kommutatív, akkor kommutatív testről beszélünk. Mi itt az előbbi elnevezést vesszük figyelembe.
Az

α = a + b i

és

β = c + d i

felírással (

a

b

c

d

valós számok) azt kapjuk, hogy:

\begin{matrix} [\begin{matrix} α & - β \\ \bar{β} & \bar{α} \end{matrix}] = a [\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}] + b [\begin{matrix} i & 0 \\ 0 & - i \end{matrix}] + c [\begin{matrix} 0 & - 1 \\ 1 & 0 \end{matrix}] + d [\begin{matrix} 0 & - i \\ - i & 0 \end{matrix}] . \end{matrix}

Ezt az összeget az

E

I

J

K

mátrixjelöléssel a következőképpen írhatjuk fel:

\begin{matrix} a E + b I + c J + d K . \end{matrix}

Elnevezés. Az

a E + b I + c J + d K

alakú kifejezéseket kvaternióknak nevezzük (

a

b

c

d

valós számok). A kvaterniók összeadása komponensenként történik. A valós számokkal való szorzás is komponensenként történik, és a kvaterniókkal felcserélhető. A kvaterniók szorzása az asszociativitás és (mindkét oldali!) disztributivitás felhasználásával és a következő összefüggések segítségével végezhető el:

(1)	$E E = E$ , $E I = I E = I$ , $E J = J E = J$ , $E K = K E = K$ ;

(2)	$I I = J J = K K = - E$ ;

(3)	$I J = K$ , $J K = I$ , $K I = J$ és $J I = - K$ , $K J = - I$ , $I K = - J$ .

A kvaterniók a fenti műveletekre nézve ferdetestet alkotnak, amelynek a neve kvaterniótest. Az

I

J

K

elemeket kvaternióegységeknek nevezik.

Megjegyzések. 1. Az (1) és (2) alapján (3) helyettesíthető az

I J K = - E

összefüggéssel.
2. A (3) alatti összefüggések könnyebben megjegyezhetők a következő módon: Az

I \to J \to K \to I

felsorolásban két egymás utáninak a szorzata a harmadik, ha a ,,nyíl irányában'' szorzunk, míg ellenkező irányú szorzásnál a harmadik negatívját kapjuk.
3. A kvaterniókat és a kvaternióegységeket írhatjuk valós elemű mátrixokként is. Gondoljuk meg, hogy a komplex számokhoz

2 \times 2

-es valós mátrixokon keresztül jutottunk el. Helyettesítsük tehát az

E

I

J

K

mátrixok

0

1

i

elemeit rendre a

\begin{matrix} [\begin{matrix} 0 & 0 \\ 0 & 0 \end{matrix}], [\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}], [\begin{matrix} 0 & - 1 \\ 1 & 0 \end{matrix}], \end{matrix}

mátrixokkal. Ilyen módon a kvaterniókat valós elemű mátrixokkal ábrázoltuk; igaz, ezek

4 \times 4

-es mátrixok. (Számoljuk ki!)

A kvaterniókat általában nem mátrixalakban szokták megadni, hanem a következőképpen:

a + b i + c j + d k

(az

a 1

kifejezés helyett

a

szerepel, hiszen bármely

x

kvaternióra

1 x = x 1 = x

). Ezt a ,,szokást'' mi is átvesszük, azzal az eltéréssel, hogy a kvaternióegységeket vastagított betűvel jelöljük, vagyis a kvaternió az

a + b i + c j + d k

alakot ölti.

Megjegyzés. Az

i^{2} = j^{2} = k^{2} = - 1

összefüggés azt mutatja, hogy a kvaterniók körében az

x^{2} + 1

polinomnak több mint kettő gyöke van (itt még csak hatot látunk). Ennek nem lehet az az oka, hogy két nemnulla elemnek a szorzata

0

volna, hiszen ez ferdetestben nem fordulhat elő. Az ok csak a kommutativitás hiánya lehet. Ha a polinomokat

a_{0} + a_{1} x + ... + a_{n} x^{n}

alakban akarjuk tekinteni, akkor a műveletek elvégezhetősége érdekében vigyázni kell a szorzásnál abban az esetben, amikor az együtthatók szorzása nem kommutatív. Ugyanis az

x a

kifejezés nem polinom! Ezen úgy segítenek, hogy a határozatlant az együtthatókkal felcserélhetőnek tekintik. Ezért

x^{2} + 1 = (x + i) (x - i)

, hiszen

x (- i) = (- i) x

. Ha itt

x

helyébe

j

-t írunk, akkor a bal oldalon

0

, a jobb oldalon viszont

(j + i) (j + i) = - 1 + k - (- k) - (- 1) = 2 k

adódik. Ez azt is jelenti, hogy esetünkben a polinomoknál a szorzat helyettesítési értéke nem mindig egyezik meg a helyettesítési értékek szorzatával.

a + b i + c j + d k

felírással az is célunk volt, hogy megmutassuk, egy kvaternió két részből áll: az

a

skalárból és a

b i + c j + d k

úgynevezett tiszta kvaternióból. A tiszta kvaterniók pontosan megfelelnek a térvektoroknak, ahol

i

j

k

a koordinátatengelyek pozitív irányába mutató egységvektorok. Az világos, hogy tiszta kvaterniók összege pontosan a vektorösszeghez tartozó tiszta kvaterniónak felel meg. A szorzat viszont érdekesebbnek bizonyulhat.
Legyen

u = a i + b j + c k

és

v = x i + y j + z k

két tiszta kvaternió. Ezek szorzata kilenc tagból áll. E tagokat összevonva a következőket kapjuk:

\begin{matrix} u v = - (a x + b y + c v) + (b z - c y) i + (c x - a z) j + (a y - b x) k . \end{matrix}

Ha fordított sorrendben végezzük el a szorzást, akkor

\begin{matrix} v u = - (a x + b y + c v) - [(b z - c y) i + (c x - a z) j + (a y - b x) k] \end{matrix}

adódik. A szorzatoknak mind a valós része, mind a tiszta kvaternió része fontos szerepet játszik a matematika különböző ágaiban. Ezeket, megfelelően

(u; v)

, illetve

u \times v

(vagy

u^v

) jelöli. Az elsőnek a neve skaláris vagy belső szorzat, a másodiké vektoriális vagy külső szorzat. Ezeket formálisan is könnyen megkaphatjuk a tiszta kvaterniók segítségével:

(u; v) = - \frac{1}{2} (u v + v u)

és

u \times v = \frac{1}{2} (u v - v u)

Megjegyzések. 1. Két vektor skaláris szorzatát geometriailag úgy kaphatjuk meg, hogy összeszorozzuk hosszukat, és az általuk közbezárt szög koszinuszát. A vektoriális szorzat egy olyan vektor, amely merőleges a két adott vektor síkjára (ha azok párhuzamosak, akkor a vektoriális szorzat

0

), hossza a két vektor hosszának és a közbezárt szög szinuszának a szorzata, és iránya olyan, hogy belőle nézve az első vektort a második irányába forgató szög pozitív.
2. A fenti összefüggés lehetővé teszi, hogy két vektor szögének szögfüggvényeit a vektorok koordinátáiból kiszámítsuk anélkül, hogy a szöget ismernénk.
3. A felírt összefüggésből mindkét szorzatnak számos tulajdonsága leolvasható. Mint például az, hogy mindkettő disztributív az összeadásra nézve, a skaláris szorzat szimmetrikus, a vektoriális szorzat antiszimmetrikus (mit is jelenthet ez a szó?) stb.

Ha a tiszta kvaterniók szorzatánál a tényezők megegyeznek, akkor azt kapjuk, hogy

uu = - (a^{2} + b^{2} + c^{2})

. Ha a megfelelő vektor az origóból az egységsugarú gömb felületére mutat, akkor ez a kvaternió gyöke az

x^{2} + 1

polinomnak. A kvaterniók körében tehát egy másodfokú egész együtthatós polinomnak végtelen sok gyöke is lehet. (Aki ismer valamennyi halmazelméletet, az láthatja, hogy a gyökök ,,kontinuumnyi sokan'' vannak.)

4. Hamilton-tól Einstein-ig

A kvaterniókat W. R. Hamilton vezette be 1843-ban. Célja az volt, hogy térvektorokat ,,oszthasson''⁴.
Egy kvaternió ‐ mint tudjuk ‐ két részből áll, egy valós részből és egy tiszta kvaternióból. A tiszta kveterniónak megfeleltethetjük a háromdimenziós tér egy pontját, de mit tegyünk a skalárral? Az előbbiek alapján világos, hogy egy tiszta kvaternió négyzete egy negatív skalár, a skalárok négyzete pedig egy pozitív skalár. Ezek valahogy ,,ellentétesen viselkednek''. 1908-ban H. Minkowski egy olyan négydimenziós teret (ez négy koordinátát jelent) vezetett be, amely ehhez van igazítva. Nevezetesen felhasználható a Lorentz-transzformáció ,,leírásához''. Itt a valós tengely felel meg az időtengelynek, mert az idő másképpen viselkedik, mint a tér. Ezzel az ábrázolásmóddal nagymértékben elősegítette az Einstein-féle speciális relativitáselmélet megértetését.
Ha korlátozzuk magunkat az idővel és figyelembe vesszük, hogy az idő egy irányba változhat és feltesszük, hogy a ,,Nagy Bumm'' idején van az időskála

0

-pontja, akkor a koordinátarendszerben a ,,helyeket'' gömbökkel ábrázolhatjuk. Ha az

u

pontot akarjuk a (Nagy Bummtól számított)

t

időben ábrázolni, ezt úgy tehetjük meg, hogy megnézzük, hova mozdult el a pont

t

idő után. Ha ez a

v

pont, akkor egy

t

sugarú

v

középpontú gömböt veszünk fel. (Ha volna idő a Nagy Bumm előtt, ezt képzetes gömb ábrázolná ‐ bármi is az.)

¹Köszönet illeti a T043034 és T043671 OTKA támogatását.

²Tudatosan nem használtuk a $\sqrt[]{- 1}$ jelölést, mert ezzel mintegy kitüntetnénk a két gyök valamelyikét.

³A modellalkotásnak az a haszna ‐ jelen esetben ‐, hogy ha a valós számok körében nincs ellentmondás (ezt nem tudjuk!!), akkor a komplex számok körében sincs.

⁴Ezt a tényt kedves volt tanítványom, Pelikán József mesélte el a következő szavak kíséretében: ,,Ha az ember valamit meg akar érteni, akkor vissza kell menni az eredethez''. Ő ugyanis elolvasta Hamilton eredeti munkáját. Ő ugyanaz a matematikus, aki hosszú évek óta vezeti a magyar csapatot a matematikai diákolimpiákon, és jelenleg is az olimpiai bizottság tagja.