Cím: Az algebra alaptétele II.
Szerző(k):  Fried Ervin 
Füzet: 2006/február, 73 - 79. oldal  PDF file
Témakör(ök): Egyéb írások

1
 

1. Komplex számok, mint valós elemű mátrixok
 

A cikk első részében megmutattuk, hogy adott K test esetén tetszőleges K-beli együtthatós és felette irreducibilis n-edfokú f(x) polinomhoz található olyan n×n-es A mátrix, amely az f(x)-nek gyöke. (A skalár együtthatók helyébe a megfelelő skalármátrixokat kell írni!) Az is igaz, hogy A-nak a K-beli együtthatós polinomjai testet alkotnak, és e test minden eleme egyértelműen írható fel, mint A-nak legfeljebb (n-1)-edfokú polinomja.
A továbbiakban azt az esetet nézzük, amikor a kiinduló test a valós számok V teste. Ez a test (amit a számegyenesen szoktunk ábrázolni) a következő jellemző tulajdonságokkal rendelkezik (a szóbanforgó elemek mind V-beliek):
(1)Minden a, b elemhez van olyan c, amire c2=a2+b2.
(2)Ha az a elemhez nincs olyan b, amire a=b2, akkor van olyan c, amire a=-c2.
(3)a=b2=-c2 pontosan az a=0 esetben lehet.
(4)Tetszőleges valós együtthatós páratlan fokú (normált) polinomnak van valós gyöke.
(5)Minden valós együtthatós (normált) polinom felbontható legfeljebb másodfokú polinomok szorzatára.

Annak a bizonyítása, hogy a valós számtest rendelkezik ezekkel a tulajdonságokkal, felhasználja (4)-nél a folytonosságot. Ezen kívül van még nagyon sok test, ami rendelkezik a fenti tulajdonságokkal. Valójában az (5) tulajdonság következik a többiből, de a ,,trükkös'' bizonyításhoz sok, viszonylag bonyolult algebrai összefüggést kell ismerni. Mindenesetre világos, hogy az a2 alakú elemek pozitívak, illetve ezeket ,,tekinthetjük'' pozitívnak (a0).
A V valós test esetében (5) miatt egy irreducibilis polinom legfeljebb másodfokú. Elsőfokú polinomnak természetesen van gyöke V-ben (ez a gyök persze egyértelmű). De van olyan másodfokú polinom, amelynek nincs valós gyöke. Ilyen például az x2+1, mert ha ennek az a valós szám gyöke lenne, akkor az a2=-1=-12 összefüggésből (3) szerint 1=0 következne, ami nem igaz.
A z x2+1 polinom (valamelyik) gyökét i-vel jelölik, és képzetes egységnek nevezik. A másik gyök persze -i. Közöttük algebrai szempontból nincs különbség.
A valós számok felsorolt tulajdonságaiból könnyen kaphatjuk, hogy bármely másodfokú, valós együtthatós polinomnak van a+bi alakú, úgynevezett komplex szám gyöke. Ugyanennek a polinomnak van egy másik gyöke is, az a-bi. Az ilyen alakú párokat egymás konjugáltjának nevezzük.
A komplex számokról a következőket tudjuk:
 

A komplex számok testet alkotnak. Minden komplex szám egyértelműen felírható a+bi alakba, ahol a, b valós számok és i2=-12.
Összeadásuk és szorzásuk a következőképpen végezhető:
(a+bi)+(c+di)=(a+c)+(b+d)iés(a+bi)(c+di)=(ac-bd)+(ad+bc)i.

Az α=a+bi és α¯=a-bi konjugáltak szorzata a2+b2 pozitív, ha α0, ennek (pozitív) négyzetgyöke az α abszolút értéke (a megfelelő vektor hossza):
α+β¯=α¯+β¯,αβ¯=α¯β¯.

Minden komplex együtthatós normált polinomnak van komplex gyöke, ezért annyi elsőfokú polinom szorzatára bontható, amennyi a foka.

 

Cikkünk első részében a gyököket ,,mátrixalakban'' adtuk meg. Így az x2+1 (valós) polinom gyöke a J=[0-110] mátrix. Négyzetre emelve azt kapjuk, hogy [0-110]2=[-100-1], ami valóban a (-1)-nek megfelelő skalármátrix. Ennek alapján az a+bi komplex számnak az [a-bba] felel meg.
 
2. Komplex számok a síkgeometriában
 

Az első részben említettük, hogy a mátrixok homogén lineáris transzformációkat írnak le. Mindenekelőtt felhívjuk a figyelmet arra, hogy különböző méretű mátrixok is összeszorozhatók, ha nem négyzetesek. A ,,szorzási eljárás'' elvégzéséhez az szükséges, hogy az első mátrix oszlopainak a száma megegyezzék a második mátrix sorainak a számával. Mielőtt erre példát mutatnánk előrebocsátjuk a következőket.
Az origóból a sík (x;y) koordinátájú pontjába mutató v vektort a [xy] mátrixszal adjuk meg. Ezt az [abcd] mátrixszal (balról) szorozva azt kapjuk, hogy:
[abcd][xy]=[ax+bycx+dy].
Eredményünket úgy értelmezhetjük, hogy a fenti mátrixszal jellemzett φ (homogén lineáris) transzformáció a v vektort az (ax+by;cx+dy) koordinátájú pontba mutató φ(v) vektorba viszi át.
 
Megjegyzés. Érdemes meggondolni az alábbiakat:
1. Legyen e az (1;0) és f a (0;1) koordinátájú pontba mutató vektor. Hova mutat φ(e) és φ(f)? És φ(v)?
2. Ha ε az E mátrixszal jellemzett függvény, akkor világos, hogy mi lesz ε(v). De mi lesz α(v), ha α ,,mátrixa'' I? Értelmezzük ezt geometriailag.
3. Milyen alakú az aE+bI mátrix? És az aE-bI? Milyen alakú ezek szorzata? Mutassuk meg, hogy ha aε+bα egyetlen nem nulla vektort is nullába visz, akkor minden vektort 0-ba visz.
4. Milyen alakú az aE+bI mátrix, ha a2+b2=1? Ekkor mi lesz aε+bα hatása?
5. ,,Olvassuk le'' aε+bα hatását általában.
 

Az eddigi eredményeket úgy foghatjuk fel, hogy a valós számok ismeretében megalkottuk a komplex számokat ‐ pontosabban szólva egy modellt alkottunk a komplex számokra, egy olyan testet, amely úgy viselkedik, ahogy a komplex számoktól3 ,,elvárjuk''.
 
3. Kvaterniók
 

Az algebra alaptétele szerint minden komplex együtthatós polinomnak van komplex gyöke. (Mi ugyan nem ebben az alakban adtuk meg, de könnyen látható, hogy ez ugyanazt jelenti.) Vegyük most a 2×2-es alakú mátrixok elemeit a komplex számok C testéből. Mivel az x2+1 polinomnak van gyöke, azért ha a J mátrixot C feletti mátrixnak fogjuk fel, akkor az αE+βJ (α,βC) alakú mátrixok nem alkotnak testet. Ugyanis az (αE+βJ)(αE-βJ)=(α2+β2)E szorzat O lesz, ha β=iα, noha egyik tényező sem 0. Ezekkel tehát nem lehet osztani (mint az I. részben láttuk).
Igaz, hogy két komplex szám négyzetösszege lehet 0, de normájuk összege αα¯+ββ¯ csak akkor, ha α=β=0. Kiséreljük meg az egyik tényezőt ,,átváltani'' a konjugáltjára!
A szóbajövő mátrix [α-ββα]. Kézenfekvő megoldás, hogy a második sorban minden elem helyébe a konjugáltját írjuk: [α-ββ¯α¯].
Az világos, hogy két ilyen alakú mátrix összege is ilyen alakú. A szorzat esetében ezt ellenőrizni kell:
[α-ββ¯α¯][γ-δδ¯γ¯]=[αγ-βδ¯-αδ-βγ¯β¯γ+α¯δ¯-β¯δ+α¯γ¯].
Eszerint az adott alakú mátrixok gyűrűt alkotnak, mert a figyelembe veendő azonosságok mind teljesülnek ‐ kivéve persze a szorzat kommutativitását. Attól eltekintve, hogy ez ‐ az előzőekben megállapítottak következtében ‐ nem is lehetne igaz, lássuk be. Ahelyett, hogy ezt ,,általában'' bizonyítanánk, elég egy ellenpéldát adni. Az alábbi ellenpéldára a későbbiekben szükségünk is lesz. Legyen
I=[i00-i]ésJ=[0-110].
Ekkor ezek szorzata
K=IJ=[0-i-i0],mígJI=[0ii0]=-K.

Ennek ellenére elképzelhető, hogy a fenti alakú mátrixok körében elvégezhető az osztás. Természetesen itt beszélhetünk ,,balosztásról'' és ,,jobbosztásról'' is. Ez azt jelenti, hogy adott AO és B elemhez keresünk olyan hasonló alakú X és Y mátrixokat, amelyekre XA=AY=B. Tekintettel arra, hogy az E egységmátrix minden mátrixszal felcserélhető, elegendő a B=E eset vizsgálata. Ha viszont minden AO mátrixhoz van olyan X, amelyre XA=E, akkor XO, tehát van olyan Z, hogy ZX=E; így:
AX=E(AX)=(ZX)(AX)=Z(X(AX))=Z((XA)X)=Z(EX)=ZX=E.
Eszerint AX=E is igaz. Természetesen AY=E esetén YA=E is teljesül. Elég tehát az ,,egyik oldali'' osztással foglalkozni. Keresünk tehát adott U=[α-ββ¯α¯] mátrixhoz olyan (hasonló alakú) V mátrixot, amelyre UV=E. Könnyen ellenőrizhető, hogy ez a következőket jelenti: Adott α és β komplex számokhoz (amelyek nem mindketten egyenlők 0-val) olyan γ és δ komplex számokat keresünk, amelyekre αδ+βγ¯=0 és α¯γ¯-β¯δ=1 teljesül. Az első egyenlőséget β¯-tal, a másodikat α-val szorozva és összeadva azt kapjuk, hogy (ββ¯+αα¯)γ¯=1. Mivel a bal oldalon levő első tényező nem 0, γ és (analóg módon) δ is meghatározható. Behelyettesítéssel meggyőződhetünk arról, hogy a kapott két elem teljesíti a kirótt feltételt.
Beláttuk tehát, hogy az [α-ββ¯α¯] alakú komplex elemű mátrixok halmaza az összeadás és szorzás (mátrix)műveletekre majdnem úgy viselkedik mint egy test, csupán a szorzás kommutativitása hiányzik. Ilyen esetekben ferdetestről beszélünk. Ma már az algebra sok ágában ezek nagyon fontosak. Ezért ezeket nevezik testnek, és ha a szorzás kommutatív, akkor kommutatív testről beszélünk. Mi itt az előbbi elnevezést vesszük figyelembe.
Az α=a+bi és β=c+di felírással (a, b, c, d valós számok) azt kapjuk, hogy:
[α-ββ¯α¯]=a[1001]+b[i00-i]+c[0-110]+d[0-i-i0].

Ezt az összeget az E, I, J, K mátrixjelöléssel a következőképpen írhatjuk fel:
aE+bI+cJ+dK.

Elnevezés. Az aE+bI+cJ+dK alakú kifejezéseket kvaternióknak nevezzük (a, b, c, d valós számok). A kvaterniók összeadása komponensenként történik. A valós számokkal való szorzás is komponensenként történik, és a kvaterniókkal felcserélhető. A kvaterniók szorzása az asszociativitás és (mindkét oldali!) disztributivitás felhasználásával és a következő összefüggések segítségével végezhető el:
(1)EE=E, EI=IE=I, EJ=JE=J, EK=KE=K;
(2)II=JJ=KK=-E;
(3)IJ=K, JK=I, KI=J és JI=-K, KJ=-I, IK=-J.

A kvaterniók a fenti műveletekre nézve ferdetestet alkotnak, amelynek a neve kvaterniótest. Az I, J, K elemeket kvaternióegységeknek nevezik.
 

Megjegyzések. 1. Az (1) és (2) alapján (3) helyettesíthető az IJK=-E összefüggéssel.
2. A (3) alatti összefüggések könnyebben megjegyezhetők a következő módon: Az IJKI felsorolásban két egymás utáninak a szorzata a harmadik, ha a ,,nyíl irányában'' szorzunk, míg ellenkező irányú szorzásnál a harmadik negatívját kapjuk.
3. A kvaterniókat és a kvaternióegységeket írhatjuk valós elemű mátrixokként is. Gondoljuk meg, hogy a komplex számokhoz 2×2-es valós mátrixokon keresztül jutottunk el. Helyettesítsük tehát az E, I, J, K mátrixok 0, 1, i elemeit rendre a
[0000],[1001],[0-110],
mátrixokkal. Ilyen módon a kvaterniókat valós elemű mátrixokkal ábrázoltuk; igaz, ezek 4×4-es mátrixok. (Számoljuk ki!)
 

A kvaterniókat általában nem mátrixalakban szokták megadni, hanem a következőképpen: a+bi+cj+dk (az a1 kifejezés helyett a szerepel, hiszen bármely x kvaternióra 1x=x1=x). Ezt a ,,szokást'' mi is átvesszük, azzal az eltéréssel, hogy a kvaternióegységeket vastagított betűvel jelöljük, vagyis a kvaternió az a+bi+cj+dk alakot ölti.
 
Megjegyzés. Az i2=j2=k2=-1 összefüggés azt mutatja, hogy a kvaterniók körében az x2+1 polinomnak több mint kettő gyöke van (itt még csak hatot látunk). Ennek nem lehet az az oka, hogy két nemnulla elemnek a szorzata 0 volna, hiszen ez ferdetestben nem fordulhat elő. Az ok csak a kommutativitás hiánya lehet. Ha a polinomokat a0+a1x+...+anxn alakban akarjuk tekinteni, akkor a műveletek elvégezhetősége érdekében vigyázni kell a szorzásnál abban az esetben, amikor az együtthatók szorzása nem kommutatív. Ugyanis az xa kifejezés nem polinom! Ezen úgy segítenek, hogy a határozatlant az együtthatókkal felcserélhetőnek tekintik. Ezért x2+1=(x+i)(x-i), hiszen x(-i)=(-i)x. Ha itt x helyébe j-t írunk, akkor a bal oldalon 0, a jobb oldalon viszont (j+i)(j+i)=-1+k-(-k)-(-1)=2k adódik. Ez azt is jelenti, hogy esetünkben a polinomoknál a szorzat helyettesítési értéke nem mindig egyezik meg a helyettesítési értékek szorzatával.
 
Az a+bi+cj+dk felírással az is célunk volt, hogy megmutassuk, egy kvaternió két részből áll: az a skalárból és a bi+cj+dk úgynevezett tiszta kvaternióból. A tiszta kvaterniók pontosan megfelelnek a térvektoroknak, ahol i, j, k a koordinátatengelyek pozitív irányába mutató egységvektorok. Az világos, hogy tiszta kvaterniók összege pontosan a vektorösszeghez tartozó tiszta kvaterniónak felel meg. A szorzat viszont érdekesebbnek bizonyulhat.
Legyen u=ai+bj+ck és v=xi+yj+zk két tiszta kvaternió. Ezek szorzata kilenc tagból áll. E tagokat összevonva a következőket kapjuk:
uv=-(ax+by+cv)+(bz-cy)i+(cx-az)j+(ay-bx)k.
Ha fordított sorrendben végezzük el a szorzást, akkor
vu=-(ax+by+cv)-[(bz-cy)i+(cx-az)j+(ay-bx)k]
adódik. A szorzatoknak mind a valós része, mind a tiszta kvaternió része fontos szerepet játszik a matematika különböző ágaiban. Ezeket, megfelelően (u;v), illetve u×v (vagy u^v) jelöli. Az elsőnek a neve skaláris vagy belső szorzat, a másodiké vektoriális vagy külső szorzat. Ezeket formálisan is könnyen megkaphatjuk a tiszta kvaterniók segítségével: (u;v)=-12(uv+vu) és u×v=12(uv-vu).
 
Megjegyzések. 1. Két vektor skaláris szorzatát geometriailag úgy kaphatjuk meg, hogy összeszorozzuk hosszukat, és az általuk közbezárt szög koszinuszát. A vektoriális szorzat egy olyan vektor, amely merőleges a két adott vektor síkjára (ha azok párhuzamosak, akkor a vektoriális szorzat 0), hossza a két vektor hosszának és a közbezárt szög szinuszának a szorzata, és iránya olyan, hogy belőle nézve az első vektort a második irányába forgató szög pozitív.
2. A fenti összefüggés lehetővé teszi, hogy két vektor szögének szögfüggvényeit a vektorok koordinátáiból kiszámítsuk anélkül, hogy a szöget ismernénk.
3. A felírt összefüggésből mindkét szorzatnak számos tulajdonsága leolvasható. Mint például az, hogy mindkettő disztributív az összeadásra nézve, a skaláris szorzat szimmetrikus, a vektoriális szorzat antiszimmetrikus (mit is jelenthet ez a szó?) stb.
 
Ha a tiszta kvaterniók szorzatánál a tényezők megegyeznek, akkor azt kapjuk, hogy uu=-(a2+b2+c2). Ha a megfelelő vektor az origóból az egységsugarú gömb felületére mutat, akkor ez a kvaternió gyöke az x2+1 polinomnak. A kvaterniók körében tehát egy másodfokú egész együtthatós polinomnak végtelen sok gyöke is lehet. (Aki ismer valamennyi halmazelméletet, az láthatja, hogy a gyökök ,,kontinuumnyi sokan'' vannak.)
 
4. Hamilton-tól Einstein-ig
 

A kvaterniókat W. R. Hamilton vezette be 1843-ban. Célja az volt, hogy térvektorokat ,,oszthasson''4.
Egy kvaternió ‐ mint tudjuk ‐ két részből áll, egy valós részből és egy tiszta kvaternióból. A tiszta kveterniónak megfeleltethetjük a háromdimenziós tér egy pontját, de mit tegyünk a skalárral? Az előbbiek alapján világos, hogy egy tiszta kvaternió négyzete egy negatív skalár, a skalárok négyzete pedig egy pozitív skalár. Ezek valahogy ,,ellentétesen viselkednek''. 1908-ban H. Minkowski egy olyan négydimenziós teret (ez négy koordinátát jelent) vezetett be, amely ehhez van igazítva. Nevezetesen felhasználható a Lorentz-transzformáció ,,leírásához''. Itt a valós tengely felel meg az időtengelynek, mert az idő másképpen viselkedik, mint a tér. Ezzel az ábrázolásmóddal nagymértékben elősegítette az Einstein-féle speciális relativitáselmélet megértetését.
Ha korlátozzuk magunkat az idővel és figyelembe vesszük, hogy az idő egy irányba változhat és feltesszük, hogy a ,,Nagy Bumm'' idején van az időskála 0-pontja, akkor a koordinátarendszerben a ,,helyeket'' gömbökkel ábrázolhatjuk. Ha az u pontot akarjuk a (Nagy Bummtól számított) t időben ábrázolni, ezt úgy tehetjük meg, hogy megnézzük, hova mozdult el a pont t idő után. Ha ez a v pont, akkor egy t sugarú v középpontú gömböt veszünk fel. (Ha volna idő a Nagy Bumm előtt, ezt képzetes gömb ábrázolná ‐ bármi is az.)
1Köszönet illeti a T043034 és T043671 OTKA támogatását.

2Tudatosan nem használtuk a -1 jelölést, mert ezzel mintegy kitüntetnénk a két gyök valamelyikét.

3A modellalkotásnak az a haszna ‐ jelen esetben ‐, hogy ha a valós számok körében nincs ellentmondás (ezt nem tudjuk!!), akkor a komplex számok körében sincs.

4Ezt a tényt kedves volt tanítványom, Pelikán József mesélte el a következő szavak kíséretében: ,,Ha az ember valamit meg akar érteni, akkor vissza kell menni az eredethez''. Ő ugyanis elolvasta Hamilton eredeti munkáját. Ő ugyanaz a matematikus, aki hosszú évek óta vezeti a magyar csapatot a matematikai diákolimpiákon, és jelenleg is az olimpiai bizottság tagja.