A szöveg csak Firefox böngészőben jelenik meg helyesen. Használja a fenti PDF file-ra mutató link-et a letöltésre. Az első egyenlet, amellyel a koordináta-geometriában találkozunk, az egyenes egyenlete: . Ennek segítségével határozhatjuk meg például két egyenes metszéspontjának a koordinátáit: ha az egyenesek egyenlete , illetve , akkor a metszéspont koordinátái azok az , számok, amelyek mind a két egyenletet kielégítik, vagyis az , számpár az
lineáris egyenletrendszer megoldása. Az egyenletek analógiájára érdemes az párt egyetlen objektumnak tekinteni: így az egyenletrendszer bal oldala kiszámolja az ismeretlen párhoz a számpárt. A feladat a megadott eredményhez tartozó pár megkeresése. Vizsgáljuk meg ezt a hozzárendelést. Az egyismeretlenes elsőfokú egyenlet mintájára vezessük be a következő jelölést: , ahol az adott számpárt, pedig a keresett számpárt jelenti, mindkettőt ,,függőleges'', oszlopszerű elrendezésben fölírva: , . Az pedig az egyenletek bal oldalán álló együtthatók téglalap-szerű elrendezésben: . Vegyük észre, hogy ezzel nem csupán egy jelölést vezettünk be, amelynek révén számok bizonyos rendszereit mátrixokkal (esetünkben , , ) ábrázoljuk, hanem ‐ ezek egymás mellé írásával ‐ egy műveletet is, amely a két sorból és két oszlopból álló (röviden: -es) és az egyetlen oszlopból álló oszlopmátrixokból kiszámolja a oszlopmátrixot. Nem kell innen túl messzire mennünk ahhoz, hogy további jelenségekre bukkanjunk, amelyek ugyancsak a fenti művelettel írhatók le. Tekintsük ehhez a sík különféle transzformációit: elforgatásokat, tükrözéseket, vetítéseket. Pontok helyett azonban vektorokra alkalmazzuk e transzformációkat, azaz rögzítsünk egy origót, és a sík egy tetszőleges pontjára tekintsük az vektort. Tudjuk, hogy a pontba mutató vektor felírható alakban, ahol és a tengelyek irányába mutató egységvektorok. Ha az említettek közül egy olyan geometriai transzformáció, amely az origót helyben hagyja és -t -be, -t pedig -be képezi, akkor képe . Írjuk fel ‐ -hez hasonlóan ‐ az és vektorokat is , alakban; ekkor képe a transzformációnál . Ekkor látható, hogy a képvektor , illetve koordinátáiból álló oszlopmátrix: | |
A transzformáció tehát egy mátrixszal ‐ a mátrixszal ‐ adható meg, és egy tetszőleges vektor képének a koordinátáit ebből a mátrixból és a vektor koordinátáiból, mátrixszorzással kapjuk meg. Ennek a mátrixnak az oszlopai pedig éppen az és a vektorok képeként adódó vektorok. A korábbi egyenletrendszert a transzformációk nyelvén megfogalmazva látható, hogy az egyenletmegoldás alaphelyzetébe kerültünk: ,,Gondoltam egy számpárt, alkalmaztam rá a transzformációt, és a -t kaptam. Melyik számpárra gondoltam?'' Vizsgáljuk meg ezután, hogy az ismert geometriai transzformációknak mi a mátrix alakja. A legegyszerűbb talán az origó középpontú hasonlóság. Ha ennek aránya , akkor az és vektor egyaránt a -szorosára változik, sőt minden vektor mindkét koordinátája a -szorosára változik. Így a mátrixa és valóban: Ennél kissé többet kell dolgozni az origó körüli forgatás mátrixáért. Ha az elforgatás szöge , akkor ‐ a szögfüggvények definíciója alapján ‐ az vektor képe , a mátrix első oszlopában tehát a , értékek állnak. A második oszlop, a vektor képe pedig az képének a 90 fokos elforgatottja, ami . Tehát a mátrixa alakú. Mielőtt továbbmennénk, érdemes megnézni, mi történik, ha az szögű forgatást követően még egy szöggel is forgatunk. A két forgatást egymás után végrehajtva összesen szöggel forgattunk, ennek a transzformációnak a mátrixa az előbbiek szerint . Másrészt az -val történő elforgatás az -t a fentiek szerint | | viszi, ezt pedig a szögű forgatás
Mivel ez éppen | | a kapott azonosságból leolvashatók a szinusz- és koszinuszfüggvényre vonatkozó addíciós képletek. Ezen túlmenően az is kiderül, hogyan célszerű értelmezni a és mátrixok szorzatát, ha azt akarjuk, hogy azzal megszorozva az oszlopot ugyanazt kapjuk, mintha -t előbb -val, majd a kapott oszlopot -val szoroznánk meg; így a két -es mátrix szorzatára kapott definíció:
illetve általában egy és egy mátrix szorzata | | pontosan ezzel érjük el, hogy a megfelelő és transzformációk egymás után alkalmazásának (kompozíciójának) a mátrixa a és transzformációk mátrixának a szorzata legyen. Másszóval a (meglehetősen mesterkéltnek tűnő) mátrixszorzás magyarázatát a megfelelő transzformációk kompozíciója adja. Haladjunk ezután tovább a nevezetes geometriai transzformációk sorában: jelölje ezúttal az origón átmenő, az tengellyel (pontosabban az egységvektorral) szöget bezáró egyenesre való tükrözést. Az tükörképe éppen az ő szögű elforgatottja, azaz , a tükörképe pedig az képének a -os elforgatottja: ; a tükrözés mátrixa tehát . Ellenőrzésként érdemes megnézni, mi történik, ha egymás után két egyenesre tükrözünk: az első egyenes az egységvektorral , a második szöget zárjon be; a két tükrözés kompozíciójának mátrixa a két tükrözés mátrixának szorzata: | | Látható, hogy ez éppen a szög 2-szeresével való forgatásnak a mátrixa, ahol a két egyenes által bezárt szög. Ezzel beláttuk, hogy két tengelyes tükrözés kompozíciója az egyenesek által bezárt szög kétszeresével való elforgatás az egyenesek metszéspontja körül. Szakadjunk el most egy rövidebb időre a ,,nevezetes'' geometriai transzformációktól és gondoljunk arra, hogy a látottak mintájára bármely -es mátrix segítségével megadhatunk egy transzformációt: ha egy ilyen mátrix, akkor az transzformáció vigye a tetszőleges vektort -be. Ennek így általában nehéz lenne szemléletes geometriai jelentést tulajdonítani; ha azonban például , akkor látható, hogy és , tehát a transzformáció ‐ legalábbis két irányban ‐ ,,szépen viselkedik'': az irányában -szeres, a irányában pedig -szeres középpontos hasonlóságként. Esetünkben ennek az volt az oka, hogy mátrixa, úgynevezett diagonális mátrix. A jelenség azonban szerencsére ennél szélesebb körben fordul elő. Nézzük példaként a mátrixot, ami szemlátomást nem diagonális. Viszont | | tehát a mátrixunknak megfelelő transzformáció a vektort önmagába képezi, a vektort pedig -be. Mi ebből a tanulság? A vektorokat ne és , hanem és segítségével írjuk fel! Ekkor ugyanis egy alakban felírt vektort a transzformáció egyszerűen -be képezi. Ahhoz, hogy az eredetileg alakban fölírt vektort ilyen formában megkapjuk, elegendő az és egységvektorokat felírnunk és segítségével: | | ekkor | | így | |
A mátrixok nyelvén ez azt jelenti, hogy a vektor képének és szerinti , koordinátái (azaz a és irányú összetevőkkel való felírásában a két együttható) az eredeti (, szerinti) koordinátákból az | | szerint kaphatók meg. Az eredmény , szerinti , koordinátáit ebből már könnyű kiszámítani: | | alapján | | Mivel az egyenlőség mindkét oldalán az , szerinti koordináták szerepelnek, a három mátrix szorzata a transzformáció eredeti mátrixát adja, vagyis | |
A kapott háromtényezős előállítás geometriai jelentése tehát a következő. A transzformáció végrehajtását három fázisra bontjuk: először az , által meghatározott koordináta-rendszerről áttérünk a , szerinti koordináta-rendszerre ‐ ennek felel meg a jobb szélső tényező; utána a transzformáció szempontjából kellemes rendszer szerint végrehajtjuk -t ‐ ezt mutatja a középső tényező; végül visszatérünk az eredeti , koordináta-rendszerre ‐ ezt írja le a bal szélső tényező. Mivel a két szélső mátrix egymással ellentétes, illetve fordított irányú lépést jelenít meg, nem túlságosan meglepő, hogy szorzatuk, | | a ,,semleges'' ún. egységmátrix, ami a mátrixok szorzására ugyanúgy viselkedik, mint a közönséges számoknál az 1: a vele való szorzás mindent változatlanul hagy. Ennek alapján azt mondjuk, hogy a két mátrix egymás inverze: , illetve . A mátrixok iménti ,,diagonalizált'' háromtényezős felírásának egy alkalmazására mutatunk példát a következő részben.
Hatványozás és lineáris rekurziók A mátrixoknak ez a meglepően messze vezető alkalmazása a lineáris rekurzióval definiált sorozatokkal kapcsolatos. A módszert ‐ az elméleti és a technikai nehézségek kikerülése végett ‐ egy ,,kisméretű'' és jól ismert példán, a Fibonacci-féle sorozaton mutatjuk be, utána próbáljuk majd a kérdést valamivel általánosabban is áttekinteni. A Fibonacci-féle sorozatot a következőképpen definiáljuk: legyen , , és minden -re . Hogyan kerülnek ide mátrixok? Legyen (minden -re) , ekkor a sorozat megadási módjából következően van olyan -es mátrix, amelyre : | | Mivel ez minden -re érvényes, alkalmazzuk rendre -re, 2-re, 3-ra stb.: , , ; látható, hogy általában . Ahhoz tehát, hogy a sorozat -edik tagját közvetlenül, az függvényében felírhassuk elegendő, ha ebben az értelemben ismerjük az mátrix hatványait. Túl sokat kísérletezni nem érdemes az első néhány hatványának kiszámításával: az egyetlen szabályszerűség, amit észrevehetünk az, hogy hatványaiban maguk a Fibonacci-számok jelennek meg, a kör tehát ebben az irányban bezárul. Újabb nekifutásként próbáljuk meg felmérni: vajon minden (-es) mátrix hatványozása ilyen nehézséggel jár-e. Nem nehéz rájönni, hogy bizonyos speciális mátrixok esetében ez egyáltalán nem így van. Ha például típusú, azaz diagonális mátrix, akkor ,,elemenként'' hatványozható, azaz . Kérdés, hogy a diagonális mátrixoknak ez a kedvező tulajdonsága átörökíthető-e minden mátrixra, vagy legalábbis a (nem diagonális) mátrixok egy részére. A részleges megoldást pontosan az előző részben megismert felbontás nyújtja! Legyen invertálható mátrix, pedig ezzel megegyező méretű diagonális. Hatványozzuk az mátrixot:
Könnyen látható, hogy (minden -re) , tehát azokat a mátrixokat valóban könnyen tudjuk hatványozni, amelyek -hoz hasonlóan származtathatók egy diagonális mátrixból. Nézzük meg, hogy a Fibonacci-féle sorozattal kapcsolatba hozott mátrix előállítható-e ilyen módon. Ennek eldöntéséhez olyan mátrixot keresünk, amelyre teljesül, alkalmas számokkal. Mivel ismeretlen mátrix inverzével nagyon kényelmetlen lenne a számolás, szorozzuk meg az egyenlet mindkét oldalát balról -mel: | | A két mátrix megfelelő elemeinek kell egyenlőnek lennie, vagyis
rendezve:
Itt az első és második egyenletből álló rendszer független a harmadik és negyedik egyenletből álló rendszertől, viszont a két rendszer azonos szerkezetű: helyébe -t, helyébe -t írva kapjuk az utóbbit az előbbiből. Az első két egyenlet rendszerét megoldva: | | esetén , és így az mátrixnak nem létezne inverze, mivel első sora csupa nulla; ezért , azaz | | A és nem lehet egymással egyenlő, mivel akkor ( és miatt) az első oszlopa a második oszlop -szerese volna, és emiatt -nek nem létezne inverze. Válasszuk ezért -et -nek, -t pedig -nek. Az és az értéke tetszőleges nemnulla számnak választható, legyen mind a kettő 1; ekkor | | és ezekkel valóban
ebből pedig az -edik Fibonacci-féle számra Célunkat a Fibonacci-féle számok explicit előállítására elértük, és az ennek érdekében végzett számolás nyilván minden olyan konkrét esetben célhoz vezet, amikor a hatványozni kívánt mátrix egyáltalán előállítható a kívánt alakban ‐ az ilyen mátrixról azt mondjuk, hogy diagonalizálható. Sajnos nem minden mátrix ilyen, például (a Fibonacci-sorozatnak megfelelő mátrixhoz látszólag nagyon hasonló) mátrix nem diagonalizálható. (Vigasszal szolgálhat ugyanakkor, hogy ezt a mátrixot nagyon könnyű hatványozni, az első néhány hatványban észrevett szabályszerűséget indukcióval egyszerűen beláthatja az Olvasó.)
A továbbiakban ‐ a -es mátrixok keretein túllépve ‐ összefoglaljuk a mátrixokra értelmezett alapvető műveleteket és azok legfontosabb tulajdonságait. Ezután röviden tárgyaljuk az ezekhez szorosan kapcsolódó lineáris egyenletrendszerekre vonatkozó lényegesebb tudnivalókat. Akik ezt a két részt túlságosan száraznak találják, nyugodtan lapozzák át; az utána következő témák részben így is követhetőek lesznek, legfeljebb egy-egy ismeretlen fogalom, jelölés vagy állítás azonosítása végett lesz majd érdemes ide alkalmanként visszatérni.
Műveletek mátrixokkal Összeadás. Két, darab sorból és oszlopból álló (röviden -as) mátrix összege az az ugyancsak -as mátrix, amelyet a két mátrix megfelelő helyén álló elemek összeadásával kapunk, azaz | | Hasonlóan egyszerűen, illetve természetesen értelmezett egy mátrix számszorosa: az adott mátrix minden elemét szorozzuk meg az illető számmal, vagyis | |
Szorzás. Két mátrix szorzatát viszont a következő, kezdetben roppant furcsának tűnő módon értelmezzük. Legyen egy -as, pedig -es mátrix; ekkor és szorzata az az -es mátrix legyen, amelynek -edik elemét az mátrix -edik sorának és a mátrix -edik oszlopának megfelelő elemeit összeszorozva, e szorzatok összegeként kapjuk: . Hangsúlyozandó, hogy és szorzata ‐ ebben a sorrendben ‐ csak akkor értelmezett, ha -nak annyi oszlopa van, ahány sora -nek, és ekkor az szorzatnak annyi sora lesz, mint -nak, és annyi oszlopa, mint -nek. Vegyük továbbá észre, hogy -nek az -edik eleme az -edik sorának (mint -as mátrixnak) és a -edik oszlopának (mint -es mátrixnak) a szorzata, legalábbis abban az értelemben, hogy az utóbbi -es mátrixot azonosítjuk az ő egyetlen elemével. Ebből következik, hogy -nek a -edik oszlopa megegyezik -nak és -edik oszlopának a szorzatával. Mit mondhatunk ezen műveletek tulajdonságairól? A legtöbb ‐ a számok körében teljesülő ‐ műveleti tulajdonság, illetve azonosság itt is érvényben marad: az -as mátrixok összeadása kommutatív és asszociatív, a csupa nullából álló nullmátrixra teljesül (minden -ra), bármely -nak létezik ellentettje amelyre . Mátrixoknak számmal és mátrixszal való szorzása egyaránt disztributív az összeadásra nézve: , , minden, megfelelő méretű , , , mátrixra. Belátható továbbá, hogy a mátrixszorzás asszociatív: ha , és megfelelő méretű mátrixok, akkor . Baj van viszont a mátrixszorzás kommutativitásával! Ha egy -as, pedig -es mátrix, akkor értelmezéséhez , értelmezéséhez szükséges; ekkor mérete , azaz , mérete pedig , vagyis . Ahhoz, hogy egyáltalán értelme legyen megkérdezni, vajon egyenlő-e -val mindenképpen szükséges, hogy a két szorzat azonos méretű legyen, tehát és egyaránt -es. A szorzás azonban még ebben a meglehetősen korlátozott körben sem kommutatív; pl. -re . Ez a szorzás egyúttal arra is figyelmeztető példát ad, hogy két mátrix szorzata lehet úgy is nulla, hogy eközben egyik tényező sem az. A mátrixszorzás ‐ egyelőre csupán a jelölések szintjén ‐ első és talán legtermészetesebb alkalmazása a lineáris egyenletrendszerek terén adódik. Lineáris egyenletrendszeren általában a következő típusú feladatot értjük. Adottak az és a számok, ahol , (alkalmas és pozitív egészekkel); keresendők mindazon számok, amelyek eleget tesznek a következő egyenleteknek: | | (1) |
Legyen ekkor az egyenletrendszer együtthatóiból álló -as mátrix, pedig az egyenletek jobb oldalán álló konstansokból képezett -es (oszlop)mátrix. Ha az ismeretlenekből álló -es (oszlop)mátrixot is bevezetjük, akkor az (1) egyenletrendszer ekvivalens az mátrixegyenlettel, hiszen az mátrix -edik sora éppen az (1) -edik egyenletének bal oldala. Ez azt sugallja, hogy a lineáris egyenletrendszer megoldásához ,,osztani'' kell(ene) az együttható-mátrixszal. A számok körében végezhető közönséges osztáshoz hasonlóan az osztás a reciprokkal (a multiplikatív inverzzel) történő szorzást jelenti, a reciprok-képzés pedig az 1 osztását. Ehhez először is meg kell találni az 1 szám megfelelőjét a mátrixok körében. Ez nem más, mint az az -es mátrix (tetszőleges -re) amelyben az első sor első, a második sor második, , az -edik sor -edik eleme 1, az összes többi pedig nulla: | | Könnyen ellenőrizhető, hogy és valóban teljesül minden -es és -as mátrixra. Mit értsünk ezután egy -as mátrix inverzén? Mivel a mátrixszorzás nem kommutatív, kétfélét is érthetünk: olyan mátrixot, amelyre , vagy olyan mátrixot, amelyre . Ilyenkor azt mondjuk, hogy az -nek balinverze, pedig jobbinverze. A szorzás értelmezéséből közvetlenül adódik, hogy és csakis -es lehet. Egyébként két különböző dologról van szó, azaz egyik tulajdonságból sem következik a másik. Például az mátrixnak van jobbinverze (több is!), ilyen pl. , viszont nincs balinverze: az -nek egyenlő az első és a második oszlopa, ezért akármilyen (-es) mátrixszal szorozzuk is balról, a szorzatban is megegyezik az első és a második oszlop, így az nem lehet (a -as) egységmátrix. Hasonlóan látható, hogy például a csupa 1-esből álló -es mátrixnak nincs sem bal, sem jobb oldali inverze. Egyszerűbb a helyzet, ha négyzetes mátrix, azaz . Ekkor -nek vagy nem létezik semmilyen oldali inverze sem, vagy egyetlen bal és egyetlen jobb oldali inverze van, és ezek egymással egyenlők; utóbbi esetben ezt az egyértelmű mátrixot hívjuk az inverzének, és -nel jelöljük. Térjünk vissza ezután az inverzek kiszámításához. Ha például az -as mátrixhoz keresünk egy jobbinverzet, akkor az mátrixegyenletet kell megoldanunk. Jelölje az oszlopait rendre , a mátrix ismeretlen oszlopait pedig . Ekkor pontosan azt jelenti, hogy , minden -re. Ez darab ‐ egyenként egyenletből álló ‐ lineáris egyenletrendszert jelent (amelyeknek közös az együttható-mátrixuk). Ebből is látható, hogy a lineáris egyenletrendszerek megoldásának kérdése nem kerülhető meg.
Lineáris egyenletrendszerek Lineáris egyenletrendszerekkel a középiskolában elsősorban a koordináta-geometriában találkozhatunk: például két egyenes közös részének meghatározásához az egyenesek egyenleteiből álló lineáris egyenletrendszert kell megoldani: ha mindkét ismeretlenre egyértelmű megoldás adódik, az azt jelenti, hogy az egyenesek egy pontban metszik egymást; ha nincs megoldás, akkor az egyenesek párhuzamosak. A következőkben röviden ismertetjük a lineáris egyenletrendszerek megoldásának egyik módszerét, amelyet Gauss-féle kiküszöbölésnek (eliminációnak) neveznek. Tekintsük ehhez az (1) egyenletrendszert, és jelöljük az -edik egyenletét -vel. Az eljárás során az egyenleteket úgy alakítjuk át, hogy egyrészt a rendszer megoldásainak halmaza ne változzon, másrészt az átalakítások sorozata olyan egyenletrendszerre vezessen, amiből a megoldás közvetlenül leolvasható. E kettős célt a következő két lépés megfelelő számú alkalmazásával érjük el:
| , ahol (az -edik egyenletet úgy változtatjuk, hogy mindkét oldalát megszorozzuk a nemnulla számmal); |
| , ahol tetszőleges szám és (az -edik egyenletet úgy változtatjuk, hogy hozzádjuk a -edik egyenlet -szeresét; a -edik egyenlet természetesen változatlan marad). | Mind a kétféle lépés olyan, hogy a rendszer egyetlen egyenletét változtatja csak meg. Az (a) esetén világos, hogy az új, egyenlet ekvivalens az eredeti -vel, így a kapott új egyenletrendszernek ugyanazok a megoldásai, mint az eredetinek. A (b) alkalmazása esetén az látszik, hogy a kapott új, egyenlet az és az egyenletek együttes következménye, ezért az így kapott új egyenletrendszernek az eredeti rendszer minden megoldása továbbra is megoldása marad. Ez azonban fordítva is igaz, mivel az új egyenletrendszerből következményként visszakaphatjuk a régit: csupán a megváltozott -edik egyenletet kell következményként visszaállítani, ami egyszerű: . Tudva, hogy az (a) és (b) típusú lépésekkel az eredetivel ekvivalens egyenletrendszerekhez jutunk, már csak arra kell törekedni, hogy ezek segítségével egyre ,,szebb'' alakúra formáljuk (1)-et. Tegyük fel ehhez, hogy ; ha , akkor változtassuk meg az ismeretlenek számozását és szükség esetén az egyenletek sorrendjét is úgy, hogy az ekként adódó együttható már ne legyen nulla; ha ezt még így sem tudjuk elérni az azt jelenti, hogy mindegyik ismeretlen együtthatója minden egyenletben nulla, tehát egyenleteink valamennyien alakúak. Ekkor nincs is több teendőnk: ha valamelyik értéke nullától különböző, akkor az egyenletrendszernek nincs megoldása (hiszen tartalmaz ,,nulla = nemnulla'' típusú egyenletet), míg abban az esetben, ha minden értéke nulla, az egyenletrendszernek minden szám -as megoldása. Tegyük fel tehát, hogy . Az (a) lépést az első egyenletre alkalmazva elérhető, hogy legyen. Ezután a (b) lépést alkalmazzuk egymás után a második, harmadik, , -edik egyenletre úgy, hogy rendre kivonjuk belőlük az első egyenlet -szeresét, , -szeresét. Így az együtthatója az első egyenletben 1, a többiben pedig nulla. Folytassuk az eljárást, ezúttal az első egyenletre koncentrált lépéssorozatot a második egyenletre irányítva: szeretnénk, hogy a második egyenletben aktuális együtthatója ne legyen nulla. Ha az ismeretlenek átszámozásával és a másodiktól az -edikig terjedő egyenletek sorrendjének megváltoztatásával sem érhető ez el, akkor a korábbiakhoz hasonlóan ezek mind alakúak, és az egyenletrendszernek vagy nincs megoldása, vagy (ha mindegyike nulla) az ismeretlenek értéke tetszőleges lehet, az pedig az első egyenletből ezekkel kifejezhető. Feltéve, hogy , a második egyenletet -vel osztva elérjük, hogy ; ezután alkalmazzuk a (b) lépést úgy, hogy az első, a harmadik, , -edik egyenletből rendre kivonjuk a második egyenlet -szeresét, , -szeresét. Ezzel együtthatója a második egyenletben 1, a többiben pedig nulla ‐ miközben ,,kellemes'' együtthatói sehol nem változnak. Az eljárást ezután a harmadik egyenletre és együtthatóinak kiritkítására összpontosítva folytatjuk stb. Végül (az ismeretlenek esetleges átszámozását és az egyenletek sorrendjének megváltoztatását is megengedve) az egyenletrendszer a következő alakot ölti: | | (3) | Ha valamelyike nullától különböző, akkor nincs megoldás, egyébként az ismeretlenek értéke tetszőlegesen megválasztható, ezekkel pedig rendre kifejezhető az első egyenletből | | szerint. Vegyük észre, hogy ha van megoldás, és (vagyis több ismeretlen van, mint ahány egyenlet), akkor az egyenletrendszernek biztosan egynél több megoldása van, hiszen ekkor miatt lesznek olyan ismeretlenek, amelyek értéke szabadon megválasztható. E megállapítás roppant fontos speciális esete a következő: Tegyük fel, hogy az (1) egyenletrendszerben ‐ az ilyen egyenletrendszert homogénnek nevezzük. Homogén lineáris egyenletrendszernek biztosan van megoldása, nyilván ilyen például (ezt szokás a rendszer triviális megoldásának nevezni). Ha ilyenkor , akkor a fentiek szerint létezik az egyenletrendszernek a triviálistól különböző megoldása is, ahol tehát nem mindegyik értéke nulla.
Lineáris kombináció, függetlenség, bázis Ebben a részben a mátrixműveletek közül elsősorban az összeadásra és a számmal való szorzásra lesz szükség. Legyenek -es oszlopmátrixok és legyenek tetszőleges számok. Az kifejezést (ami ugyancsak egy -es oszlopmátrix) a rendszer elemeinek az együtthatókkal képezett lineáris kombinációjának hívjuk. Ha az összes együttható nulla, akkor nyilván a kombináció értéke a csupa nullából álló oszlopmátrix. Ha az együtthatók minden más értéke esetén (vagyis ha nem mindegyikük nulla) a kombináció sosem egyenlő a csupa nullából álló oszlopmátrixszal, akkor a rendszert (lineárisan) függetlennek nevezzük. Azt mondjuk továbbá, hogy a rendszer (lineárisan) összefüggő, ha nem független, azaz létezik olyan nemtriviális lineáris kombinációja, ami a csupa nullából álló oszlopmátrixot adja. Hogyan dönthető el, hogy egy rendszer független-e? Meg kell vizsgálni, hogy az számok mely értékére lesz a velük képezett lineáris kombináció , azaz meg kell oldanunk az egyenletet. Ha , akkor | | azaz ‐ a két szélső oszlopmátrix megfelelő elemeit egyenlővé téve ‐ egy homogén lineáris egyenletrendszert kell megoldanunk (pl. az ismertetett Gauss-féle elimináció módszerével). Ha megoldásként csak a triviális adódik, akkor a rendszer független, egyébként pedig összefüggő. Könnyen látható, hogy független rendszer bármelyik elemét elhagyva a megmaradó rendszer is független. Az is gyorsan ellenőrizhető, hogy az egységmátrix oszlopai független rendszert alkotnak. Megállapíthatjuk tehát, hogy az -es oszlopmátrixok körében létezik egyelemű, kételemű, háromelemű, , -elemű független rendszer. Vajon létezik-e -nél több elemű is? A válasz nemleges: ha , akkor egy -es oszlopmátrixokból álló -elemű rendszer biztosan összefüggő, hiszen ennek eldöntéséhez egy egyenletből álló, -ismeretlenes homogén lineáris egyenletrendszert kell megoldanunk, amiről viszont szerint tudjuk, hogy létezik nemtriviális megoldása. Mit mondhatunk a maximális, azaz -elemű független rendszerekről? Tegyük fel, hogy egy ilyen rendszer. Ha ehhez még hozzáveszünk egy tetszőleges -es oszlopmátrixot, akkor az így kapott -elemű rendszer összefüggő, azaz van olyan nemtriviális lineáris kombinációja, ami nulla: | | (4) |
Megmutatjuk, hogy itt . Tegyük föl ugyanis, hogy , ekkor (4)-ből az marad, hogy . A rendszer azonban független, így ez csak a triviális lineáris kombináció lehet, azaz . Ellentmondásra jutottunk, hiszen a (4)-ben látható kombináció nemtriviális. Tehát ; ekkor -t könnyen kifejezhetjük (4)-ből: . Azt kaptuk, hogy lineáris kombinációjaként minden -es oszlopmátrix kifejezhető; az ilyen tulajdonságú független rendszert bázisnak nevezzük.
Sajátérték és determináns Próbáljunk meg a Fibonacci-sorozatnál alkalmazott számolás hátterére is egy pillantást vetni. Tegyük fel ezért, hogy egy olyan -es mátrix, amely előáll alakban, alkalmas diagonális mátrixszal. Jelölje ezúttal is az -es egységmátrix -edik oszlopát. Ne feledjük, hogy egy tetszőleges -es mátrixot az -vel jobbról megszorozva eredményül a -edik oszlopát kapjuk. Tekintsük ezután a keresett mátrix inverzének az -edik oszlopát, vagyis az szorzatot. Erre | | Kiderült, hogy olyan (nem ) oszlopmátrix, amely az -val balról megszorozva a -szeresére változik. Azt mondjuk ilyenkor, hogy az sajátvektora, és az mátrix -hez tartozó sajátértéke. Tehát oszlopai valamennyien sajátvektorai -nak. Megmutatjuk, hogy ez már jellemzi is a megfelelő mátrixokat: ha olyan invertálható mátrix, amelynek oszlopai az -nak sajátvektorai, akkor diagonális mátrix (főátlójában sajátértékeivel), azaz diagonalizálható. Jelölje ehhez ismét az mátrix -edik oszlopát, ekkor feltételezésünk szerint -nek az -edik oszlopa , ezért -nek az -edik oszlopa -edik oszlopa -edik oszlopa -edik oszlopa; tehát valóban | | diagonális. A kapott eredmények szerint egy -es mátrix pontosan akkor diagonalizálható, ha bizonyos sajátvektoraiból mint oszlopokból összeállítható egy invertálható -es mátrix. A kapott feltétel nyomán rögtön szemben találjuk magunkat a következő kérdéssel: hogyan határozhatjuk meg a sajátvektorokat? A válasz kezdetben egyszerűnek tűnik: ha ismerjük az mátrix sajátértékeit, akkor egy adott sajátértékhez tartozó sajátvektorok meghatározása az homogén lineáris egyenletrendszer nemtriviális megoldásainak a megkeresését jelenti, ez tehát (már) nem probléma. De honnan tudjuk (előre), hogy mik az sajátértékei? Az (5) szerint ezek éppen azok a számok, amelyekre az , illetve ‐ némileg átrendezve ‐ az homogén lineáris egyenletrendszernek létezik a triviálistól különböző megoldása. A korábbiakra visszaemlékezve láthatjuk, hogy ez éppen akkor következik be, amikor az mátrix oszlopainak rendszere lineárisan összefüggő. Persze ismerjük az eljárást, amivel adott esetén ez eldönthető; de ismeretlen lévén kedvezőbb lenne, ha az összefüggőség kérdését egy képletbe való behelyettesítéssel dönthetnénk el. Ilyen formula valóban létezik, a neve determináns; illusztrációként -es mátrixokra készítjük el. Legyen a kérdéses mátrix . A | | oszlopok rendszere pontosan akkor összefüggő, ha léteznek olyan és számok, amelyek közül legalább az egyik nem nulla, és . Ha például , akkor , azaz . Ez éppen azt jelenti, hogy a és a arányok egyenlők (ugyanígy, ha ), azaz , illetve . A determinánsa tehát , ami pontosan akkor nulla, ha oszlopai lineárisan összefüggő rendszert alkotnak. Ellenőrizzük mindezt a Fibonacci-sorozat mátrixára: | | az ismerős másodfokú egyenlet. Általában egy -es mátrix determinánsa olyan, a mátrix elemeiből képezett szorzatok előjeles összege, ahol ‐ minden lehetséges módon ‐ minden sorból és oszlopból kiválasztunk egy-egy (összesen ) elemet, és az értéke pontosan akkor nulla, ha a mátrix oszlopai összefüggő rendszert alkotnak. Elmondható tehát, hogy egy -es mátrix sajátvektorainak és sajátértékeinek meghatározása egy -edfokú egyenlet és darab, egyenként egyenletből álló, -ismeretlenes (homogén) lineáris egyenletrendszer megoldását igényli.
Egy kombinatorikai alkalmazás Legyen egy -elemű véges halmaz, pedig különböző részhalmazai -nak. Kérdés: legfeljebb mennyi lehet a , ha az részhalmazok közül bármely kettőnek (mármint két különbözőnek) pontosan egy közös eleme van? A kérdésben szereplő ,,legfeljebb'' szó jogosságát az mutatja, hogy -nak (-hez képest) kicsi értékeire ‐ például -ra ‐ nagyon könnyű ilyen részhalmazokat megadni, viszont növekedtével a metszetfeltétel egyre erősebb korlátozást jelent. Némi gondolkozás után azonban eszünkbe juthat a következő konfiguráció, amivel elérhető: Legyen , és legyen , , , , ; itt bármely két részhalmaz metszete . Egy másik, ehhez hasonló lehetőség: , , , , . A kérdés ezután úgy módosítható, hogy lehet-e az -nél nagyobb. Megmutatjuk, hogy nem lehet. Ehhez mátrixokat használunk majd és azt az eredményt, hogy -es oszlopmátrixokból álló független rendszernek legfeljebb eleme lehet. Előbb azonban térjünk vissza az elsőként talált konfigurációhoz. Ennek jellegzetessége, hogy az egyik részhalmaz egyelemű. Ha egy, a probléma feltételét kielégítő konfigurációról tudjuk, hogy az egyik részhalmaz egyelemű, akkor az szükségképpen része a többi részhalmaznak, hiszen a velük alkotott metszet csak úgy állhat egyetlen elemből. Ekkor viszont ez az elem alkotja bármely két részhalmaznak is a közös részét, ezért a többi részhalmaznak ezen elemet nem tartalmazó része páronként diszjunkt halmazrendszert alkot. Mivel ezek egy elemű halmaz nemüres részei, számuk legfeljebb lehet. Tehát , azaz . A továbbiakban ezért elegendő azokkal az esetekkel foglalkoznunk, amikor mindegyik részhalmaznak legalább két eleme van. Az részhalmazokhoz oszlopmátrixokat rendelünk. Legyen , ahol | | Tetszőleges oszlopmátrix transzponáltjának hívjuk a sormátrixot. A módszer azon az egyszerű észrevételen alapul, hogy | | (6) |
Megmutatjuk, hogy az rendszer lineárisan független; ebből a korábban látottak szerint valóban következik majd, hogy . Vizsgálnunk kell, hogy milyen lineáris kombinációjuk . Tegyük föl ezért, hogy | | ekkor (6) szerint nyilván
Itt a második összeg négyzete nemnegatív, az elsőben minden összeadandó szorzat nemnegatív, és a szorzatok tényezője pozitív. A teljes összeg ezért csak úgy lehet nulla, ha minden . Tehát valóban lineárisan független.
Miután beláttuk, hogy legfeljebb részhalmaz választható ki az előírt módon, felvetődik a kérdés, vajon mit lehet mondani azokról az esetekről, amikor éppen a maximális számú, halmazból áll a rendszer. A kezdetben talált két konfiguráció alapján gondolhatjuk, hogy még sok, esetleg bonyolultabb szerkezetű példa is van, vagy ellenkezőleg: bizonyítékot kereshetünk arra, hogy további példákra nem nagyon számíthatunk, esetleg nincs is más a már találtakon kívül. Szerencsére nem kell előre eldönteni, melyik irányban próbálkozzunk ‐ csupán használnunk kell azokat az oszlopmátrixokat, amelyekbe a részhalmazok adatait kódoltuk. Annyit azért érdemes elöljáróban észrevenni, hogy egy ilyen tagból álló halmazrendszer szükségképpen lefedi a -t: ha ugyanis lenne a -nak olyan eleme, ami egyik részhalmazban sincs benne, akkor valamennyi az elemű halmaznak lenne része; de ott a bizonyítottak szerint legfeljebb ilyen részhalmazból álló rendszer található.
Tegyük fel tehát, hogy az páronként különböző részhalmazai az -elemű halmaznak, mindegyikük legalább kételemű, és bármely kettőnek egyetlen közös eleme van. Láttuk, hogy ekkor a nekik megfelelő oszlopmátrixok rendszere lineárisan független. Tudjuk viszont, hogy -elemű független rendszerként bázist is alkotnak! Ez azt jelenti, hogy minden -es oszlopmátrix előállítható az lineáris kombinációjaként. Használjuk ezt fel az egységmátrix oszlopaira: Mielőtt továbbmennénk, vezessük be a következő jelölést: legyen | |
Így (6) és (7) szerint
Legyen , ekkor tehát innen pedig amiből ‐ definíciója alapján ‐ | | Ebből kifejezhető : | | azaz | | Itt a számláló és a nevező egyaránt pozitív, és a számláló kisebb a nevezőnél; ezért A (8)-cal összevetve ebből az következik, hogy esetén pozitív, esetén pedig negatív. Legyen most , de egyébként tetszőleges. Ekkor (6) és (7) alapján
| | Egy nulla értékű (és ‐ mivel a halmazrendszer lefedi -t ‐ nem üres) összeget kaptunk, amelyben egyik tag sem nulla; így lennie kell a tagok között pozitívnak. Ha egy ilyen tag, akkor a következő két dolgot tudjuk róla: 1. , hiszen pozitív; 2. , mivel a tag a fenti összegből való. Kiderült tehát, hogy ‐ maximális elemszámának köszönhetően ‐ a halmazrendszer azzal a további tulajdonsággal is rendelkezik, hogy a bármely két eleme egyszerre benne van az darab részhalmaz valamelyikében. Megjegyzendő, hogy a két megadott példánk közül a másodikra ez teljesül. Megmutatható viszont, hogy esetén minden ettől különböző konfiguráció nagyon szigorú számossági feltételeknek tesz eleget: mindegyik részhalmaz ugyanannyi elemből áll (legyen ez a szám ), a minden eleme pontosan részhalmazban van benne, és ezekből következően . Ezeket a konfigurációkat véges projektív síkoknak nevezzük. Az elnevezés nem véletlen: ha elemeit tekintjük pontoknak, az részhalmazokat pedig egyeneseknek, akkor valóban teljesülnek a projektív síkgeometria axiómái, miszerint bármely két különböző egyenesnek pontosan egy közös pontja van, és bármely két ponthoz található (előbbi szerint pontosan egy) olyan egyenes, amely mindkét pontot tartalmazza. Ha prímhatvány, akkor egy elemű halmazon létezik véges projektív sík (olykor többféle is!). Híres, és mindmáig megoldatlan probléma viszont, hogy létezik-e olyan szám, ami nem prímhatvány, de az elemű halmazon mégis megadható projektív sík. Az egymást egy pontban metsző halmazok rendszeréről szóló ún. Erdős ‐ de Bruijn-tételt tehát a következőképpen fogalmazhatjuk meg: Ha egy elemű halmaz darab részhalmaza közül bármelyik kettőnek pontosan egy közös eleme van, akkor , és ha , akkor a rendszer vagy az ismertetett két példa egyike, vagy egy véges projektív sík.
Befejezés Mátrixok sajátvektorai és sajátértékei a matematika és a fizika számos területén előfordulnak. Befejezésül essék néhány szó ismét a koordináta-geometriáról. Tekintsük például azt a síkgörbét, amelynek (a szokásos derékszögű koordináta-rendszerben) az egyenlete Mi ez a görbe, mik a főbb geometriai jellemzői? Könnyebb lenne erre választ adni, ha egy másik, az alakzathoz ,,jobban illeszkedő'' koordináta-rendszerben lenne az egyenlet felírva. Csakhogy éppen ez a feladat: az adekvát koordináták megtalálása. Ha a koordináta-rendszert eltoljuk a vektorral, akkor az új , koordinátákkal , teljesül; ezeket az eredeti egyenlet változóiba helyettesítve egy kis számolás után megkaphatjuk az alakzatunk egyenletét az új rendszerben. De a részletek kiszámolása nélkül is látható, hogy az új egyenletben ugyanazok maradnak a másodfokú tagok (, , ) együtthatói. A probléma kemény magja tehát ezekben keresendő ‐ az elsőfokú tagokat és a konstanst hagyjuk is egyelőre figyelmen kívül. A megoldás kulcsa az, hogy a részt mátrixokkal, alakban írjuk fel. Ha a koordináta-rendszert az origó körül fokkal elforgatjuk, az új , koordinátákra | | Így az elforgatott koordináta-rendszerben az alakzat új egyenletének másodfokú része: | | A megjelölt háromtényezős mátrixszorzat adja az új egyenletben a másodfokú tagok együtthatóit. Jó lenne, ha ott az együtthatója nulla lenne, mert akkor ‐ a koordináta-rendszer alkalmas eltolása után ‐ könnyű lenne észrevenni, hogy pl. ellipszissel, hiperbolával vagy parabolával van-e dolgunk. Ez éppen azt jelentené, hogy az aláhúzott mátrix diagonális. Itt felcsillan a remény: a bal szélen álló mátrix éppen a jobb oldalinak az inverze! Célba érhetünk tehát, ha az eredeti mátrix diagonalizálható. Egyszerű és már ismert számolással ellenőrizhető is, hogy ez a mátrix valóban diagonalizálható. Ám ne örüljünk korán: a diagonalizálhatóság önmagában itt nem elegendő, a követelmény az, hogy alkalmas típusú mátrixszal lehessen diagonalizálni ‐ ilyen pedig a mi mátrixunkhoz nem létezik. Azonban szerencsénk van: lehet más is a kiindulási mátrix! Vegyük észre ugyanis, hogy (9)-ben az együtthatója a mátrix jobb felső és bal alsó elemének összegeként adódik ‐ így ezek egyikét szabadon megválaszthatjuk. Válasszuk őket egyenlőnek, ekkor az mátrix a bal felső és a jobb alsó sarok meghatározta egyenesre szimmetrikus. A lineáris algebra egy alapvető tétele ‐ az ún. főtengelytétel ‐ szerint minden szimmetrikus -es mátrix egy alkalmas ortogonális mátrixszal diagonalizálható; -es esetben ez éppen a kívánt alakot jelenti. Esetünkben a megfelelő diagonalizáló mátrix , és az új , koordinátákkal felírt azaz , helyettesítésekkel kapott új egyenlet (az elforgatott koordináta-rendszerben): | |
Innen már simább úton haladhatunk tovább; teljes négyzetté kiegészítéssel eltüntethetjük az elsőfokú tagokat: | | ennek megfelelően eltolhatjuk a koordináta-rendszert, végül osztunk az újonnan adódó konstans tag abszolút értékével. Az egyenlet fenti alakjából egyébként már leolvasható, hogy ‐ 2 és 7 pozitív lévén ‐ görbénk egy ellipszis. A szokásos alakba való átírással megkaphatjuk az ellipszis tengelyeinek hosszát, a diagonalizáló mátrix révén pedig (ld. és társai) e tengelyeknek az eredeti koordináta-rendszer tengelyeivel bezárt szögét. |