Cím: Mátrixok
Szerző(k):  Hermann Péter 
Füzet: 2006/május, 258 - 277. oldal  PDF  |  MathML 
Témakör(ök): Szakmai cikkek

A szöveg csak Firefox böngészőben jelenik meg helyesen. Használja a fenti PDF file-ra mutató link-et a letöltésre.

Az első egyenlet, amellyel a koordináta-geometriában találkozunk, az egyenes egyenlete: ax+by=c. Ennek segítségével határozhatjuk meg például két egyenes metszéspontjának a koordinátáit: ha az egyenesek egyenlete a1x+b1y=c1, illetve a2x+b2y=c2, akkor a metszéspont koordinátái azok az x, y számok, amelyek mind a két egyenletet kielégítik, vagyis az x, y számpár az

a1x+b1y=c1a2x+b2y=c2
lineáris egyenletrendszer megoldása.
Az ax=b egyenletek analógiájára érdemes az (x,y) párt egyetlen objektumnak tekinteni: így az egyenletrendszer bal oldala kiszámolja az ismeretlen (x,y) párhoz a (c1,c2) számpárt. A feladat a megadott (c1,c2) eredményhez tartozó pár megkeresése. Vizsgáljuk meg ezt a hozzárendelést.
Az egyismeretlenes elsőfokú egyenlet mintájára vezessük be a következő jelölést: Ax̲=c̲, ahol c̲ az adott (c1,c2) számpárt, x̲ pedig a keresett (x,y) számpárt jelenti, mindkettőt ,,függőleges'', oszlopszerű elrendezésben fölírva: x̲=(xy), c̲=(c1c2). Az A pedig az egyenletek bal oldalán álló együtthatók téglalap-szerű elrendezésben: A=(a1b1a2b2).
Vegyük észre, hogy ezzel nem csupán egy jelölést vezettünk be, amelynek révén számok bizonyos rendszereit mátrixokkal (esetünkben A, c̲, x̲) ábrázoljuk, hanem ‐ ezek egymás mellé írásával ‐ egy műveletet is, amely a két sorból és két oszlopból álló (röviden: 2×2-es) A=(a1b1a2b2) és az egyetlen oszlopból álló x̲=(xy) oszlopmátrixokból kiszámolja a c̲=(c1c2)=(a1x+b1ya2x+b2y) oszlopmátrixot.
Nem kell innen túl messzire mennünk ahhoz, hogy további jelenségekre bukkanjunk, amelyek ugyancsak a fenti művelettel írhatók le. Tekintsük ehhez a sík különféle transzformációit: elforgatásokat, tükrözéseket, vetítéseket. Pontok helyett azonban vektorokra alkalmazzuk e transzformációkat, azaz rögzítsünk egy O origót, és a sík egy tetszőleges P pontjára tekintsük az OP vektort. Tudjuk, hogy a P(x,y) pontba mutató OP vektor felírható OP=xi̲+yj̲ alakban, ahol i̲ és j̲ a tengelyek irányába mutató egységvektorok. Ha T az említettek közül egy olyan geometriai transzformáció, amely az origót helyben hagyja és i̲-t i'̲-be, j̲-t pedig j̲'-be képezi, akkor OP=xi̲+yj̲ képe xi̲'+yj̲'. Írjuk fel ‐ OP-hez hasonlóan ‐ az i̲' és j̲' vektorokat is i̲'=t11i̲+t21j̲, j̲'=t12i̲+t22j̲ alakban; ekkor OP képe a T transzformációnál T(OP)=xi̲'+yj̲'=x(t11i̲+t21j̲)+y(t12i̲+t22j̲)=(t11x+t12y)i̲+(t21x+t22y)j̲. Ekkor látható, hogy a képvektor t11x+t12y, illetve t21x+t22y koordinátáiból álló oszlopmátrix:
(t11x+t12yt21x+t22y)=(t11t12t21t22)(xy).

A T transzformáció tehát egy mátrixszal ‐ a (t11t12t21t22) mátrixszal ‐ adható meg, és egy tetszőleges vektor képének a koordinátáit ebből a mátrixból és a vektor koordinátáiból, mátrixszorzással kapjuk meg. Ennek a mátrixnak az oszlopai pedig éppen az i̲ és a j̲ vektorok képeként adódó vektorok.
A korábbi egyenletrendszert a transzformációk nyelvén megfogalmazva látható, hogy az egyenletmegoldás alaphelyzetébe kerültünk: ,,Gondoltam egy (x,y) számpárt, alkalmaztam rá a transzformációt, és a (c1,c2)-t kaptam. Melyik számpárra gondoltam?''
Vizsgáljuk meg ezután, hogy az ismert geometriai transzformációknak mi a mátrix alakja. A legegyszerűbb talán az origó középpontú hasonlóság. Ha ennek aránya λ, akkor az i̲ és j̲ vektor egyaránt a λ-szorosára változik, sőt minden vektor mindkét koordinátája a λ-szorosára változik. Így a mátrixa (λ00λ) és valóban:
(λ00λ)(xy)=(λxλy).
Ennél kissé többet kell dolgozni az origó körüli forgatás mátrixáért. Ha az elforgatás szöge α, akkor ‐ a szögfüggvények definíciója alapján ‐ az i̲ vektor képe cosαi̲+sinαj̲, a mátrix első oszlopában tehát a cosα, sinα értékek állnak. A második oszlop, a j̲ vektor képe pedig az i̲ képének a 90 fokos elforgatottja, ami -sinαi̲+cosαj̲. Tehát a mátrixa (cosα-sinαsinαcosα) alakú.
Mielőtt továbbmennénk, érdemes megnézni, mi történik, ha az α szögű forgatást követően még egy β szöggel is forgatunk. A két forgatást egymás után végrehajtva összesen α+β szöggel forgattunk, ennek a transzformációnak a mátrixa az előbbiek szerint (cos(α+β)-sin(α+β)sin(α+β)cos(α+β)). Másrészt az α-val történő elforgatás az (xy)-t a fentiek szerint
(cosα-sinαsinαcosα)(xy)=(cosαx-sinαysinαx+cosαy)-ba
viszi, ezt pedig a β szögű forgatás
(cosβ-sinβsinβcosβ)((cosα-sinαsinαcosα)(xy))=(cosβ-sinβsinβcosβ)(cosαx-sinαysinαx+cosαy)==((cosβcosα-sinβsinα)x-(cosβsinα+sinβcosα)y(cosβsinα+sinβcosα)x+(-sinβsinα+cosβcosα)y)-ba.


Mivel ez éppen
(cos(α+β)-sin(α+β)sin(α+β)cos(α+β))(xy)=(cos(α+β)x-sin(α+β)ysin(α+β)x+cos(α+β)y),
a kapott azonosságból leolvashatók a szinusz- és koszinuszfüggvényre vonatkozó addíciós képletek. Ezen túlmenően az is kiderül, hogyan célszerű értelmezni a (cosα-sinαsinαcosα) és (cosβ-sinβsinβcosβ) mátrixok szorzatát, ha azt akarjuk, hogy azzal megszorozva az (xy) oszlopot ugyanazt kapjuk, mintha (xy)-t előbb (cosα-sinαsinαcosα)-val, majd a kapott oszlopot (cosβ-sinβsinβcosβ)-val szoroznánk meg; így a két 2×2-es mátrix szorzatára kapott definíció:
(cosβ-sinβsinβcosβ)(cosα-sinαsinαcosα)=def.=def.(cosβcosα-sinβsinαcosβsinα+sinβcosαcosβsinα+sinβcosα-sinβsinα+cosβcosα),


illetve általában egy (t11t12t21t22) és egy (s11s12s21s22) mátrix szorzata
(t11t12t21t22)(s11s12s21s22)=(t11s11+t12s21t11s12+t12s22t21s11+t22s21t21s12+t22s22);
pontosan ezzel érjük el, hogy a megfelelő T és S transzformációk egymás után alkalmazásának (kompozíciójának) a mátrixa a T és S transzformációk mátrixának a szorzata legyen. Másszóval a (meglehetősen mesterkéltnek tűnő) mátrixszorzás magyarázatát a megfelelő transzformációk kompozíciója adja.
Haladjunk ezután tovább a nevezetes geometriai transzformációk sorában: jelölje ezúttal T az origón átmenő, az x tengellyel (pontosabban az i̲ egységvektorral) γ szöget bezáró egyenesre való tükrözést. Az i̲ tükörképe éppen az ő 2γ szögű elforgatottja, azaz cos2γi̲+sin2γj̲, a j̲ tükörképe pedig az i̲ képének a -90-os elforgatottja: sin2γi̲-cos2γj̲; a tükrözés mátrixa tehát (cos2γsin2γsin2γ-cos2γ).
Ellenőrzésként érdemes megnézni, mi történik, ha egymás után két egyenesre tükrözünk: az első egyenes az i̲ egységvektorral γ, a második δ szöget zárjon be; a két tükrözés kompozíciójának mátrixa a két tükrözés mátrixának szorzata:
(cos2γsin2γsin2γ-cos2γ)(cos2δsin2δsin2δ-cos2δ)=(cos2(γ-δ)-sin2(γ-δ)sin2(γ-δ)cos2(γ-δ)).
Látható, hogy ez éppen a γ-δ szög 2-szeresével való forgatásnak a mátrixa, ahol γ-δ a két egyenes által bezárt szög. Ezzel beláttuk, hogy két tengelyes tükrözés kompozíciója az egyenesek által bezárt szög kétszeresével való elforgatás az egyenesek metszéspontja körül.
Szakadjunk el most egy rövidebb időre a ,,nevezetes'' geometriai transzformációktól és gondoljunk arra, hogy a látottak mintájára bármely 2×2-es mátrix segítségével megadhatunk egy transzformációt: ha (a11a12a21a22) egy ilyen mátrix, akkor az A transzformáció vigye a tetszőleges OP=xi̲+yj̲ vektort (a11x+a12y)i̲+(a21x+a22y)j̲-be. Ennek így általában nehéz lenne szemléletes geometriai jelentést tulajdonítani; ha azonban például a12=a21=0, akkor látható, hogy A(xi̲)=a11xi̲ és A(yj̲)=a22yj̲, tehát a transzformáció ‐ legalábbis két irányban ‐ ,,szépen viselkedik'': az i̲ irányában a11-szeres, a j̲ irányában pedig a22-szeres középpontos hasonlóságként. Esetünkben ennek az volt az oka, hogy A mátrixa, (a1100a22) úgynevezett diagonális mátrix. A jelenség azonban szerencsére ennél szélesebb körben fordul elő. Nézzük példaként a B=(3234) mátrixot, ami szemlátomást nem diagonális. Viszont
(3234)(1-1)=(1-1),és(3234)(23)=(1218);
tehát a mátrixunknak megfelelő B transzformáció a b̲1=i̲-j̲ vektort önmagába képezi, a b̲2=2i̲+3j̲ vektort pedig 12i̲+18j̲=6b̲2-be.
Mi ebből a tanulság? A vektorokat ne i̲ és j̲, hanem b̲1 és b̲2 segítségével írjuk fel! Ekkor ugyanis egy ub̲1+vb̲2 alakban felírt vektort a B transzformáció egyszerűen ub̲1+6vb̲2-be képezi. Ahhoz, hogy az eredetileg xi̲+yj̲ alakban fölírt vektort ilyen formában megkapjuk, elegendő az i̲ és j̲ egységvektorokat felírnunk b̲1 és b̲2 segítségével:
i̲=35b̲1+15b̲2,j̲=-25b̲1+15b̲2;
ekkor
xi̲+yj̲=x(35b̲1+15b̲2)+y(-25b̲1+15b̲2)=(35x-25y)b̲1+(15x+15y)b̲2,
így
B(xi̲+yj̲)=(35x-25y)b̲1+6(15x+15y)b̲2.

A mátrixok nyelvén ez azt jelenti, hogy a vektor képének b̲1 és b̲2 szerinti u', v' koordinátái (azaz a b̲1 és b̲2 irányú összetevőkkel való felírásában a két együttható) az eredeti (i̲, j̲ szerinti) (x,y) koordinátákból az
(u'v')=(1006)(35-251515)(xy)
szerint kaphatók meg. Az eredmény i̲, j̲ szerinti x', y' koordinátáit ebből már könnyű kiszámítani:
u'b̲1+v'b̲2=u'(i̲-j̲)+v'(2i̲+3j̲)=(u'+2v')i̲+(-u'+3v')j̲
alapján
(x'y')=(12-13)(u'v')=(12-13)(1006)(35-251515)(xy).
Mivel az egyenlőség mindkét oldalán az i̲, j̲ szerinti koordináták szerepelnek, a három mátrix szorzata a B transzformáció eredeti mátrixát adja, vagyis
B=(3234)=(12-13)(1006)(35-251515).

A kapott háromtényezős előállítás geometriai jelentése tehát a következő. A B transzformáció végrehajtását három fázisra bontjuk: először az i̲, j̲ által meghatározott koordináta-rendszerről áttérünk a b̲1, b̲2 szerinti koordináta-rendszerre ‐ ennek felel meg a jobb szélső tényező; utána a transzformáció szempontjából kellemes rendszer szerint végrehajtjuk B-t ‐ ezt mutatja a középső tényező; végül visszatérünk az eredeti i̲j̲ koordináta-rendszerre ‐ ezt írja le a bal szélső tényező.
Mivel a két szélső mátrix egymással ellentétes, illetve fordított irányú lépést jelenít meg, nem túlságosan meglepő, hogy szorzatuk,
(3234)(35-251515)=(1001)=(35-251515)(3234)
a ,,semleges'' ún. egységmátrix, ami a mátrixok szorzására ugyanúgy viselkedik, mint a közönséges számoknál az 1: a vele való szorzás mindent változatlanul hagy. Ennek alapján azt mondjuk, hogy a két mátrix egymás inverze: (35-251515)=(3234)-1, illetve (3234)=(35-251515)-1.
A mátrixok iménti ,,diagonalizált'' háromtényezős felírásának egy alkalmazására mutatunk példát a következő részben.
 
Hatványozás és lineáris rekurziók
 

A mátrixoknak ez a meglepően messze vezető alkalmazása a lineáris rekurzióval definiált sorozatokkal kapcsolatos. A módszert ‐ az elméleti és a technikai nehézségek kikerülése végett ‐ egy ,,kisméretű'' és jól ismert példán, a Fibonacci-féle sorozaton mutatjuk be, utána próbáljuk majd a kérdést valamivel általánosabban is áttekinteni.
A Fibonacci-féle sorozatot a következőképpen definiáljuk: legyen f0=0, f1=1, és minden n1-re fn+1=fn+fn-1. Hogyan kerülnek ide mátrixok? Legyen (minden n1-re) v̲n=(fnfn-1), ekkor a sorozat megadási módjából következően van olyan 2×2-es A mátrix, amelyre Av̲n=v̲n+1:
(1110)(fnfn-1)=(fn+1fn).
Mivel ez minden n-re érvényes, alkalmazzuk rendre n=1-re, 2-re, 3-ra stb.: v̲2=Av̲1, v̲3=Av̲2=A(Av̲1)=A2v̲1, v̲4=Av̲3=A(A2v̲1)=A3v̲1; látható, hogy általában v̲n+1=Anv̲1. Ahhoz tehát, hogy a sorozat n-edik tagját közvetlenül, az n függvényében felírhassuk elegendő, ha ebben az értelemben ismerjük az A mátrix hatványait. Túl sokat kísérletezni nem érdemes az A első néhány hatványának kiszámításával: az egyetlen szabályszerűség, amit észrevehetünk az, hogy A hatványaiban maguk a Fibonacci-számok jelennek meg, a kör tehát ebben az irányban bezárul.
Újabb nekifutásként próbáljuk meg felmérni: vajon minden (2×2-es) mátrix hatványozása ilyen nehézséggel jár-e. Nem nehéz rájönni, hogy bizonyos speciális mátrixok esetében ez egyáltalán nem így van. Ha például B=(a00b) típusú, azaz diagonális mátrix, akkor ,,elemenként'' hatványozható, azaz Bn=(an00bn). Kérdés, hogy a diagonális mátrixoknak ez a kedvező tulajdonsága átörökíthető-e minden mátrixra, vagy legalábbis a (nem diagonális) mátrixok egy részére.
A részleges megoldást pontosan az előző részben megismert felbontás nyújtja! Legyen M invertálható mátrix, B pedig ezzel megegyező méretű diagonális. Hatványozzuk az A=M-1BM mátrixot:
A2=M-1BMM-1BM=M-1B2M,A3=M-1BMM-1B2M=M-1B3M stb.
Könnyen látható, hogy (minden n-re) An=M-1BnM, tehát azokat a mátrixokat valóban könnyen tudjuk hatványozni, amelyek A-hoz hasonlóan származtathatók egy diagonális mátrixból. Nézzük meg, hogy a Fibonacci-féle sorozattal kapcsolatba hozott (1110) mátrix előállítható-e ilyen módon. Ennek eldöntéséhez olyan M=(x1x2y1y2) mátrixot keresünk, amelyre
(1110)=M-1(c100c2)M
teljesül, alkalmas ci számokkal. Mivel ismeretlen mátrix inverzével nagyon kényelmetlen lenne a számolás, szorozzuk meg az egyenlet mindkét oldalát balról M-mel:
(x1x2y1y2)(1110)=(c100c2)(x1x2y1y2),azaz(x1+x2x1y1+y2y1)=(c1x1c1x2c2y1c2y2).
A két mátrix megfelelő elemeinek kell egyenlőnek lennie, vagyis
x1+x2=c1x1y1+y2=c2y1x1=c1x2y1=c2y2,
rendezve:
(1-c1)x1+x2=0x1-c1x2=0(1-c2)y1+y2=0y1-c2y2=0.
Itt az első és második egyenletből álló rendszer független a harmadik és negyedik egyenletből álló rendszertől, viszont a két rendszer azonos szerkezetű: x helyébe y-t, c1 helyébe c2-t írva kapjuk az utóbbit az előbbiből. Az első két egyenlet rendszerét megoldva:
x1=c1x2,ebből((1-c1)c1+1)x2=0.
x2=0 esetén x1=0, és így az M mátrixnak nem létezne inverze, mivel első sora csupa nulla; ezért 1+c1-c12=0, azaz
c1=1±52,és ehhez teljesen hasonlóanc2=1±52.
A c1 és c2 nem lehet egymással egyenlő, mivel akkor (x1=c1x2 és y1=c2y2 miatt) az M első oszlopa a második oszlop c1=c2-szerese volna, és emiatt M-nek nem létezne inverze. Válasszuk ezért c1-et 1+52-nek, c2-t pedig 1-52-nek. Az x2 és az y2 értéke tetszőleges nemnulla számnak választható, legyen mind a kettő 1; ekkor
M=(3+521+523-521-52),M-1=(-1+5251+5253-525-3-525),
és ezekkel valóban
(1110)n=(-1+5251+5253-525-3-525)((1+52)n00(1-52)n)(3+521+523-521-52)==(15[(1+52)n+1-(1-52)n+1]15[(1+52)n-(1-52)n]15[(1+52)n-(1-52)n]15[(1+52)n-1-(1-52)n-1]),


ebből pedig az n-edik Fibonacci-féle számra
fn=15[(1+52)n-(1-52)n].

Célunkat a Fibonacci-féle számok explicit előállítására elértük, és az ennek érdekében végzett számolás nyilván minden olyan konkrét esetben célhoz vezet, amikor a hatványozni kívánt mátrix egyáltalán előállítható a kívánt M-1BM alakban ‐ az ilyen mátrixról azt mondjuk, hogy diagonalizálható. Sajnos nem minden mátrix ilyen, például (a Fibonacci-sorozatnak megfelelő mátrixhoz látszólag nagyon hasonló) (1101) mátrix nem diagonalizálható. (Vigasszal szolgálhat ugyanakkor, hogy ezt a mátrixot nagyon könnyű hatványozni, az első néhány hatványban észrevett szabályszerűséget indukcióval egyszerűen beláthatja az Olvasó.)
 
A továbbiakban ‐ a 2×2-es mátrixok keretein túllépve ‐ összefoglaljuk a mátrixokra értelmezett alapvető műveleteket és azok legfontosabb tulajdonságait. Ezután röviden tárgyaljuk az ezekhez szorosan kapcsolódó lineáris egyenletrendszerekre vonatkozó lényegesebb tudnivalókat. Akik ezt a két részt túlságosan száraznak találják, nyugodtan lapozzák át; az utána következő témák részben így is követhetőek lesznek, legfeljebb egy-egy ismeretlen fogalom, jelölés vagy állítás azonosítása végett lesz majd érdemes ide alkalmanként visszatérni.
 
Műveletek mátrixokkal
 

Összeadás. Két, n darab sorból és k oszlopból álló (röviden n×k-as) mátrix összege az az ugyancsak n×k-as mátrix, amelyet a két mátrix megfelelő helyén álló elemek összeadásával kapunk, azaz
(a11a12...a1ka21a22...a2kan1an2...ank)+(b11b12...b1kb21b22...b2kbn1bn2...bnk)=(a11+b11a12+b12...a1k+b1ka21+b21a22+b22...a2k+b2kan1+bn1an2+bn2...ank+bnk)
Hasonlóan egyszerűen, illetve természetesen értelmezett egy mátrix számszorosa: az adott mátrix minden elemét szorozzuk meg az illető számmal, vagyis
c(a11a12...a1ka21a22...a2kan1an2...ank)=(ca11ca12...ca1kca21ca22...ca2kcan1can2...cank)

Szorzás. Két mátrix szorzatát viszont a következő, kezdetben roppant furcsának tűnő módon értelmezzük. Legyen A egy n×k-as, B pedig k×-es mátrix; ekkor A és B szorzata az az n×-es C mátrix legyen, amelynek (i,j)-edik elemét az A mátrix i-edik sorának és a B mátrix j-edik oszlopának megfelelő elemeit összeszorozva, e szorzatok összegeként kapjuk: cij=ai1b1j+ai2b2j+...+aikbkj. Hangsúlyozandó, hogy A és B szorzata ‐ ebben a sorrendben ‐ csak akkor értelmezett, ha A-nak annyi oszlopa van, ahány sora B-nek, és ekkor az AB szorzatnak annyi sora lesz, mint A-nak, és annyi oszlopa, mint B-nek. Vegyük továbbá észre, hogy AB-nek az (i,j)-edik eleme az A i-edik sorának (mint 1×k-as mátrixnak) és a B j-edik oszlopának (mint k×1-es mátrixnak) a szorzata, legalábbis abban az értelemben, hogy az utóbbi 1×1-es mátrixot azonosítjuk az ő egyetlen elemével. Ebből következik, hogy AB-nek a j-edik oszlopa megegyezik A-nak és B j-edik oszlopának a szorzatával.
Mit mondhatunk ezen műveletek tulajdonságairól? A legtöbb ‐ a számok körében teljesülő ‐ műveleti tulajdonság, illetve azonosság itt is érvényben marad: az n×k-as mátrixok összeadása kommutatív és asszociatív, a csupa nullából álló 0 nullmátrixra A+0=A teljesül (minden A-ra), bármely A-nak létezik ellentettje (-A=(-1)A) amelyre A+(-A)=0. Mátrixoknak számmal és mátrixszal való szorzása egyaránt disztributív az összeadásra nézve: c(A+B)=cA+cB, M(A+B)=MA+MB, (A+B)D=AD+BD minden, megfelelő méretű A, B, M, D mátrixra. Belátható továbbá, hogy a mátrixszorzás asszociatív: ha A, B és C megfelelő méretű mátrixok, akkor (AB)C=A(BC).
Baj van viszont a mátrixszorzás kommutativitásával! Ha A egy n×k-as, B pedig t×r-es mátrix, akkor AB értelmezéséhez k=t, BA értelmezéséhez r=n szükséges; ekkor AB mérete n×r, azaz n×n, BA mérete pedig t×k, vagyis k×k. Ahhoz, hogy egyáltalán értelme legyen megkérdezni, vajon AB egyenlő-e BA-val mindenképpen szükséges, hogy a két szorzat azonos méretű legyen, tehát A és B egyaránt n×n-es. A szorzás azonban még ebben a meglehetősen korlátozott körben sem kommutatív; pl. n=2-re (0100)(1000)=(0000)(0100)=(1000)(0100).
Ez a szorzás egyúttal arra is figyelmeztető példát ad, hogy két mátrix szorzata lehet úgy is nulla, hogy eközben egyik tényező sem az.
A mátrixszorzás ‐ egyelőre csupán a jelölések szintjén ‐ első és talán legtermészetesebb alkalmazása a lineáris egyenletrendszerek terén adódik. Lineáris egyenletrendszeren általában a következő típusú feladatot értjük. Adottak az aij és a bi számok, ahol 1in, 1jk (alkalmas n és k pozitív egészekkel); keresendők mindazon x1,x2,...,xk számok, amelyek eleget tesznek a következő egyenleteknek:

a11x1+a12x2+...+a1kxk=b1a21x1+a22x2+...+a2kxk=b2an1x1+an2x2+...+ankxk=bn
(1)

Legyen ekkor A=(aij) az egyenletrendszer együtthatóiból álló n×k-as mátrix, b̲=(bi) pedig az egyenletek jobb oldalán álló konstansokból képezett n×1-es (oszlop)mátrix. Ha az ismeretlenekből álló k×1-es x̲=(xj) (oszlop)mátrixot is bevezetjük, akkor az (1) egyenletrendszer ekvivalens az
Ax̲=b̲(2)
mátrixegyenlettel, hiszen az Ax̲ mátrix i-edik sora éppen az (1) i-edik egyenletének bal oldala. Ez azt sugallja, hogy a lineáris egyenletrendszer megoldásához ,,osztani'' kell(ene) az A együttható-mátrixszal. A számok körében végezhető közönséges osztáshoz hasonlóan az osztás a reciprokkal (a multiplikatív inverzzel) történő szorzást jelenti, a reciprok-képzés pedig az 1 osztását. Ehhez először is meg kell találni az 1 szám megfelelőjét a mátrixok körében. Ez nem más, mint az az n×n-es mátrix (tetszőleges n-re) amelyben az első sor első, a második sor második, ..., az n-edik sor n-edik eleme 1, az összes többi pedig nulla:
In=(10...001...000...1).
Könnyen ellenőrizhető, hogy AIn=A és InB=B valóban teljesül minden k×n-es A és n×k-as B mátrixra. Mit értsünk ezután egy n×k-as M mátrix inverzén? Mivel a mátrixszorzás nem kommutatív, kétfélét is érthetünk: olyan B mátrixot, amelyre BM=Ik, vagy olyan C mátrixot, amelyre MC=In. Ilyenkor azt mondjuk, hogy B az M-nek balinverze, C pedig jobbinverze. A szorzás értelmezéséből közvetlenül adódik, hogy B és C csakis k×n-es lehet. Egyébként két különböző dologról van szó, azaz egyik tulajdonságból sem következik a másik. Például az M=(111112) mátrixnak van jobbinverze (több is!), ilyen pl. C=(1-211-11), viszont nincs balinverze: az M-nek egyenlő az első és a második oszlopa, ezért akármilyen (3×2-es) B mátrixszal szorozzuk is balról, a szorzatban is megegyezik az első és a második oszlop, így az nem lehet (a 3×3-as) egységmátrix. Hasonlóan látható, hogy például a csupa 1-esből álló 3×4-es mátrixnak nincs sem bal, sem jobb oldali inverze. Egyszerűbb a helyzet, ha M négyzetes mátrix, azaz n=k. Ekkor M-nek vagy nem létezik semmilyen oldali inverze sem, vagy egyetlen bal és egyetlen jobb oldali inverze van, és ezek egymással egyenlők; utóbbi esetben ezt az egyértelmű mátrixot hívjuk az M inverzének, és M-1-nel jelöljük.
Térjünk vissza ezután az inverzek kiszámításához. Ha például az n×k-as A mátrixhoz keresünk egy B jobbinverzet, akkor az AB=In mátrixegyenletet kell megoldanunk. Jelölje az In oszlopait rendre e̲1,e̲2,...,e̲n, a B mátrix ismeretlen oszlopait pedig y̲(1),y̲(2),...,y̲(n). Ekkor AB=In pontosan azt jelenti, hogy Ay̲(i)=e̲i, minden in-re. Ez n darab ‐ egyenként n egyenletből álló ‐ lineáris egyenletrendszert jelent (amelyeknek közös az együttható-mátrixuk). Ebből is látható, hogy a lineáris egyenletrendszerek megoldásának kérdése nem kerülhető meg.
 
Lineáris egyenletrendszerek
 

Lineáris egyenletrendszerekkel a középiskolában elsősorban a koordináta-geometriában találkozhatunk: például két egyenes közös részének meghatározásához az egyenesek egyenleteiből álló lineáris egyenletrendszert kell megoldani: ha mindkét ismeretlenre egyértelmű megoldás adódik, az azt jelenti, hogy az egyenesek egy pontban metszik egymást; ha nincs megoldás, akkor az egyenesek párhuzamosak.
A következőkben röviden ismertetjük a lineáris egyenletrendszerek megoldásának egyik módszerét, amelyet Gauss-féle kiküszöbölésnek (eliminációnak) neveznek. Tekintsük ehhez az (1) egyenletrendszert, és jelöljük az i-edik egyenletét Ei-vel. Az eljárás során az egyenleteket úgy alakítjuk át, hogy egyrészt a rendszer megoldásainak halmaza ne változzon, másrészt az átalakítások sorozata olyan egyenletrendszerre vezessen, amiből a megoldás közvetlenül leolvasható. E kettős célt a következő két lépés megfelelő számú alkalmazásával érjük el:

(a)EiEi'=cEi, ahol c0 (az i-edik egyenletet úgy változtatjuk, hogy mindkét oldalát megszorozzuk a nemnulla c számmal);
(b)EiEi'=Ei+dEj, ahol d tetszőleges szám és ji (az i-edik egyenletet úgy változtatjuk, hogy hozzádjuk a j-edik egyenlet d-szeresét; a j-edik egyenlet természetesen változatlan marad).
Mind a kétféle lépés olyan, hogy a rendszer egyetlen egyenletét változtatja csak meg. Az (a) esetén világos, hogy az új, Ei' egyenlet ekvivalens az eredeti Ei-vel, így a kapott új egyenletrendszernek ugyanazok a megoldásai, mint az eredetinek. A (b) alkalmazása esetén az látszik, hogy a kapott új, Ei' egyenlet az Ei és az Ej egyenletek együttes következménye, ezért az így kapott új egyenletrendszernek az eredeti rendszer minden megoldása továbbra is megoldása marad. Ez azonban fordítva is igaz, mivel az új egyenletrendszerből következményként visszakaphatjuk a régit: csupán a megváltozott i-edik egyenletet kell következményként visszaállítani, ami egyszerű: Ei=Ei'-dEj.
Tudva, hogy az (a) és (b) típusú lépésekkel az eredetivel ekvivalens egyenletrendszerekhez jutunk, már csak arra kell törekedni, hogy ezek segítségével egyre ,,szebb'' alakúra formáljuk (1)-et. Tegyük fel ehhez, hogy a110; ha a11=0, akkor változtassuk meg az ismeretlenek számozását és szükség esetén az egyenletek sorrendjét is úgy, hogy az ekként adódó a11' együttható már ne legyen nulla; ha ezt még így sem tudjuk elérni az azt jelenti, hogy mindegyik xi ismeretlen együtthatója minden egyenletben nulla, tehát egyenleteink valamennyien 0=bi alakúak. Ekkor nincs is több teendőnk: ha valamelyik bi értéke nullától különböző, akkor az egyenletrendszernek nincs megoldása (hiszen tartalmaz ,,nulla = nemnulla'' típusú egyenletet), míg abban az esetben, ha minden bi értéke nulla, az egyenletrendszernek minden szám k-as megoldása.
Tegyük fel tehát, hogy a110. Az (a) lépést az első egyenletre alkalmazva elérhető, hogy a11=1 legyen. Ezután a (b) lépést alkalmazzuk egymás után a második, harmadik, ..., n-edik egyenletre úgy, hogy rendre kivonjuk belőlük az első egyenlet a21-szeresét, ..., an1-szeresét. Így az x1 együtthatója az első egyenletben 1, a többiben pedig nulla.
Folytassuk az eljárást, ezúttal az első egyenletre koncentrált lépéssorozatot a második egyenletre irányítva: szeretnénk, hogy a második egyenletben x2 aktuális a22' együtthatója ne legyen nulla. Ha az x2,...,xk ismeretlenek átszámozásával és a másodiktól az n-edikig terjedő egyenletek sorrendjének megváltoztatásával sem érhető ez el, akkor a korábbiakhoz hasonlóan ezek mind 0=bi' alakúak, és az egyenletrendszernek vagy nincs megoldása, vagy (ha b2',...,bn' mindegyike nulla) az x2,...,xk ismeretlenek értéke tetszőleges lehet, az x1 pedig az első egyenletből ezekkel kifejezhető. Feltéve, hogy a22'0, a második egyenletet a22'-vel osztva elérjük, hogy a22'=1; ezután alkalmazzuk a (b) lépést úgy, hogy az első, a harmadik, ..., n-edik egyenletből rendre kivonjuk a második egyenlet a12'-szeresét, ..., an2'-szeresét. Ezzel x2 együtthatója a második egyenletben 1, a többiben pedig nulla ‐ miközben x1 ,,kellemes'' együtthatói sehol nem változnak.
Az eljárást ezután a harmadik egyenletre és x3 együtthatóinak kiritkítására összpontosítva folytatjuk stb. Végül (az ismeretlenek esetleges átszámozását és az egyenletek sorrendjének megváltoztatását is megengedve) az egyenletrendszer a következő alakot ölti:

x1+c1,r+1xr+1+...+c1,kxk=d1x2+c2,r+1xr+1+...+c2,kxk=d2xr+cr,r+1xr+1+...+cr,kxk=dr0=dr+10=dn
(3)
Ha dr+1,...,dn valamelyike nullától különböző, akkor nincs megoldás, egyébként az xr+1,...,xk ismeretlenek értéke tetszőlegesen megválasztható, ezekkel pedig x1,...,xr rendre kifejezhető az első r egyenletből
xi=di-(ci,r+1xr+1+...+ci,kxk)
szerint. Vegyük észre, hogy ha van megoldás, és n<k (vagyis több ismeretlen van, mint ahány egyenlet), akkor az egyenletrendszernek biztosan egynél több megoldása van, hiszen ekkor rn<k miatt lesznek olyan ismeretlenek, amelyek értéke szabadon megválasztható. E megállapítás roppant fontos speciális esete a következő:
(*) Tegyük fel, hogy az (1) egyenletrendszerben b1=...=bn=0 ‐ az ilyen egyenletrendszert homogénnek nevezzük. Homogén lineáris egyenletrendszernek biztosan van megoldása, nyilván ilyen például x1=x2=...=xk=0 (ezt szokás a rendszer triviális megoldásának nevezni). Ha ilyenkor n<k, akkor a fentiek szerint létezik az egyenletrendszernek a triviálistól különböző megoldása is, ahol tehát nem mindegyik xi értéke nulla.
 
Lineáris kombináció, függetlenség, bázis
 

Ebben a részben a mátrixműveletek közül elsősorban az összeadásra és a számmal való szorzásra lesz szükség.
Legyenek v̲1,v̲2,...,v̲k n×1-es oszlopmátrixok és legyenek x1,x2,...,xk tetszőleges számok. Az
x1v̲1+x2v̲2+...+xkv̲k
kifejezést (ami ugyancsak egy n×1-es oszlopmátrix) a v̲1,v̲2,...,v̲k rendszer elemeinek az x1,x2,...,xk együtthatókkal képezett lineáris kombinációjának hívjuk. Ha az összes xi együttható nulla, akkor nyilván a kombináció értéke a csupa nullából álló oszlopmátrix. Ha az együtthatók minden más értéke esetén (vagyis ha nem mindegyikük nulla) a kombináció sosem egyenlő a csupa nullából álló oszlopmátrixszal, akkor a v̲1,v̲2,...,v̲k rendszert (lineárisan) függetlennek nevezzük. Azt mondjuk továbbá, hogy a rendszer (lineárisan) összefüggő, ha nem független, azaz létezik olyan nemtriviális lineáris kombinációja, ami a csupa nullából álló 0̲ oszlopmátrixot adja.
Hogyan dönthető el, hogy egy rendszer független-e? Meg kell vizsgálni, hogy az xi számok mely értékére lesz a velük képezett lineáris kombináció 0̲, azaz meg kell oldanunk az x1v̲1+x2v̲2+...+xkv̲k=0̲ egyenletet. Ha v̲j=(a1ja2janj), akkor
(000)=x1(a11a21an1)+x2(a12a22an2)+...+xk(a1ka2kank)=(a11x1+a12x2+...+a1kxka21x1+a22x2+...+a2kxkan1x1+an2x2+...+ankxk),
azaz ‐ a két szélső oszlopmátrix megfelelő elemeit egyenlővé téve ‐ egy homogén lineáris egyenletrendszert kell megoldanunk (pl. az ismertetett Gauss-féle elimináció módszerével). Ha megoldásként csak a triviális adódik, akkor a rendszer független, egyébként pedig összefüggő.
Könnyen látható, hogy független rendszer bármelyik elemét elhagyva a megmaradó rendszer is független. Az is gyorsan ellenőrizhető, hogy az In egységmátrix oszlopai független rendszert alkotnak. Megállapíthatjuk tehát, hogy az n×1-es oszlopmátrixok körében létezik egyelemű, kételemű, háromelemű, ..., n-elemű független rendszer. Vajon létezik-e n-nél több elemű is? A válasz nemleges: ha k>n, akkor egy n×1-es oszlopmátrixokból álló k-elemű rendszer biztosan összefüggő, hiszen ennek eldöntéséhez egy n egyenletből álló, k-ismeretlenes homogén lineáris egyenletrendszert kell megoldanunk, amiről viszont (*) szerint tudjuk, hogy létezik nemtriviális megoldása.
Mit mondhatunk a maximális, azaz n-elemű független rendszerekről? Tegyük fel, hogy v̲1,v̲2,...,v̲n egy ilyen rendszer. Ha ehhez még hozzáveszünk egy tetszőleges n×1-es z̲ oszlopmátrixot, akkor az így kapott n+1-elemű rendszer összefüggő, azaz van olyan nemtriviális lineáris kombinációja, ami nulla:
x1v̲1+x2v̲2+...+xnv̲n+yz̲=0̲.(4)

Megmutatjuk, hogy itt y0. Tegyük föl ugyanis, hogy y=0, ekkor (4)-ből az marad, hogy x1v̲1+x2v̲2+...+xnv̲n=0̲. A v̲1,v̲2,...,v̲n rendszer azonban független, így ez csak a triviális lineáris kombináció lehet, azaz x1=...=xn=0. Ellentmondásra jutottunk, hiszen a (4)-ben látható kombináció nemtriviális. Tehát y0; ekkor z̲-t könnyen kifejezhetjük (4)-ből: z̲=(-x1y)v̲1+(-x2y)v̲2+...+(-xny)v̲n.
Azt kaptuk, hogy v̲1,v̲2,...,v̲n lineáris kombinációjaként minden n×1-es oszlopmátrix kifejezhető; az ilyen tulajdonságú független rendszert bázisnak nevezzük.
 
Sajátérték és determináns
 

Próbáljunk meg a Fibonacci-sorozatnál alkalmazott számolás hátterére is egy pillantást vetni. Tegyük fel ezért, hogy A egy olyan n×n-es mátrix, amely előáll M-1BM alakban, alkalmas B=(c10...00c2...00...cn) diagonális mátrixszal. Jelölje ezúttal is e̲i az n×n-es egységmátrix i-edik oszlopát. Ne feledjük, hogy egy tetszőleges n×n-es G mátrixot az e̲i-vel jobbról megszorozva eredményül a G i-edik oszlopát kapjuk. Tekintsük ezután a keresett M mátrix inverzének az i-edik oszlopát, vagyis az ni=M-1e̲i szorzatot. Erre
An̲i=M-1BMM-1e̲i=M-1Be̲i=M-1(0ci0)=M-1(cie̲i)=ciM-1e̲i=cin̲i.
Kiderült, hogy n̲i olyan (nem 0̲) oszlopmátrix, amely az A-val balról megszorozva a ci-szeresére változik. Azt mondjuk ilyenkor, hogy n̲i az A sajátvektora, és ci az A mátrix n̲i-hez tartozó sajátértéke. Tehát M-1 oszlopai valamennyien sajátvektorai A-nak. Megmutatjuk, hogy ez már jellemzi is a megfelelő M-1 mátrixokat: ha N:=M-1 olyan invertálható mátrix, amelynek oszlopai az A-nak sajátvektorai, akkor B:=MAM-1 diagonális mátrix (főátlójában A sajátértékeivel), azaz A=M-1BA diagonalizálható. Jelölje ehhez ismét n̲i az N:=M-1 mátrix i-edik oszlopát, ekkor feltételezésünk szerint AM-1=AN-nek az i-edik oszlopa An̲i=cin̲i, ezért MAM-1=M(AM-1)-nek az i-edik oszlopa M(cin̲i)=ci(Mn̲i)=ci(M(M-1 i-edik oszlopa))=ci(MM-1 i-edik oszlopa)=ci(In i-edik oszlopa)=(0ci0); tehát valóban
MAM-1=(c10...00c2...00...cn)
diagonális.
A kapott eredmények szerint egy n×n-es mátrix pontosan akkor diagonalizálható, ha bizonyos sajátvektoraiból mint oszlopokból összeállítható egy invertálható n×n-es mátrix.
A kapott feltétel nyomán rögtön szemben találjuk magunkat a következő kérdéssel: hogyan határozhatjuk meg a sajátvektorokat?
A válasz kezdetben egyszerűnek tűnik: ha ismerjük az A mátrix sajátértékeit, akkor egy adott ci sajátértékhez tartozó sajátvektorok meghatározása az
Ax̲=cix̲(5)
homogén lineáris egyenletrendszer nemtriviális megoldásainak a megkeresését jelenti, ez tehát (már) nem probléma. De honnan tudjuk (előre), hogy mik az A sajátértékei? Az (5) szerint ezek éppen azok a ci számok, amelyekre az Ax̲-cix̲=0̲, illetve ‐ némileg átrendezve ‐ az (A-ciIn)x̲=0̲ homogén lineáris egyenletrendszernek létezik a triviálistól különböző megoldása. A korábbiakra visszaemlékezve láthatjuk, hogy ez éppen akkor következik be, amikor az A-ciIn mátrix oszlopainak rendszere lineárisan összefüggő. Persze ismerjük az eljárást, amivel adott ci esetén ez eldönthető; de ci ismeretlen lévén kedvezőbb lenne, ha az összefüggőség kérdését egy képletbe való behelyettesítéssel dönthetnénk el. Ilyen formula valóban létezik, a neve determináns; illusztrációként 2×2-es mátrixokra készítjük el.
Legyen a kérdéses mátrix D=(d11d12d21d22). A
d̲1=(d11d21),d̲2=(d12d22)
oszlopok rendszere pontosan akkor összefüggő, ha léteznek olyan x1 és x2 számok, amelyek közül legalább az egyik nem nulla, és x1d̲1+x2d̲2=0̲. Ha például x20, akkor d̲2=-x1x2d̲1, azaz (d12d22)=-x1x2(d11d21). Ez éppen azt jelenti, hogy a d12:d11 és a d22:d21 arányok egyenlők (ugyanígy, ha x10), azaz d12d21=d11d22, illetve d11d22-d12d21=0. A D=(d11d12d21d22) determinánsa tehát detD=d11d22-d12d21, ami pontosan akkor nulla, ha D oszlopai lineárisan összefüggő rendszert alkotnak.
Ellenőrizzük mindezt a Fibonacci-sorozat mátrixára:
0=det((1110)-ci(1001))=det(1-ci11-ci)=(1-ci)(-ci)-11=ci2-ci-1,
az ismerős másodfokú egyenlet.
Általában egy n×n-es mátrix determinánsa olyan, a mátrix elemeiből képezett szorzatok előjeles összege, ahol ‐ minden lehetséges módon ‐ minden sorból és oszlopból kiválasztunk egy-egy (összesen n) elemet, és az értéke pontosan akkor nulla, ha a mátrix oszlopai összefüggő rendszert alkotnak. Elmondható tehát, hogy egy n×n-es mátrix sajátvektorainak és sajátértékeinek meghatározása egy n-edfokú egyenlet és n darab, egyenként n egyenletből álló, n-ismeretlenes (homogén) lineáris egyenletrendszer megoldását igényli.
 
Egy kombinatorikai alkalmazás
 

Legyen H egy n-elemű véges halmaz, A1,A2,...,Ak pedig különböző részhalmazai H-nak. Kérdés: legfeljebb mennyi lehet a k, ha az Ai részhalmazok közül bármely kettőnek (mármint két különbözőnek) pontosan egy közös eleme van?
A kérdésben szereplő ,,legfeljebb'' szó jogosságát az mutatja, hogy k-nak (n-hez képest) kicsi értékeire ‐ például k=1,2,3-ra ‐ nagyon könnyű ilyen részhalmazokat megadni, viszont k növekedtével a metszetfeltétel egyre erősebb korlátozást jelent. Némi gondolkozás után azonban eszünkbe juthat a következő konfiguráció, amivel k=n elérhető: Legyen H={h1,h2,...,hn}, és legyen A1={h1}, A2={h1,h2}, A3={h1,h3}, ..., An={h1,hn}; itt bármely két részhalmaz metszete {h1}. Egy másik, ehhez hasonló lehetőség: A1={h2,h3,...,hn}, A2={h1,h2}, A3={h1,h3}, ..., An={h1,hn}. A kérdés ezután úgy módosítható, hogy lehet-e k az n-nél nagyobb. Megmutatjuk, hogy nem lehet. Ehhez mátrixokat használunk majd és azt az eredményt, hogy n×1-es oszlopmátrixokból álló független rendszernek legfeljebb n eleme lehet.
Előbb azonban térjünk vissza az elsőként talált konfigurációhoz. Ennek jellegzetessége, hogy az egyik részhalmaz egyelemű. Ha egy, a probléma feltételét kielégítő konfigurációról tudjuk, hogy az egyik részhalmaz egyelemű, akkor az szükségképpen része a többi részhalmaznak, hiszen a velük alkotott metszet csak úgy állhat egyetlen elemből. Ekkor viszont ez az elem alkotja bármely két részhalmaznak is a közös részét, ezért a többi k-1 részhalmaznak ezen elemet nem tartalmazó része páronként diszjunkt halmazrendszert alkot. Mivel ezek egy n-1 elemű halmaz nemüres részei, számuk legfeljebb n-1 lehet. Tehát k-1n-1, azaz kn. A továbbiakban ezért elegendő azokkal az esetekkel foglalkoznunk, amikor mindegyik Ai részhalmaznak legalább két eleme van.
Az Aj részhalmazokhoz oszlopmátrixokat rendelünk. Legyen a̲j=(a1,ja2,jan,j), ahol
ai,j={1, ha hiAj,0, ha hiAj.
Tetszőleges c̲=(c1c2cn) oszlopmátrix transzponáltjának hívjuk a c̲T=(c1c2...cn) sormátrixot. A módszer azon az egyszerű észrevételen alapul, hogy
a̲jTa̲=|AjA|={|Aj|2,ha  j=,1,ha  j.(6)

Megmutatjuk, hogy az a1,a2,...,ak rendszer lineárisan független; ebből a korábban látottak szerint valóban következik majd, hogy kn. Vizsgálnunk kell, hogy milyen lineáris kombinációjuk 0̲. Tegyük föl ezért, hogy
x1a̲1+x2a̲2+...+xka̲k=0̲,
ekkor (6) szerint nyilván
0=0̲T0̲=(j=1kxja̲j)T(t=1kxta̲t)=j=1kxj2a̲jTa̲j+jtxjxta̲jTa̲t==j=1k|Aj|xj2+jtxjxt=j=1k(|Aj|-1)xj2+(j=1kxj)2.

Itt a második összeg négyzete nemnegatív, az elsőben minden összeadandó szorzat nemnegatív, és a szorzatok |Aj|-1 tényezője pozitív. A teljes összeg ezért csak úgy lehet nulla, ha minden xj=0. Tehát a̲1,a̲2,...,a̲k valóban lineárisan független.
 

Miután beláttuk, hogy legfeljebb n részhalmaz választható ki az előírt módon, felvetődik a kérdés, vajon mit lehet mondani azokról az esetekről, amikor éppen a maximális számú, n halmazból áll a rendszer. A kezdetben talált két konfiguráció alapján gondolhatjuk, hogy még sok, esetleg bonyolultabb szerkezetű példa is van, vagy ellenkezőleg: bizonyítékot kereshetünk arra, hogy további példákra nem nagyon számíthatunk, esetleg nincs is más a már találtakon kívül. Szerencsére nem kell előre eldönteni, melyik irányban próbálkozzunk ‐ csupán használnunk kell azokat az oszlopmátrixokat, amelyekbe a részhalmazok adatait kódoltuk. Annyit azért érdemes elöljáróban észrevenni, hogy egy ilyen n tagból álló halmazrendszer szükségképpen lefedi a H-t: ha ugyanis lenne a H-nak olyan h eleme, ami egyik Ai részhalmazban sincs benne, akkor valamennyi Ai az n-1 elemű H{h} halmaznak lenne része; de ott a bizonyítottak szerint legfeljebb n-1 ilyen részhalmazból álló rendszer található.
 

Tegyük fel tehát, hogy az A1,A2,...,An páronként különböző részhalmazai az n-elemű H={h1,h2,...,hn} halmaznak, mindegyikük legalább kételemű, és bármely kettőnek egyetlen közös eleme van. Láttuk, hogy ekkor a nekik megfelelő a̲1,a̲2,...,a̲n oszlopmátrixok rendszere lineárisan független. Tudjuk viszont, hogy n-elemű független rendszerként bázist is alkotnak! Ez azt jelenti, hogy minden n×1-es oszlopmátrix előállítható az a̲1,a̲2,...,a̲n lineáris kombinációjaként. Használjuk ezt fel az In egységmátrix e̲1,e̲2,...,e̲n oszlopaira:
e̲i=j=1nyi,ja̲j.(7)

Mielőtt továbbmennénk, vezessük be a következő jelölést: legyen
δi,Aj={1,ha  hiAj,0,ha  hiAj.

Így (6) és (7) szerint
δi,Ak=a̲kTe̲i=a̲kTj=1nyi,ja̲j.=j=1nyi,ja̲kTa̲j=j=1nyi,j|AkAj|==yi,k|Ak|+j:jkyi,j=yi,k(|Ak|-1)+j=1nyi,j.
Legyen yi=j=1nyi,j, ekkor tehát
δi,Ak=yi,k(|Ak|-1)+yi,
innen pedig
yi,k=δi,Ak-yi|Ak|-1,(8)
amiből ‐ yi definíciója alapján ‐
yi=k=1nyi,k=j=1nδi,Ak-yi|Ak|-1.
Ebből kifejezhető yi:
yi(1+k=1n1|Ak|-1)=k=1nδi,Ak|Ak|-1=k:hiAk1|Ak|-1,
azaz
yi=(k:hiAk1|Ak|-1)/(1+k=1n1|Ak|-1).
Itt a számláló és a nevező egyaránt pozitív, és a számláló kisebb a nevezőnél; ezért
0<yi<1.
A (8)-cal összevetve ebből az következik, hogy hiAk esetén yi,k pozitív, hiAk esetén pedig negatív.
Legyen most ji, de egyébként i,jn tetszőleges. Ekkor (6) és (7) alapján
0=e̲jTei̲=e̲jTk=1nyi,ka̲k=k=1nyi,ke̲jTa̲k=k=1nyi,kδj,Ak=k:hjAkyi,k.
Egy nulla értékű (és ‐ mivel a halmazrendszer lefedi H-t ‐ nem üres) összeget kaptunk, amelyben egyik tag sem nulla; így lennie kell a tagok között pozitívnak. Ha yi,k egy ilyen tag, akkor a következő két dolgot tudjuk róla: 1. hiAk, hiszen yi,k pozitív; 2. hjAk, mivel a tag a fenti összegből való.
Kiderült tehát, hogy ‐ maximális elemszámának köszönhetően ‐ a halmazrendszer azzal a további tulajdonsággal is rendelkezik, hogy a H bármely két eleme egyszerre benne van az n darab részhalmaz valamelyikében. Megjegyzendő, hogy a két megadott példánk közül a másodikra ez teljesül. Megmutatható viszont, hogy n4 esetén minden ettől különböző konfiguráció nagyon szigorú számossági feltételeknek tesz eleget: mindegyik Ai részhalmaz ugyanannyi elemből áll (legyen ez a szám q+1), a H minden eleme pontosan q+1 részhalmazban van benne, és ezekből következően n=q2+q+1. Ezeket a konfigurációkat véges projektív síkoknak nevezzük. Az elnevezés nem véletlen: ha H elemeit tekintjük pontoknak, az Ai részhalmazokat pedig egyeneseknek, akkor valóban teljesülnek a projektív síkgeometria axiómái, miszerint bármely két különböző egyenesnek pontosan egy közös pontja van, és bármely két ponthoz található (előbbi szerint pontosan egy) olyan egyenes, amely mindkét pontot tartalmazza. Ha q prímhatvány, akkor egy n=q2+q+1 elemű halmazon létezik véges projektív sík (olykor többféle is!). Híres, és mindmáig megoldatlan probléma viszont, hogy létezik-e olyan k szám, ami nem prímhatvány, de az n=k2+k+1 elemű halmazon mégis megadható projektív sík.
Az egymást egy pontban metsző halmazok rendszeréről szóló ún. Erdős ‐ de Bruijn-tételt tehát a következőképpen fogalmazhatjuk meg: Ha egy n4 elemű halmaz k darab részhalmaza közül bármelyik kettőnek pontosan egy közös eleme van, akkor kn, és ha k=n, akkor a rendszer vagy az ismertetett két példa egyike, vagy egy véges projektív sík.
 
Befejezés
 

Mátrixok sajátvektorai és sajátértékei a matematika és a fizika számos területén előfordulnak. Befejezésül essék néhány szó ismét a koordináta-geometriáról. Tekintsük például azt a síkgörbét, amelynek (a szokásos derékszögű koordináta-rendszerben) az egyenlete
6x2+4xy+3y2+5x-8y-10=0.
Mi ez a görbe, mik a főbb geometriai jellemzői? Könnyebb lenne erre választ adni, ha egy másik, az alakzathoz ,,jobban illeszkedő'' koordináta-rendszerben lenne az egyenlet felírva. Csakhogy éppen ez a feladat: az adekvát koordináták megtalálása. Ha a koordináta-rendszert eltoljuk a v̲=(a,b) vektorral, akkor az új x', y' koordinátákkal x=x'+a, y=y'+b teljesül; ezeket az eredeti egyenlet változóiba helyettesítve egy kis számolás után megkaphatjuk az alakzatunk egyenletét az új rendszerben. De a részletek kiszámolása nélkül is látható, hogy az új egyenletben ugyanazok maradnak a másodfokú tagok (x2, xy, y2) együtthatói. A probléma kemény magja tehát ezekben keresendő ‐ az elsőfokú tagokat és a -10 konstanst hagyjuk is egyelőre figyelmen kívül.
A megoldás kulcsa az, hogy a 6x2+4xy+3y2 részt mátrixokkal,
(xy)(6403)(xy)(9)
alakban írjuk fel. Ha a koordináta-rendszert az origó körül β fokkal elforgatjuk, az új x', y' koordinátákra
(xy)=(cosβ-sinβsinβcosβ)(x'y'),illetve(xy)=(cosβsinβ-sinβcosβ)(x'y').
Így az elforgatott koordináta-rendszerben az alakzat új egyenletének másodfokú része:
(x'y')(cosβsinβ-sinβcosβ)(6403)(cosβ-sinβsinβcosβ)(x'y').
A megjelölt háromtényezős mátrixszorzat adja az új egyenletben a másodfokú tagok együtthatóit. Jó lenne, ha ott az x'y' együtthatója nulla lenne, mert akkor ‐ a koordináta-rendszer alkalmas eltolása után ‐ könnyű lenne észrevenni, hogy pl. ellipszissel, hiperbolával vagy parabolával van-e dolgunk. Ez éppen azt jelentené, hogy az aláhúzott mátrix diagonális. Itt felcsillan a remény: a bal szélen álló mátrix éppen a jobb oldalinak az inverze! Célba érhetünk tehát, ha az eredeti (6403) mátrix diagonalizálható. Egyszerű és már ismert számolással ellenőrizhető is, hogy ez a mátrix valóban diagonalizálható. Ám ne örüljünk korán: a diagonalizálhatóság önmagában itt nem elegendő, a követelmény az, hogy alkalmas (cosβ-sinβsinβcosβ) típusú mátrixszal lehessen diagonalizálni ‐ ilyen pedig a mi mátrixunkhoz nem létezik.
Azonban szerencsénk van: lehet más is a kiindulási mátrix! Vegyük észre ugyanis, hogy (9)-ben az xy együtthatója a (6403) mátrix jobb felső és bal alsó elemének összegeként adódik ‐ így ezek egyikét szabadon megválaszthatjuk. Válasszuk őket egyenlőnek, ekkor az (6223) mátrix a bal felső és a jobb alsó sarok meghatározta egyenesre szimmetrikus. A lineáris algebra egy alapvető tétele ‐ az ún. főtengelytétel ‐ szerint minden szimmetrikus n×n-es mátrix egy alkalmas ortogonális mátrixszal diagonalizálható; 2×2-es esetben ez éppen a kívánt alakot jelenti.
Esetünkben a megfelelő diagonalizáló mátrix (1525-2515), és az új x', y' koordinátákkal felírt
(xy)=(1525-2515)(x'y'),
azaz x=15x'+25y', y=-25x'+15y' helyettesítésekkel kapott új egyenlet (az elforgatott koordináta-rendszerben):
2x'2+7y'2+215x'+25y'-10=0.

Innen már simább úton haladhatunk tovább; teljes négyzetté kiegészítéssel eltüntethetjük az elsőfokú tagokat:
2(x'+2145)2+7(y'+175)2=10+44180+1245,
ennek megfelelően eltolhatjuk a koordináta-rendszert, végül osztunk az újonnan adódó konstans tag abszolút értékével. Az egyenlet fenti alakjából egyébként már leolvasható, hogy ‐ 2 és 7 pozitív lévén ‐ görbénk egy ellipszis. A szokásos x2a2+y2b2=1 alakba való átírással megkaphatjuk az ellipszis tengelyeinek hosszát, a diagonalizáló mátrix révén pedig (ld. arcsin25 és társai) e tengelyeknek az eredeti koordináta-rendszer tengelyeivel bezárt szögét.