Sistema di equazioni lineari

Disambiguazione – "Sistema lineare" rimanda qui. Se stai cercando il concetto di sistema lineare in teoria dei sistemi, vedi Sistema dinamico lineare.

In matematica, e in particolare in algebra lineare, un sistema di equazioni lineari, anche detto sistema lineare, è un sistema composto da più equazioni lineari che devono essere verificate tutte contemporaneamente. Una soluzione del sistema è un vettore i cui elementi sono le soluzioni delle equazioni che compongono il sistema, ovvero tali che se sostituiti alle incognite rendono le equazioni delle identità.

Definizione

Un sistema di equazioni lineari è un insieme di m {\displaystyle m} equazioni lineari in n {\displaystyle n} incognite, che può essere scritto nel modo seguente:[1][2]

{ a 1 , 1 x 1 + a 1 , 2 x 2 + + a 1 , n x n = b 1 a 2 , 1 x 1 + a 2 , 2 x 2 + + a 2 , n x n = b 2 a m , 1 x 1 + a m , 2 x 2 + + a m , n x n = b m {\displaystyle {\begin{cases}a_{1,1}x_{1}+a_{1,2}x_{2}+\cdots +a_{1,n}x_{n}=b_{1}\\a_{2,1}x_{1}+a_{2,2}x_{2}+\cdots +a_{2,n}x_{n}=b_{2}\\\vdots \\a_{m,1}x_{1}+a_{m,2}x_{2}+\cdots +a_{m,n}x_{n}=b_{m}\\\end{cases}}}

Il numero n {\displaystyle n} delle incognite è detto anche ordine del sistema.

Se i termini noti b i {\displaystyle b_{i}} sono tutti nulli il sistema è detto omogeneo.

Una n {\displaystyle n} -upla ( x 1 , , x n ) {\displaystyle (x_{1},\dots ,x_{n})} di elementi nel campo è una soluzione del sistema se soddisfa tutte le m {\displaystyle m} equazioni.[3]

Due sistemi si dicono equivalenti se hanno lo stesso insieme di soluzioni. In particolare, due sistemi lineari sono equivalenti se ogni equazione di uno è combinazione lineare delle equazioni dell'altro.[4]

Forma matriciale

In notazione indiciale il sistema si scrive:

j n a i j x j = b i {\displaystyle \sum _{j}^{n}a_{ij}x_{j}=b_{i}}

Definendo i vettori dei coefficienti:

a i ( a i 1 a i n ) {\displaystyle \mathbf {a} _{i}\equiv {\begin{pmatrix}a_{i1}\\\vdots \\a_{in}\end{pmatrix}}}

e il vettore degli m {\displaystyle m} termini noti:

b ( b 1 b m ) {\displaystyle \mathbf {b} \equiv {\begin{pmatrix}b_{1}\\\vdots \\b_{m}\end{pmatrix}}}

il sistema è equivalente alla combinazione lineare:[1]

i n a i x i = b {\displaystyle \sum _{i}^{n}a^{i}x_{i}=\mathbf {b} }

Definendo x {\displaystyle \mathbf {x} } il vettore delle n {\displaystyle n} incognite:

x ( x 1 x n ) {\displaystyle \mathbf {x} \equiv {\begin{pmatrix}x_{1}\\\vdots \\x_{n}\end{pmatrix}}}

ciascuna equazione è equivalente ad un prodotto scalare standard:[5]

a 1 x = b 1 {\displaystyle \mathbf {a} _{1}\cdot \mathbf {x} =b_{1}}
{\displaystyle \cdots }
a m x = b m {\displaystyle \mathbf {a} _{m}\cdot \mathbf {x} =b_{m}}

Se il sistema è omogeneo il vettore delle incognite è quindi ortogonale ai vettori dei coefficienti.

Usando le matrici ed il prodotto scalare fra matrici (prodotto riga per colonna) si possono separare i coefficienti, le incognite ed i termini noti del sistema, scrivendolo nel modo seguente:

( a 11 a 12 a 1 n a 21 a 22 a 2 n a m 1 a m 2 a m n ) ( x 1 x 2 x n ) = ( b 1 b 2 b m ) {\displaystyle {\begin{pmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\end{pmatrix}}{\begin{pmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{pmatrix}}={\begin{pmatrix}b_{1}\\b_{2}\\\vdots \\b_{m}\end{pmatrix}}}

Ora se A {\displaystyle A} è la matrice m × n {\displaystyle m\times n} dei coefficienti:

A ( a 1 , 1 a 1 , n a m , 1 a m , n ) {\displaystyle A\equiv {\begin{pmatrix}a_{1,1}&\cdots &a_{1,n}\\\vdots &\ddots &\vdots \\a_{m,1}&\cdots &a_{m,n}\end{pmatrix}}}

di cui in effetti a 1 , , a n {\displaystyle \mathbf {a} ^{1},\ldots ,\mathbf {a} ^{n}} sono le colonne, con le definizioni del vettore delle incognite e di quello dei termini noti il sistema si scrive finalmente in forma matriciale:

A x = b {\displaystyle A\cdot \mathbf {x} =\mathbf {b} }

Matrice completa

Il sistema può essere descritto usando la matrice completa:

( A , b ) = ( a 1 , 1 a 1 , n b 1 a m , 1 a m , n b m ) {\displaystyle (A,\mathbf {b} )=\left({\begin{matrix}a_{1,1}&\cdots &a_{1,n}&b_{1}\\\vdots &\ddots &\vdots &\vdots \\a_{m,1}&\cdots &a_{m,n}&b_{m}\end{matrix}}\right)}

detta matrice associata al sistema. Essa è ottenuta dalla giustapposizione della matrice dei coefficienti e del vettore dei termini noti.

Le matrici A   {\displaystyle A\ } e ( A , b ) {\displaystyle (A,\mathbf {b} )} sono dette rispettivamente matrice incompleta (o matrice dei coefficienti) e completa (o orlata). I numeri x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}} sono le incognite, i numeri a i j {\displaystyle a_{ij}} sono i coefficienti ed i numeri b i {\displaystyle b_{i}} i termini noti. Coefficienti e termini noti sono elementi di un campo, ad esempio quello formato dai numeri reali o complessi.

Caratteristiche

Il grado di un sistema di equazioni polinomiali è definito come il prodotto dei gradi delle equazioni che lo compongono. Quindi un sistema lineare è un sistema polinomiale di primo grado.

In generale, un sistema lineare può essere:

  • Determinato, quando ha una sola soluzione.
  • Impossibile, quando non ha nessuna soluzione.
  • Indeterminato, quando ha infinite soluzioni.
  • Numerico, quando le soluzioni sono rappresentate da numeri.
  • Letterale, quando le soluzioni sono rappresentate da espressioni letterali.
  • Omogeneo, quando i termini noti sono tutti zero.

Se il campo K {\displaystyle K} di appartenenza di coefficienti e termini noti di un sistema di ordine n {\displaystyle n} è infinito, ci sono tre possibilità: esiste una sola soluzione, non ci sono soluzioni oppure ce ne sono infinite. Il teorema che asserisce questo fatto e che permette di stabilire se e quante soluzioni esistono senza risolvere il sistema è il teorema di Rouché-Capelli. Nel caso in cui esistano soluzioni, queste formano un sottospazio affine di K n {\displaystyle K^{n}} .

Il sistema omogeneo associato

Si consideri l'operazione lineare:

L ( x ) = i n x i A i {\displaystyle L(\mathbf {x} )=\sum _{i}^{n}x_{i}A^{i}}

Il nucleo di L {\displaystyle L} è lo spazio delle soluzioni del sistema omogeneo associato, mentre l'immagine è lo spazio generato dalle colonne A 1 , , A n {\displaystyle A^{1},\ldots ,A^{n}} . Per il teorema del rango segue che la dimensione dello spazio delle soluzioni più il rango per colonne di A {\displaystyle A} è pari ad n {\displaystyle n} .

Essendo il vettore delle incognite ortogonale ai vettori riga della matrice dei coefficienti, lo spazio delle soluzioni è il complemento ortogonale del sottospazio generato dalle righe di A {\displaystyle A} . La somma delle rispettive dimensioni deve pertanto essere pari ad n {\displaystyle n} .

Dalle due affermazioni precedenti si conclude che il rango r {\displaystyle r} per righe è pari al rango per colonne, e che lo spazio delle soluzioni ha dimensione n r {\displaystyle n-r} .[5] Lo spazio delle soluzioni è dunque un sottospazio vettoriale di dimensione n ρ ( A ) {\displaystyle n-\rho (A)} .

Lo spazio delle soluzioni

Lo stesso argomento in dettaglio: Teorema di Rouché-Capelli.

Il sistema ammette soluzione se e solo se il vettore b {\displaystyle \mathbf {b} } è l'immagine del vettore x {\displaystyle \mathbf {x} } ottenuta mediante l'applicazione lineare L A : K n K m {\displaystyle L_{A}\colon K^{n}\to K^{m}} definita nel seguente modo:

L A ( x ) = A x   {\displaystyle L_{A}(\mathbf {x} )=A\mathbf {x} \ }

L'immagine di L A {\displaystyle L_{A}} è generata dai vettori dati dalle colonne di A {\displaystyle A} , e quindi b {\displaystyle \mathbf {b} } è nell'immagine se e solo se lo span delle colonne di A {\displaystyle A} contiene b {\displaystyle \mathbf {b} } , cioè se e solo se lo spazio generato dalle colonne di A {\displaystyle A} è uguale allo spazio generato dalle colonne di ( A | b ) {\displaystyle (A|\mathbf {b} )} . In modo equivalente il sistema ammette soluzione se e solo se le due matrici abbiano lo stesso rango, come stabilisce il teorema di Rouché-Capelli.

Se esiste una soluzione x 0 {\displaystyle \mathbf {x} _{0}} , ogni altra soluzione si scrive come x 0 + v {\displaystyle \mathbf {x} _{0}+\mathbf {v} } , dove v {\displaystyle \mathbf {v} } è una soluzione del sistema lineare omogeneo associato:[6]

A v = 0 {\displaystyle A\mathbf {v} =0}

Infatti:

A ( x 0 + v ) = A x 0 + A v = b + 0 = b   {\displaystyle A(\mathbf {x} _{0}+\mathbf {v} )=A\mathbf {x} _{0}+A\mathbf {v} =\mathbf {b} +\mathbf {0} =\mathbf {b} \ }

Lo spazio delle soluzioni, ottenuto traslando il nucleo con il vettore x 0 {\displaystyle \mathbf {x} _{0}} , è quindi il sottospazio affine dato da:

Sol ( A , b ) = x 0 + Sol ( A , 0 ) {\displaystyle \operatorname {Sol} (A,\mathbf {b} )=\mathbf {x} _{0}+\operatorname {Sol} (A,\mathbf {0} )}

La dimensione dello spazio delle soluzioni del sistema completo è uguale alla dimensione dello spazio delle soluzioni del sistema omogeneo associato.[7] Per il teorema di Rouché-Capelli tale soluzione è unica se e solo se il rango della matrice A {\displaystyle A} è n {\displaystyle n} . Altrimenti se il campo K {\displaystyle K} è infinito esistono infinite soluzioni, e queste formano un sottospazio vettoriale di K n {\displaystyle K^{n}} , avente come dimensione la nullità t = n rk ( A ) {\displaystyle t=n-\operatorname {rk} (A)} della matrice.

Strumenti per la risoluzione

Lo stesso argomento in dettaglio: Sistema di equazioni.

Dato un sistema lineare nella forma

A x = b {\displaystyle A\cdot \mathbf {x} =\mathbf {b} }

dove x {\displaystyle \mathbf {x} } è il vettore colonna delle incognite, b {\displaystyle \mathbf {b} } è il vettore colonna dei termini noti e A {\displaystyle A} è la matrice dei coefficienti ed è quadrata e invertibile, la soluzione è unica ed è pari al prodotto:

A 1 b {\displaystyle A^{-1}\cdot \mathbf {b} }

dove A 1 {\displaystyle A^{-1}} è l'inversa di A {\displaystyle A} . Il calcolo della matrice inversa è spesso complicato e oneroso dal punto di vista computazionale, ragion per cui un sistema lineare normalmente non viene risolto calcolando direttamente la matrice inversa.

Di grande importanza teorica per i sistemi lineari, ma non utilizzata in pratica per motivi simili, è la regola di Cramer.

Di uso generale per sistemi con migliaia di equazioni è invece il metodo di eliminazione di Gauss, che si basa sul metodo di riduzione.

Il metodo di riduzione

Il metodo di riduzione è specifico per i sistemi lineari. Il procedimento consiste nel sostituire una delle equazioni del sistema con una opportuna combinazione lineare di due equazioni del sistema stesso, ottenendo un sistema equivalente a quello dato. Più precisamente, se due righe sono espresse come prodotto tra opportune sottomatrici dei coefficienti e il vettore x delle soluzioni, ovvero

{ A x = c B x = d {\displaystyle {\begin{cases}A\mathbf {x} =\mathbf {c} \\B\mathbf {x} =\mathbf {d} \end{cases}}}

allora è possibile sostituire una delle due con l'equazione

m A x + n B x = m c + n d {\displaystyle m\cdot A\mathbf {x} +n\cdot B\mathbf {x} =m\cdot \mathbf {c} +n\cdot \mathbf {d} } .

dove m {\displaystyle m} e n {\displaystyle n} sono due numeri scalari qualsiasi, entrambi diversi da zero.

Note

  1. ^ a b Lang, p. 61.
  2. ^ Hoffman, Kunze, p. 3.
  3. ^ Hoffman, Kunze, p. 4.
  4. ^ Hoffman, Kunze, p. 6.
  5. ^ a b Lang, p. 176.
  6. ^ Lang, p. 177.
  7. ^ Lang, p. 178.

Bibliografia

  • Serge Lang, Algebra lineare, Torino, Bollati Boringhieri, 1992, ISBN 88-339-5035-2.
  • (EN) Kenneth Hoffman e Ray Kunze, Linear Algebra, 2ª ed., Englewood Cliffs, New Jersey, Prentice-Hall, 1971, ISBN 0-13-536821-9.
  • F. Odetti e M. Raimondo, Elementi di Algebra Lineare e Geometria Analitica, ECIG, 1992, ISBN 88-7545-717-4.

Voci correlate

Altri progetti

Altri progetti

  • Wikiversità
  • Wikimedia Commons
  • Collabora a Wikiversità Wikiversità contiene risorse sul sistema di equazioni lineari
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file sul sistema di equazioni lineari

Collegamenti esterni

  • (EN) Eric W. Weisstein, Sistema di equazioni lineari, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàGND (DE) 4035826-4
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica