CHAPTER 7: DISCUSSION
7.2 D ISCUSSION OF THE STUDY FINDINGS
Podemos, a partir de uma base {v1, . . . , vn} uma base de um espaço vetorial V, obter
uma base ortogonal {w1, . . . , wn} de V, seguindo o procedimento descrito em seguida e
conhecido como processo de ortogonalização de Gram-Schmidt. Defina
w1 = v1.
Agora escreva
e determine o escalar β12 para que a condição de ortogonalidade hw1, w2i = 0 seja satis-
feita. Substitua w2 por v2− β12w1 nesta condição para obter
β12 = hw1, v2i hw1, w1i
. Em seguida, considere
w3 = v3− β13w1− β23w3
e determine β13e β23para tornar w3 ortogonal a w1 e w2. Das condições de ortogonalidade
hw1, w3i = 0 e hw2, w3i = 0 calcule β13= hw1, v3i hw1, w1i e β23= hw2, v3i hw2, w2i .
Prosseguindo com este raciocínio, se chega a um conjunto ortogonal {w1, . . . , wn} de
vetores que é base de V. Observe que os vetores w1, w2, . . . , wnsão definidos recursivamente
por w1 = v1 e wk = vk− β1kw1− · · · − βk−1,kwk−1 para k = 2, . . . , n, onde βik = hwi, vki hwi, wii .
A partir da base ortogonal {w1, . . . , wn} pode-se determinar uma base ortonormal {q1,
. . . , qn}, onde qi = wi/ kwik . Esta base ortonormal pode ser obtida ao mesmo tempo em
que se obtém a base ortogonal. Comece com
w1 = v1 e q1 = w1/ kw1k
e continue com o processo de ortogonalização, tomando
w2 = v2− r12q1 e q2 = w2/ kw2k ,
w3 = v3− r13q1 − r23q2 e q3 = w3/ kw3k ,
e assim por diante, até que, num passo genérico k,
wk = vk− r1kq1− · · · − rk−1,kqk−1 e qk = wk/ kwkk ,
onde
rik = hqi, vki ,
Exemplo 4.12 Os ternos ordenados (1, 0, 0), (0, 3/5, 4/5), (0, 4/5, −3/5) formam uma base ortonormal no espaço vetorial Cnem relação ao produto interno
h (a1, a2, a3), (b1, b2, b3) i = ¯a1b1+ ¯a2b2+ ¯a3b3.
Exemplo 4.13 Os polinômios 1, x, x2 formam uma base ortonormal no espaço vetorial sobre C dos polinômios de grau menor ou igual a 2 e coeficientes complexos, munido com o produto interno
a1+ a2x + a3x2, b1+ b2x + b3x2®= ¯a1b1 + ¯a2b2+ ¯a3b3.
Exemplo 4.14 Considere o espaço vetorial sobre C dos polinômios com coeficientes com- plexos de grau menor ou igual a 3, com o produto interno
hf, gi = Z 1
−1
f(x)g(x)dx.
O conjunto {1, x, x2, x3} é uma base não ortogonal deste espaço vetorial. A base ortogonal
obtida a partir dela, usando o procedimento de Gram-Schmidt, é { 1, x, x2− 1/3, x3 − (3/5)x }.
Este procedimento pode ser estendido para o espaço vetorial dos polinômios de grau menor ou igual a n.
Denotemos por p0(x), p1(x), p2(x), . . . os polinômios obtidos de 1, x, x2, . . . pelo
processo de ortogonalização de Gram-Schmidt, usando o produto interno definido acima. Os polinômios Lk(x) = pk(x)/pk(1) continuam ortogonais dois a dois e são denominados
de polinômios de Legendre. Os quatro primeiros são L0(x) = 1, L1(x) = x, L2(x) = 3 2x 2 − 12, L3(x) = 5 2x 3 −32x. Tanto {1, x, x2, x3} quanto {L
0(x), L1(x), L2(x), L3(x)} são bases do espaço dos polinômios
de grau menor ou igual a 3. A segunda possui a vantagem de ser ortogonal, o que a torna mais adequada para determinados cálculos. Os métodos espectrais usam polinômios ortog- onais para resolver equações diferenciais parciais tanto analítica quanto numericamente.
4.6
Decomposição QR
Vamos analisar o caso especial do espaço vetorial complexo Cn×1 com o produto interno
hx, yi = x∗y.
Seja A = [v1, . . . , vn] uma matriz m × n cujo coluna k é vk. Um modo interessante
de olhar para o produto Ax, onde x = [x1, . . . , xn]T é uma matriz em Cm×1 consiste em
escrever
e observar que Ax é uma combinação linear das colunas de A.
Mantendo a notação do parágrafo anterior, sendo b uma matriz coluna em Cm×1, a
igualdade matricial Ax = b, pode ser escrita na forma b = x1v1+ · · · + xnvn
que pode ser interpretada do seguinte modo: x é a matriz de b na base formada pelas colunas de A. Se as colunas de A forem linearmente independentese b estiver na imagem de A, a decomposição é única.
Ainda uma última observação, sendo A = [v1, . . . , vn], então
A∗ = v1∗ ... vn∗ e A∗A = v∗ 1v1 v1∗v2 v1∗vn v2∗v1 v2∗v2 v2∗vn v∗ nv1 v∗nv2 vn∗vn = [v∗ivj] .
Se {q1, . . . , qn} for uma base ortonormal em Cn×1, então qi∗qj = δij. A matriz quadrada
Q = [q1, . . . , qn], cuja coluna k é qk, é unitária pois Q∗Q = [qi∗qj] = [δij] = I. Conclusão,
quando as colunas de uma matriz quadrada formarem uma base ortonormal de Cn×1, ela
é unitária.
Vamos iniciar com um caso particular, em que n = 3. Seja {v1, v2, v3} uma base de
C3×1 e {q1, q2, q3} a base ortonormal de C3×1 obtida pelo processo de ortogonalização de Gram-Schmidt. Seja A = [v1, v2, v3] a matriz cuja coluna k é vk e Q = [q1, q2, q3] a
matriz cuja coluna k é qk. Sabemos, pelo desenvolvimento da seção anterior que
v1 = w1
v2 = r12q1+ w2
v3 = r13q1+ r23q2+ w3
onde rik = hqi, vki quando i 6= k ou ainda,
v1 = r11q1 v2 = r12q1+ r22q2 v3 = r13q1+ r23q2+ r33q3 com rkk = kwkk . Então, [v1, v2, v3] = [q1, q2, q3] r033 rr1233 rr1323 0 0 r33
ou A = QR, onde Q é uma matriz unitária e R = r033 rr1233 rr1323 0 0 r33
é triangular superior. Esta é a chamada decomposição QR de uma matriz A,
Motivados por esse exemplo, vamos mostrar um processo para obter a decomposição QR de uma matriz A em Cm×n, analizando dois casos separadamente. No primeiro, todas
as colunas de A são linearmente independentes e, no segundo caso, nem todas as colunas de A são linearmente independentes.
As colunas da matriz são linearmente independentes
Seja A = [v1, . . . , vn] uma matriz complexa de ordem m por n, cujas colunas v1, . . . , vn
são vetores linearmente independentes de Cm×1, o que exige m≥ n. Usando o processo
de ortogonalização de Gram-Schmidt, podemos escrever obter uma matriz Q = [q1, . . . ,
qn] cujas colunas formam uma base ortonormal para o espaço gerado pelas colunas de A
e onde
v1 = r11q1
v2 = r12q1+ r22q2
v3 = r13q1+ r23q2+ r33q3
· · ·
Essas igualdades escritas na forma matricial resultam em [v1, v2, v3, . . . , vn] = [q1, q2, q3, . . . , qn] r11 r12 r13 · · · 0 r22 r23 · · · 0 0 r33 · · · · · · · . que se resume em A = ˆQ ˆR denominada decomposição QR reduzida de A.
Nesta decomposição, observe que o espaço hv1i , gerado por v1 é igual ao espaço hq1i
gerado por q1, o espaço hv1, v2i gerado por v1 e v2 é igual ao espaço hq1, q2i gerado por q1,
q2, e assim por diante,
hq1i = hv1i ,
hq1, q2i = hv1, v2i ,
hq1, q2, q3i = hv1, v2, v3i ,
Completemos a base {q1, . . . , qn} com os vetores unitários qn+1, . . . , qm de modo que
{q1, . . . , qn, . . . , qm} seja uma base ortonormal de Cm. A matriz Q = [q1, . . . , qn, . . . , qm]
obtida pela inclusão de m − n colunas à direita de ˆQ e a matriz R obtida pela inclusão de m − n linhas nulas na parte inferior de R são tais que
A = QR
que é a chamada decomposição QR completa de A ou decomposição QR de A. Realizado este desenvolvimento, podemos descrever o algoritmo clássico de Gram- Schmidt, que possibilita a obtenção da decomposição QR de uma mariz A. Alertamos o leitor de que este algoritmo é numericamente instável.
================================
Algoritmo 8.1. Algoritmo clássico de Gram-Schmidt (instável) Entrada: Base {v1, . . . , vn} de Cn
Saída: Base ortonormal {q1, . . . , qn} de Cn
================================ for k = 1 to n wk = vk for i = 1 to k − 1 rik = q∗ivk wk = wk− rikqi rkk = kwkk qk = wk/rkk ================================ Solução de Ax = b usando a decomposição QR
Quando A é uma matriz quadrada de ordem m, cujas colunas são linearmente indepen- dentes, o sistema Ax = b possui uma única solução. Para resolver este sistema usando a decomposição QR, procedemos do seguinte modo:
1. Calcule a decomposição A = QR. 2. Determine y = Q∗b.
3. Resolva o sistema Rx = y na variável x.
As colunas da matriz são linearmente dependentes
Passemos ao caso em que m ≥ n e as colunas de A formam um conjunto linearmente dependente. Neste caso, lá pelas tantas, vk depende linearmente das colunas v1, . . . , vk−1,
à sua esquerda, ou seja,
e, para este valor de k,
wk = vk− r1kq1− r2kq2− · · · − rk−1,kqk−1 = 0.
Quando isto ocorre, escolhemos um vetor unitário qj, ortogonal aos vetores q1, . . . , qj−1,
obtendo um conjunto ortonormal {q1, . . . , qj−1, qj}.
Vejamos um exemplo em que A = [v1, v2, v3, v4]. Suponha que v1 e v2 são linearmente
independentes. Usando o método de ortogonalização de Gram-Schmidt, calculamos v1 = r11q1
v2 = r12q1+ r22q2
Supondo v3 no espaço gerado por {q1, q2}, tem-se
w3 = v3− r13q1− r23q2 = 0
e
v3 = r13q1+ r23q2
Daí, escolhe-se de modo arbitrário um q3 unitário, ortogonal a q1 e a q2. Com esta escolha,
{q1, q2, q3} é ortonormal e o espaço que ele gera contém o espaço gerado por {v1, v2, v3}.
Se v4 não pertencer ao espaço gerado por {q1, q2, q3}, Calcula-se
q4 = 1 r44 (v4− r14q1− r24q2− r34q3) quando então [v1, v2, v3, v4] = [q1, q2, q3, q4] r11 r12 r13 r14 0 r22 r23 r24 0 0 0 r34 0 0 0 r44
onde se observa que a matriz da direita é triangular superior. Note-se que o espaço gerado por {q1, q2, q3, q4} contém o espaço gerado por {v1, v2, v3, v4}.
No caso genérico, este procedimento continua, até obter as matrizes ˆQ e ˆR. As colunas da matriz ˆQ = [q1, . . . , qn], de ordem m por n, são vetores ortogonais entre si e possuem
módulo unitário. A matriz ˆR, de ordem n por n, é triangular superior. Para estas matrizes, A = ˆQ ˆR.
Esta fatoração de A é conhecida como decomposição QR reduzida de A.
Podemos acrescentar m−n colunas qn+1, . . . , qm à direita de ˆQ, de modo que {q1, . . . ,
qn, . . . , qm} seja uma base ortonormal de Cm e assim, obter uma matriz unitária Q = [q1,
. . . , qn, . . . , qm], de ordem m por m, cujas colunas formam uma base ortonormal de Cm.
Na continuação, devemos acrescentar m − n linhas nulas na parte inferior de ˆR, obtendo uma matriz R, de ordem m por n, triangular superior. As matrizes Q e R assim obtidas são de tal forma que
Esta é a decomposição QR completa de A ou apenas decomposição QR de A. Quando m < n, o procedimento é semelhante ao anterior. A decomposição se encerra quando obtemos o conjunto de m vetores B = {q1, . . . , qm}, que formam uma base
ortonormal de Cm. A matriz quadrada Q = [q
1, . . . , qm], de ordem m, e a matriz triangular
superior R de ordem m por n, obtidas no desenrolar do processo são tais que A = QR.
Este produto é conhecido como decomposição QR completa da matriz A ou decomposição QR de A. Exemplo 4.15 A decomposição QR de −1 3 01 0 1 0 1 2 é −1/ √ 2 3/√22 −1/√11 1/√2 3/√22 −1/√11 0 2/√22 3/√11 √ 2 −3/√2 1/√2 0 11/√22 7/√22 0 0 5/√11 . Exemplo 4.16 A decomposição QR de −1 31 0 0 1 é −1/ √ 2 3/√22 1/√11 1/√2 3/√22 1/√11 0 p2/11 −3/√11 √ 2 −3/√2 0 p11/2 0 0 Exemplo 4.17 A decomposição QR de 1 1 2 0 1 1 1 0 1 0 2 0 é 1/√2 1/√22 2/√33 3/√3 0 2/√22 4/√33 −3/√3 1/√2 −1/√22 −2/√33 −3/√3 0 4/√22 −3/√33 0 √ 2 1/√2 3/√2 0 1/√22 3/√22 0 0 6/√33 0 0 0 Exemplo 4.18 A decomposição QR de 1 1 2 0 1 1 1 0 1 0 0 0
é 1/√2 1/√6 1/√3 0 0 2/√6 −1√3 0 1/√2 −1/√6 −1√3 0 0 0 0 1 √ 2 1/√2 3/√2 0 3/√6 3/√6 0 0 0 0 0 0 Exemplo 4.19 A decomposição QR de 1 1 2 00 1 1 1 1 0 1 3 é A = QR, onde Q = 1/ √ 2 1/√6 1/√3 0 2/√6 −1/√3 1/√2 −1/√6 −1/√3 e R = √ 2 1/√2 3/√2 3/√2 0 3/√6 3/√6 −1/√6 0 0 0 −4/√3 .
Soma de subespaços
Sejam V1, . . . , Vk subespaços vetoriais de V. O conjunto
V1+ · · · + Vk = { v1+ · · · + vk: vi ∈ Vi para i = 1, . . . , k }
é um subespaço vetorial de V e recebe o nome de soma de V1, . . . , Vk.
Teorema 5.1 Sejam V e W dois subespaços de um espaço vetorial U. Então dim(V + W ) = dim(V ) + dim(W )− dim(V ∩ W ).
Prova. Quando V está contido em W, então V ∩ W = V e V + W = W. Neste caso, dim(V ) + dim(W )− dim(V ∩ W ) = dim(V ) + dim(W ) − dim(V ) = dim(W ) o que prova o teorema para este caso particular. Do mesmo modo se prova que o teorema vale quando W está contido em V.
Vamos agora tratar o caso em que V ∩ W é diferente de V e de W. Seja B1 = {u1, . . . ,
up} uma base de V ∩ W. Vamos completá-la de modo que B2 = {u1, . . . , up, v1, . . . , vq}
seja base de V e B3 = {u1, . . . , up, w1, . . . , wr} seja base de W. O conjunto B4 = {u1,
. . . , up, v1, . . . , vq, w1, . . . , wr} gera V + W e, se for linearmente independente, será base
de V + W. Neste caso,
dim(V + W ) = p + q + r = (q + p) + (r + p)− p = dim(V ) + dim(W )− dim(V ∩ W ) e o teorema estará provado.
Falta provar que B4 é linearmente independente. Vamos mostrar que, se x1, . . . , xp,
y1, . . . , yq, z1, . . . , zr forem escalares tais que
x1u1+ · · · + xpup+ y1v1+ · · · + yqvq+ z1w1+ · · · + zrwr = 0,
então todos eles são nulos. Analisemos esta possibilidade. Se algum yj for diferente de
zero, o vetor não nulo y1v1+ · · · + yqvq seria uma combinação linear dos elementos de
B3. Logo, ele estaria em W e em V ao mesmo tempo, estando na interseção V ∩ W
e assim y1v1+ · · · + yqvq poderia ser escrito como uma combinação linear de u1, . . . ,
up, contrariando a hipótese de B2 ser base. Do mesmo modo não podemos ter um zk
diferente de zero. Logo, yj e zk são todos nulos e a equação se reduz a x1u1+ · · · + xpup =
0. Sendo B1 uma base, concluímos que x1, . . . , xp são todos nulos. Daí B4 é linearmente
independente. ¤
5.1
Soma direta
Definição 5.2 Sejam V1, . . . , Vk subespaços vetoriais de V. Se todo v em V puder ser
escrito de forma única como uma soma do tipo v = v1+ · · · + vk
onde vi ∈ Vi, diremos que V é uma soma direta dos subespaços V1, . . . , Vke escreveremos
V = V1⊕ · · · ⊕ Vk.
Se V = V1⊕ V2, então V1 e V2 são denominados complementares.
Dois subespaços vetoriais V1 e V2 de V são disjuntos se a interseção V1∩ V2 contiver
apenas o zero.
Teorema 5.3 Sejam V1 e V2 subespaços vetorias de V tais que V = V1+ V2. Então V =
V1⊕ V2 se e só se V1, V2 forem disjuntos.
Prova. Se V = V1⊕ V2, seja v um vetor de V na interseção de V1 e V2. Então
v = v|{z} ∈V1 + 0|{z} ∈V2 = 0|{z} ∈V1 + v|{z} ∈V2
e, como a decomposição é única, v = 0, provando que V1 e V2 são disjuntos.
Se V1 e V2 forem disjuntos, como V = V1+ V2, todo v em V pode ser decomposto
numa soma v = v1+ v2, com v1 em V1 e v2 em V2. Se houvesse outra decomposição v =
w1+ wk, com w1 em V1 e w2 em V2, então v1+ v2 = w1+ w2 e assim, v1 − w1 = w2−
v2. Sendo v1− w1 um vetor de V1 igual a w2− v2, um vetor de V2, então v1− w1 está na
interseção de V1 com V2 e, como estes dois subespaços são disjuntos, v1− w1 = 0 ou v1 =
w1. Com este resultado, obtemos w2− v2 = 0 ou v2 = w2, provando que a decomposição
de v numa soma de um elemento de V1 com um elemento de V2 é única e assim, V = V1⊕
V2. ¤
Quando V igual à soma de mais do que dois subespaços, o fato de os espaços envolvidos serem disjuntos dois a dois não é suficiente para garantir que V seja a soma direta desses subespaços como nos mostra o exemplo a seguir.
Exemplo 5.4 Seja V = R2 e V1 = {(x, 0)∈ R2 : x∈ R}, V
2 = {(0, y) ∈ R2 : y ∈ R},
V3 = {(x, x) ∈ R2 : x ∈ R}. Estes três subespaços são disjuntos dois a dois, V = V1+
V2+ V3, mas V não é a soma direta de V1, V2 e V3.
A condição de serem disjuntos será substituida pela condição de serem independentes. Os subespaços vetoriais V1, . . . , Vk de V são independentes se
v1+ · · · + vk= 0,
com vi em Vi, para i = 1, . . . , k, então v1 = · · · = vk = 0.
Uma caracterização da independência dos subespaços é a seguinte: Os subespaços V1,
. . . , Vk são independentes se e só se Vj for disjunto da soma V1+ · · · + Vj−1, para j = 2,
. . . , k. Dois espaços vetoriais V1 e V2 de V são independentes se e só se forem disjuntos.
Teorema 5.5 Sejam V1, . . . , Vk subespaços vetoriais de um espaço vetorial V tais que
V = V1+ · · · + Vk. Então V = V1⊕ · · · ⊕ Vk se e só se V1, . . . , Vk forem independentes.
Prova. Se V = V1⊕ · · · ⊕ Vk, sejam v1, . . . , vkvetores de V1, . . . , Vk, respectivamente,
e tais que v1+ · · · + vk = 0. Como 0 = 0+ · · · + 0, da unicidade da decomposição,
concluímos que vi = 0 para i = 1, . . . , k. Logo, V1, . . . , Vk são independentes.
Se V = V1+ · · · + Vk e V1, . . . , Vk forem independentes, todo v em V pode ser
decomposto numa soma v = v1+ · · · + vk, com vi em Vi, para i = 1, . . . , k. Se houvesse
outra decomposição v = w1+ · · · + wk, com wi em Vi, então (v1− w1)+ · · · + (vk− wk) =
0 e, da independência dos subespaços vetoriais Vi, concluímos que vi = wi, para i = 1,
. . . , k. Logo, a decomposição de v como soma de vetores de V1, . . . , Vk é única e V = V1⊕
· · ·⊕ Vk. ¤
Teorema 5.6 Sejam V1, . . . , Vk subespaços vetoriais de V, um espaço vetorial com di-
mensão finita. Se V = V1 ⊕ · · · ⊕Vk então
dim V = dim V1+ · · · + dim Vk.
Prova. Seja Bi base de Vi para i = 1, . . . , k.
Se V = V1⊕ · · · ⊕Vk, todo v em V pode ser decomposto de forma única numa soma
v = v1+ · · · + vk, com vi em Vi, para i = 1, . . . , k. Cada vi pode ser decomposto de
forma única nos vetores da base Bi. Logo, v pode ser escrito de forma única como uma
combinação linear dos vetores da união B1∪ · · · ∪ Bk, provando que esta é uma base de
5.2
Complemento ortogonal
Definição 5.7 Seja V um espaço vetorial com produto interno e S um subespaço vetorial de V. O conjunto
S⊥= {v ∈ V : hv, si = 0 para todo s em S } é um subespaço de V, chamado de complemento ortogonal de S.
Para mostrar que um determinado vetor v está em S⊥, basta mostrar que ele é ortog-
onal a todo vetor de uma base de S. O único vetor que está ao mesmo tempo em S e em S⊥ é o vetor nulo e daí,
S∩ S⊥ = {0}.
Teorema 5.8 Seja S um subespaço vetorial de dimensão finita de um espaço vetorial V com produto interno. Então V = S ⊕ S⊥.
Prova. Seja {v1, . . . , vp} uma base ortonormal de S. Dado qualquer v em V, o vetor
w = v− hv1, vi v1− · · · − hvp, vi vp
é ortogonal a todo vetor de S. Desta forma, qualquer vetor v pode ser decomposto numa soma v = s+ w, onde s = hv1, vi v1+ · · · + hvp, vi vp pertence a S e w pertence a S⊥ e
assim, V = S+ S⊥.
Vamos mostrar que esta decomposição é única. Se v = s1+ w1, com s1 em S e w1 em
S⊥, então s + w = s
1+ w1 e assim, s − s1 = w1− w, mostrando que os vetores s − s1 e
w1− w estão na interseção S ∩ S⊥. Como a interseção só possui o vetor nulo, s = s e w =
w. ¤
Se v é um vetor de um subespaço S de um espaço vetorial V, então v é ortogonal a todo vetor de S⊥ e assim ele pertence ao ¡S⊥¢⊥, mostrando que S está contido no
complemento ortogonal do complemento ortogonal de S, isto é, S ⊂ ¡S⊥¢⊥. Por outro
lado, V = S⊕S⊥= S⊥⊕¡S⊥¢⊥e assim, dim V = dim S+ dim S⊥ = dim S⊥+ dim¡S⊥¢⊥,
que acarreta na igualdade dim S = dim¡S⊥¢⊥. Estando S contido em¡S⊥¢⊥ e possuindo ambos a mesma dimensão, eles são iguais
¡
Transformação adjunta
Sejam V e W espaços vetoriais complexos com dimensão finita e produto interno. Dado uma tansformação linear L : V → W, vamos mostrar que existe uma única transformação linear L∗ : W → V tal que
hLv, wi = hv, L∗wi . para todo v em V e w em W.
Primeiro a existência. Sendo B1 = {v1, . . . , vn} uma base ortonormal de V e B2 =
{w1, . . . , wm} uma base ortonormal de W podemos escrever Lvj, para j = 1, . . . , n, como
uma combinação linear dos elementos de B2
Lv1 = a11w1+ a21w2+ · · · + am1wm
Lv2 = a12w1+ a22w2+ · · · + am2wm
· · ·
Lvn = a1nw1+ a2nw2+ · · · + amnwm
Para definir uma transformação linear, basta estabelecer seu valor nos elementos de uma base do seu domínio. Seja L∗ : W → V aquela transformação linear que leva w
i, para i =
1, 2, . . . , m, nos seguintes vetores de V
L∗w1 = ¯a11v1+ ¯a12v2+ · · · + ¯a1nvn
L∗w2 = ¯a21v1+ ¯a22v2+ · · · + ¯a2nvn
· · ·
L∗wm = ¯am1v1+ ¯am2v2+ · · · + ¯amnvn
Usando o símbolo de somatório, os valores das transformações lineares L e L∗ nas bases
de seus respectivos domínios se escrevem Lvj = m X i=1 aijwi L∗wi = n X j=1 ¯ aijvj. 81
Da ortonormalidade das bases B1 e B2, segue hLvj, wii = hvj, L∗wii fazendo com que
hLv, wi = hv, L∗wi para todo v em V e w em W, o que prova a existência.
Agora a unicidade. Se T : W → V for outra transformação linear para a qual hLv, wi = hv, T wi
para todo v em V e w em W, então
hv, L∗wi = hv, T wi ou
hv, (L∗− T )wi = 0
ainda para todo v em V e w em W. Fazendo v = (L∗− T )w, obtemos
h (L∗− T )w, (L∗− T )w i = 0
ou (L∗− T )w = 0 para todo w em W, mostrando que T = L∗, o que prova a unicidade.
A transformação linear L∗ recebe o nome de transformação adjunta de L.
Se L : V → W e T : W → U forem duas transformações lineares, então (T L)∗ = L∗T∗.
Se A = [aij] for a matriz de L : V → W e B = [bij] for a matriz de L∗ : W → V nas
bases ortonormais B1 e B2 de V e W, respectivamente, então bij = ¯aji e
B = A∗.
Esta relação entre as matrizes de L e L∗ só se verifica se as bases forem ortonormais, como
nos mostra o próximo exemplo.
Este conceito de transformação adjunta se aplica a transformações lineares entre es- paços vetoriais reais. Neste caso, os escalares serão reais e ¯aij = aij e
Exemplo 6.1 Seja L(x, y) = (2x + 3y, 5x + 7y, 11x + 13y) uma transformação linear do R2 no R3. Consideremos nestes dois espaços seus respectivos produtos internos euclidianos
h (x1, y1), (x2, y2) i = x1x2+ y1y2
e
h (x1, y1, z1), (x2, y2, z2) i = x1x2+ y1y2+ z1z2.
Seja B1 = {e1, e2} a base canônica do R2e B2 = (f1, f2, f3) a base canônica do R3 que são
ortonormais em relação aos produtos internos euclidianos de R2 e R3, respectivamente.
Temos
Le1 = 2f1+ 5f2+ 11f3
e L∗f1 = 2e1+ 3e2 L∗f2 = 5e1+ 7e2 L∗f3 = 11e1 + 13e2 de modo que [L]12= 25 37 11 13 , [L∗]21 = · 2 5 11 3 7 13 ¸ onde uma é a transposta da outra.
Entretanto, se v1 = (1, 2), v2 = (0, 1), w1 = (1, 1, 1), w2 = (0, 1, 2) e w3 = (0, 0, 1)
então B3 = {v1, v2} será base de R2 e B4 = {w1, w2, w3} será base de R3. Nenhuma das
duas é ortonormal em relação ao produto interno euclidiano do R2 e R3. O leitor poderá
verificar que Lv1 = 8w1+ 11w2+ 7w3 Lv2 = 3w1+ 4w2 + 2w3 e L∗w1 = 18v1− 13v2 L∗w2 = 27v1− 21v2 L∗w3 = 11v1− 9v2 As matrizes [L]34= 11 48 3 7 2 e [L∗]43= · 18 27 11 −13 −21 −9 ¸ não são mais uma a adjunta da outra.
Dada a transformação linear L, a transformação adjunta L∗ é a única que satisfaz
à igualdade hLv, wi = hv, L∗wi para todo v em V e todo w em W. De fato, se T for
outra transformação linear para a qual hLv, wi = hv, T wi para todo v e todo w, então hv, T wi = hv, L∗wi e hv, T w− L∗wi = 0 para todo v o que acarreta na igualdade T w =
L∗w para todo w, nos conduzindo à igualdade T = L∗. Para todo v em V e w em W, tem-se
hL∗w, vi = hv, L∗wi = hLv, wi = hw, Lvi ,
mostrando que a adjunta da adjunta é igual a L, isto é, (L∗)∗ = L.
Um operador linear L : V → V é auto-adjunto quando L∗ = L.
Exemplo 6.2 Sejam x = (x1, x2, x3) e y = (y1, y2, y3) dois pontos do R3, consideremos o
produto interno hx, yi = x1y2+ x2y2+ x2y3. Em relação a este produto interno, o operador
linear L : R3 → R3 definido por L(x, y, z) = (2x+ 3y+ 5z, 3x+ y, 5x+ 4z) é auto-adjunto
pois L∗ = L.
Teorema 6.3 Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L, vale a relação
Im (L)⊥ = ker(L∗).
Prova. Se w ∈ Im (L)⊥, então hLv, wi = 0 ou hv, L∗wi = 0 para todo v ∈ V de onde
se conclui que L∗w = 0 mostrando que w está no ker(L∗).
Reciprocamente, se w ∈ ker(L∗), então hLv, wi = hv, L∗wi = hv, 0i = 0 para todo
v ∈ V, provando, deste modo, que w é ortogonal a todo elemento da imagem de L. Conclui-se que w pertence ao complemento ortogonal da Im (L). ¤
Como L∗∗= L, substituindo L por L∗ na igualdade acima, segue
Im (L∗)⊥= ker(L) ou
Im (L∗) = ker(L)⊥
Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L,
V = ker(L)⊕ Im (L∗).
Esta igualdade ocorre porque V = ker(L) ⊕ ker(L)⊥ = ker(L)⊕ Im (L∗).
Quando L é auto-adjunta,
Im (L)⊥ = ker(L).
Teorema 6.4 Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L,
1. Im (L) = Im (LL∗).
2. ker(L∗) = ker(LL∗).
Prova. 1a. Inicialmente provaremos que Im LL∗ ⊂ Im L. Se w ∈ Im (LL∗), então existe um w1 tal que w = LL∗w1 = L(L∗w1) provando que w ∈ Im (L).
1b. Vamos provar agora que Im (L) ⊂ Im (LL∗). Se w ∈ Im (L), então w = Lv para
algum v em V. Podemos escrever de modo único v = v1 + v2 onde v1 ∈ Im (L∗) e v2 ∈
ker(L). Logo w = Lv = Lv1+ Lv2 = Lv1. Como v1 ∈ ker(L)⊥ = Im (L∗), existe w1 tal que
v1 = L∗w1 e assim w = LL∗w1, mostrando que w ∈ Im (LL∗), o que completa a prova da
2a. Se w ∈ ker(L∗) então L∗w = 0 e, em consequência, LL∗w = 0, provando que
ker(L∗) ⊂ ker(LL∗).
2b. Se w ∈ ker(LL∗) então L(L∗w) = 0 e L∗w pertence ao ker(L) e à Im (L∗) cuja
interseção contém apenas o zero. Logo, L∗w = 0, provando que w está no ker(L∗). Com
isto, provamos que ker(LL∗) ⊂ ker(L∗), o que completa a prova da parte 2 do teorema.
¤
Resumindo: Para uma transformação linear L : V → W e sua adjunta L∗ : W → V valem as identidades
(L∗)∗ = L Im (L∗) = ker(L)⊥ Im (LL∗) = Im (L), ker(LL∗) = ker(L∗).
Definição 6.5 Seja V um espaço vetorial com produto interno. O operador linear L : V → V é antiadjunto quando L∗ =−L e unitário quando L∗ = L−1.
Teorema 6.6 Numa base ortonormal, a matriz A = [aij] de um operador auto-adjunto é
hermitiana (A = A∗), a de um operador antiadjunto é antihermitiana (A =−A∗) e a
de um operador unitário é unitária (A∗ = A−1).
Teorema 6.7 O operador linear L : V → V é unitário se e só se, para todo v1 e v2 em V,
hLv1, Lv2i = hv1, v2i .
Para fixar a nomenclatura, apresentamos o quadro abaixo. Espaço Real Espaço Complexo Operador Matriz Operador Matriz auto-adjunto simétrica auto-adjunto hermitiana antiadjunto anti-simétrica antiadjunto antihermitiana ortogonal ortogonal unitário unitária
6.1
Posto de uma transformação linear
Definição 6.8 Sejam V e W espaços vetoriais e L : V → W uma transformação linear. A dimensão da imagem de L é chamada de posto de L.
Sendo A uma matriz complexa de ordem m por n. Considerada como uma trans- formação linear de Cn em Cm, seu posto é igual ao número de colunas linearmente
independentes que A possui.
O número de colunas linearmente independentes de uma matriz é igual ao número de suas linhas linearmente independente.
Teorema 6.9 Sejam V e W espaços vetoriais de dimensão finita e L : V → W uma transformação linear. Seja A a representação matricial de L em relação a bases de V e de W. O posto de L é igual ao posto de A.
Exemplo 6.10 Seja L : R3 → R3 definida por
L(x, y, z) = ( x + 2y− z, 2x + 4y − 2z, y + 2z ) = (x + 2y− z)(1, 2, 0) + (y + 2z)(0, 0, 1), cujo posto é 2. A matriz de L em relação à base canônica do R3 é
A = 1 22 4 −1−2 0 1 2
a primeira e terceira linha são linearmente independentes e a segunda é o dobro da primeira. As duas primeiras colunas são linearmente independentes e a terceira é igual a −5 vezes a primeira mais 2 vezes a segunda. O posto de A é dois.
Teorema 6.11 Sejam V e W espaços vetoriais com produto interno e dimensão finita. Seja L : V → W linear. O posto das transformações lineares L, L∗, L∗L e LL∗ são iguais.
Prova. Sabemos que
V = ker(L)⊕ Im (L∗), de onde obtemos
dim ker(L) + dim Im (L∗) = dim V. Por outro lado,
dim ker(L) + dim Im (L) = dim V.
Dessas duas igualdades concluímos que dim Im (L∗) = dim Im (L) provando que o posto
de L é igual ao posto de L∗.
Como Im (LL∗) = Im (L) e Im (L∗L) = Im (L∗), o teorema está provado. ¤
Corolário 6.12 Seja A uma matriz complexa. As matrizes A, A∗, AA∗ e A∗A possuem
o mesmo posto.
Sejam V e W espaços vetoriais, ambos com dimensão finita. A imagem de uma transformação linear L : V → W está contida em W. Portanto, o posto de L deve ser menor ou igual do que a dimensão de W. Se {v1, . . . , vn} for uma base de V, qualquer
vetor v em V pode ser decomposto de modo único como uma combinação linear v = x1v1+ · · · + xnvn e assim, Lv = L(x1v1+ · · · + xnvn) = x1Lv1+ · · · + xnLvn, mostrando
que {Lv1, . . . , Lvn} gera a imagem de L o que assim o posto de L deve ser menor ou
igual do que a dimensão de V. Concluímos que o posto de L não pode ser maior do que a dimensão de V nem maior do que a dimensão de W. Motivados por este comentário, diremos que L tem posto máximo quando o posto de L for igual ao mínimo entre a dimensão de V e a dimensão de W.
Teorema 6.13 Sejam V e W espaços vetoriais com dimensão finita, ambos com produto interno. Seja L : V → W uma transformação linear com posto máximo.
1. Quando dim V ≤ dim W, a transformação linear L∗L : V → V é um isomorfismo.
2. Quando dim W ≤ dim V, a transformação linear LL∗ : W → W é um isomorfismo.
Prova. Quando
1. posto(L) = dim V ≤ dim W, então dim Im (L∗L) = dim Im (L) = dim(V ) e assim
L∗L é sobrejetora e, portanto, um isomorfismo.
2. posto(L) = dim W ≤ dim V, então dim Im (LL∗) = dim Im (L∗) = dim(W ) e assim
LL∗ é sobrejetora e, portanto, um isomorfismo. ¤