• No results found

CHAPTER 7: DISCUSSION

7.2 D ISCUSSION OF THE STUDY FINDINGS

Podemos, a partir de uma base {v1, . . . , vn} uma base de um espaço vetorial V, obter

uma base ortogonal {w1, . . . , wn} de V, seguindo o procedimento descrito em seguida e

conhecido como processo de ortogonalização de Gram-Schmidt. Defina

w1 = v1.

Agora escreva

e determine o escalar β12 para que a condição de ortogonalidade hw1, w2i = 0 seja satis-

feita. Substitua w2 por v2− β12w1 nesta condição para obter

β12 = hw1, v2i hw1, w1i

. Em seguida, considere

w3 = v3− β13w1− β23w3

e determine β13e β23para tornar w3 ortogonal a w1 e w2. Das condições de ortogonalidade

hw1, w3i = 0 e hw2, w3i = 0 calcule β13= hw1, v3i hw1, w1i e β23= hw2, v3i hw2, w2i .

Prosseguindo com este raciocínio, se chega a um conjunto ortogonal {w1, . . . , wn} de

vetores que é base de V. Observe que os vetores w1, w2, . . . , wnsão definidos recursivamente

por w1 = v1 e wk = vk− β1kw1− · · · − βk−1,kwk−1 para k = 2, . . . , n, onde βik = hwi, vki hwi, wii .

A partir da base ortogonal {w1, . . . , wn} pode-se determinar uma base ortonormal {q1,

. . . , qn}, onde qi = wi/ kwik . Esta base ortonormal pode ser obtida ao mesmo tempo em

que se obtém a base ortogonal. Comece com

w1 = v1 e q1 = w1/ kw1k

e continue com o processo de ortogonalização, tomando

w2 = v2− r12q1 e q2 = w2/ kw2k ,

w3 = v3− r13q1 − r23q2 e q3 = w3/ kw3k ,

e assim por diante, até que, num passo genérico k,

wk = vk− r1kq1− · · · − rk−1,kqk−1 e qk = wk/ kwkk ,

onde

rik = hqi, vki ,

Exemplo 4.12 Os ternos ordenados (1, 0, 0), (0, 3/5, 4/5), (0, 4/5, −3/5) formam uma base ortonormal no espaço vetorial Cnem relação ao produto interno

h (a1, a2, a3), (b1, b2, b3) i = ¯a1b1+ ¯a2b2+ ¯a3b3.

Exemplo 4.13 Os polinômios 1, x, x2 formam uma base ortonormal no espaço vetorial sobre C dos polinômios de grau menor ou igual a 2 e coeficientes complexos, munido com o produto interno

­

a1+ a2x + a3x2, b1+ b2x + b3x2®= ¯a1b1 + ¯a2b2+ ¯a3b3.

Exemplo 4.14 Considere o espaço vetorial sobre C dos polinômios com coeficientes com- plexos de grau menor ou igual a 3, com o produto interno

hf, gi = Z 1

−1

f(x)g(x)dx.

O conjunto {1, x, x2, x3} é uma base não ortogonal deste espaço vetorial. A base ortogonal

obtida a partir dela, usando o procedimento de Gram-Schmidt, é { 1, x, x2− 1/3, x3 − (3/5)x }.

Este procedimento pode ser estendido para o espaço vetorial dos polinômios de grau menor ou igual a n.

Denotemos por p0(x), p1(x), p2(x), . . . os polinômios obtidos de 1, x, x2, . . . pelo

processo de ortogonalização de Gram-Schmidt, usando o produto interno definido acima. Os polinômios Lk(x) = pk(x)/pk(1) continuam ortogonais dois a dois e são denominados

de polinômios de Legendre. Os quatro primeiros são L0(x) = 1, L1(x) = x, L2(x) = 3 2x 2 − 12, L3(x) = 5 2x 3 −32x. Tanto {1, x, x2, x3} quanto {L

0(x), L1(x), L2(x), L3(x)} são bases do espaço dos polinômios

de grau menor ou igual a 3. A segunda possui a vantagem de ser ortogonal, o que a torna mais adequada para determinados cálculos. Os métodos espectrais usam polinômios ortog- onais para resolver equações diferenciais parciais tanto analítica quanto numericamente.

4.6

Decomposição QR

Vamos analisar o caso especial do espaço vetorial complexo Cn×1 com o produto interno

hx, yi = x∗y.

Seja A = [v1, . . . , vn] uma matriz m × n cujo coluna k é vk. Um modo interessante

de olhar para o produto Ax, onde x = [x1, . . . , xn]T é uma matriz em Cm×1 consiste em

escrever

e observar que Ax é uma combinação linear das colunas de A.

Mantendo a notação do parágrafo anterior, sendo b uma matriz coluna em Cm×1, a

igualdade matricial Ax = b, pode ser escrita na forma b = x1v1+ · · · + xnvn

que pode ser interpretada do seguinte modo: x é a matriz de b na base formada pelas colunas de A. Se as colunas de A forem linearmente independentese b estiver na imagem de A, a decomposição é única.

Ainda uma última observação, sendo A = [v1, . . . , vn], então

A∗ =    v1∗ ... vn∗    e A∗A =     v∗ 1v1 v1∗v2 v1∗vn v2∗v1 v2∗v2 v2∗vn v∗ nv1 v∗nv2 vn∗vn     = [v∗ivj] .

Se {q1, . . . , qn} for uma base ortonormal em Cn×1, então qi∗qj = δij. A matriz quadrada

Q = [q1, . . . , qn], cuja coluna k é qk, é unitária pois Q∗Q = [qi∗qj] = [δij] = I. Conclusão,

quando as colunas de uma matriz quadrada formarem uma base ortonormal de Cn×1, ela

é unitária.

Vamos iniciar com um caso particular, em que n = 3. Seja {v1, v2, v3} uma base de

C3×1 e {q1, q2, q3} a base ortonormal de C3×1 obtida pelo processo de ortogonalização de Gram-Schmidt. Seja A = [v1, v2, v3] a matriz cuja coluna k é vk e Q = [q1, q2, q3] a

matriz cuja coluna k é qk. Sabemos, pelo desenvolvimento da seção anterior que

v1 = w1

v2 = r12q1+ w2

v3 = r13q1+ r23q2+ w3

onde rik = hqi, vki quando i 6= k ou ainda,

v1 = r11q1 v2 = r12q1+ r22q2 v3 = r13q1+ r23q2+ r33q3 com rkk = kwkk . Então, [v1, v2, v3] = [q1, q2, q3]   r033 rr1233 rr1323 0 0 r33  

ou A = QR, onde Q é uma matriz unitária e R =   r033 rr1233 rr1323 0 0 r33  

é triangular superior. Esta é a chamada decomposição QR de uma matriz A,

Motivados por esse exemplo, vamos mostrar um processo para obter a decomposição QR de uma matriz A em Cm×n, analizando dois casos separadamente. No primeiro, todas

as colunas de A são linearmente independentes e, no segundo caso, nem todas as colunas de A são linearmente independentes.

As colunas da matriz são linearmente independentes

Seja A = [v1, . . . , vn] uma matriz complexa de ordem m por n, cujas colunas v1, . . . , vn

são vetores linearmente independentes de Cm×1, o que exige m≥ n. Usando o processo

de ortogonalização de Gram-Schmidt, podemos escrever obter uma matriz Q = [q1, . . . ,

qn] cujas colunas formam uma base ortonormal para o espaço gerado pelas colunas de A

e onde

v1 = r11q1

v2 = r12q1+ r22q2

v3 = r13q1+ r23q2+ r33q3

· · ·

Essas igualdades escritas na forma matricial resultam em [v1, v2, v3, . . . , vn] = [q1, q2, q3, . . . , qn]     r11 r12 r13 · · · 0 r22 r23 · · · 0 0 r33 · · · · · · ·     . que se resume em A = ˆQ ˆR denominada decomposição QR reduzida de A.

Nesta decomposição, observe que o espaço hv1i , gerado por v1 é igual ao espaço hq1i

gerado por q1, o espaço hv1, v2i gerado por v1 e v2 é igual ao espaço hq1, q2i gerado por q1,

q2, e assim por diante,

hq1i = hv1i ,

hq1, q2i = hv1, v2i ,

hq1, q2, q3i = hv1, v2, v3i ,

Completemos a base {q1, . . . , qn} com os vetores unitários qn+1, . . . , qm de modo que

{q1, . . . , qn, . . . , qm} seja uma base ortonormal de Cm. A matriz Q = [q1, . . . , qn, . . . , qm]

obtida pela inclusão de m − n colunas à direita de ˆQ e a matriz R obtida pela inclusão de m − n linhas nulas na parte inferior de R são tais que

A = QR

que é a chamada decomposição QR completa de A ou decomposição QR de A. Realizado este desenvolvimento, podemos descrever o algoritmo clássico de Gram- Schmidt, que possibilita a obtenção da decomposição QR de uma mariz A. Alertamos o leitor de que este algoritmo é numericamente instável.

================================

Algoritmo 8.1. Algoritmo clássico de Gram-Schmidt (instável) Entrada: Base {v1, . . . , vn} de Cn

Saída: Base ortonormal {q1, . . . , qn} de Cn

================================ for k = 1 to n wk = vk for i = 1 to k − 1 rik = q∗ivk wk = wk− rikqi rkk = kwkk qk = wk/rkk ================================ Solução de Ax = b usando a decomposição QR

Quando A é uma matriz quadrada de ordem m, cujas colunas são linearmente indepen- dentes, o sistema Ax = b possui uma única solução. Para resolver este sistema usando a decomposição QR, procedemos do seguinte modo:

1. Calcule a decomposição A = QR. 2. Determine y = Q∗b.

3. Resolva o sistema Rx = y na variável x.

As colunas da matriz são linearmente dependentes

Passemos ao caso em que m ≥ n e as colunas de A formam um conjunto linearmente dependente. Neste caso, lá pelas tantas, vk depende linearmente das colunas v1, . . . , vk−1,

à sua esquerda, ou seja,

e, para este valor de k,

wk = vk− r1kq1− r2kq2− · · · − rk−1,kqk−1 = 0.

Quando isto ocorre, escolhemos um vetor unitário qj, ortogonal aos vetores q1, . . . , qj−1,

obtendo um conjunto ortonormal {q1, . . . , qj−1, qj}.

Vejamos um exemplo em que A = [v1, v2, v3, v4]. Suponha que v1 e v2 são linearmente

independentes. Usando o método de ortogonalização de Gram-Schmidt, calculamos v1 = r11q1

v2 = r12q1+ r22q2

Supondo v3 no espaço gerado por {q1, q2}, tem-se

w3 = v3− r13q1− r23q2 = 0

e

v3 = r13q1+ r23q2

Daí, escolhe-se de modo arbitrário um q3 unitário, ortogonal a q1 e a q2. Com esta escolha,

{q1, q2, q3} é ortonormal e o espaço que ele gera contém o espaço gerado por {v1, v2, v3}.

Se v4 não pertencer ao espaço gerado por {q1, q2, q3}, Calcula-se

q4 = 1 r44 (v4− r14q1− r24q2− r34q3) quando então [v1, v2, v3, v4] = [q1, q2, q3, q4]     r11 r12 r13 r14 0 r22 r23 r24 0 0 0 r34 0 0 0 r44    

onde se observa que a matriz da direita é triangular superior. Note-se que o espaço gerado por {q1, q2, q3, q4} contém o espaço gerado por {v1, v2, v3, v4}.

No caso genérico, este procedimento continua, até obter as matrizes ˆQ e ˆR. As colunas da matriz ˆQ = [q1, . . . , qn], de ordem m por n, são vetores ortogonais entre si e possuem

módulo unitário. A matriz ˆR, de ordem n por n, é triangular superior. Para estas matrizes, A = ˆQ ˆR.

Esta fatoração de A é conhecida como decomposição QR reduzida de A.

Podemos acrescentar m−n colunas qn+1, . . . , qm à direita de ˆQ, de modo que {q1, . . . ,

qn, . . . , qm} seja uma base ortonormal de Cm e assim, obter uma matriz unitária Q = [q1,

. . . , qn, . . . , qm], de ordem m por m, cujas colunas formam uma base ortonormal de Cm.

Na continuação, devemos acrescentar m − n linhas nulas na parte inferior de ˆR, obtendo uma matriz R, de ordem m por n, triangular superior. As matrizes Q e R assim obtidas são de tal forma que

Esta é a decomposição QR completa de A ou apenas decomposição QR de A. Quando m < n, o procedimento é semelhante ao anterior. A decomposição se encerra quando obtemos o conjunto de m vetores B = {q1, . . . , qm}, que formam uma base

ortonormal de Cm. A matriz quadrada Q = [q

1, . . . , qm], de ordem m, e a matriz triangular

superior R de ordem m por n, obtidas no desenrolar do processo são tais que A = QR.

Este produto é conhecido como decomposição QR completa da matriz A ou decomposição QR de A. Exemplo 4.15 A decomposição QR de   −1 3 01 0 1 0 1 2   é  −1/ √ 2 3/√22 −1/√11 1/√2 3/√22 −1/√11 0 2/√22 3/√11     √ 2 −3/√2 1/√2 0 11/√22 7/√22 0 0 5/√11   . Exemplo 4.16 A decomposição QR de   −1 31 0 0 1   é  −1/ √ 2 3/√22 1/√11 1/√2 3/√22 1/√11 0 p2/11 −3/√11     √ 2 −3/√2 0 p11/2 0 0   Exemplo 4.17 A decomposição QR de     1 1 2 0 1 1 1 0 1 0 2 0     é     1/√2 1/√22 2/√33 3/√3 0 2/√22 4/√33 −3/√3 1/√2 −1/√22 −2/√33 −3/√3 0 4/√22 −3/√33 0         √ 2 1/√2 3/√2 0 1/√22 3/√22 0 0 6/√33 0 0 0     Exemplo 4.18 A decomposição QR de     1 1 2 0 1 1 1 0 1 0 0 0    

é     1/√2 1/√6 1/√3 0 0 2/√6 −1√3 0 1/√2 −1/√6 −1√3 0 0 0 0 1         √ 2 1/√2 3/√2 0 3/√6 3/√6 0 0 0 0 0 0     Exemplo 4.19 A decomposição QR de   1 1 2 00 1 1 1 1 0 1 3   é A = QR, onde Q =   1/ √ 2 1/√6 1/√3 0 2/√6 −1/√3 1/√2 −1/√6 −1/√3   e R =   √ 2 1/√2 3/√2 3/√2 0 3/√6 3/√6 −1/√6 0 0 0 −4/√3   .

Soma de subespaços

Sejam V1, . . . , Vk subespaços vetoriais de V. O conjunto

V1+ · · · + Vk = { v1+ · · · + vk: vi ∈ Vi para i = 1, . . . , k }

é um subespaço vetorial de V e recebe o nome de soma de V1, . . . , Vk.

Teorema 5.1 Sejam V e W dois subespaços de um espaço vetorial U. Então dim(V + W ) = dim(V ) + dim(W )− dim(V ∩ W ).

Prova. Quando V está contido em W, então V ∩ W = V e V + W = W. Neste caso, dim(V ) + dim(W )− dim(V ∩ W ) = dim(V ) + dim(W ) − dim(V ) = dim(W ) o que prova o teorema para este caso particular. Do mesmo modo se prova que o teorema vale quando W está contido em V.

Vamos agora tratar o caso em que V ∩ W é diferente de V e de W. Seja B1 = {u1, . . . ,

up} uma base de V ∩ W. Vamos completá-la de modo que B2 = {u1, . . . , up, v1, . . . , vq}

seja base de V e B3 = {u1, . . . , up, w1, . . . , wr} seja base de W. O conjunto B4 = {u1,

. . . , up, v1, . . . , vq, w1, . . . , wr} gera V + W e, se for linearmente independente, será base

de V + W. Neste caso,

dim(V + W ) = p + q + r = (q + p) + (r + p)− p = dim(V ) + dim(W )− dim(V ∩ W ) e o teorema estará provado.

Falta provar que B4 é linearmente independente. Vamos mostrar que, se x1, . . . , xp,

y1, . . . , yq, z1, . . . , zr forem escalares tais que

x1u1+ · · · + xpup+ y1v1+ · · · + yqvq+ z1w1+ · · · + zrwr = 0,

então todos eles são nulos. Analisemos esta possibilidade. Se algum yj for diferente de

zero, o vetor não nulo y1v1+ · · · + yqvq seria uma combinação linear dos elementos de

B3. Logo, ele estaria em W e em V ao mesmo tempo, estando na interseção V ∩ W

e assim y1v1+ · · · + yqvq poderia ser escrito como uma combinação linear de u1, . . . ,

up, contrariando a hipótese de B2 ser base. Do mesmo modo não podemos ter um zk

diferente de zero. Logo, yj e zk são todos nulos e a equação se reduz a x1u1+ · · · + xpup =

0. Sendo B1 uma base, concluímos que x1, . . . , xp são todos nulos. Daí B4 é linearmente

independente. ¤

5.1

Soma direta

Definição 5.2 Sejam V1, . . . , Vk subespaços vetoriais de V. Se todo v em V puder ser

escrito de forma única como uma soma do tipo v = v1+ · · · + vk

onde vi ∈ Vi, diremos que V é uma soma direta dos subespaços V1, . . . , Vke escreveremos

V = V1⊕ · · · ⊕ Vk.

Se V = V1⊕ V2, então V1 e V2 são denominados complementares.

Dois subespaços vetoriais V1 e V2 de V são disjuntos se a interseção V1∩ V2 contiver

apenas o zero.

Teorema 5.3 Sejam V1 e V2 subespaços vetorias de V tais que V = V1+ V2. Então V =

V1⊕ V2 se e só se V1, V2 forem disjuntos.

Prova. Se V = V1⊕ V2, seja v um vetor de V na interseção de V1 e V2. Então

v = v|{z} ∈V1 + 0|{z} ∈V2 = 0|{z} ∈V1 + v|{z} ∈V2

e, como a decomposição é única, v = 0, provando que V1 e V2 são disjuntos.

Se V1 e V2 forem disjuntos, como V = V1+ V2, todo v em V pode ser decomposto

numa soma v = v1+ v2, com v1 em V1 e v2 em V2. Se houvesse outra decomposição v =

w1+ wk, com w1 em V1 e w2 em V2, então v1+ v2 = w1+ w2 e assim, v1 − w1 = w2−

v2. Sendo v1− w1 um vetor de V1 igual a w2− v2, um vetor de V2, então v1− w1 está na

interseção de V1 com V2 e, como estes dois subespaços são disjuntos, v1− w1 = 0 ou v1 =

w1. Com este resultado, obtemos w2− v2 = 0 ou v2 = w2, provando que a decomposição

de v numa soma de um elemento de V1 com um elemento de V2 é única e assim, V = V1⊕

V2. ¤

Quando V igual à soma de mais do que dois subespaços, o fato de os espaços envolvidos serem disjuntos dois a dois não é suficiente para garantir que V seja a soma direta desses subespaços como nos mostra o exemplo a seguir.

Exemplo 5.4 Seja V = R2 e V1 = {(x, 0)∈ R2 : x∈ R}, V

2 = {(0, y) ∈ R2 : y ∈ R},

V3 = {(x, x) ∈ R2 : x ∈ R}. Estes três subespaços são disjuntos dois a dois, V = V1+

V2+ V3, mas V não é a soma direta de V1, V2 e V3.

A condição de serem disjuntos será substituida pela condição de serem independentes. Os subespaços vetoriais V1, . . . , Vk de V são independentes se

v1+ · · · + vk= 0,

com vi em Vi, para i = 1, . . . , k, então v1 = · · · = vk = 0.

Uma caracterização da independência dos subespaços é a seguinte: Os subespaços V1,

. . . , Vk são independentes se e só se Vj for disjunto da soma V1+ · · · + Vj−1, para j = 2,

. . . , k. Dois espaços vetoriais V1 e V2 de V são independentes se e só se forem disjuntos.

Teorema 5.5 Sejam V1, . . . , Vk subespaços vetoriais de um espaço vetorial V tais que

V = V1+ · · · + Vk. Então V = V1⊕ · · · ⊕ Vk se e só se V1, . . . , Vk forem independentes.

Prova. Se V = V1⊕ · · · ⊕ Vk, sejam v1, . . . , vkvetores de V1, . . . , Vk, respectivamente,

e tais que v1+ · · · + vk = 0. Como 0 = 0+ · · · + 0, da unicidade da decomposição,

concluímos que vi = 0 para i = 1, . . . , k. Logo, V1, . . . , Vk são independentes.

Se V = V1+ · · · + Vk e V1, . . . , Vk forem independentes, todo v em V pode ser

decomposto numa soma v = v1+ · · · + vk, com vi em Vi, para i = 1, . . . , k. Se houvesse

outra decomposição v = w1+ · · · + wk, com wi em Vi, então (v1− w1)+ · · · + (vk− wk) =

0 e, da independência dos subespaços vetoriais Vi, concluímos que vi = wi, para i = 1,

. . . , k. Logo, a decomposição de v como soma de vetores de V1, . . . , Vk é única e V = V1⊕

· · ·⊕ Vk. ¤

Teorema 5.6 Sejam V1, . . . , Vk subespaços vetoriais de V, um espaço vetorial com di-

mensão finita. Se V = V1 ⊕ · · · ⊕Vk então

dim V = dim V1+ · · · + dim Vk.

Prova. Seja Bi base de Vi para i = 1, . . . , k.

Se V = V1⊕ · · · ⊕Vk, todo v em V pode ser decomposto de forma única numa soma

v = v1+ · · · + vk, com vi em Vi, para i = 1, . . . , k. Cada vi pode ser decomposto de

forma única nos vetores da base Bi. Logo, v pode ser escrito de forma única como uma

combinação linear dos vetores da união B1∪ · · · ∪ Bk, provando que esta é uma base de

5.2

Complemento ortogonal

Definição 5.7 Seja V um espaço vetorial com produto interno e S um subespaço vetorial de V. O conjunto

S⊥= {v ∈ V : hv, si = 0 para todo s em S } é um subespaço de V, chamado de complemento ortogonal de S.

Para mostrar que um determinado vetor v está em S⊥, basta mostrar que ele é ortog-

onal a todo vetor de uma base de S. O único vetor que está ao mesmo tempo em S e em S⊥ é o vetor nulo e daí,

S∩ S⊥ = {0}.

Teorema 5.8 Seja S um subespaço vetorial de dimensão finita de um espaço vetorial V com produto interno. Então V = S ⊕ S⊥.

Prova. Seja {v1, . . . , vp} uma base ortonormal de S. Dado qualquer v em V, o vetor

w = v− hv1, vi v1− · · · − hvp, vi vp

é ortogonal a todo vetor de S. Desta forma, qualquer vetor v pode ser decomposto numa soma v = s+ w, onde s = hv1, vi v1+ · · · + hvp, vi vp pertence a S e w pertence a S⊥ e

assim, V = S+ S⊥.

Vamos mostrar que esta decomposição é única. Se v = s1+ w1, com s1 em S e w1 em

S⊥, então s + w = s

1+ w1 e assim, s − s1 = w1− w, mostrando que os vetores s − s1 e

w1− w estão na interseção S ∩ S⊥. Como a interseção só possui o vetor nulo, s = s e w =

w. ¤

Se v é um vetor de um subespaço S de um espaço vetorial V, então v é ortogonal a todo vetor de S⊥ e assim ele pertence ao ¡S⊥¢⊥, mostrando que S está contido no

complemento ortogonal do complemento ortogonal de S, isto é, S ⊂ ¡S⊥¢⊥. Por outro

lado, V = S⊕S⊥= S¡S⊥¢⊥e assim, dim V = dim S+ dim S= dim S+ dim¡S⊥¢⊥,

que acarreta na igualdade dim S = dim¡S⊥¢⊥. Estando S contido em¡S⊥¢⊥ e possuindo ambos a mesma dimensão, eles são iguais

¡

Transformação adjunta

Sejam V e W espaços vetoriais complexos com dimensão finita e produto interno. Dado uma tansformação linear L : V → W, vamos mostrar que existe uma única transformação linear L∗ : W → V tal que

hLv, wi = hv, L∗wi . para todo v em V e w em W.

Primeiro a existência. Sendo B1 = {v1, . . . , vn} uma base ortonormal de V e B2 =

{w1, . . . , wm} uma base ortonormal de W podemos escrever Lvj, para j = 1, . . . , n, como

uma combinação linear dos elementos de B2

Lv1 = a11w1+ a21w2+ · · · + am1wm

Lv2 = a12w1+ a22w2+ · · · + am2wm

· · ·

Lvn = a1nw1+ a2nw2+ · · · + amnwm

Para definir uma transformação linear, basta estabelecer seu valor nos elementos de uma base do seu domínio. Seja L∗ : W → V aquela transformação linear que leva w

i, para i =

1, 2, . . . , m, nos seguintes vetores de V

L∗w1 = ¯a11v1+ ¯a12v2+ · · · + ¯a1nvn

L∗w2 = ¯a21v1+ ¯a22v2+ · · · + ¯a2nvn

· · ·

L∗wm = ¯am1v1+ ¯am2v2+ · · · + ¯amnvn

Usando o símbolo de somatório, os valores das transformações lineares L e L∗ nas bases

de seus respectivos domínios se escrevem Lvj = m X i=1 aijwi L∗wi = n X j=1 ¯ aijvj. 81

Da ortonormalidade das bases B1 e B2, segue hLvj, wii = hvj, L∗wii fazendo com que

hLv, wi = hv, L∗wi para todo v em V e w em W, o que prova a existência.

Agora a unicidade. Se T : W → V for outra transformação linear para a qual hLv, wi = hv, T wi

para todo v em V e w em W, então

hv, L∗wi = hv, T wi ou

hv, (L∗− T )wi = 0

ainda para todo v em V e w em W. Fazendo v = (L∗− T )w, obtemos

h (L∗− T )w, (L− T )w i = 0

ou (L∗− T )w = 0 para todo w em W, mostrando que T = L, o que prova a unicidade.

A transformação linear L∗ recebe o nome de transformação adjunta de L.

Se L : V → W e T : W → U forem duas transformações lineares, então (T L)∗ = L∗T∗.

Se A = [aij] for a matriz de L : V → W e B = [bij] for a matriz de L∗ : W → V nas

bases ortonormais B1 e B2 de V e W, respectivamente, então bij = ¯aji e

B = A∗.

Esta relação entre as matrizes de L e L∗ só se verifica se as bases forem ortonormais, como

nos mostra o próximo exemplo.

Este conceito de transformação adjunta se aplica a transformações lineares entre es- paços vetoriais reais. Neste caso, os escalares serão reais e ¯aij = aij e

Exemplo 6.1 Seja L(x, y) = (2x + 3y, 5x + 7y, 11x + 13y) uma transformação linear do R2 no R3. Consideremos nestes dois espaços seus respectivos produtos internos euclidianos

h (x1, y1), (x2, y2) i = x1x2+ y1y2

e

h (x1, y1, z1), (x2, y2, z2) i = x1x2+ y1y2+ z1z2.

Seja B1 = {e1, e2} a base canônica do R2e B2 = (f1, f2, f3) a base canônica do R3 que são

ortonormais em relação aos produtos internos euclidianos de R2 e R3, respectivamente.

Temos

Le1 = 2f1+ 5f2+ 11f3

e L∗f1 = 2e1+ 3e2 L∗f2 = 5e1+ 7e2 L∗f3 = 11e1 + 13e2 de modo que [L]12=   25 37 11 13   , [L∗]21 = · 2 5 11 3 7 13 ¸ onde uma é a transposta da outra.

Entretanto, se v1 = (1, 2), v2 = (0, 1), w1 = (1, 1, 1), w2 = (0, 1, 2) e w3 = (0, 0, 1)

então B3 = {v1, v2} será base de R2 e B4 = {w1, w2, w3} será base de R3. Nenhuma das

duas é ortonormal em relação ao produto interno euclidiano do R2 e R3. O leitor poderá

verificar que Lv1 = 8w1+ 11w2+ 7w3 Lv2 = 3w1+ 4w2 + 2w3 e L∗w1 = 18v1− 13v2 L∗w2 = 27v1− 21v2 L∗w3 = 11v1− 9v2 As matrizes [L]34=   11 48 3 7 2   e [L∗]43= · 18 27 11 −13 −21 −9 ¸ não são mais uma a adjunta da outra.

Dada a transformação linear L, a transformação adjunta L∗ é a única que satisfaz

à igualdade hLv, wi = hv, L∗wi para todo v em V e todo w em W. De fato, se T for

outra transformação linear para a qual hLv, wi = hv, T wi para todo v e todo w, então hv, T wi = hv, L∗wi e hv, T w− Lwi = 0 para todo v o que acarreta na igualdade T w =

L∗w para todo w, nos conduzindo à igualdade T = L∗. Para todo v em V e w em W, tem-se

hL∗w, vi = hv, L∗wi = hLv, wi = hw, Lvi ,

mostrando que a adjunta da adjunta é igual a L, isto é, (L∗)∗ = L.

Um operador linear L : V → V é auto-adjunto quando L∗ = L.

Exemplo 6.2 Sejam x = (x1, x2, x3) e y = (y1, y2, y3) dois pontos do R3, consideremos o

produto interno hx, yi = x1y2+ x2y2+ x2y3. Em relação a este produto interno, o operador

linear L : R3 → R3 definido por L(x, y, z) = (2x+ 3y+ 5z, 3x+ y, 5x+ 4z) é auto-adjunto

pois L∗ = L.

Teorema 6.3 Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L, vale a relação

Im (L)⊥ = ker(L∗).

Prova. Se w ∈ Im (L)⊥, então hLv, wi = 0 ou hv, L∗wi = 0 para todo v ∈ V de onde

se conclui que L∗w = 0 mostrando que w está no ker(L).

Reciprocamente, se w ∈ ker(L∗), então hLv, wi = hv, Lwi = hv, 0i = 0 para todo

v ∈ V, provando, deste modo, que w é ortogonal a todo elemento da imagem de L. Conclui-se que w pertence ao complemento ortogonal da Im (L). ¤

Como L∗∗= L, substituindo L por Lna igualdade acima, segue

Im (L∗)⊥= ker(L) ou

Im (L∗) = ker(L)⊥

Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L,

V = ker(L)⊕ Im (L∗).

Esta igualdade ocorre porque V = ker(L) ⊕ ker(L)⊥ = ker(L)⊕ Im (L).

Quando L é auto-adjunta,

Im (L)⊥ = ker(L).

Teorema 6.4 Sejam V e W espaços vetoriais com produto interno e L : V → W linear. Sendo L∗ : W → V a adjunta de L,

1. Im (L) = Im (LL∗).

2. ker(L∗) = ker(LL).

Prova. 1a. Inicialmente provaremos que Im LL∗ ⊂ Im L. Se w ∈ Im (LL∗), então existe um w1 tal que w = LL∗w1 = L(L∗w1) provando que w ∈ Im (L).

1b. Vamos provar agora que Im (L) ⊂ Im (LL∗). Se w ∈ Im (L), então w = Lv para

algum v em V. Podemos escrever de modo único v = v1 + v2 onde v1 ∈ Im (L∗) e v2 ∈

ker(L). Logo w = Lv = Lv1+ Lv2 = Lv1. Como v1 ∈ ker(L)⊥ = Im (L∗), existe w1 tal que

v1 = L∗w1 e assim w = LL∗w1, mostrando que w ∈ Im (LL∗), o que completa a prova da

2a. Se w ∈ ker(L∗) então Lw = 0 e, em consequência, LLw = 0, provando que

ker(L∗) ⊂ ker(LL).

2b. Se w ∈ ker(LL∗) então L(Lw) = 0 e Lw pertence ao ker(L) e à Im (L) cuja

interseção contém apenas o zero. Logo, L∗w = 0, provando que w está no ker(L). Com

isto, provamos que ker(LL∗) ⊂ ker(L), o que completa a prova da parte 2 do teorema.

¤

Resumindo: Para uma transformação linear L : V → W e sua adjunta L∗ : W → V valem as identidades

(L∗)∗ = L Im (L∗) = ker(L)⊥ Im (LL∗) = Im (L), ker(LL∗) = ker(L∗).

Definição 6.5 Seja V um espaço vetorial com produto interno. O operador linear L : V → V é antiadjunto quando L∗ =−L e unitário quando L= L−1.

Teorema 6.6 Numa base ortonormal, a matriz A = [aij] de um operador auto-adjunto é

hermitiana (A = A∗), a de um operador antiadjunto é antihermitiana (A =−A) e a

de um operador unitário é unitária (A∗ = A−1).

Teorema 6.7 O operador linear L : V → V é unitário se e só se, para todo v1 e v2 em V,

hLv1, Lv2i = hv1, v2i .

Para fixar a nomenclatura, apresentamos o quadro abaixo. Espaço Real Espaço Complexo Operador Matriz Operador Matriz auto-adjunto simétrica auto-adjunto hermitiana antiadjunto anti-simétrica antiadjunto antihermitiana ortogonal ortogonal unitário unitária

6.1

Posto de uma transformação linear

Definição 6.8 Sejam V e W espaços vetoriais e L : V → W uma transformação linear. A dimensão da imagem de L é chamada de posto de L.

Sendo A uma matriz complexa de ordem m por n. Considerada como uma trans- formação linear de Cn em Cm, seu posto é igual ao número de colunas linearmente

independentes que A possui.

O número de colunas linearmente independentes de uma matriz é igual ao número de suas linhas linearmente independente.

Teorema 6.9 Sejam V e W espaços vetoriais de dimensão finita e L : V → W uma transformação linear. Seja A a representação matricial de L em relação a bases de V e de W. O posto de L é igual ao posto de A.

Exemplo 6.10 Seja L : R3 → R3 definida por

L(x, y, z) = ( x + 2y− z, 2x + 4y − 2z, y + 2z ) = (x + 2y− z)(1, 2, 0) + (y + 2z)(0, 0, 1), cujo posto é 2. A matriz de L em relação à base canônica do R3 é

A =   1 22 4 −1−2 0 1 2  

a primeira e terceira linha são linearmente independentes e a segunda é o dobro da primeira. As duas primeiras colunas são linearmente independentes e a terceira é igual a −5 vezes a primeira mais 2 vezes a segunda. O posto de A é dois.

Teorema 6.11 Sejam V e W espaços vetoriais com produto interno e dimensão finita. Seja L : V → W linear. O posto das transformações lineares L, L∗, LL e LLsão iguais.

Prova. Sabemos que

V = ker(L)⊕ Im (L∗), de onde obtemos

dim ker(L) + dim Im (L∗) = dim V. Por outro lado,

dim ker(L) + dim Im (L) = dim V.

Dessas duas igualdades concluímos que dim Im (L∗) = dim Im (L) provando que o posto

de L é igual ao posto de L∗.

Como Im (LL∗) = Im (L) e Im (LL) = Im (L), o teorema está provado. ¤

Corolário 6.12 Seja A uma matriz complexa. As matrizes A, A∗, AA∗ e AA possuem

o mesmo posto.

Sejam V e W espaços vetoriais, ambos com dimensão finita. A imagem de uma transformação linear L : V → W está contida em W. Portanto, o posto de L deve ser menor ou igual do que a dimensão de W. Se {v1, . . . , vn} for uma base de V, qualquer

vetor v em V pode ser decomposto de modo único como uma combinação linear v = x1v1+ · · · + xnvn e assim, Lv = L(x1v1+ · · · + xnvn) = x1Lv1+ · · · + xnLvn, mostrando

que {Lv1, . . . , Lvn} gera a imagem de L o que assim o posto de L deve ser menor ou

igual do que a dimensão de V. Concluímos que o posto de L não pode ser maior do que a dimensão de V nem maior do que a dimensão de W. Motivados por este comentário, diremos que L tem posto máximo quando o posto de L for igual ao mínimo entre a dimensão de V e a dimensão de W.

Teorema 6.13 Sejam V e W espaços vetoriais com dimensão finita, ambos com produto interno. Seja L : V → W uma transformação linear com posto máximo.

1. Quando dim V ≤ dim W, a transformação linear L∗L : V → V é um isomorfismo.

2. Quando dim W ≤ dim V, a transformação linear LL∗ : W → W é um isomorfismo.

Prova. Quando

1. posto(L) = dim V ≤ dim W, então dim Im (L∗L) = dim Im (L) = dim(V ) e assim

L∗L é sobrejetora e, portanto, um isomorfismo.

2. posto(L) = dim W ≤ dim V, então dim Im (LL∗) = dim Im (L) = dim(W ) e assim

LL∗ é sobrejetora e, portanto, um isomorfismo. ¤