Discussion on the results of other produced isotopes

para efetuar a ACI (Hyvärinen et al., 2001b).

3.6 Métodos que Usam uma Estrutura Temporal

Nas Secções consideradas anteriormente, o modelo linear ACI assenta em misturas de variáveis aleatórias independentes. No entanto, em muitas aplicações, o que se mistura não são as variáveis aleatórias, mas os sinais ao longo do tempo, cujas observações constituem as designadas séries temporais. Estes casos não estão de acordo com o modelo básico da ACI, no qual as amostras (misturas) de x não têm uma ordem especíﬁca, uma vez que podemos trocá-las de qualquer forma que não afetam a validade do modelo nem os métodos de estimação apresentados. Porém, ao trabalhar com misturas de CIs que representam séries temporais, a situação é diferente pois convém que a estrutura temporal seja preservada na implementação do modelo.

Se as CIs forem sinais ao longo do tempo devem conter muito mais estrutura do que simples variáveis aleatórias, como é o caso das autocovariâncias, isto é, das covariâncias entre os valores da série em diferentes pontos desfasados no tempo. Tais estatísticas adicionais podem ser usadas para melhorar a estimação do modelo, e nesse sentido, esta informação pode tornar possível a estimação do modelo em casos onde os métodos básicos da ACI não podem estimá-lo, como por exemplo, se as CIs forem Normais mas correlacionadas ao longo do tempo.

De acordo com a Subsecção 1.4.1, e tendo em conta a noção de processo estocástico, nesta Secção considera-se a estimação do modelo ACI quando as CIs são séries temporais, si(t), t = 1, 2, ..., onde t é o índice temporal. Portanto t passa a ter um signiﬁcado mais especíﬁco ao deﬁnir uma ordem em termos de estrutura de cada CI e o modelo (3.1) passa a ser representado por

x(t) = As(t),

onde se admite que A é a matriz quadrada das misturas e que as CIs si continuam a ser independentes. Por outro lado, as CIs não são obrigadas a seguir a não normalidade.

Passamos a descrever de seguida alguns pressupostos em relação à estrutura temporal subja- cente das CIs, os quais permitem a estimação do modelo sendo considerados como alternativas ao pressuposto da não normalidade (Hyvärinen et al., 2001b):

2. Considera-se o caso em que as variâncias das CIs são não estacionárias.

3. Analisa-se a complexidade de Kolmogoroﬀ como uma estrutura para a ACI com misturas correlacionadas no tempo.

3.6.1 Separação por Autocovariâncias

Autocovariâncias Como uma Alternativa à Não Normalidade

Uma maneira relativamente simples de abordar a estrutura temporal é através de autocova- riâncias, ou seja, pelas covariâncias entre os valores de uma série temporal em diferentes pontos no tempo, que são dadas por cov(xi(t), xi(t − τ)), para uma certa constante de desfasamento τ = 0, e com i = 1, 2, ..., n. Para o caso em que os dados apresentam dependências no tempo, as autocovariâncias são diferentes de zero. Para além das autocovariâncias, consideram-se as covariâncias entre duas séries temporais, cov(xi(t), xj(t − τ)), para i = j.

Deﬁnição 3.6.1 Para um dado desfasamento τ e para o vetor das misturas x, as estatísticas anteriores podem ser agrupadas na matriz de covariâncias dos desfasamentos no tempo dada por

Cτx= E(x(t)x(t − τ)T). (3.25)

Como se sabe, no branqueamento, encontrar uma matriz V tal que z(t) = Vx(t) não é suﬁciente para estimar as CIs uma vez que existe uma inﬁnidade de diferentes matrizes V que devolvem componentes não correlacionadas. Esta é a razão pela qual no modelo básico da ACI tem que ser usada a não normalidade nas CIs, como acontece por exemplo, na variante de esti- mação do modelo para minimização das dependências de ordem superior através da informação mútua.

De acordo com Tong et al. (1991), a informação contida em Cx

τ poderá ser usada em vez da informação de ordem superior para obter as CIs. Para isso, deverá encontrar-se uma matriz B, de transformação dos dados, que para além de forçar as covariâncias instantâneas de y(t) = Bx(t) a tenderem para zero, também as covariâncias dos desfasamentos deverão tender para zero de tal forma que E(yi(t)yj(t − τ)) = 0 para todos os valores de i, j e τ, uma vez que se pretende que as covariâncias dos desfasamentos das CIs sejam todas nulas devido à sua independência. Através destas covariâncias conseguir-se-á bastante informação adicional para estimar o modelo, sem necessidade de recorrer a informação de ordem superior.

3.6. MÉTODOS QUE USAM UMA ESTRUTURA TEMPORAL 77 Usando um Desfasamento no Tempo

No caso mais simples em que se usa apenas um desfasamento no tempo (geralmente denotado por τ = 1), pode ser formulado um algoritmo para encontrar uma matriz que anule as covariâncias instantâneas e as que correspondem ao desfasamento τ em causa.

Considere-se o modelo x(t) = As(t) e os dados branqueados dados por z(t) = Vx(t) = VAs(t).

De acordo com a Subsecção 3.4.2, em que VA = WT _{é uma matriz ortogonal de separação, vem} z(t) = WT_s_{(t), e logo Wz(t) = s(t). Para um dado desfasamento vem Wz(t − τ) = s(t − τ).}

Tendo em conta (3.25), a matriz de covariâncias dos desfasamentos para o vetor z(t) é dada por

Cτz= E(z(t)z(t − τ)T), (3.26)

e a matriz de covariâncias dos desfasamentos para o vetor s(t) é dada por Cs

τ = E(s(t)s(t − τ)T). (3.27)

Uma versão da matriz de covariâncias dos desfasamentos de (3.26) pode ser dada pela matriz simétrica (ver Apêndice C.1.2)

¯ Cτz= 1 2 $ Cτz+ (C z τ)T % . A partir de (3.26) e de (3.27), vem ¯ Cτz = 1 2 * E z(t)z(t − τ)T + E z(t)z(t − τ)T T+ = 1 2 , E$WTs(t) WTs_{(t − τ)} T%+$E$WTs(t) WTs_{(t − τ)} T%%T - = 1 2W T *_E$_s_{(t)s(t − τ)}T%_{+ E}$_s (t − τ)s(t)T%+W = 1 2W T *_Cs τ+ (C s τ)T + W.

Devido à independência de si(t), a matriz Cτs é diagonal (e consequentemente simétrica), e portanto

1 2

C_τs+ (C_τs)T%= C_τs. Como tal estabelece-se a relação

ou seja, as matrizes Cs

τ e W constituem a decomposição em valores e vetores próprios de ¯C z τ. Desta forma a decomposição em valores e vetores próprios ﬁca bem deﬁnida e relativamente simples de implementar em qualquer algoritmo quando se utiliza a matriz simétrica ¯Cz

τ em vez da usual matriz de covariâncias dos desfasamentos.

Um algoritmo muito simples e rápido de aplicar, que será descrito na Secção 3.7, denomina- -se por AMUSE (Algorithm for Multiple Unknown Signals Extraction) e poderá ser consultado em Tong et al. (1991). Este algoritmo possui uma desvantagem na aplicabilidade: no caso em que alguns valores próprios da matriz de covariâncias dos desfasamentos no tempo são iguais, os correspondentes vetores próprios não são únicos, e logo as correspondentes CIs não são estimadas. Os valores próprios são dados por cov(si(t), si(t − τ)), e como tal estes são distintos se e só se as covariâncias desfasadas forem diferentes para todas as CIs.

Um outro algoritmo similar foi proposto por Molgedey e Schuster (1994), o qual também inclui informação acerca da estrutura temporal dos dados, requerendo que as correlações para certos instantes e as correlações desfasadas no tempo entre as diferentes misturas desapareçam. A estimação das CIs prende-se novamente com a decomposição em valores e vetores próprios que requere a diagonalização simultânea de duas matrizes simétricas.

Extensão para Vários Desfasamentos no Tempo

Quando se consideram vários desfasamentos no tempo é possível utilizar uma certa extensão do algoritmo AMUSE por forma a melhorar o seu desempenho. Como tal é suﬁciente que as covariâncias sejam diferentes para um desses desfasamentos.

Pretendendo-se diagonalizar simultaneamente todas as matrizes de covariâncias dos desfasa- mentos, serão formuladas funções que indicam o grau de diagonalização obtido. Para avaliar o quanto uma matriz é ou não similar a uma matriz diagonal pode minimizar-se a soma de quadrados dos elementos que se encontram fora da diagonal. Essa minimização pode ser obtida com base no gradiente descendente ou através de métodos adaptados para a decomposição em valores e vetores próprios, à diagonalização aproximada de várias matrizes em simultâneo. Um dos algoritmos mais aplicados neste contexto, proposto por Belouchrani et al. (1997), denomina- -se por SOBI (Second-Order Blind Identiﬁcation). De entre outros trabalhos envolvendo assuntos relacionados com as autocovariâncias salientam-se Amari (2000) e Yeredor (2000).

3.6. MÉTODOS QUE USAM UMA ESTRUTURA TEMPORAL 79

3.6.2 Separação por Não Estacionariedade de Variâncias

A estrutura temporal dos sinais permite que a ACI seja executada utilizando uma aproximação alternativa à não estacionariedade das variâncias das CIs, admitindo que estas mudam suave- mente ao longo do tempo. Matsuoka et al. (1995) foram os primeiros autores a abordar a não estacionariedade para separar as CIs, propondo para tal um algoritmo especíﬁco.

A separação de séries temporais não estacionárias pode ser levada a cabo através de uma variante de autocorrelações. Segundo Matsuoka et al. (1995), caso se encontre uma matriz B de tal modo que as CIs de y(t) = Bx(t) sejam não correlacionadas em cada valor de tempo t então as CIs serão estimadas, pois devido à não estacionariedade, a covariância de y(t) depende de t e ao forçar as CIs a serem não correlacionadas para cada t, obtém-se uma condição muito mais forte que o branqueamento.

A não correlação local de y(t) pode ser avaliada utilizando as mesmas medidas que são usadas nos algoritmos da Extensão para Vários Desfasamentos no Tempo, assim como através de um algoritmo similar ao de Matsuoka et al. (1995).

A não estacionariedade da variância de uma série temporal y(t) pode também ser medida com base na correlação ao longo do tempo das energias E(y(t)2_{y(t − τ)}2_{), onde τ é um desfasamento} que geralmente é igual à unidade. O cumulante correspondente à correlação de energias é dado pelo cumulante cruzado de 4a_{ordem. Um algoritmo do ponto ﬁxo semelhante ao FastICA pode} se usado para maximizar a não estacionariedade da variância medida pelo cumulante cruzado.

3.6.3 Princípios de Separação Uniﬁcados

Os dois princípios de separação apresentados (autocovariâncias e variâncias não estacionárias) complementam o princípio da não normalidade, o qual representa a base da estimação do modelo básico de ACI.

A escolha do princípio a utilizar deverá depender dos dados que se pretendem analisar e do objetivo do estudo, uma vez que critérios diferentes levam a considerar diferentes pressupostos nos próprios dados. Numa grande parte dos casos os dados não possuem uma estrutura temporal associada, pelo que a ordem das amostras é arbitrária e não tem qualquer signiﬁcado. Neste caso só o modelo básico de ACI baseado na não normalidade pode ser usado. Por outro lado, as alternativas só são signiﬁcativas se os dados vierem de uma fonte que tenha uma estrutura

temporal intrínseca.

Segundo Hyvärinen et al. (2001b), quando os dados possuem uma estrutura temporal, o modelo básico de ACI funciona muitas vezes bem e apesar de não usar tal informação não é afetado por esta. No entanto a estimação do modelo poderá ﬁcar longe de ser a ideal por não usar toda essa estrutura dos dados quando existe.

Complexidade de Kolmogoroﬀ como uma Estrutura de Uniﬁcação

É possível combinar diferentes tipos de informação, como por exemplo não normalidade com autocorrelações.

A complexidade de Kolmogoroﬀ proporciona uma forma de medir a complexidade de um algoritmo.

De acordo com Pajunen (1998), a complexidade de Kolmogoroﬀ para uma sequência de carateres xn_{= x}

1x2...xné dada por

KU(xn) = min pU(xn)

|pU(xn)| ,

onde pU(.) é um algoritmo ou programa computacional, que permite gerar a sequência xn, no universo U de todos os programas, e onde o módulo representa o comprimento da sequência usada por cada algoritmo.

A complexidade de Kolmogoroﬀ mede a quantidade de estrutura de um sinal através da quantidade de compressão que é possível na codiﬁcação do sinal, de acordo com o comprimento do código do mesmo. Em termos computacionais é uma medida que pretende encontrar o melhor esquema de codiﬁcação para o respetivo sinal (Pajunen, 1998). A complexidade de Kolmogoroﬀ permite englobar um tipo de estrutura mais geral em que praticamente todos os pressupostos podem ser considerados, desde as estruturas de tempo como as autocorrelações e a não estacionariedade até estruturas que usam a teoria da informação.

In document Cross section measurements for the (sider 86-130)