O pré-processamento tem como objetivo principal a redução de artefactos não oriundos dos EEGs (ver secção 2.5.1). A cadeia genérica de pré-processamento encontra-se representada na Figura 18.
Após a captura do EEG é sempre aplicado um Filtro de Notch, a cada um dos 16 canais para atenuar o ruído resultante da corrente elétrica (ver secção 2.5.1).
Figura 18. Fluxograma Genérico de Pré-Processamento.
Adicionalmente é ainda possível aplicar um filtro passa-baixo para remover frequências acima dos 100Hz, diminuir a taxa de amostragem30, ou então rejeitar amostras
contaminadas com artefactos. Esta rejeição processa-se com base em limiares médios de
amplitude num conjunto de elétrodos. É possível, por exemplo, garantir que a amplitude média se encontra entre os limites do EEG, 10 e 100μV, ou então identificar as amostras em que a amplitude média dos elétrodos frontais, mais afetados pelos artefactos oculares, não é superior a 100μV.
4.3 Extração de Características
O processo de extração de características aplica uma dada função a segmentos consecutivos do EEG, transformando cada conjunto de amostras numa nova sequência de valores, geralmente n-dimensionais (ver secção 2.5.2). Esta é uma prática comum (Keirn & Aunon, 1990; Anderson & Sijercic, 1996; Lehtonen, 2002; Palaniappan, Paramesran, Nishida, & Saiwaki, 2002), suportando não só o processamento em tempo real, mas também garantindo uma menor variabilidade das características do sinal dentro de cada segmento.
Antes da extração de características propriamente dita, é ainda possível aplicar janelas funções matemáticas, nulas fora do segmento, que se destinam fundamentalmente a minimizar as descontinuidades introduzidas devido à segmentação (ver seção 2.5.2). Nos resultados apresentados no âmbito desta tese usam-se segmentos de um segundo (256 amostras) com sobreposição de 0.5 segundos, e janelas retangulares, constantes dentro do segmento. Ambos os valores foram fixados após a realização de alguns testes, explicados com mais detalhe no capítulo 6, aonde são apresentados os resultados.
A biblioteca desenvolvida suporta várias formas de extração de características (ver secção 5), embora nos resultados apresentados nesta tese se tenham usado fundamentalmente duas funções que estimam a energia média associada a cada um dos cinco ritmos, δ, θ, α, β e γ, durante um dado período de tempo:
A Densidade de Potência Espectral Média em cada Ritmo
A Potência Espectral Média Normalizada da Transformada Wavelet Contínua (CWT) em cada Ritmo
Em ambos os casos, cada segmento é reduzido a 16x5 (80) valores reais, a potência espetral média estimada em cada um dos cinco ritmos do EEG e em cada um dos 16 sinais. A utilização de duas funções neste âmbito permitiu testar e escolher a que obteve melhores resultados em termos de classificação, considerando-se ser esta a mais adequada para os dados capturados.
A Densidade de Potência Espectral Média em cada Ritmo é uma técnica frequentemente referida em trabalho relacionado (Keirn & Aunon, 1990; Anderson & Sijercic, 1996; Lehtonen, 2002). No âmbito desta tese, esta é estimada no intervalo entre 1 a 128Hz, com resolução de 1Hz, através do método paramétrico de Burg (Keirn & Aunon, 1990; Anderson & Sijercic, 1996; Palaniappan, Paramesran, Nishida, & Saiwaki, 2002) de ordem 16 − um valor fixado após a realização de alguns testes descritos nos resultados (capítulo 6). Quando se aplica esta função a um dado segmento de EEG obtém-se 16x128 valores reais, correspondentes à potência espectral média no segmento em cada frequência, de 1 a 128Hz, nos 16 canais. O vetor final de características é determinado utilizando a fórmula 4.1, onde é calculada a média no intervalo de cada ritmo; r é o ritmo definido pelo intervalo de frequências [finicial, ffinal] e sc representa o segmento de EEG num dado canal c.
(4.1)
Em alternativa, a Potência Espectral Média Normalizada da Transformada
Wavelet Contínua (CWT) em cada Ritmo foi adaptada do trabalho de Jung et al. (Jung, et
al., 2008). Esta apresenta as vantagens já referidas em relação à utilização de wavelets (ver secção 2.5.2), embora exija mais recursos em termos de processamento. Neste caso utiliza-se uma wavelet continua chamada Morlet, que é aplicada em posições consecutivas no tempo, com várias escalas, selecionadas de modo a corresponderem ao intervalo de frequências entre 1 e 128Hz com a resolução de 1Hz. Desta aplicação a um dado segmento, neste caso com 256
amostras (um segundo) resultam 16x256x128 valores complexos, a que se chamam coeficientes. Estes estimam a similaridade do sinal de cada um dos 16 canais em relação à
wavelet, estando esta escalada com a escala que corresponde à frequência pretendida. A
fórmula seguinte mostra os cálculos efetuados para um canal de um dado segmento e ritmo; r é o ritmo definido pelo intervalo de frequências [finicial, ffinal] e sc representa o segmento de
EEG num dado canal c.
(4.2) O quadrado do módulo do coeficiente estima a energia da transformada: quanto maior esta for, maior a similaridade em relação à wavelet nessa posição, e por conseguinte à frequência determinada pela sua escala. Por fim, antes de se determinar a média, a energia é previamente normalizada, de acordo com o indicado por Jung et al., através da divisão pela variância determinada no elétrodo respetivo.
Adicionalmente foram ainda usadas outras características unidimensionais, para fins específicos. A média da amplitude do sinal em todos os elétrodos, por exemplo, foi usada na análise em tempo real para detetar situações em que esta não está dentro dos parâmetros considerados normais para o EEG humano, por exemplo quando não há utilizador ligado no dispositivo. (4.3)
s representa o segmento de EEG e 0x7000 é o valor do sinal que corresponde à amplitude
nula, definido no formato .BIN, o adoptado (ver secção 3.5).
A carga mental foi determinada com base no trabalho de Kimura et al. (Kimura, Uwano, Ohira, & Matsumoto, 2009) e Masaki et al. (Masaki, Ohira, Uwano, & Matsumoto, 2011), apresentado na secção 2.3.2. Estes autores relacionam esta medida com medidas clássicas de avaliação de usabilidade, por estar associada à sensação de conforto e desconforto dos utilizadores, tendo como pressuposto que uma maior carga mental implicará um maior desconforto. A carga mental é estimada através da razão entre a proporção de potência espetral no ritmo β, relacionado com atividade mental, e a proporção de energia espetral no ritmo α, relacionado com o descanso mental:
(4.4)
Esta medida foi determinada em segmentos de um segundo, com meio segundo de sobreposição, sendo depois determinada a média em todos os elétrodos – uma medida a que se chamou carga mental média. Neste âmbito a média permite reduzir o impacto introduzido pelas possíveis diferenças de localização nos elétrodos entre ensaios.
4.4 Redução de Características
Tal como já foi anteriormente referido, o objetivo fundamental da redução de características é diminuir a dimensão dos vetores de propriedades, utilizados na cadeia de processamento, sem que isso tenha um impacto negativo relevante no resultado final. No âmbito desta tese, esta pode ocorrer com base em métodos de transformação e/ ou seleção de características (descritos na secção 2.5.3).
Um destes métodos, a Análise de Componentes Principais (PCA), é um exemplo conhecido de transformação de características, já descrito com detalhe na secção 2.5.3.1. Este método transforma linearmente o espaço de vetores original num novo sistema de coordenadas não correlacionado, chamadas componentes principais. As novas características encontram-se ordenadas por ordem descendente de variância, o que facilita a sua eliminação. Assume-se neste caso que a relevância de uma componente principal é diretamente proporcional à sua variância; uma propriedade que não varia é provável que não faça variar os resultados.
No que se refere à seleção de características, esta procura localizar um conjunto mais relevante de características, permitindo saber exatamente quais os sinais e características que o compõem (ver secção 2.5.3.2). A Figura 19 esquematiza o seu funcionamento no contexto da cadeia de processamento proposta, ocorrendo sempre antes da classificação, mas podendo ser com ou sem supervisão, consoante requeira ou não a classificação prévia dos vectores de características.
Como existe mapeamento directo, o resultado desta seleção pode ser posteriormente reincorporado no processo, em sessões subsequentes restringindo o conjunto de sinais e/ou características capturados, extraídos e processados. Um facto assinalado no diagrama original do fluxograma de processamento (ver Figura 16).
Figura 19. Processo de seleção de características
A secção seguinte descreve um processo de seleção de características, com supervisão, a que se chamou análise de relevância (Oliveira, Grigore, Guimarães, & Duarte, 2010). Este método ordena as características com base num conjunto de medidas de dissemelhança, determinadas entre os conjuntos de amostras pertencentes a cada uma das classes.