Todos os dados relativos ao estudo I foram tratados e analisados com recurso ao Statistical Program for Social Sciences (SPSS), na versão 20.0. Para o tratamento estatístico dos dados, foram inicialmente consideradas 114 variáveis, referentes ao número de itens do questionário. No decorrer do processo, outras foram criadas, a partir das existentes (consultar anexo 2.8 para informação mais detalhada). Relativamente ao pré-teste, foram usadas técnicas de análise descritiva (e também algumas técnicas inferenciais), de modo a retirar as necessárias conclusões quanto às músicas a usar, nos dois cenários experimentais com música (ver anexo III). Para a consecução das análises quantitativas relativas ao
2 Foram considerados inválidos questionários recolhidos com menos de 80% de respostas completas, bem como
51 estudo principal, foram igualmente aplicadas técnicas descritivas, designadamente para caracterização sociodemográfica da amostra e a análise preliminar das variáveis (anexo 4.1). A consistência interna do constructo incluído no estudo I (sensibilidade auditiva) foi medida pelo Alpha de Cronbach, o qual toma valores entre 0 e 1. A este propósito, DeVellis (2012) defende que valores do coeficiente a partir de 0,65 já são reveladores de uma consistência interna minimamente aceitável.
Para a análise comparativa dos grupos de tratamento foram usados testes de hipóteses, que permitiram testar os dados da amostra e generalizar conclusões para a população (anexo 4.2). Duas tipologias de análises paramétricas revelaram-se fundamentais para a comparação de médias entre os grupos: o teste t-Student foi usado para analisar os grupos de tratamento, dois a dois, e também para comparar grupos amostrais definidos por variáveis dicotómicas; a Análise de Variância Simples foi usada para analisar, os três grupos de tratamento, em simultâneo, bem como para comparar grupos definidos por variáveis nominais com mais de duas categorias (ex: frequência de visitas).
Antes de se avançar com a aplicação dos testes, tornou-se necessário verificar as suas condições e/ou pressupostos de aplicabilidade, nomeadamente garantir que as variáveis seguiam uma distribuição normal, em cada uma das populações (tendo-se recorrido, para isso, a testes de ajustamento à normal, exceto nos casos em que a amostra foi considerada de grandes dimensões3). Especificamente para as ANOVA’s aplicadas, a par da normalidade, foi ainda necessário verificar o pressuposto da igualdade de variâncias populacionais entre os grupos comparados (através do teste do Levene), visto esta ser outra condição essencial à sua válida aplicação. Nos casos em que as condições de aplicabilidade não foram garantidas, tornou-se necessário recorrer subsidiariamente a testes não paramétricos, designadamente aos testes de Mann Whitney (alternativa ao t-Student) e de Kruskal Wallis (alternativa à ANOVA). Em adição, foram empregues análises de mediação (anexos 4.3), no intuito de se detetar um eventual papel mediador das emoções na relação entre presença (ou ritmo) da música e respostas dos indivíduos (intenções de compra, avaliação cognitiva, memória). Esta tipologia de análise assenta na definição de Baron e Kenny (1986), segunda a qual uma variável funcionará como “mediadora” se contribuir para explicar a relação entre duas outras variáveis. Na sua configuração básica, o modelo de Baron e Kenny (1986) postula que uma variável independente (“X”) é causa para uma variável dependente (“Y”), por meio de uma variável mediadora (“M”), traduzindo-se esta relação (mecanismo de mediação) por uma cadeia causal do tipo X→M →Y (Zhao et al., 2010). Neste caso, a variável independente considerada foi a atmosfera sonora (presença/ausência de música) – e ainda o ritmo (mexido/calmo), numa análise realizada a título complementar (anexo 4.4). Por sua vez, as intenções de compra da arte, as avaliações cognitivas da experiência e as recordações das obras foram equacionadas como variáveis dependentes; já os estados de entusiasmo e de prazer foram testados como variáveis mediadoras.
3 Por convenção, superior a 30 elementos. O Teorema do Limite Central, embora não assegure a normalidade da
52
Para se detetarem efeitos de mediação, Baron e Kenny (1986) propõem a utilização do procedimento inferencial desenvolvido por Sobel (1982), que testa, para a população, a hipótese do efeito indireto da variável independente sobre a dependente ser igual a zero. Sendo um dos pressupostos subjacentes a esta técnica a assunção da normalidade da distribuição da variável, a sua aplicação exige uma amostra de grande dimensão (Preacher e Hayes, 2004). Assim, para maximizar a probabilidade de se detetarem efeitos significativos, optou-se por empregar a análise de mediação num total de 3744 casos4, e ainda usando bootstrapping (em 1000 amostras). A aplicação do critério de Sobel implica a estimação de um conjunto de modelos de regressão, daí que esta tenha sido uma outra técnica empregue. Neste caso, foram estimados modelos de regressão linear simples, múltipla e logística binária, para determinar o valor dos coeficientes (e respetivo erro-padrão), de forma a aplicar a fórmula de cálculo (Sobel, 1982):
(1)
Z = Valor do teste; a = Coeficiente não estandardizado da relação entre variável independente e mediador; sa = Erro-padrão de a; b =
Coeficiente não estandardizado da relação entre mediador e variável dependente, quando a esta também é preditor; sb = Erro-padrão de b.
Os resultados das regressões forneceram parâmetros para o teste de Sobel, mas também permitiram caracterizar as relações entre as variáveis. A par disto, foram úteis para identificar o tipo de mediação observável. Se o efeito direto da variável independente sobre a variável dependente (coeficiente na regressão X→Y) não for significativo, o tipo de mediação aplicável será a mediação “apenas indireta”; se esse efeito direto for significativo poder-se-á observar mediação “complementar” ou “competitiva”. A primeira verifica-se caso o efeito direto e o efeito indireto (via mediador) tenham igual direção, e a segunda caso tenham direções opostas (Zhao et al., 2010).
Para as análises de mediação relativas às variáveis dependentes “intenções de compra” e “avaliações”, foram empregues modelos de regressão linear, cuja válida implementação obrigou à prévia verificação dos seguintes pressupostos (Hair et al., 2009):
A variável dependente tem de ser quantitativa, enquanto as variáveis independentes podem ter natureza qualitativa, desde que sejam suscetíveis serem tratadas como quantitativas ou estejam codificadas numa escala binária. Este pressuposto foi parcialmente verificado – as intenções de compra e as avaliações foram medidas em escalas numéricas, e todas as variáveis independentes foram medidas em escalas binárias. A sua não verificação para a análise do papel mediador das emoções nas recordações motivou a opção por empregar, neste âmbito, modelos de regressão binária logística.
A relação entre a variável dependente e as variáveis independentes é de natureza linear. Este pressuposto foi testado caso a caso, analisando os valores do coeficiente de correlação linear de Pearson (ver quadro IV-28, em anexo).
44 O equivalente aos 234 participantes as 16 obras vistas, ou seja, numa lógica de trial-level data, em vez de
53 Verifica-se uma independência nas observações, sendo esta visível se os resíduos exibirem um comportamento aleatório, não se encontrando correlacionados entre si. Este pressuposto foi testado caso a caso, pelo cálculo da estatística de Durbin-Watson, que toma valores entre 0 e 4. Valores próximos de 2 traduzem a inexistência de correlação entre os resíduos, permitindo concluir acerca da sua independência (ver quadro IV-28, em anexo).
Existe homocedasticidade nos dados (a variância dos resíduos é constante). Este pressuposto foi analisado graficamente (caso a caso), observando o diagrama de dispersão entre a variável resíduos e a variável valores previstos. Na generalidade dos casos, o diagrama mostrou que os resíduos não mantêm uma distância constante face ao eixo horizontal, sugerindo, à partida, a existência de homocedasticidade, confirmando-se o pressuposto.
Os resíduos apresentam valor esperado igual zero (a variável resíduos, que contém o valor dos desvios, isto é, das diferença entre o valor observado e o valor estimado pela reta da equação, tem de apresentar média igual zero). Este pressuposto é verificado sempre que o modelo inclui uma constante, como é o caso neste estudo (ver quadro IV-28, em anexo).
Normalidade dos desvios (é necessário verificar que os resíduos se distribuem de uma forma aproximadamente normal). Tal pressuposto foi testado graficamente (caso a caso), observando os gráficos de aproximação à normal para a variável resíduos. Na generalidade dos casos, os digramas mostraram que os resíduos se ajustavam bem à distribuição normal.
As variáveis independentes não apresentam correlação com os resíduos. Este pressuposto foi testado graficamente (caso a caso), no diagrama de dispersão entre as variáveis independentes e os resíduos. Na maioria dos casos, o digrama não indiciou qualquer relação linear.
Não existe multicolinearidade (as variáveis independentes não se encontram correlacionadas entre si). Este pressuposto aplica-se apenas aos modelos de regressão múltipla, e foi testado, caso a caso, pelos indicadores de colinearidade VIF e Tolerance. Se VIF < 10 (Tol > 0,1), para todas as variáveis independentes, o pressuposto é confirmado (ver quadro IV-28, em anexo). A regressão logística binária não envolve os mesmos pressupostos da regressão linear. Podendo lidar com qualquer tipo de relação, não é necessário que as variáveis dependente e independente estejam linearmente relacionadas; adicionalmente, valores residuais não têm de estar normalmente distribuídos e a sua variância não tem de ser necessariamente constante. Porém, outras condições devem observar- se (Lund e Lund, 2013; Tabachnick e Fidell, 2012; Wuensch, 2015):
A variável dependente tem de ser dicotómica, podendo as variáveis independentes apresentar qualquer natureza. O pressuposto verifica-se, dado que a “recordação”, originalmente medida através de scores médios, foi transformada, para efeitos da análise de mediação, na variável binária “recordação das obras vistas?” (0 = não, 1 = sim).
Ausência de multicolinearidade entre as variáveis independentes. Este pressuposto foi testado nos modelos de regressão linear estimados (com as mesmas variáveis independentes).
54
Dever-se-á garantir a independência das observações, e as categorias definidas pela variável dependente deverão ser exaustivas e mutuamente exclusivas, isto é, cada caso observado tem de pertencer a uma, mas apenas uma, categoria. Após a transformação da variável recordação, esta condição foi garantida (cada obra vista foi ou não foi recordada por cada participante). Dimensão amostral: dado que a regressão logística lida com probabilidades, para se obterem
estimativas válidas é recomendável garantir uma amostra de pelo menos 50 casos por variável independente. Este pressuposto foi cumprido, pois, como visto atrás, os modelos logísticos foram todos estimados com base numa amostra de dimensão superior a 3000 elementos. O efeito moderador de algumas variáveis inseridas no questionário foi também analisado, mas apenas com base nas técnicas descritivas e inferenciais às quais já se aludiu anteriormente. Deste modo, foram ensaiadas análises comparativas após divisão da amostra em função das variáveis grupo etário, género, sensibilidade auditiva, preferências musicais, frequência de visitas e nível de familiaridade com a arte (ver quadros IV-22 a IV-27, em anexo).