• No results found

Analysis of North Sea Q1 IBTS species abundance trends

In document WGBIODIV11.pdf (2.681Mb) (sider 39-48)

3.6 Case study of North Sea continental shelf fishes

3.6.4 Analysis of North Sea Q1 IBTS species abundance trends

O impacto das variáveis explicativas (independentes) sobre as variáveis dependentes (de resposta) foi mensurado por meio da estimativa de regressões lineares multivariadas e, também, de regressões logísticas. Os cálculos foram realizados com auxílio do software Stata36.

36

Em cada resultado das regressões observei quatro valores: 1. coeficiente da regressão - mede o efeito de cada variável explicativa sobre a variável de resultados; 2. P-t - indica se e o quanto o coeficiente é significativo; 3. Prob > F: teste para ver se todos os coeficientes do modelo são

Estimei regressões com dados em painel, as quais são adequadas para acompanhar uma mesma unidade de corte transversal (os estados, por exemplo) ao longo do tempo, isto é, possibilitam observar o comportamento das variáveis em vários pontos do tempo ao longo do tempo. Privilegiei o modelo PCSE - erros-padrão corrigidos em painel - sempre que a estrutura dos dados permitiu. Preferi esse modelo porque ele controla prováveis problemas de heteroscedasticidade37 e apresentou coeficientes similares ao do pooled, os quais foram mais favoráveis para a análise proposta. Quando não foi possível estimar as regressões pelo modelo PCSE, usei o pooled que é um modelo que ignora a estrutura em painel dos dados e trata o banco como se todas as observações fossem independentes umas das outras e, por vezes, para comparar, usei o modelo de efeitos fixos, o qual que trata as variáveis não observadas como parâmetros fixos. Nesses dois últimos casos, a fim de conferir mais consistência às estimativas, trabalhei com o estimador robusto de erros-padrão38.

Procedi de três maneiras alternadas nas análises e previsões39 acerca da variável dependente. Cada uma delas a depender, claro, do modelo da regressão, mas também, do objetivo com a exposição dos resultados.

Uma das formas que analisei os resultados das regressões lineares foi considerando diretamente os coeficientes de regressão: o modelo para as estimativas, a significância, os valores e sinal das variações previstas. O modelo dessas regressões é:

diferentes de 0: se o numéro é < 0.05, então o modelo é adequado. 4. R-quadrado – coeficiente de determinação que mostra o poder de explicação dos modelos. É uma medida geral da força de associação. Nas regressões logísticas o r-quadrado não existe, mas sua função é substituída pelo pseudo R-quadrado. Não apresentarei aqui os valores usualmente divulgados como “bons” em cada um destes resultados porque isso é controvertido. No entanto, penso que nas análises ficará claro a forma que os analisei.

37

A heterocedasticidade entendida como acentuada dispersão dos dados em torno de uma reta do modelo regredido.

38

Os textos especializados recomendam aplicar a regressão robusta para corrigir eventuais problemas de heterocedasticidade.

39

Lembro noções elementares sobre o que são e o alcance dos valores preditos: são valores da variável dependente que podem ser baseados diretamente nos coeficientes da regressão estimada, ou podem ser obtidos a partir de fórmulas que utilizam esses coeficientes na equação. Assim, valores preditos são, também, a predição acerca dos valores que assumirá as variáveis independentes (Bertolo n.d.; Gujarati & Porter 2011; Wooldridge 2011). Nas duas concepções, interligadas, valores preditos encaminham a análise sobre os efeitos das variáveis explicativas na variação da variável de resposta, mas o efeito na variação não denota, necessariamente, causalidade.

y = !

0

+ !

1

x

1

+ β

2

x

2

3

x

3

+ …β

m

x

m

onde

y é o valor previsto da variável dependente

!0 o intercepto, é o valor previsto de y quando x=0

!1, !2... é o coeficiente de regressão referente a cada variável independente

" é o valor previsto da variável independente, isto é, cada xj é uma variável de

previsão e y é a variável de resposta:

No entanto, quando meu interesse era salientar uma das variáveis independentes em especial, optei por resolver equações complementares, incluindo o desvio padrão. Esse é o procedimento mais frequente na tese, pois entendi que trouxe ganhos analíticos, como poderá ser conferido no desenvolvimento do trabalho. Exemplifico a sequência dos procedimentos para uma variável de interesse, digamos a referente ao coeficiente !3:

#

= [!

0

+ !

1

"

1

+ !

2

"

2

] + !

3

"

3

ŷ= [!

0

+ !

1

"

1

+ !

2

"

2

] + !

3

∗(x

3

+s)

ŷ =

ŷ− #

Admiti x como a média das respectivas variáveis independentes s = desvio padrão referente à variável independente de interesse

Interpretação: mantidas as variáveis de controle constante, o aumento de um desvio padrão na variável de interesse, aumenta a variável dependente em ŷ.

Nota-se que as estimativas têm interpretação de efeito parcial (ceteris

paribus). Tudo o mais mantido igual, obtém-se a variação prevista em y dadas as

variações na variável independente em análise (Wooldridge 2011, pp.70–71). Na terceira forma de análise a variável dependente era binária e, por isso, estimei modelos de regressão não linear. Usei o modelo de regressões logísticas e fiz os cálculos dos efeitos marginais para as análises das probabilidades relacionadas às variáveis independentes, incluindo, também, algumas variáveis em interação, também chamadas de condições.

Em síntese, o método dessa pesquisa é o estatístico descritivo. O seu desenvolvimento partiu das seguintes premissas e modelo causal:

4.3.1 Pressupostos e modelo causal em exame

As estratégias metodológicas foram realizadas para observar se e como a sobrerrepresentação dos distritos eleitorais afeta o comportamento de legisladoras e legisladores. Especificamente testei a aplicação do modelo distributivista das barganhas legislativas que pode ser sintetizado na formulação:

IRR afeta DRR

Tal formulação implica que parlamentares de distritos eleitorais sobrerrepresentados (DSO) conseguem levar mais recursos para seus distritos do que as/os colegas dos distritos proporcionais ou sub-representados (DRG) porque têm comportamento semelhante nas votações.

Se essa afirmação for verdadeira, as análises devem mostrar que a sobrerrepresentação distrital é uma das variáveis mais significativas entre as discutidas anteriormente. Planejei quatro tipos de análises empíricas para verificar isso.

A primeira é o exame do efeito dos valores do índice de representação (IRR) sobre os valores das transferências fiscais do governo central (DRR).

Na segunda análise, a variável dependente é a coesão do voto de parlamentares de distritos sobrerrepresentados. A presunção é que parlamentares de distritos sobrerrepresentados são mais coesos do que colegas de outros tipos de distritos. A medida da coesão do voto é o índice de Rice.

Analisei, também, a probabilidade de que uma dupla de parlamentares votará junto. A variável dependente é o voto igual de uma díade em relação ao fato da dupla advir de distrito sobrerrepresentado distrito sobrerrepresentados, pertencer à coalizão do governo e ser filiado ao mesmo partido, principalmente. De acordo com a literatura, a expectativa é que encontrar evidências sobre a importância destacada do primeiro atributo.

A última variável dependente é a participação em coalizões vitoriosas. Analisei a frequência com que legisladoras e legisladores de distritos sobrerrepresentados participaram em coalizões vitoriosas. Se seu “preço” relativo faz de tais representantes parceiros mais atraentes, então nós deveremos ver que elas/eles são mais propensos a participar nas coalizões vitoriosas do que colegas com outros atributos.

O modelo causal é:

,-- à -,./ (12 3í567 12 .158. :;<1=;1>5) à 3--

Apresentarei os procedimentos metodológicos específicos e os resultados de cada uma dessas análises nas próximas quatro seções.

In document WGBIODIV11.pdf (2.681Mb) (sider 39-48)