• No results found

3.5.1 Construção de um aplicativo

Para medir a freqüência com que cada um dos padrões estudados ocorreu e, adicionalmente, validar se os preços subseqüentes subiram ou desceram conforme enumerado no Quadro 2, foi construído um sistema na forma de macros em uma planilha eletrônica, resultando, ao final, na aplicação denominada “Valida Padrão

Candlestick”. A aplicação é executada em 3 etapas: (i) importação do arquivo-base (cotações históricas) oriundo da Bovespa para dentro de uma planilha, (ii) varredura da planilha gerada na primeira etapa e verificada a existência de cada um dos 16 padrões estudados, gerando uma planilha por padrão discriminando todos os papéis (ativos) para aquele padrão, e (iii) sumarização da quantidade de ocorrências de cada padrão, baseando-se no conjunto de planilhas geradas na segunda etapa.

3.5.2 Fórmulas de identificação de cada padrão

Todas as fórmulas utilizadas na aplicação “Valida Padrão Candlestick” foram extraídos de CANDLESTICK TRADING FORUM (2010), ambiente virtual de apoio ao investidor na análise de candlesticks. As fórmulas utilizadas no âmbito deste trabalho estão enumeradas no Quadro 3.

3.5.3 Avaliação dos preços subseqüentes

Para avaliar os preços subseqüentes à ocorrência do padrão, tomou-se por base o preço de fechamento do dia de formação do padrão, considerado aqui como D+0 (dia zero). Em seguida, analisaram-se os preços de fechamento dos 7 pregões seguintes (D+1 a D+7) e, para cada um desses pregões, verificou-se se o preço de fechamento do ativo foi superior (subiu) ou inferior (desceu) ao seu preço em D+0.

3.5.4 Pré-processamento

Uma vez disponibilizados os arquivos de cotação histórica, conforme os pro- cedimentos enumerados no Anexo I, foi necessário:

(i) Concatenar os arquivos gerando o arquivo intitulado COTAHIST.ATUDOx.txt:

copy cotahist_a2005.txt + cotahist_a2006.txt + cotahist_a2007.txt + cotahist_a2008.txt +

cotahist_a2009.txt COTAHIST_ATUDOx.txt

(ii) Classificar o arquivo COTAHIST_ATUDOx.txt em ordem ascendente, de forma a otimizar a importação do seu resultado – COTAHIST_ATUDO.txt, para a pla- nilha MS-Excel.

Ao final, o arquivo COTAHIST_ATUDO.TXT conterá todos os dados necessá- rios para as análises subseqüentes.

Padrão Envolvente Baixista (Engolfe de baixa)

((C1 > O1) AND (O > C) AND (O >= C1) AND (O1 >= C) AND ((O - C) > (C1 - O1))) Envolvente Altista (Engolfe de alta)

((O1 > C1) AND (C > O) AND (C >= O1) AND (C1 >= O) AND ((C - O) > (O1 - C1))) Harami Baixista (mulher grávida de baixa)

((C1 > O1) AND (O > C) AND (O <= C1) AND (O1 <= C) AND ((O - C) < (C1 - O1))) Harami Altista (mulher grávida de alta)

((O1 > C1) AND (C > O) AND (C <= O1) AND (C1 <= O) AND ((C - O) < (O1 - C1))) Estrela da Manhã

((O2 > C2) AND ((O2 - C2) / (0.001 + H2 - L2) > 0.6) AND (C2 > O1) AND (O1 > C1) AND ((H1 - L1) > (3 * (C1 - O1))) AND (C > O) AND (O > O1)) AND (L2 < H1)

Estrela da Noite

((C2 > O2) AND ((C2 - O2) / (0.001 + H2 - L2) > 0.6) AND (C2 < O1) AND (C1 > O1) AND ((H1 - L1) > (3 * (C1 - O1))) AND (O > C) AND (O < O1)) AND H2 > L1

Bebê Abandonado de alta

((O2 > C2) AND ((O2 - C2) / (0.001 + H2 - L2) > 0.6) AND (C2 > O1) AND (O1 > C1) AND ((H1 - L1) > (3 * (C1 - O1))) AND (C > O) AND (O > O1)) AND (H1 <= L2)

Bebê Abandonado de baixa

(C2 > O2) AND ((C2 - O2) / (0.001 + H2 - L2) > 0.6) AND (C2 < O1) AND (C1 > O1) AND ((H1 - L1) > (3 * (C1 - O1))) AND (O > C) AND (O < O1)) AND H2 <= L1

Martelo

(((H - L) > 3 * (O - C) AND ((C - L) / (0.001 + H - L) > 0.6) AND ((O - L) / (0.001 + H - L) > 0.6))) Homem Enforcado

(((H - L) > 4 * (O - C)) AND ((C - L) / (0.001 + H - L) >= 0.75) AND ((O - L) / (0.001 + H - L) >= 0.075))

Martelo Invertido (Inverted Hammer)

(((H - L) > 3 * (O - C)) AND ((H - C) / (0.001 + H – L) > 0.6) AND ((H - O) / (0.001 + H - L) > 0.6))

Estrela Cadente (Shooting Star)

(((H - L) > 4 * (O - C)) AND ((H – C) / (0.001 + H - L) >= 0.75) AND ((H - O) / (0.001 + H - L) >= 0.75))

Linha Penetrante (Piercing Line)

((C1 < O1) AND (((O1 + C1) / 2) < C) AND (O < C) AND (O < C1) AND (C < O1) AND ((C - O) / (0.001 + (H - L)) > 0.6))

Tempestade à vista (Dark Cloud Cover)

((C1 > O1) AND (((C1 + O1) / 2) > C) AND (O > C) AND (O > C1) AND (C > O1) AND ((O - C) / (0.001 + (H - L)) > 0.6))

Um Soldado Branco (One White Soldier)

((C1 < O1) AND (((O1 + C1) / 2) < C) AND (O < C) AND (O > C1) AND (O < O1) AND (C > O1) AND ((C - O) / (0.001 + (H - L)) > 0.6))

Um Corvo Preto (One Black Crow)

((C1 > O1) AND (((C1 + O1) / 2) > C) AND (O > C) AND (O < C1) AND (C < O1) AND (O > O1) AND ((O - C) / (0.001 + (H - L)) > 0.6))

Legenda: C = Preço de Fechamento (Close); O = Preço de Abertura (Open); L = Preço Mínimo (Low); H = Preço Máximo (High); C1 = Preço de Fechamento (Close) do dia imediatamente anterior (D-1); O1 = Preço de Abertura (Open) em D-1; L1 = Preço Mínimo (Low) em D-1; H1 = Preço Máximo (High) em D-1;

C2 = Preço de Fechamento (Close) de dois dias imediatamente anteriores (D-2); O2 = Preço de

Abertura (Open) em D-2; L2 = Preço Mínimo (Low) em D-2; H2 = Preço Máximo (High) em D-2.

Quadro 3: Fórmulas referentes aos padrões de candlesticks utilizados

3.5.5 Execução da aplicação

Primeira Etapa - Importação de arquivo

A primeira etapa da aplicação corresponde à importação do arquivo-base COTAHIST_ATUDO.txt para uma planilha. É importante esclarecer que, apesar de o arquivo conter todos os ativos negociados na Bovespa no mercado à vista de 2005 a 2009, o foco deste trabalho é analisar os 10 papéis explicitados na seção 3.4.

Foi definido um filtro na aplicação para desprezar quaisquer papéis diferentes daqueles estipulados. Foram lidos 1.209.321 registros de cotação histórica, resul- tando, ao final, em 11.154 registros para o período e papéis considerados. A planilha resultante da importação do arquivo-base contém as seguintes colunas:

• Pregão, que corresponde à data de negociação do ativo na Bovespa, no for- mato ano (4 dígitos), mês (2 dígitos) e dia (2 dígitos);

• Código, que corresponde ao código do papel (ativo) negociado, limitado aos 10 papéis previamente definidos;

• Código do Mercado em que o papel foi negociado. O código 10 corresponde ao mercado à vista;

• Nome Resumido do papel;

• Preço de Abertura do papel no pregão em questão; • Máximo, maior valor de negociação do papel no pregão;

• Mínimo, menor valor de negociação do papel no pregão;

• Fechamento, valor do último negócio feito com o papel. Em outras palavras é o valor de fechamento de negociação do ativo;

• Qtde Negócio, que corresponde à quantidade de negócios realizados no pre- gão para o ativo;

• Qtde Título, que corresponde à quantidade de títulos negociados para o ativo no pregão;

• Volume: é o volume financeiro negociado ao longo do pregão para o ativo em questão;

• Data, que corresponde à data do pregão, porém, no formato dia, mês e ano com barras (aqui a data original foi convertida para o formato DD/MM/AAAA). Segunda Etapa – Análises iniciais

Nessa etapa, o histórico de cotação de cada ativo é percorrido e, para cada pregão, é testado se os preços que formam o candle correspondem ao padrão exa- minado (aplicação das fórmulas apresentadas no Quadro 3). Sendo positiva a vali- dação, é contabilizada como uma ocorrência do ativo para o padrão. A hipótese de os preços desse ativo subirem ou descerem nos 7 pregões subseqüentes também é verificada com a respectiva contabilização de sua freqüência.

Terceira Etapa – resumo geral (por regra)

Nesta etapa, é realizada a consolidação dos totais de todos os padrões apre- sentados em um Resumo Geral, de modo a facilitar a explicação do comportamento dos 16 padrões estudados.

3.5.6 Nível de agregação adotado para o estudo

Embora os padrões ocorram em um dado ativo, observado ao longo de um certo tempo, o nível de agregação adotado neste estudo é o padrão. Procura-se determinar os padrões que ocorreram para o mercado acionário brasileiro como um todo, tomando-se por amostra os papéis que representam maior volume financeiro (cerca de 40% da composição do IBovespa) e quantidade de negócios. Testou-se, assim, a força do padrão para o mercado em geral e não para um papel em particular, a exemplo do que Morris (2006) fez em seu estudo para o mercado norte-

americano. Daí a pertinência de se comparar os resultados deste e daquele trabalho.

Da análise de cada padrão constam as seguintes informações:

• Seu tipo, indicando se o padrão refere-se a uma “Reversão da Alta” ou a uma “Reversão da Baixa”;

• A quantidade total de ocorrências contabilizada para o padrão, ou seja, quan- tas vezes que o padrão ocorreu na série histórica;

• O percentual obtido pela razão entre a quantidade de acertos para cada dia avaliado (de D+1 a D+7) e a quantidade identificada;

• Percentual de perda média ou de ganho médio para cada ocorrência do pa- drão em análise, ou seja, a variação do preço de fechamento no dia avaliado (de D+1 a D+7) com relação ao preço de fechamento em D+0.

3.5.7 Abordagem adotada para análise dos padrões

Embora, metodologicamente, esta dissertação não contemple uma hipótese a ser provada, dada a sua natureza descritiva, o método adotado para análise dos pa- drões observados requer a adoção de hipóteses de trabalho, baseadas no compor- tamento esperado para um padrão, conforme a prática do mercado de capitais.

Adota-se como hipótese (Ha) que cada padrão permite inferir os preços sub-

seqüentes à sua ocorrência, ou seja, que os preços sobem ou descem a depender do padrão estudado e essa probabilidade não é equânime, isto é, não é de 50% em cada caso. Para validar essa hipótese, é utilizado um teste estatístico e assume-se como hipótese nula (H0) o inverso de Ha – também aqui denominada de hipótese al-

ternativa, ou seja: a probabilidade (p) de ocorrer alta ou baixa após o padrão é a mesma (H0 = 50%). Isso significa que o valor de p não pode ser significativamente

diferente de 0,5 (50%). Caso seja, acata-se a hipótese alternativa (Ha): a probabili-

dade de ocorrer alta é diferente de ocorrer baixa após o padrão, indicando que o va- lor de p é significativamente diferente de 0,5 (50%).

Para o teste estatístico, foram utilizadas a distribuição de Bernoulli e a Binomial, calculando-se, em seguida, o intervalo de confiança para os resultados encontrados. A distribuição de Bernoulli é usada para descrever um experimento no qual existem apenas 2 saídas possíveis, tipicamente um “sucesso” ou “fracasso”, entendida, no âmbito deste trabalho, como os preços subseqüentes respeitarem a

tendência esperada ou não. Nesse tipo de experimento, chamado de Ensaio de Bernoulli ou simplesmente ensaio, a probabilidade de sucesso é denominada p. Já a distribuição binomial é usada para caracterizar um certo número de sucessos em n ensaios de Bernoulli, para modelar alguns experimentos comuns nos quais cada elemento é selecionado independentemente e tem a mesma probabilidade p de apresentar um atributo específico. O intervalo de confiança é calculado para a probabilidade de sucesso em um experimento binomial e, no âmbito deste trabalho, é o intervalo que dará suporte à afirmação de que o padrão de fato é confiável como preditor de preço futuro de um ativo e a que nível é essa confiança: se a 90%, 95% ou a 99%.

Distribuição de Bernoulli

Para Bussab (2002, p. 141), muitos experimentos são tais que os resultados apresentam ou não uma determinada característica3. Para cada experimento, pode- se definir uma variável aleatória X, que assume apenas dois valores: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. Será indicada a probabilidade de sucesso p, isto é, P(sucesso) = P(S) = p, 0 < p < 1.

Bussab (2002, p. 142) define a variável aleatória X, como aquela que assume apenas os valores 0 e 1, com função de probabilidade (x, p(x)) tal que

(((( ))))

((((

))))

(((( ))))

((((

))))

         ==== ==== ==== ==== ==== ==== p 1 X P 1 p p - 1 0 X P 0 p

é chamada variável aleatória de Bernoulli. Em outras palavras, diz-se que uma vari- ável assim definida tem uma distribuição ou ensaio de Bernoulli, e será usada no âmbito deste trabalho no sentido de asseverar ou não os resultados obtidos, vez que deseja-se saber se determinado padrão de candlestick reverte, de fato, uma alta ou baixa (sucesso) ou se não reverte (fracasso).

3 Alguns exemplos: (i) uma moeda é lançada: o resultado ou é cara, ou não (ocorrendo, então,

coroa); (ii) um dado é lançado: ou ocorre face 5 ou não (ocorrendo, então uma das faces 1, 2, 3, 4 ou 6); (iii) uma peça é escolhida ao acaso de um lote contendo 500 peças: essa peça é defeituosa ou não; (iv) uma pessoa escolhida ao acaso dentre 1.000 é ou não do sexo masculino; (v) uma pessoa escolhida ao acaso entre os moradores de uma cidade e verifica-se se ela é favorável ou não a um projeto municipal. Em todos esses casos, interessa-se pela ocorrência de sucesso (cara, face 5, etc) ou fracasso (coroa, face diferente de 5, etc).

Distribuição Binomial

Para Bussab (2002, p. 143), repetindo-se o ensaio de Bernoulli n vezes obtém-se uma amostra de tamanho n de uma distribuição de Bernoulli. Em outras palavras, a distribuição binomial é aplicada para caracterizar um certo número de sucessos em n ensaios de Bernoulli, sendo usada comumente para modelar alguns experimentos muito comuns nos quais cada elemento é selecionado de forma independente e tem a mesma probabilidade p de apresentar um atributo específico.

Para Fonseca e Martins (1996, p. 64), trata-se de uma distribuição de probabi- lidade adequada aos experimentos que apresentam apenas dois resultados (suces- so ou fracasso). Esse modelo é fundamentado nas seguintes hipóteses:

• H1: n provas independentes e do mesmo tipo são realizadas;

• H2: cada prova admite dois resultados – sucesso ou fracasso;

• H3: a probabilidade de sucesso em cada prova é p e de fracasso é 1 - p = q.

A variável Y é definida como o número de sucesso das n provas, podendo ter os valores 0, 1, 2, 3, ..., n. Logo, admitindo-se o sucesso corresponder a 1 e o fra- casso a 0, ou seja, provas de Bernoulli, tem-se:

• Para Y = 0, uma sequência de n zeros: 0000 ... 0. Logo: P(Y = 0) = q.q.q.q ... q = q

• Para Y = 1, uma sequência de n zeros: 1000 ... 0; 0100 ... 0; 001000 ...0; se- rão n sequências, cada uma com um único sucesso e n - 1 fracassos:

P(Y - 1) = n.p.qn-1

• Para Y = y, tem-se y sucessos e (n - y) fracassos, correspondendo a sequên- cias com y algarismos 1 e n - y zeros. Cada sequência terá probabilidade de pyqn-y, e como há      n y

sequências distintas, tem-se P(Y = y) =      n y py.qn-y, que é a

expressão geral da distribuição Binomial (FONSECA, 1996, p. 64).

Para Y = n, tem-se uma sequência de n uns: 1111 ... 1, logo P(Y = n) = pn

Tem-se também:

• Média: de acordo com as hipóteses, vê-se que Y é a soma de n variáveis do tipo “Bernoulli”, daí:

µ(Y) = nµ(X) = n.p, ou seja, µ(Y) = np

• Variância: tem-se:

Intervalo de Confiança

Para Fonseca (1996, p. 186), Intervalo de Confiança (IC) trata-se de uma téc- nica para se fazer inferência estatística. A partir de um IC construído com os elemen- tos amostrais, infere-se sobre um parâmetro da população.

A partir de um parâmetro populacional θ e um estimador θ’ de θ, e conhecida a distribuição de probabilidade de θ’, é possível construir um intervalo θ’1 ≤ θ ≤ θ’2,

que contém θ, e se exigir que a probabilidade do intervalo seja de (1 - α) = nível de confiança. Normalmente, usa-se (1 - α)×100 = 90%, 95%, 99% ... Assim, tem-se (FONSECA, 1996, p. 194): P﴾ f - Z α 2

f(1 f ) n ≤ p ≤ f + Z α 2

f(1 f ) n ) = (1 – α)

4 Análise das observações

Neste capítulo é apresentada uma comparação entre as freqüências observa- das para o mercado brasileiro com aquelas apresentadas por Morris (2006). Entre- tanto, a simples verificação de freqüências não nos garante a validade estatística da análise, sendo necessário um estudo baseado em intervalos de confiança.