• No results found

2.8 Metodiske betraktninger

2.8.2 Kilder og datainnsamling

Apresenta-se nesta seção uma formalização do conjunto de definições importantes para a explanação do trabalho e que serão utilizados ao longo deste. Além disso, são demonstradas algumas características teóricas relevantes para sistemas multiagentes competitivos aplicados a mercados financeiros.

• S : conjunto dos possíveis estados do ambiente sob o qual atuam os agentes. • φ : Conjunto ordenado dos ativos financeiros existentes no ambiente. A expres-

são φirepresenta um identificador específico de um ativo. O conjunto φ é com-

posto por todos os N identificadores possíveis, φ = { φ1, φ2, ....φn}.

• Price(φi,t): Função que especifica o preço do ativo φino tempo t. Considera-se

que os preços serão sempre positivos, isto é Price(φi,t) ∈ ℜ∗+.

• A: conjunto de todos os agentes operadores de um sistema. Um agente opera- dor é uma entidade de software capaz de comprar e vender ativos financeiros de modo autônomo. Aponta-se um operador através da expressão Ai, onde i repre-

senta um número identificador do operador. Um agente operador é definido por uma tupla <µi,φi,ωi> em que µié uma estratégia de atuação (µi), φié um ativo a

4.1 Formalização de Conceitos 61

ser administrado e ωié o conjunto de recursos sob responsabilidade do operador

i.

• θi: ordem dada por um agente operador Ai, escolhida dentro de um conjunto

de ordens possíveis θ . Uma ordem é definida por uma tupla <φi,q,y> onde φi

corresponde ao ativo alvo, q ∈ ℜ+define uma quantidade de unidades do ativo a

ser transacionada, e o tipo de transação y ∈ (compra,venda). Um caso particular de ordem, a ordem limitada ˜θi é definida pela tupla <φi,q,y,p>, onde um preço

limite p ∈ ℜ∗

+, funciona como um preço máximo numa ordem de compra e preço

mínimo numa ordem de venda.

• µ: função µ : S × H(S) → θ que define uma estratégia de análise de um agente operador. µ determina uma ação a ser adotada ((θi)) pelo agente i, dado o estado

atual e histórico de estados H(S) do ambiente.

• M: sociedade composta por vários agentes operadores que atuam para um mesmo proprietário e obedecem a uma função de utilidade P. Denota-se que um agente Aipertence a uma determinada sociedade M por Ai∈M.

• ωi : conjunto dos recursos controlados por um agente operador Ai. É definido

como uma tupla ωi = <mi, ωi1, ωi2, ..., ωin>, onde mi∈ ℜ∗+ representa a quantia

em dinheiro maior que zero alocada ao agente Ai. A expressão ωij representa o

número de ações (shares) do ativo identificado por φj mantidas correntemente

pelo agente Ai(ωij∈N). Pode-se identificar os recursos mantidos pelo agente Ai

no tempo t pela expressão ωi(t). Sem a referência de tempo explícita, admite-se

que a referência é feito aos recursos mantidos pelo agente no tempo corrente. O conjunto de todos os recursos dos agentes de uma sociedade é definido como ω = {ω1, ..., ωi} ∀i ∈ A.

• V(ωi,t): função em ℜ∗+que especifica o valor no tempo t dos recursos do agente

Ai, conforme a equação 4.1.

V (ωi,t) = mi+

j∈φ

Price(φi,t) ∗ ωij (4.1)

• V(ω,t): função que informa o valor no tempo t dos recursos de uma sociedade M. É expressa pela equação 4.2.

V (ω,t) =

i∈M

V (ωi,t) (4.2)

• R(ωi,t) : retorno financeiro de um agente Aino instante t é uma função com ima-

4.1 Formalização de Conceitos 62

anterior. É definido formalmente pela equação 4.3. R(ωi,t) =V (ωi,t) −V (ωi,t − 1)

V (ωi,t − 1) (4.3)

• K(ωi,t): risco de um agente Aino instante t. É definido como o desvio padrão

dos retornos de um agente do instante inicial até o instante t. Tal definição é de uso comum em finanças. Para uma discussão sobre formas de medir riscos, ver seção 3.2.1. Formalmente, o risco de um agente é definido pela equação 4.4. A imagem da função risco pertence ao conjunto ℜ. O risco médio (R) pode ser calculado através da fórmula 4.5

K(ωi,t) = s 1 N −1∗ N

t=1 (R(ωi,t) − R(ωi))2 (4.4) R(ωi) = N1 ∗ N

t=1 R(ωi,t) (4.5)

• PT(Ai): função de utilidade que mede o desempenho de um agente operador em

determinado período T, permitindo a comparação entre desempenhos de agentes distintos, a medida que números maiores representam melhor desempenho. Os agentes têm como objetivo maximizar tal função e são avaliados pelos demais e por si mesmos através dela. Denota-se por Pt2

t1(Ai) o desempenho do operador Ai no intervalo de tempo [t1,t2]. A expressão PT(Ai) corresponde, ao desempenho

do agente Ai no período [tatual−T,tatual]. É possível definir uma função de uti-

lidade P com base na premissa de que os agentes operadores buscam maximizar seu retorno financeiro tal como definido na equação 4.3. Desta forma, optou-se por definir a função de utilidade P para um agente operador como explicitado na equação 4.6.

Pt2

t1(Ai) =

V (ωi,t2) −V (ωi,t1)

V (ωi,t1) (4.6)

Considera-se que um operador inicia sempre com recursos não nulos e que os ati- vos não podem assumir preço zero, logo ∀i,∀t,V (ωi,t) > 0 e V (ω,t) > 0. Ana-

logamente, pode-se definir para uma sociedade M a função de utilidade Pt2

t1(M):

Pt2

t1(M) =

V (ω,t2) −V (ω,t1)

V (ω,t1) (4.7)

A classe de problemas alvo pode ser definida formalmente então como um con- junto de problemas onde o tempo está no intervalo [t0, ∞] e não há uma estratégia com

desempenho superior as demais em todos os intervalos de tempo. Formalmente: ∀Ai, ∃(Aj, T ) , T = [t1,t2] → PT(Aj) > PT(Ai) (4.8)

4.1 Formalização de Conceitos 63

Dentro desta classe de problemas valem as seguintes hipóteses sobre as estratégias de atuação disponíveis e que serão usadas no decorrer deste trabalho:

• Desempenho inconstante no tempo: Uma estratégia com bom desempenho atualmente pode apresentar mau desempenho no futuro, e vice-versa, devido a mudanças no mercado.

• Desempenho inconstante em ativo: Uma estratégia com bom desempenho em um determinado ativo φxpode ter desempenho sofrível em outro ativo, no mesmo

intervalo de tempo.

Um dos problemas que pertencem a esta classe é exatamente a atuação em merca- dos financeiros. Neste domínio, além das características citadas anteriormente, pode-se afirmar que não há meio plenamente confiável para predizer o comportamento do am- biente (mercado, ou mesmo de um ativo específico) e conseqüentemente não se pode prever com exatidão o comportamento de cada estratégia ou qual delas terá melhor desempenho. Entretanto, as mudanças no desempenho não ocorrem de forma abrupta, mas de modo relativamente lento (alguns minutos) para os computadores atuais. Isto nos leva a tentar explorar a atuação simultânea de várias estratégias.

O uso de um conjunto de agentes com diferentes estratégias trabalhando juntos, não garante obrigatoriamente um desempenho melhor para o sistema. Entretanto, é possível obter um desempenho melhor do que o desempenho do melhor agente. Por outro lado, desempenho do sistema também não tem como limite inferior o desempe- nho do pior agente, podendo ser ainda pior que este. Estes fatos são demonstrados a seguir.

Teorema 2: O desempenho de uma sociedade M pode ser melhor em um deter- minado período de avaliação do que o desempenho do agente An melhor avaliado no

mesmo período.

Demonstração: Seja M uma sociedade com agentes operadores A = {A1, A2...An,

} e um período de avaliação do sistema T = [ta,td]. Sem perda de generalidade, pode-se

escrever: que PT(A1) ≤ PT(A2) ≤ ...PT(An).

Pela definição de PT(M), caso todos os recursos de M fossem alocados exclusiva-

mente para um determinado agente Axno período T, então V (ωn,t) = V (ω,t), logo:

PT(M) = PT(Ax) (4.9)

Para qualquer sistema M em um ambiente multiagente complexo tal como des- crito, vale a equação 4.7 e considerando intervalo subseqüentes [ta,tb] e [tb,tc] pode-se

4.1 Formalização de Conceitos 64 afirmar: Ptc ta(M) = V (ω,tc) V (ω,ta)−1 = ( V (ω,tb) V (ω,ta)−1+1)( V (ω,tc) V (ω,tb)−1+1)−1 = (P tb ta+1)∗(P tc tb+1)−1 (4.10) Logo, considerando um período [tb,tc] qualquer contido no período de avaliação

T, isto é [tb,tc] ⊂ [ta,td]=T. Pode-se deduzir:

PT(M) = (Pttab(M) + 1) ∗ (P

tc

tb(M) + 1) ∗ (P

td

tc(M) + 1) − 1 (4.11)

Com base na expressão 4.8, pode-se considerar por hipótese a existência de um intervalo [tb,tc], no qual o agente Axtenha o melhor desempenho entre todos os agen-

tes, embora seu desempenho no período total [ta,td] seja menor que o operador An.

Então, pode-se afirmar que Ptc

tb(Ax) > P

tc

tb(An). Caso todos os recursos fossem alo- cados ao operador Ax no período [tb,tc], então de acordo com a equação 4.9 têm-se

Ptc

tb(M) = P

tc

tb(Ax). De modo análogo, caso nos intervalos [ta,tb] e [tc,td] todos os recursos alocados estivessem alocados ao operador An, então: Pttab(M) = P

tb

ta(An) e Ptd

tc(M) = P

td

tc(An). Substituindo estas expressões para P

tc tb(M), P tb ta(M) e P td tc(M) na equação 4.11, tem-se: a:1 b:3 c:4 d:2 PT(M) = (Pttab(An) + 1) ∗ (P tc tb(Ax) + 1) ∗ (P td tc(An) + 1) − 1 (4.12) mas como: Ptc tb(Ax) > P tc tb(An) (4.13)

pode-se deduzir que: PT(M) > (Pttab(An) + 1) ∗ (P

tc

tb(An) + 1) ∗ (P

td

tc(An) + 1) − 1 = PT(An) (4.14)

Neste caso, a sociedade M construída da forma indicada tem desempenho melhor que seu agente operador com melhor desempenho (An) no mesmo período. Isto de-

monstra que o desempenho do sistema em um determinado período de avaliação pode ser melhor que o desempenho do agente melhor avaliado no mesmo período. De modo análogo, pode-se demonstrar que o desempenho do sistema em um determinado pe- ríodo de avaliação pode ser pior que o desempenho do agente pior avaliado no mesmo período.