Læreplangruppens sammensetning og arbeide

5. IDENTITET OG DIALOG, MANGFOLD ELLER ENHET?

6.6 Læreplangruppens sammensetning og arbeide

Quando existem apenas dois jogadores, é comum descrever-se o jogo através de uma bi-matriz G = {A, BT}, que pode ser representada tal como mostra a Ta- bela 2.1. Esta matriz mostra as estratégias puras que os jogadores podem utilizar e os ganhos Ahk = π1(sh, sk) e BhkT = π2(sh, sk), respectivamente do jogador 1 e

2, para cada perfil de estratégias (sh, sk), sh ∈ S1, sk ∈ S2.

Jogador 2 s12 . . . sr2 Jogador 1 s11 (A1,1, B T 1,1) . . . (A1,r, B1,rT ) .. . ... . .. ... sq1 (Aq,1, B T q,1) . . . (Aq,r, Bq,rT )

Tabela 2.1: Bi-matriz de ganhos de um jogo de dois jogadores.

Os jogos simétricos de dois jogadores e duas estratégias estão entre os jogos mais estudados na teoria dos jogos e na teoria dos jogos evolucionária (ver Sec- ção 2.5), sendo os que são utilizados como caso de estudo neste trabalho. Num jogo simétrico o papel dos jogadores é indistinguível. Isto significa que o conjunto de estratégias disponíveis e as funções de ganho são iguais para os dois jogadores,

2.4. Teoria dos Jogos 25 ou seja, S1 = S2 = {s1, ..., sq} e A = B. Estes jogos podem ser representados

através de uma matriz de ganhos simples como definido na Equação 2.5 para um jogo com duas estratégias. Nesta matriz o valor de cada célula representa o ganho do jogador que realiza a acção equivalente às linhas da matriz.

s1 s2

s1 a b

s2 c d

(2.5) Os jogos simétricos de dois jogadores e duas estratégias podem ser classificados quanto aos equilíbrios de Nash nas três classes seguintes (Szabó & Fáth, 2007):

• Jogos de dominância pura [(a − c)(d − b) ≤ 0]: Neste caso, uma das estra- tégias é estritamente dominada pela outra. Se a − c > 0 e d − b < 0, o equilíbrio de Nash consiste no perfil (s1, s1). Se a − c < 0 e d − b > 0, o

equilíbrio de Nash consiste no perfil (s2, s2).

• Jogos de anti-coordenação [a − c < 0, d − b > 0]: Existem dois equilíbrios de Nash constituídos por estratégias puras e outro constituído por estratégias mistas. Os dois primeiros são (s1, s2) e (s2, s1). Se p e q forem, respecti-

vamente, a probabilidade de os jogadores 1 e 2 jogarem s1, o equilíbrio de

Nash misto é igual a (p = r, q = r), em que

r = 1

1 + a−c_d−b. (2.6)

• Jogos de coordenação [a − c > 0, d − b < 0]: Existem dois equilíbrios de Nash constituídos por estratégias puras e outro constituído por estratégias mistas. Os dois primeiros são (s1, s1) e (s2, s2). O equilíbrio de Nash misto

é igual a (p = r, q = r), com r definido como na Equação 2.6, tal como para os jogos de anti-coordenação.

No caso em que cada jogador tem à sua disposição as acções Cooperar (C) e Não Cooperar (D)2_{, a matriz de ganhos é geralmente definida como na Equa-}

ção 2.7, onde R, S, T e P são, respectivamente, abreviaturas dos termos Reward, Sucker, Temptation e Penalty, usados na língua inglesa.

C D C R S D T P ! (2.7) 2_{Do inglês Defect.}

Como é prática comum, vamos considerar R = 1 e P = 0 e restringir S e T aos intervalos −1 < S < 1, 0 < T < 2 (Hauert, 2002; Roca et al., 2009a). A região S > 0, T < 1 corresponde ao jogo da Harmonia em que a estratégia racional consiste em jogar C. Este jogo não constitui um dilema social uma vez que é sempre melhor cooperar. O famoso jogo Dilema do Prisioneiro (Axelrod, 1984) corresponde à região S < 0, T > 1. De forma mais genérica, este é um jogo onde se verificam as condições T > R > P > S. Repare-se que existe uma forte tentação de jogar D pois isso pode resultar no ganho máximo T . Esta é a decisão racional, o que leva a que o equilíbrio de Nash deste jogo seja (D, D). No entanto, se ambos os jogadores jogarem D, terão um ganho inferior (P ) ao que obteriam se ambos jogassem C (R), daí o dilema. Tanto o jogo da Harmonia como o Dilema do Prisioneiro são jogos de dominância pura. A região S > 0, T > 1 corresponde ao jogo Snowdrift. Neste jogo a melhor acção a realizar depende da acção do adversário: deve realizar-se a acção oposta do outro jogador, sendo este, portanto, um jogo de anti-coordenação. Este jogo é também conhecido por Falcão-Pomba e por jogo da Galinha. Os diferentes nomes por que é conhecido reflectem a variedade de situações reais que pode modelar (Hauert & Doebeli, 2004). Finalmente, a região S < 0, T < 1 corresponde ao jogo Caça ao Veado. Neste jogo existe um dilema entre jogar a acção C, potencialmente mais proveitosa mas mais arriscada, e a acção D, menos proveitosa mas menos arriscada. A Figura 2.1 mostra o denominado plano ST que permite representar a região a que corresponde cada um destes jogos, em função de S e de T .

Para além do plano ST , é também muito comum a utilização de versões do Dilema do Prisioneiro e do Snowdrift que podem ser descritas por apenas um parâmetro. No primeiro caso, é costume utilizar-se os valores R = 1, P = S = 0, T = b > 1, onde b reflecte a dificuldade do jogo para os agentes cooperantes. Esta parametrização foi utilizada pela primeira vez em Nowak & May (1992). Na Figura 2.1 este jogo corresponde à linha vermelha, estando portanto no limite entre um jogo do tipo Dilema do Prisioneiro e um jogo do tipo Snowdrift. No caso do Snowdrift, é muito comum a parametrização R = 1, P = 0, S = r − 1, T = r + 1, onde 0 ≤ r ≤ 1 representa o rácio custo-benefício de cooperação mútua. A dificuldade do jogo para os agentes cooperantes aumenta com o valor de r. Esta versão do jogo pode ser descrita do seguinte modo: Existe uma tarefa cuja execução implica um custo c a ser dividido pelos jogadores que participarem na sua execução e um benefício b > c para ambos os jogadores, independentemente da sua participação. Se ambos os jogadores cooperarem na execução da tarefa,

2.4. Teoria dos Jogos 27

-1

Harmonia Snowdrift

Caça ao Veado Dilema do Prisioneiro S 0 1 T 1 0 2

Figura 2.1: Representação do plano ST , correspondente aos jogos simétricos de dois jogadores e duas estratégias onde R = 1, P = 0, −1 < S < 1, 0 < T < 2. Cada quadrante deste plano corresponde a um jogo, sendo o Di- lema do Prisioneiro, o Snowdrift e o Caça ao Veado os jogos mais utilizados no estudo da evolução da cooperação.

recebem cada um o ganho b − c/2; Se apenas um jogador cooperar, este recebe b − c, enquanto o jogador não-cooperante recebe por inteiro o benefício b; Se ambos se abstiverem de cooperar, cada um recebe o ganho 0. Se utilizarmos c = 1, então r = 1/(2b − 1), 0 ≤ r ≤ 1, o que equivale à parametrização descrita acima. A seguir apresentamos as matrizes de ganhos correspondentes às versões de um parâmetro do Dilema do Prisioneiro (à esquerda) e do Snowdrift (à direita).

C D C 1 0 D b 0 ! C D C 1 1 − r D 1 + r 0 ! (2.8)

Como referimos acima, os jogos simétricos de dois jogadores e duas estratégias encontram-se entre os mais estudados na teoria dos jogos e na teoria dos jogos evolucionária (ver próxima secção). Existem, no entanto, outros jogos também frequentemente utilizados como sejam os jogos Ultimato, Investimento e Cento- peia que são jogos de dois jogadores que envolvem a transferência de dinheiro. Exemplos de jogos com um número arbitrário de jogadores são, por exemplo, o Dilema do Lenhador e o jogo do Bem Comum. Este dois jogos modelam uma situação que é comum designar por Tragédia dos Comuns onde existe um recurso

cuja exploração deve ser gerida por vários agentes. Uma descrição destes e outros jogos pode ser encontrada em Gintis (2000) e em Mariano (2006).

In document 1.3 Læreplaner og teoretiske innfallsvinkler til en læreplananalyse (sider 76-79)