Teoria de Jogos por Alda Carvalho - Qual será a melhor estratégia de Ronaldo na marcação dos livres directos?

Eixos de Opinião de Janeiro de 2020

Alda Carvalho - Docente do Ensino Superior e Investigadora do CEMAPRE/ISEG


Título: Qual será a melhor estratégia de Ronaldo na marcação dos livres directos?

Uma situação típica em Teoria de Jogos de John von Neumann diz respeito ao clássico Dilema do prisioneiro. Dois ladrões são interrogados em salas separadas, sem que possam comunicar. Cada um deles pode optar por denunciar o seu cúmplice, ou por não colaborar com a polícia. Se nenhum colaborar, cada um dos larápios apanha 1 ano de prisão. Se ambos denunciarem, cada um dos larápios apanha 8 anos de prisão. Se um denunciar e outro não, o denunciante sai em liberdade e o outro apanha 10 anos de prisão. O melhor cenário conjunto é apanharem os dois um ano de prisão, só alcançável através de cooperação. Seguindo uma lógica não cooperativa, regendo-se unilateralmente apenas pelo seu ponto de vista, cada jogador deve optar por denunciar o cúmplice. Se ambos o fizerem, com vista a maximizar o pior cenário, segue-se uma pena de 8 anos para cada um. Mesmo sabendo de antemão a escolha do adversário, nenhum dos jogadores optaria pela mudança de estratégia. Trata-se de um equilíbrio de Nash em estratégias puras (https://www.youtube.com/watch?v=5Kkz0feflSE&t=7s). A formalização e determinação de equilíbrios é um dos objectivos da Teoria de Jogos de John von Neumann.

Em jogos de soma nula, o que um jogador ganha é, simetricamente, o que o seu oponente perde. Exemplos famosos deste tipo de jogos são as batalhas entre pilotos de caça e pilotos de bombardeiro na segunda guerra mundial. Um piloto de caça normalmente atacava um bombardeiro mergulhando por cima (estratégia «huno-ao-sol»). Se o piloto do bombardeiro fosse apanhado desprevenido, essa estratégia era 100% eficaz. Com ajuda de óculos escuros, os pilotos dos bombardeiros passaram a olhar para cima ocasionalmente para procurar os caças. A manobra era arriscada, mas diminuía a eficácia da estratégia «huno-ao-sol» - esta passava a ser apenas 95% eficaz. Devido a este facto, os pilotos dos caças responderam com uma segunda estratégia; um ataque arriscado de baixo para cima (estratégia «ezak-imak», oposto de kamikaze). Se os pilotos dos bombardeiros estivessem a olhar para cima, morriam pela certa; se os pilotos dos bombardeiros estivessem a olhar para baixo, eram eles que infligiam a morte certa aos pilotos dos caças. Analisando este jogo, pode ver-se que não existe equilíbrio de Nash em estratégias puras.

Suponhamos que, utilizando um dispositivo aleatório, o piloto do caça opta 99% das vezes pela estratégia «huno-ao-sol» e apenas 1% das vezes pela estratégia «ezak-imak» (uma estratégia mista). Se o piloto do bombardeiro optar por olhar sempre para cima, o resultado esperado é 0.99×0.95+0.01×1=0.9505. Se o piloto do bombardeiro optar por olhar sempre para baixo, o resultado esperado é 0.99×1+0.01×0=0.99.

Uma estratégia mista por parte do piloto do bombardeiro só pode piorar a sua perspectiva, dado estar a adicionar peso a uma estratégia com pior valor esperado. Por exemplo, suponhamos que o piloto do bombardeiro responde com a estratégia mista que consiste em optar por olhar para cima 90% das vezes e olhar para baixo 10% das vezes. Nesse caso, o resultado esperado conjunto é igual a

0.99×0.9×0.95+0.99×0.1×1+0.01×0.9×1+0.01×0.1×0≅0.95445.

Sendo assim, a estratégia mista (99% «huno-ao-sol» e 1% «ezak-imak») por parte do piloto de caça garante um valor esperado de 0.9505. Melhor do que 0.95!

Usando o Teorema de Minimax de von Neumann, é possível determinar o equilíbrio de Nash em estratégias mistas. No exemplo anterior, o equilíbrio é atingido com uma estratégia mista para cada um dos jogadores: o piloto de caça deve optar, de forma aleatória, 20 em cada 21 vezes pela estratégia «huno-ao-sol»; e o piloto de bombardeiro deve optar, de forma aleatória, 20 em cada 21 vezes pela estratégia olhar para cima. Neste caso, o resultado esperado é igual a

Suponhamos que o Cristiano Ronaldo tem uma taxa de conversão de livres de 8.5%, mesmo quando a barreira salta alto. Se a barreira não saltar, a taxa sobe para os 13%. O Ronaldo pode optar marcar o livre com manha, executando um «under wall». Quando isso acontece, no caso de a barreira saltar, o Ronaldo tem uma eficácia de 9%. É claro que, se executar um «under wall» sem a barreira saltar, a eficácia é nula. Qual será o equilíbrio de Nash nesta situação?

Publicado/editado: 05/01/2020