A Porta dos Desesperados, a Moeda de Ouro e o Problema dos Prisioneiros

Você acorda uma manhã e se vê de volta aos anos 80 no corpo de uma criança de oito anos, participando do programa infantil de Sérgio Mallandro. Talvez você preferisse ter acordado como uma barata gigante, mas nós nunca podemos prever como as transmigrações de alma no plano astral vão ocorrer.

mallandrodr.jpgFelizmente sua mente permanece a mesma – mais uma dessas coisas inexplicáveis da transmigração de alma. Quando se dá conta, está participando de uma das brincadeiras do programa, “A Porta dos Desesperados“. Ela é muito simples: existem três portas iguais. Atrás de uma delas está um prêmio, quem sabe um Lango-Lango ou um Pogobol. Atrás das outras duas portas estão pessoas com fantasias de monstro.

Você escolhe uma porta, e irá ganhar o que estiver atrás dela. Neste momento, para dar mais emoção à excitante brincadeira, Sérgio Mallandro, dizendo que quer lhe ajudar e sabendo de antemão em qual das portas está o prêmio, abre uma das outras duas portas para revelar um monstro, ou melhor, um homem mal-vestido de monstro. E Mallandro faz a derradeira pergunta: “Quer trocar?“, intercaladas com exclamações incompreensíveis como “Ráááá!” e “Glugluglu!“.

Em meio a toda esta insólita situação, a questão aqui é muito mais complexa do que parece a princípio. Prêmios Nobel, e toda uma comunidade de acadêmicos falharam em respondê-la corretamente. Será que você consegue? Afinal, é ou não vantajoso trocar de porta? Raáááá!

Este pequeno problema tornou-se famoso pelo mundo como o problema de Monty Hall, devido ao apresentador que possuía um quadro parecido em seu programa popular “Let’s Make a Deal” (“Vamos fazer um trato”) nos anos 70, algo como os diversos programas de auditório de Sílvio Santos. Muitos neurônios são queimados porque a resposta do problema é contra-intuitiva, o que quer dizer que a primeira resposta que você der a ele deve estar errada. Não tenha medo, tente descobrir se é ou não vantajoso trocar de porta antes de continuar lendo.

portadosdesesperadosdr.jpg

Tentou? Pois bem, vamos primeiro à resposta correta e contra-intuitiva. É sim vantajoso trocar, na verdade é duas vezes mais provável ganhar o prêmio se você trocar de porta do que se não o fizer. Acredite… se quiser! Ou leia a explicação.

Portas da Esperança
Existem três portas, vamos chamá-las de A, B e C. Quando você escolheu uma delas, digamos a A, a chance de que ela seja a premiada é de 1/3. Como conseqüência, as chances de que você tenha errado, ou em outras palavras, de que o prêmio esteja nas outras duas portas B ou C são de 2/3. Você pode comprovar isso somando a probabilidade de cada uma das outras portas ou simplesmente sabendo que a probabilidade de que haja um prêmio é sempre 1. O importante é ter em mente que a chance de que o prêmio esteja nas outras portas que você não escolheu é de 2/3.

Entendendo isso, basta notar que Mallandro abrirá sem erro uma dessas outras duas portas que contém um monstro. Ao fazer isso, ele está lhe dando uma informação valiosa: se o prêmio estava em uma das portas que você não escolheu, então agora ele só pode estar na porta que você não escolheu e não foi aberta. Ou seja, se você errou ao escolher uma porta – e as chances disto são de 2/3 – então ao abrir uma das outras portas não-premiadas o apresentador está efetivamente lhe dizendo onde está o prêmio. Toda vez que você tiver escolhido inicialmente uma porta errada, ao trocar de porta você irá com certeza ganhar.

Como as chances de que você tenha errado em sua escolha inicial, lembrando, são de 2/3, se você trocar de porta suas chances de ganhar serão de 2/3. Inversamente, a chance de que você ganhe se não trocar de porta continua sendo de apenas 1/3. É assim mais vantajoso trocar de porta, acredite… se compreender!

portascorredordr.jpg

Ainda não? Tente então imaginar o problema com 1.000 portas, o mega-super-especial da Porta dos Desesperados do programa do Mallandro, com três horas de duração. Você escolhe uma porta, e então Serginho Mallandro abre todas as outras 998 portas, revelando 998 monstros. Restam apenas duas portas, a que você escolheu inicialmente e a outra oferecida para troca. Uma delas tem o prêmio. A outra tem mais um sujeito fantasiado.

Com 1.000 portas, suas chances iniciais de ganhar o prêmio eram ínfimas. Você pode ter quase certeza (ou mais precisamente, 99,9% de “certeza”) que o prêmio estava em alguma das outras portas. E agora, Mallandro facilitou imensamente a sua vida. Se o prêmio estava em alguma das outras portas, agora ele só pode estar naquela porta que ele oferece para troca. Com 99,9% de certeza, se você trocar irá ganhar o prêmio. Rááááá!

Para quem ainda discordar dos resultados, tente simular o problema com um baralho e a ajuda de alguém. Separe três cartas, uma delas sendo o coringa (o prêmio). Embaralhe, disponha-as viradas, escolha uma para si. A pessoa fazendo o papel de Sérgio Mallandro deve então ver as duas cartas que sobraram, e virar uma que não seja o coringa. Você pode então escolher ficar com a sua carta ou trocar pela que restou.

Depois de efetuar essa simulação um número suficiente de vezes, você irá descobrir que “trocar” é mesmo duas vezes mais vantajoso do que “ficar”.

Ainda não está convencido e não tem um baralho à mão? Há simulações online do problema aqui, aqui ou aqui.

matrixportasdr.jpg

(Não) confie (apenas) em sua intuição
A resposta intuitiva ao problema é a de que quando o apresentador revelou uma porta não-premiada, nós teríamos à nossa frente um novo dilema com apenas duas portas e um prêmio, portanto as chances de que o prêmio esteja em qualquer uma das duas portas seriam de 50%. Não faria diferença trocar de porta.

E aí reside a falha. Em verdade, a porta que o apresentador abre depende da porta que nós escolhemos inicialmente. Ele sabe desde o começo onde está o prêmio (repetindo: nunca abrirá uma porta premiada). Ao abrir uma porta, ele não está criando um jogo todo novo, mas sim dando informações sobre o jogo original.

Presumimos, por algum motivo, que o apresentador abriu uma porta aleatoriamente, mas como vimos, se tivermos escolhido inicialmente uma porta não-premiada, ele não tem nenhuma liberdade de escolha e só pode abrir uma porta, que contém o outro monstro.

Se o apresentador abrir uma porta aleatoriamente – correndo assim o risco de revelar o prêmio e acabar com a brincadeira ali mesmo -, então, e apenas então, não fará diferença trocar de porta. Será como a simulação com cartas sugerida anteriormente, mas sem tomar o cuidado de não virar o coringa antes da hora. Nesta situação, e apenas nesta situação, as chances de trocar ou não de carta permanecem as mesmas. Mas então, as chances de que a brincadeira acabe antes da hora também são as mesmas. Todas equivalem a 1/3 (e, caso a porta aberta revele um monstro ou a carta virada não seja um coringa, as chances de ficar ou trocar são agora iguais).

Entender o problema e como as sutilezas de como a questão é apresentada afetam a sua resposta é quase mágico. Veja que se Mallandro abriu uma porta e apareceu um monstro, temos uma situação. Mas como interpretá-la depende de saber se ele sabia desde o início onde estava o prêmio, e assim se revelou um monstro deliberadamente ou não.

Subitamente, é como se o conhecimento de Sérgio Mallandro afetasse instantaneamente a sua percepção da realidade. Está aqui uma frase que você nunca esperaria ler na vida. Mas algo que se passa na mente de Sérgio Mallandro passa a influenciar diretamente decisões tão importantes para a sua vida como ganhar ou não um Atari. Algo quase sobrenatural. Como transmigrações de alma no plano astral.

Na vida real, é bem verdade, durante o programa não estava sempre claro se Mallandro, ao abrir uma porta, pretendia (e sabia que iria) revelar um monstro. Como vimos, nesse caso realmente não poderíamos afirmar com segurança se seria mais vantajoso trocar de porta.

Contudo, mesmo nesta situação incerta, ainda é recomendável que você troque de porta. Porque na situação de abertura aleatória, não faria diferença ficar ou trocar de porta, enquanto que na outra seria duas vezes mais vantajoso trocar. Isto é, você só tem a ganhar e nada a perder trocando de porta. Demonstre sua superioridade intelectual sobre o cara que pegou a Xuxa, e troque de porta.

hellraiserdr.jpg

Moedas de ouro…
A menos que as forças do mal conspirem para que o quadro da Porta dos Desesperados volte à televisão, é improvável que o importantíssimo conhecimento exposto até aqui lhe seja diretamente útil. Mas o raciocínio do problema de Monty Hall, também chamado de paradoxo de Monty Hall, não se resume àquela brincadeira do Mallandro. Ráááá!

Tome este outro paradoxo similar, o paradoxo da caixa de Bertrand. Há três caixas iguais. Em uma há duas moedas de ouro, em outra duas moedas de prata, e na que restou uma moeda de ouro e uma de prata. Muito bem.

Você escolhe uma caixa aleatoriamente, e pode pegar uma moeda. Deu sorte: é uma moeda de ouro. Agora, quais as chances de que a moeda que restou na caixa que escolheu também seja uma moeda de ouro? Se lhe oferecerem a opção de trocar de caixa, será vantajoso trocar? Pense sobre a questão antes de continuar, ela tem uma aplicação prática imediata.

A resposta, contra-intuitiva, é de que as chances de que a outra moeda na caixa que escolheu seja de ouro são de 2/3. Neste caso, ao contrário do anterior, fique com a caixa, não queira trocá-la por nenhuma outra.

Explica-se: há três caixas, OO (Ouro-Ouro), OP (Ouro-Prata) e PP (Prata-Prata). Ao pegar uma moeda de ouro, sabemos que as chances de ter pegado uma moeda da caixa PP equivalem a zero. Restam as caixas OO e OP. Mas as chances de que tenha escolhido qualquer uma destas duas caixas não são de 50%. Você pegou ou O1 de OO, ou O2 de OO, ou O de OP. As chances de que tenha pegado cada uma dessas três moedas de ouro é de 1/3, e somando as chances de O1 com O2, temos que as chances de que a outra moeda seja de ouro são de 2/3. Isto é, as chances de que tenha escolhido a caixa OO são de 2/3, contra 1/3 da caixa OP.

A aplicação imediata, mas nada honesta, do paradoxo da caixa de Bertrand é a “trapaça das três cartas“, como Martin Gardner a chamou. Você marca as extremidades opostas de três cartas iguais com tinta vermelha e preta (VV, VP, PP). Deixa que uma pessoa escolha uma carta qualquer, e mostra apenas uma extremidade da carta escolhida, de forma que nem mesmo você consiga ver a outra extremidade (podem-se usar os dedos, as outras cartas ou um envelope). Basta apostar então que a outra extremidade tem a mesma cor marcada.

Seguindo sua intuição, a pessoa deve imaginar que as chances de que a cor na outra extremidade seja igual ou diferente são de 50%, e parecerá uma aposta justa. Mas vimos que as chances de que a cor seja igual são na verdade de 2/3. Aplique a trapaça um número suficiente de vezes, e a banca sempre sairá ganhando.

laranjadr32.jpg

E prisioneiros
Jogos de azar são ilegais, e imagine agora que a pena para esse crime seja prisão perpétua com reprises sem fim do Programa do Mallandro. Imagine ainda que você e outros dois Sedentários estiveram aplicando essa trapaça e foram pegos e condenados. Depois de muita pressão da comunidade de leitores a esta punição desumana, um juiz decidiu livrar a pele de um dos Sedentários condenados.

Isto é, você, Sedentário A, e dois outros leitores, os Sedentários B e C, estão em uma prisão, sendo que apenas um escapará dessa. O juiz, sabendo que toda esta história começou com uma certa coluna sobre a Porta dos Desesperados, ou o problema de Monty Hall, resolve então se divertir e ver se você realmente entendeu algo daquilo.

Ele diz: “Joguei aqui meu dado perfeitamente aleatório, e com ele já decidi quem de vocês será liberado. Está anotado neste papel aqui. Não posso dizer ainda se vai ser você ou não, mas vou lhe contar uma coisa: o Sedentário B precisa se preparar, porque vai ouvir ‘glugluglu‘ pelo resto de seus dias”. O juiz dá então uma risada maquiavélica, e continua:

“Vou fazer o seguinte: se você quiser, pode trocar de destino com o Sedentário C. Pense nisso”. Enquanto o juiz se afasta, passando moedas de ouro e prata por entre os dedos, você escuta um murmúrio tênue lembrando algo como “Salci Fufu!” e imagina que droga de situação hipótética é esta.

Mas então? Vale a pena trocar? Será esta uma resposta intuitiva? Contra-intuitiva? Quais as chances de que isso realmente aconteça? Haverá Mallandrinhas nas reprises?

A resposta a isto, o Universo e Tudo Mais, na próxima coluna.

mallandrinhasdr.jpg

– – –

A série “Como se construíram as pirâmides?” ainda vai ser concluída, com mais duas colunas intercaladas ou publicadas depois do final desta nova série de colunas com curiosidades matemáticas.