2010/7/26 Jorge Luis Rodrigues e Silva Luis jorgelrs1...@hotmail.com:
Um pai, tentando convencer o filho a tornar-se tenista, oferece-lhe prêmio
se ele vencer duas partidas seguidas numa série de três jogos. A única
restrição é que o filho deve jogar alternadamente com o pai e o seu
treinador; devendo escolher então entre uma das duas séries:
pai-treinador-pai ou treinador-pai-treinador. O treinador joga melhor que o
pai. Qual série o filho deve escolher?
Esse problema é bem interessante, porque tem dois aspectos. O
primeiro, é que parece ser estranho escolher TPT
(treinador-pai-treinador) em vez de PTP. Mas veja bem.
Sejam p e t as probabilidades de o filho vencer um jogo contra seu pai
e seu treinador, respectivamente. No tênis, não há empate (mas o jogo
pode durar mito tempo!), logo a probabilidade de ele
ganhar os dois primeiros jogos na configuração PTP é pt. Nesse caso,
ele já tem o prêmio. Se ele perder o primeiro jogo, com probabilidade
(1-p), ele deve ganhar os dois seguintes, logo com probabilidade tp.
Total : pt + (1-p)*tp. (Exercício: veja que essa probabilidade é
realmente menor do que 1, e que ela é máxima exatamente quando p=1, o
que parece bem razoável). Mas se a configuração for TPT, as
probabilidades passam a ser tp + (1-t)*pt. E como o treinador joga
melhor do que o pai quer dizer que a chance de perder contra o
treinador (que vale 1-t, lembre) é maior do que perder contra o pai.
Assim, o filho tem mais chances de ganhar se escolher a configuração
em que ele joga contra o treinador mais vezes. O que tem uma
explicação intuitiva simples. Em qualquer dos casos, o filho tem que
ganhar uma partida contra o treinador. Mais ainda, na configuração
PTP, ele é obrigado a ganhar contra o treinador, enquanto que na
configuração TPT, ele é obrigado a ganhar do pai (o que é mais fácil)
e ele tem 2 chances para tentar ganhar do treinador. Fim de papo.
Mesmo ??? Se você fosse o filho, você escolheria isso ? Eu não...
enfim, depende. Se forem jogos realmente independentes (como a gente
tem mania de pensar por conta dos probleminhas de vestibular), a
dedução procede. Mas imagine que o pai não tem todo o tempo do mundo,
nem o filho, nem o treinador, e na verdade são três jogos
consecutivos. Pode ser um jogo cada dia, mas pode ser muito pior, por
exemplo, durante uma sessão de treinamento. Ou imagine que se trata de
ping-pong, por exemplo, em que os jogos são mais curtos. O raciocínio
acima não leva em consideração um fator muito importante: se você
ganhou um jogo contra alguém que é mais forte do que você, talvez
você tenha se cansado um bocado para tanto. E, de modo geral, para
ganhar uma partida contra um profissional, ou contra um
café-com-leite, a história é bem diferente. Eu proponho, portanto, o
seguinte raciocínio.
Sejam dois jogos consecutivos J1 e J2. Imagine que você tem chance g1
de ganhar o primeiro jogo, e g2 o segundo, se eles fossem realmente
fisicamente independentes. Seja um parâmetro alfa 1. Então você
tem chance somente de (1 - alfa*(1-g1))*g2 de ganhar o segundo. O
coeficiente na frente do g2 é bem simples, mas satisfaz o seguinte:
- se alfa = 0, os jogos são independentes
- para todo 0 alfa 1, os jogos são dependentes, e a chance de
ganhar o segundo decresce com alfa
- para alfa fixo, a chance de ganhar o segundo diminui se você teve
que se cansar mais para ganhar o jogo anterior.
A função (1-g1) de penalidade é provavelmente simples demais. Se g1
fosse quase 1, talvez você devesse descansar mais. Acho que uma boa
função seria uma tangente hiperbólica com uma baita inflexão em g1 =
0.5. Mas deixa pra lá, já vai ficar complicado o suficiente. Aliás,
note que a probabilidade é a mesma independentemente do resultado do
jogo: ela corresponde ao cansaço de ter jogado contra um jogador de
dificuldade 1 - g1. É claro que isso complica ainda mais as coisas:
se você notar que você vai perder, talvez você desista. Eu vou supor
que não é o caso, porque afinal, se o pai notar que o filho desistiu
de ganhar, ele vai dizer: não, você não jogou direito, um
profissional não desistiria assim. Ainda mais que os torneios da ATP
são sempre eliminatórios :).
Com o problema modificado para incorporar esse aspecto a mais, as
probabilidades se tornam:
p*(1 - alfa*(1-p))*t + (1-p)*(1 - alfa*(1-p))*t*(1 - alfa*(1 -
alfa*(1-p))*t)*p = pt( (1 - alfa*(1-p)) + (1-p)*(1 - alfa*(1-p))*(1 -
alfa*(1 - alfa*(1-p))*t)) para a configuração PTP, e permutando p e t
para a configuração TPT.
A diferença PTP - TPT é, portanto (depois de dividir por p*t, que é
sempre positivo) :
dif =
(3*t^2*p-3*p^2*t+p^3*t-t^3*p-t+p)*alfa^3+(2*p^2*t+2*t-2*t^2*p-2*p)*alfa^2+(-4*t+t^2+4*p-p^2)*alfa+t-p
Com um pouco de boa vontade (e um computador pra fazer as contas e ver
que vai dar certo), você vê que essa diferença dá pra dividir por p-t,
que é positivo. O que é mais ou menos natural visto a simetria do
problema. Portanto, o que nos interessa é, na verdade, o sinal de
(t^2*p-3*p*t+p^2*t+1)*alfa^3 +