Deixa eu ver se desmistifico um pouco a (belíssima!) distribuição de
Benford...

Note que há vários tipos de números randômicos. Se um numero eh sorteado
aleatoriamente em [10,100) (com distribuição uniforme de probabilidade),
então o primeiro digito tem a mesma chance de ser 1, 2 ou 7, com 1/9 para
cada.

Agora, a distribuição de probabilidade dos números que aparecem em vários
eventos não eh aleatória DESTE jeito. Se os números tem uma densidade de
probabilidade do tipo C/x (onde x varia continuamente de 1 a 100, digamos),
então:

a) A Integral de C/x de x=1 a x=100 tem de dar 1; com isto, você descobre
que C=1/(ln(100)-ln(1))=1/ln(100)
b) A probabilidade do primeiro digito ser 1 eh a integral C/x de 1 a 2, mais
a integral de 10 a 20, que dah
(ln(20)-ln(10))/ln(100)+(ln(2)-ln(1))/ln(100)=log(2) (log aqui eh base 10);
analogamente, a probabilidade do primeiro digito ser 6 sera
(ln(7)-ln(6)+ln(70)-ln(60))/ln(100)=log(7)-log(6). E assim por diante, os
dígitos menores são menos comuns, e a distribuição tem as diferenças entre
logs sucessivos.

A mesma distribuição aparece se você supuser que x varia continuamente de
10^m a 10^n com densidade de probabilidade do tipo C/x. Ta, o assunto não eh
só isso (por exemplo, minha escolha de intervalo de 10^m a 10^n eh meio
especifica; mas, se x variar de a<10^m<10^n<b, com varias ordens de grandeza
entre a e b, então os "rabos" de probabilidade entre a e 10^m e entre 10^n e
b não devem afetar muito as coisas; se o valor mínimo for a=1, as coisas
melhoram muito!), mas acho que o espírito esta contido nisso que eu escrevi.
Em suma, se os números que você esta olhando tem uma distribuicao que faz
números altos serem raros (mais ou menos com densidade proporcional a
1/x), e tem pelo menos algumas ordens de grandeza possíveis nos dados, então
os primeiros dígitos satisfazem a distribuicao de Benford. Eh por isso que
histogramas com comprimentos de rios e populacoes de cidades tem primeiro
digito satisfazendo esta distribuição, mas primeiro digito de números de
loteria não (em loterias, não há preferência por números menores, todos são
igualmente prováveis).

A propósito, há algum tempo atrás, eu fui ao site do IBGE e catei as
populacoes de todos os municípios brasileiros pelo ultimo censo, botei tudo
no Excel para extrair o primeiro digito de cada e botei num histograma. Eh
inacreditável como o histograma encaixa quase perfeitamente numa
distribuição de Benford (assim como as primeiras tantas potencias de vários
números -- 10 não vale -- e outras coisas que eu experimentei onde números
altos são mais raros). Agora, se você declarar que uma "cidade" eh um
município com 70000 a 120000 habitantes, a distribuição do primeiro digito
das populacoes das "cidades" não eh mais Benford -- como você se limitou a
"menos de uma ordem de grandeza" nos dados, você eliminou completamente a
possibilidade de o primeiro digito ser 2, 3, 4, 5 ou 6, e isso muda toda a
distribuição, eh claro.

Isto dito, ainda não li os papers que justificam a distribuição com mais
rigor -- tenho certeza que meus argumentos acima devem estar cheios de
furos...

Abraço,
      Ralph

2008/9/22 Bouskela <[EMAIL PROTECTED]>

>  Olá José Airton!
>
> Vi em, uma de suas mensagens posteriores, que você conseguiu concluir que a
> Lei de Benford é válida para a distribuição do 1º dígito de 2^n. Muito bem!
>
> Posso fazer também um raciocínio lógico para INTUIR a validade desta Lei
> para as cotações de uma Bolsa de Valores genérica: a unidade monetária
> (real, dólar, euro...) é (geralmente) projetada para que os preços se situem
> nas proximidades da própria unidade, ou, então, de seus múltiplos de 10 -
> daí a primazia do número "1" - vá lá...
>
> Mas o que dizer da distribuição do número de habitantes das cidades de um
> país? E do número de mangas em cada mangueira de um grande pomar? Etc...
>
> Podemos INTUIR que a nossa base decimal de numeração está em harmonia com o
> Universo (nossa lógica faz parte dele) e, portanto, foi projetada para
> privilegiar o número "1" - um argumento meio na linha do Paulo Coelho... (é
> dose!).
>
> Bem, ao que tudo indica, a Lei de Benford se aplica a (todas?) as
> distribuições quase-aleatórias. Por que "quase"? Porque essas tais
> distribuições devem estar associadas a eventos reais (físicos) - pelo
> menos é assim que parece! Uma distribuição de números randômicos, por
> exemplo, não obedece à Lei de Benford.
>
> Em resumo, concordo com o Tarso: é tudo muito estranho...
>
> Sds.,
>   [EMAIL PROTECTED]
> [EMAIL PROTECTED]
>
>  ------------------------------
> *De:* [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] *Em
> nome de *JOSE AIRTON CARNEIRO
> *Enviada em:* domingo, 21 de setembro de 2008 22:14
> *Para:* obm-l@mat.puc-rio.br
> *Assunto:* Re: [obm-l] A Lei de Benford e as Loterias
>
>  Estranha mas verdadeira.Acabei de comprovar com a calculadora do meu
> celular:
> 2^0 = 1
> 2^4 = 16
> 2^7 = 128
> 2^10 = 1024
> 2^14 = 16384
> 2^17 = 131072
> 2^20 = 1048576
> 2^24 = 16777216
> 2^27 = 134217728
> 2^30 = 1073741824
> 2^34 = 17179869184
> 2^37 = 137438953472
> 2^40 = 1099511627776
> 2^44 = 17592186044416
> 2^47 = 140737488355328
> 2^50 = 1125899906842624
> 2^54 = 18014398509481984
> .
> .
> .
> 2^100 = 1267650600228229401496703205376.
> Os expoentes sempre obedecendo a seqüência : 0 -  4 - 3 - 3 - 4 - 3 - 3 - 4
> - 3 - 3 - 4....... começam com 1.
> ou seja ,de [0 , 100] temos 32 potências que começam com o algarismo 1
> Em 21/09/08, Tarso Moura Leitão <[EMAIL PROTECTED]> escreveu:
>>
>>  Uma pequena correção: o logaritmo que mencionei no e-mail anterior está
>> errado, o correto é log2, logaritmo decimal de 2. Na questão da Cone Sul
>> pedia-se para provar que dentre as potências de 2 com o expoente entre 1 e
>> 1000 000 mais de 300 mil começam com o algarismo 1. Eta coisa estranha.
>> Um abraço
>> Tarso Moura Leitão
>>
>
>

Responder a