On 16-11-14 20:59, Edgar Zanella Alvarenga wrote:
Prometeu, mas não confio na qualidade dessas "aberturas de dados", ainda mais vindo da USP (veja a qualidade das bases de dados do portal da transparência da USP http://www.transparencia.usp.br/). Vai saber a granularidade dos dados que vão liberar ou se vai ser numa interface tão ruim quanto o que a Folha forneceu, sem possibilidade de acesso aos dados brutos de forma simples.

É isso é verdade...

De qualquer forma adicionei os outros dados da Folha no meu repositório
(https://github.com/aivuk/var/tree/master/usp-salarios/) e fiz algumas análises básicas:

http://nbviewer.ipython.org/github/aivuk/var/blob/master/usp-salarios/Dados%20dos%20sal%C3%A1rios%20da%20USP.ipynb

90.66% (28272 de 29225) recebem menos de R$24000.00 por mês, sendo que
eles representam 90.66% do custo da USP em salários

3.26% (953 de 29225) recebem mais de R$24000.00, sendo que eles representam
9.34% do custo da USP em salários.

Legal! =)
Só acho que há um erro na última linha do código, pq 28272 de 29225 é 96,73%.
90,66% receber 90.66% do dinheiro seria perfeito demais. =P


Edgar

On 16/11/2014 19:07, Andres MRM wrote:
Boa!

A USP prometeu abrir esses dados amanhã, não?
www.usp.br/imprensa/?p=44644K
Me pergunto como a Folha pode ter aberto hoje...

"Os dados foram antecipados para o jornal Folha de S. Paulo como cumprimento de determinação judicial, decorrente de processo impetrado pela empresa
jornalística."

Ah, agora vi.


On 16-11-14 18:49, Luiz Augusto wrote:
Massa!

Após os cliques, ele também oferece para download uma "tabela de referência cruzada", de nome de arquivo "tabela-nomes_crosstab.csv", pesando 7Mb.

Há algum dado "novo" nessa ou ela foi gerada automaticamente pelo sistema através da "tabela-nomes_data.csv" (de 4mb, espelhada no seu repositório)?

PS.: Fuçando, achei também um "salarios-usp.twbx", que é basicamente um .ZIP. Dei umas risadas ao dar de cara com uma subpasta "Data/medalhas". Medalhinha pra quem estoura o teto constitucional? rs (ok, deve ser do modelo que a Folha usou, mas não dava pra perder a piadinha). Os arquivos
de dentro desse twbx/ZIP parecem ser XMLs, caso alguém prefira.

Luiz

2014-11-16 18:31 GMT-02:00 Edgar Zanella Alvarenga <[email protected]>:

Hoje a Folha liberou um infográfico contendo os salários de todos
professores e
funcionários da USP:

http://www1.folha.uol.com.br/infograficos/2014/11/117724-
ranking-de-salarios-da-usp.shtml

Para quem quiser os dados em csv que foram utilizados pra gerar esse
infográfico,
deixei disponível aqui (basta clicar em "Raw" pra baixar):

https://github.com/aivuk/var/blob/master/usp-salarios/
tabela-nomes_data.csv

A Folha utilizou o software Tableau pros infográficos, e deixaram como
opção de download
apenas como imagem ou pdf apenas do conteúdo que estiver visualizando na
página.
Após baixar todas as imagens (2239) e gastar um tempinho tentando fazer
ocr descobri
que se clicasse em algum local do infográfico e depois tentasse baixar os
dados novamente,
surgia a opção de baixar tudo em um csv. Não sei se é um bug ou feature,
mas vou considerar
um feature.

Edgar



_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br


_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br

_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br

_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br

Responder a