On 16/11/2014 21:53, Everton Zanella Alvarenga wrote:
Estou tentando colocar no CSV e, ao trabalhar um pouco nos dados,
notei que há muitos salários com valor nulo ou com valores indicando
apenas na notação decimal.
Na verdade são 27 valores 0, mas está assim na página do infográfico da
Folha também e no CSV. Não dá pra saber o motivo.
Exemplo, para o Renan Braz aparece 5.8 ao
invés de 5800. O Tableau parece conseguir identificar isso.
Não consegue, ele confunde o separador de milhares ',' com '.'. Exibe
5,800 que é equivalente a 5,8. Pra ver como ele se confunde basta
buscar
pelo primeiro nome "Renan" e vai notar que ele arredonda 5,8 pra 6.
É preciso limpar esses dados. Coloque a coluna dos salários em ordem
decrescente e veja as últimas 150 linhas. Dá para ver que tem coisa
estranha aí que precisa ser ajustada, como os salários nulos ou até
abaixo do salário mínimo, alguns casos provavelmente múltiplos de
1000, como o que citei acima.
Difícil saber se é só multiplicar por 10, ou 100, ou 1000. O melhor é
não
fazer nada ou simplesmente excluir. Mas dado que são poucos dados isso
afeta minimamente os resultados. (53 apenas recebem menos que R$100 e
99
recebem menos que um salário mínimo).
Edgar
Em 16 de novembro de 2014 21:18, Edgar Zanella Alvarenga <[email protected]
[23]> escreveu:
Legal! =)
Só acho que há um erro na última linha do código, pq 28272 de
29225 é 96,73%.
90,66% receber 90.66% do dinheiro seria perfeito demais. =P
Valeu, tinha um erro mesmo, tinha feito a porcentam com o valor ao
invés do número
de pessoas. Vai demorar alguns minutos pra atualizar o cache do
link que passei, mas
os valores corrigidos são:
96.74% (28272 de 29225) recebem menos de R$24000.00, sendo que eles
representam 90.66% do custo da USP em salários.
3.26% (953 de 29225) recebem mais de R$24000.00, sendo que eles
representam 9.34% do custo da USP em salários.
Edgar
Edgar
On 16/11/2014 19:07, Andres MRM wrote:
Boa!
A USP prometeu abrir esses dados amanhã, não?
www.usp.br/imprensa/?p=44644K [10]
Me pergunto como a Folha pode ter aberto hoje...
"Os dados foram antecipados para o jornal Folha de S. Paulo
como cumprimento
de determinação judicial, decorrente de processo impetrado
pela empresa
jornalística."
Ah, agora vi.
On 16-11-14 18:49, Luiz Augusto wrote:
Massa!
Após os cliques, ele também oferece para download uma
"tabela de referência
cruzada", de nome de arquivo "tabela-nomes_crosstab.csv",
pesando 7Mb.
Há algum dado "novo" nessa ou ela foi gerada
automaticamente pelo sistema
através da "tabela-nomes_data.csv" (de 4mb, espelhada no
seu repositório)?
PS.: Fuçando, achei também um "salarios-usp.twbx", que é
basicamente um
.ZIP. Dei umas risadas ao dar de cara com uma subpasta
"Data/medalhas".
Medalhinha pra quem estoura o teto constitucional? rs (ok,
deve ser do
modelo que a Folha usou, mas não dava pra perder a
piadinha). Os arquivos
de dentro desse twbx/ZIP parecem ser XMLs, caso alguém
prefira.
Luiz
2014-11-16 18:31 GMT-02:00 Edgar Zanella Alvarenga
<[email protected] [6]>:
Hoje a Folha liberou um infográfico contendo os salários
de todos
professores e
funcionários da USP:
http://www1.folha.uol.com.br/infograficos/2014/11/117724-
[1]
ranking-de-salarios-da-usp.shtml
Para quem quiser os dados em csv que foram utilizados pra
gerar esse
infográfico,
deixei disponível aqui (basta clicar em "Raw" pra
baixar):
https://github.com/aivuk/var/blob/master/usp-salarios/
[2]
tabela-nomes_data.csv
A Folha utilizou o software Tableau pros infográficos, e
deixaram como
opção de download
apenas como imagem ou pdf apenas do conteúdo que estiver
visualizando na
página.
Após baixar todas as imagens (2239) e gastar um tempinho
tentando fazer
ocr descobri
que se clicasse em algum local do infográfico e depois
tentasse baixar os
dados novamente,
surgia a opção de baixar tudo em um csv. Não sei se é
um bug ou feature,
mas vou considerar
um feature.
Edgar
_______________________________________________
okfn-br mailing list
[email protected] [3]
https://lists.okfn.org/mailman/listinfo/okfn-br [4]
Unsubscribe:
https://lists.okfn.org/mailman/options/okfn-br [5]
_______________________________________________
okfn-br mailing list
[email protected] [7]
https://lists.okfn.org/mailman/listinfo/okfn-br [8]
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
[9]
_______________________________________________
okfn-br mailing list
[email protected] [11]
https://lists.okfn.org/mailman/listinfo/okfn-br [12]
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
[13]
_______________________________________________
okfn-br mailing list
[email protected] [14]
https://lists.okfn.org/mailman/listinfo/okfn-br [15]
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
[16]
_______________________________________________
okfn-br mailing list
[email protected] [17]
https://lists.okfn.org/mailman/listinfo/okfn-br [18]
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br [19]
_______________________________________________
okfn-br mailing list
[email protected] [20]
https://lists.okfn.org/mailman/listinfo/okfn-br [21]
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br [22]
--
Everton Zanella Alvarenga (also Tom)
Open Knowledge Brasil - Rede pelo Conhecimento Livre
http://br.okfn.org [24]
Links:
------
[1] http://www1.folha.uol.com.br/infograficos/2014/11/117724-
[2] https://github.com/aivuk/var/blob/master/usp-salarios/
[3] mailto:[email protected]
[4] https://lists.okfn.org/mailman/listinfo/okfn-br
[5] https://lists.okfn.org/mailman/options/okfn-br
[6] mailto:[email protected]
[7] mailto:[email protected]
[8] https://lists.okfn.org/mailman/listinfo/okfn-br
[9] https://lists.okfn.org/mailman/options/okfn-br
[10] http://www.usp.br/imprensa/?p=44644K
[11] mailto:[email protected]
[12] https://lists.okfn.org/mailman/listinfo/okfn-br
[13] https://lists.okfn.org/mailman/options/okfn-br
[14] mailto:[email protected]
[15] https://lists.okfn.org/mailman/listinfo/okfn-br
[16] https://lists.okfn.org/mailman/options/okfn-br
[17] mailto:[email protected]
[18] https://lists.okfn.org/mailman/listinfo/okfn-br
[19] https://lists.okfn.org/mailman/options/okfn-br
[20] mailto:[email protected]
[21] https://lists.okfn.org/mailman/listinfo/okfn-br
[22] https://lists.okfn.org/mailman/options/okfn-br
[23] mailto:[email protected]
[24] http://br.okfn.org
_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br