[Wikimedia Brasil] Vandalismo num artigo ou erro no sistema? O efeito é destruidor

André Z. D. A. Sun, 25 Dec 2016 15:41:41 -0800

Olá para todos,

como costumo fazer muitas vezes, acessei uma página na Wikipédia, naocasião, na de língua portuguesa mesmo, para aprender um pouco maissobre algo que passou por mim numa conversa qualquer. Isto faz uns 2 ou3 dias.

O que aconteceu foi completamente incomum, inesperado e praticamenteinexplicável. Quando eu acessei a página do "artigo X", meu computadorcomeçou, poucos instantes depois, a aumentar seu uso de memória, bemrapidamente. Em poucos segundos a memória RAM se esgotou (eu mantenho ummonitor do sistema na minha barra de tarefas mostrando o uso dememória). Após a RAM se esgotar, claro, começou a aumentar o uso damemória virtual, que é em disco. Fiquei olhando aquilo, esperando algoacontecer pra talvez explicar o negócio. Seria a página da Wikipédia quecausou o uso gigantesco de memória? Eu costumo ter muitos programasabertos simultaneamente, e vários deles ficam fazendo coisas diversas otempo todo, embora não continuamente. Com quase tudo do sistema sendotransferido pra memória virtual, decidi fechar o navegador, que foi oúltimo passo que fiz, provável culpado. Demorei vários minutos praconseguir matar ele pelo sistema. Tudo estava muito lento, respondendovários segundos depois da sua ação causal. Quando o navegador foiobrigado a parar de rodar, sem escolha, houve um aumento instantâneo damemória disponível, tanto na RAM quando na memória virtual que tambémfoi gasta (e também é mostrada no meu monitor de sistema). Conclusão: onavegador foi quem gastou toda esta quantidade de memória. "Será porque?", eu me perguntei. A Wikipédia é uma página tão leve, e funcionaaté sem o javascript habilidado! (coisa que costumo usar desligadotambém porque ela fica mais lenta com as bobagens dinâmicas que vieramsendo acrescentadas nos últimos anos, e eu não gosto de nenhuma; prefiroas páginas leves, rápido carregamento, leitura, tudo rápido, sempre!)

Enfim. Tentei abrir o mesmo artigo de novo, com o javascriptdesabilitado. Mesmo resultado... e mais tempo perdido pela "bagunçamemorial" feita no sistema.

Deixei pra lá um tempo. Talvez fosse alguma mudança na Wikipédia quedeveria ser consertada rapidamente. Mas passando 1 dia, tentei de novo,não mudou nada.

Passado mais um dia, tentei outros artigos na Wikipédia, desta vez.Todos normais, abriram super rápido, como costuma acontecer. "E aí?Vamos tentar o artigo X de novo?" - pensei. E, como podem imaginar peloassunto desta mensagem, o problema se repetiu. O problema pareceu ser,neste momento, algo que só tem neste artigo ou algo que pode ter emoutros também, e que por "sorte" não tinha nos artigos que testei, elesestavam normais.

Mais tempo perdido recuperando o sistema que ficou bem lento... chatopra caramba!

Hoje, no final da tarde, me sentindo meio inspirado (ou à toa), quisachar o ponto exato da causa do problema. Porém, tinha várias limitaçõespara eu contornar. Por exemplo, eu não consigo abrir o código fonte(wikipediano) da página em questão, pra ver se tem algum vandalismonele. Isto vocês poderão fazer por mim - espero! - depois que euterminar de cronicar isto tudo.

Salvei a página pela linha de comando. Eliminei no código fonte delatoda ocorrência de scripts. Abri a página no navegador, ansioso...PEEEEEEEEEEM! Mesmo problema, mais perda de tempo. Já me sentindo meiobobo por perder tanto tempo sem necessidade, eu consigo fazer melhor, jáfui pensando em como evitar as lentidões na próxima tentativa. Fiz istoenquanto consertava a atual.

Ideia: buscar no código fonte da página, que já confirmei ter oproblema. E o problema não é dos scripts, direta ou indiretamente -importante separação! Agora eu tenho "apenas" que achar qual linha oucaracterística da página (já salva no meu disco) faz a memória donavegador estourar. Acho que tem um máximo pro efeito, mas não tenhocerteza... eu sempre consegui parar o navegador antes da memória totaldo sistema, que é muito grande, chegar ao fim.

"Como fazer a busca?" - pensei. Fácil! Quantas linhas tem o código?Divido ao meio, apago a primeira ou a segunda metade, abro a páginaresultante com algo perto de metade do tamanho original. Isto dará umcódigo HTML ruim, claro. E eu não quis consertar ele pra ficar "menoserrado", cheio de coisas não terminadas, etiquetas não fechadas, etc.Mas eu consigo arrumar o básico mais visível e os navegadores sãoprojetados para lidar com vários tipos de erros nas páginas que abrem. Econtando com isto, e fazendo esta busca binária, eu poderia,possivelmente, chegar a uma única linha culpada em poucas tentativas!Certo?? Meio idealista, mas é uma possibilidade a se tentar, já queestava bem no escuro com a causa do negócio.

A minha sorte está boa, consegui chegar rapidamente a uma única linhaculpada! Nela tinha algo absurdo pra existir num artigo qualquer daWikipédia. E pra confirmar que a culpa era do trem que eu achei, apagueiTUDO da página, exceto os cabeçalhos; tirei da etiqueta "<body" todos oselementos, exceto aqueles mais profundos que continham a tal linha -neste momento - suspeita. Abri a página só com esta linha, num códigomínimo, de poucas linhas, e... O problema existiu! Exatamente igual!!Detalhe exótico mudado pra algo razoável, abri a página sem efeito algum(e quase sem conteúdo também). Pra terminar, baixei de novo, pela linhade comando, toda a página do artigo X. Fazendo uma busca simples,descobri que existiam duas ocorrências do possível erro. "Que taltestar??" - pensei. Fiz apenas duas mudanças no código baixado,alterando o exótico pra algo razoável. Abri o arquivo no navegador...ótimo! Não ocorreu problema algum! Problema confirmado, soluçãoencontrada... e agora??

O artigo desta história está no endereçohttp://pt.wikipedia.org/wiki/Tender.


http://pt.wikipedia.org/wiki/Tender

É um artigo bem curto, e nem era sobre o que eu queria ler (que é o"tender" que as pessoas comem, alternativamente a um peru de Natal, atéonde já vi).

O problema, que faz o navegador estourar a memória, são 2 palavras noartigo que estão com tamanho explícito, no código fonte HTML, de 4000pixels! Exatamente 4000! E este tamanho absurdo de fonte, por um motivotécnico que nem me interessa saber com exatidão, causa um gastohorroroso de memória. As palavras, ambas ocorrêndo apenas uma vez noartigo, como confirmei, são "Último" e "Próximo".

As linhas de código fonte HTML com os 2 problemas estão abaixo,envolvidas por "--", pra ajudar:

--

<div class="nodeco" style="position:absolute; font-size:4000px;font-weight:lighter; font-style:italic; line-height:1em;vertical-align:top;">Último</div>

--

<div class="nodeco" style="position:absolute; font-size:4000px;font-weight:lighter; font-style:italic; line-height:1em;vertical-align:top;">Próximo</div>

--

Se estas palavras são consequência direta do código fonte wikipediano doartigo, e portanto deverão ser efeito de algum vandalismo facilmentelocalizado e de algum usuário, ou não, vocês poderão me dizer.

Se forem algum erro de configuração ou sei lá o que do sistema, afetandopossívelmente vários outros artigos com características semelhantes aeste, acho que nesta lista vocês saberão pra onde deve ser comunicado oproblema. Imagino que o Rodrigo poderá fazer tal comunicação.

E, por favor, quem responder esta mensagem, não se esqueça de me colocarcomo destinatário também! Não só da primeira resposta, como daspossíveis outras respostas subsequentes! Eu não faço mais parte dalista, mas gostaria de receber todas as mensagem da possível discussãodeste problema.

Fico aguardando. Espero ter colaborado, e agradeço antecipadamente aoque vier.


Atenciosamente,

André


_______________________________________________
WikimediaBR-l mailing list
[email protected]
https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l

[Wikimedia Brasil] Vandalismo num artigo ou erro no sistema? O efeito é destruidor

Responder a