Gustavo Fukao escreveu: > On Feb 12, 2008 12:02 PM, Patrick Tracanelli > <[EMAIL PROTECTED]> wrote: >> Gustavo Fukao escreveu: >>> Pessoal, >>> >>> Estou utilizando o Cacti para monitoramento SNMP .... so que estou >>> precisando que me enviasse e-mail quando um servico parasse .... >>> >>> Achei um plugin (Thold) para enviar e-mail qdo a maquina mudasse de >>> estado, mas estou procurando alerta para servicos. >>> >>> Achei tambem templates utilizando smokeping e advanced ping, mas ambos >>> para geracao de graficos...... >> Cara o thold alerta, mas teoricamente voce tem que por o alerta por >> threshold criado. É esse o caminho, se voce quer monitorar servico por >> servico. >> >> Porem, se voce quer monitorar disponibilidade geral use o plugin >> Monitor. Nesse caso ele so alerta quando a maquina para (leia-se, o SNMP) >> >> -- >> Patrick Tracanelli >> >> FreeBSD Brasil LTDA. >> Tel.: (31) 3516-0800 >> [EMAIL PROTECTED] >> http://www.freebsdbrasil.com.br >> "Long live Hanin Elias, Kim Deal!" >> >> >> ------------------------- >> Histórico: http://www.fug.com.br/historico/html/freebsd/ >> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd >> > > Tem algum template (advanced ping / smoke ping / outro ) que vc esteja > monitorando ????
Fukao, não tem não. Tudo que eu preciso monitorar o faço por SNMP, pois ter os gráficos é fundamental nesse ambiente. Se o ambiente é mais simples e requer apenas monitoramento de disponibilidade de serviços (e não métricas de qualidade) uso apenas Nagios. Mas no caso como monitoro tudo, crio os thresholds pelo Thold pros perfis de grafico. Não tem como ser mais simples e completo. Assim, eu gero alertas de vários tipos. Exemplo de um tipo de monitoracao, Squid. Se o Squid cair, alerta (obviamente), mas se o squid passar a atender pouquissimos hits no grafico de 5 minutos, abaixo do que eu considero a métrica mínima de eficiencia, alerta tambem. Se a porcentagem de HIT do squid ficar muito baixa, alerta. Se a de MISS ficar muito alta, alerta também. Se o número de requisições ficar acima de 10% do máximo aceitável na métrica de qualidade da empresa, alerta também. Outros exemplos mais bacanas, de monitoramento de serviços que não ouvem na rede. Por exemplo, um sistema de automação de forno industrial, que roda em Windows. Como monitorar sua atividade? Simples, pelo consumo de memória. Se consome memória ta ativo. Se por algum momento o consumo retornar 0 ou "nan" no Cacti, é porque o serviço morreu. Ai alerta. Se ele consumir mais memória do que o máximo usual, alerta também. Se ele consumir mais CPU do que o máximo aceitável, alerta também. Enfim, pra empresas sérias, monitorar apenas disponibilidade é pouco. Métricas de qualidade são fundamentais, principalmente se o SLA contratualmente oferecer garantias. Ai mais do que avisar ter historico grafico é fundamental. Mas bla-bla-bla a parte o mais bacana é a facilidade. Mas repito, se eu quero monitorar apenas "servico caiu, servico voltou", ai uso Nagios. -- Patrick Tracanelli FreeBSD Brasil LTDA. Tel.: (31) 3516-0800 [EMAIL PROTECTED] http://www.freebsdbrasil.com.br "Long live Hanin Elias, Kim Deal!" ------------------------- Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd