Orientações Software de Monitoramento

Informações e orientações básicas sobre o Software de Monitoramento

Explicando o Mapa

Mapa, é a forma como o Operador do Centro de Computação visualiza em uma perspectiva geral, todos os ambientes monitorados da Universidade. Temos diversas divisões de mapas e agrupamentos criando uma organização em áreas, tipos de monitoramentos e projetos. 

Equipamentos

Para efeito desse serviço, por ora, entenda-se por equipamentos: servidores e  switches de rede, conectados na rede da Unicamp.

Monitoramento e Tempo de Verificações

Elencar todos os serviços do equipamento que sejam necessários  o monitoramento; e para tais, especificar em que porta deve ser realizado o monitoramento e qual  a média de tempo para checagem. Por exemplo, verificação do serviço HTTP, porta 80, à cada 5 minutos.
No caso de verificação se o equipamento está no ar ( ping ) é realizado check no serviço ICMP.

Esse é o método sem agente. Caso o equipamento não responda ao nosso servidor, o problema será tratado como fora do ar, podendo haver várias possibilidades como causa; às quais deverão ser investigadas tanto pelo responsável pelo equipamento quanto pelo responsável pelo software de monitoramento. 

Portanto, o usuário será informado apenas que o serviço ICMP (ping) não está respondendo ao nosso servidor.

Triggers e Avisos de alerta

Utilizamos esse recurso para gerar o alerta em caso de problemas, existe o item que está sendo monitorado e sua resposta esperada; após isso, verificamos se está normal ou não. Essa trigger faz o disparo de alertas caso o valor coletado do monitoramento divirja do valor esperado. Para gerar uma maior confiabilidade nessa informação de monitoramento, criamos um padrão que é uma contagem das últimas 5 (cinco) verificações e, se desse total, tiver de 3 ou mais falhas, é disparado o alarme de problema.  A mensagem de alerta disparado está em conformidade com o NOTES informado na solicitação de serviço.

NOTES 

Notes, é a ação que o Operador deve tomar em caso de problema no item monitorado, conforme informações passadas pelo solicitante. 

A referida ação poderá ocorrer tanto no horário de expediente ( comercial, das 8:30h às 17:30h) quanto fora dele, incluindo finais de semana  e feriados.

O serviço de Operação, do CCUEC/DPROD, trabalha 24/7 ( 24h, 7 dias por semana); sendo assim, uma vez identificado algum problema no monitoramento do equipamento, o Operador entrará em contato por telefone comunicando o ocorrido para providências, independente do horário e dia.

Durante o Expediente: informar o ramal e o nome da equipe/pessoa responsável para receber o aviso

Fora do Expediente:  havendo interesse/necessidade de acionamento nesse período, recomendamos que seja informado um número de telefone/celular para contato; podendo ser inclusive  o número de telefone/celular  do serviço de plantão, caso o órgão disponha desse serviço. Caso contrário, entenderemos que não haverá ação a ser tomada pela equipe de Operadores do CCUEC.