Informações e orientações básicas sobre o Software de Monitoramento
Explicando o Mapa
Mapa, é a forma como o Operador do Centro de Computação visualiza em uma perspectiva geral, todos os ambientes monitorados da Universidade. Temos diversas divisões de mapas e agrupamentos criando uma organização em áreas, tipos de monitoramentos e projetos.
Equipamentos
Para efeito desse serviço, por ora, entenda-se por equipamentos: servidores e switches de rede, conectados na rede da Unicamp.
Monitoramento e Tempo de Verificações
Elencar todos os serviços do equipamento que sejam necessários o monitoramento; e para tais, especificar em que porta deve ser realizado o monitoramento e qual a média de tempo para checagem. Por exemplo, verificação do serviço HTTP, porta 80, à cada 5 minutos.
No caso de verificação se o equipamento está no ar ( ping ) é realizado check no serviço ICMP.
Esse é o método sem agente. Caso o equipamento não responda ao nosso servidor, o problema será tratado como fora do ar, podendo haver várias possibilidades como causa; às quais deverão ser investigadas tanto pelo responsável pelo equipamento quanto pelo responsável pelo software de monitoramento.
Portanto, o usuário será informado apenas que o serviço ICMP (ping) não está respondendo ao nosso servidor.
Triggers e Avisos de alerta
Utilizamos esse recurso para gerar o alerta em caso de problemas, existe o item que está sendo monitorado e sua resposta esperada; após isso, verificamos se está normal ou não. Essa trigger faz o disparo de alertas caso o valor coletado do monitoramento divirja do valor esperado. Para gerar uma maior confiabilidade nessa informação de monitoramento, criamos um padrão que é uma contagem das últimas 5 (cinco) verificações e, se desse total, tiver de 3 ou mais falhas, é disparado o alarme de problema. A mensagem de alerta disparado está em conformidade com o NOTES informado na solicitação de serviço.
NOTES
Notes, é a ação que o Operador deve tomar em caso de problema no item monitorado, conforme informações passadas pelo solicitante.
A referida ação poderá ocorrer tanto no horário de expediente ( comercial, das 8:30h às 17:30h) quanto fora dele, incluindo finais de semana e feriados.
O serviço de Operação, do CCUEC/DPROD, trabalha 24/7 ( 24h, 7 dias por semana); sendo assim, uma vez identificado algum problema no monitoramento do equipamento, o Operador entrará em contato por telefone comunicando o ocorrido para providências, independente do horário e dia.
Durante o Expediente: informar o ramal e o nome da equipe/pessoa responsável para receber o aviso
Fora do Expediente: havendo interesse/necessidade de acionamento nesse período, recomendamos que seja informado um número de telefone/celular para contato; podendo ser inclusive o número de telefone/celular do serviço de plantão, caso o órgão disponha desse serviço. Caso contrário, entenderemos que não haverá ação a ser tomada pela equipe de Operadores do CCUEC.