системите за monitoring – лъжливото овчарче в ИТ системите

vladimir simeonov
08/08/2011

Фактите:

използването на система за мониторинг на ИТ интфраструктура е неизбежно събитие застигащо администратора и. съществуват много, твърде много решения за мониторинг, както безплатни, така и платени и всички те страдат от един общ недостатък – синдрома на лъжливото овчарче.

Не сте чували за него??

ОК – пример от реалният живот.

Ползвам скрипт, който архивира всяка вечер в последователност всички сървъри. и разбира се получавам емейл със статуса на архивирането, както и СМС за грешка. проблема е, че програмата за синхронизация много често свършва със грешка, която не е фатална. на третата вечер спрях дори да обръщам внимание на получените СМС-и.

аналогична е и ситуацията с мониторинговите системи. липсата на пинг за 10сек която системата може да детектне и да извести може никога да не се забележи. но администратор който получава постоянно нови и ниви известия за събитие което е отминало в даден момент спира да му обръща внимание.

система която в реално време известява за отпадането на свързаност и т.н. е напълно безмислена, ако това отпадане е за части от секундата или за време, през което не може да се извърши диагностика на проблема. а генерирането постоянно на такива съобщения е побъркващо.

изхода е един: отъврете се от такава система.. напишете си сами качествен скрипт, който да проверява обстойно системата ви; скрипт с интелект, който да пуска повторна проверка след няколко секунди, а не да вдига алармата за загуба на пинг.

в крайна сметка никой не вярва на лъжливото овчарче. една такава система е безсмислена и неефективна.

Comments are closed !