
Что такое система мониторинга ИТ-инфраструктуры?
Мониторинг IT-инфраструктуры компании позволяет своевременно определять состояние, находить появляющиеся ошибки и быстро исправлять их. Для определения всех возможных нюансов была создана система управления и мониторинга ИТ-инфраструктуры предприятия.
Система мониторинга IT инфраструктуры в режиме 24/7 собирает информацию о физическом и программном состоянии серверов и рабочих станций и посылает сигнал в наш офис в случае возникновения проблемы. Сразу после этого специалисты ИТ-компании предпринимают действия для устранения ошибки и возобновления работы сервиса.
Что мы предлагаем?
С марта 2017 года мы внедрили автоматическую систему мониторинга ИТ инфраструктуры состояния сети всех клиентов, которые заказали у нас услугу IT-аутсорсинга.
Основной принцип нашей работы – решение проблем до их возникновения, путем проведения комплекса профилактических работ и настройки системы мониторинга ИТ инфраструктуры и отчетности о предстоящих сбоях.
Таким образом, нашим клиентам не приходится тратить свои время и нервы, дожидаясь, пока заработают жизненно необходимые для бизнеса сервисы. Система обеспечивает стабильную работу всей инфраструктуры, поэтому о большинстве потенциальных и произошедших сбоях клиенты даже не узнают т.к. мы работаем на опережение и только находившаяся в зачатке ошибка будет устранена.

Тарифы на онлайн-мониторинг IT-инфраструктуры в Екатеринбурге
- Место на жестком диске
- Загруженность оперативной памяти
- Загруженность процессора
- Очередь жетских дисков
- Доступность важнейших инфраструктурных сервисов (например, Terminal Server)
- Запущенные процессы на сервере
- Изменение учетных данных
- Антивирусные службы
- Недоступность внешних информационных ресурсов
- Температура материнской платы или других комплектующих
- Ошибки и критические события дискового массива
- S.M.A.R.T. - тест (основной тест работоспособности жестких дисков)
- Вход в сеть под учётной записью с правами администратора
- Попытки удаленного входа в учетные записи
- Загруженность Интернет-канала
- Расход денежных средств в ЛК провайдеров (при наличии API)
- Уровень тонера/чернил в принтерах и МФУ
- Опасные события (например, добавление пользователя в группу)


Отслеживаемые параметры в рамках услуги:
01. Место на жестком диске
- При окончании свободного места на жестком диске — сервис перестанет работать. Рекомендуется освободить необходимое кол-во места на дисках.
- Если свободное место закончилось скачкообразно – выявить приложение, требующие дополнительных ресурсов, и узнать, почему ведёт себя таким образом.
02. Загруженность оперативной памяти
Чрезмерная загрузка оперативной памяти приведет к некорректной работе приложений и сервисов. Рекомендуется проанализировать причины нехватки оперативной памяти и предпринять необходимые меры.
03. Температура материнской платы или других комплектующих
Высокая вероятность поломки оборудования и простоя рабочих мест. Необходимо заменить термопасту, кулеры, прочистить охлаждение или модернизировать.
04. Загруженность процессора
Загруженность процессоров грозит снижению производительности вычислительной связи. Проверить на наличие вредоносного ПО и модернизировать оборудование.
05. Очередь жестких дисков
Очередь свидетельствует о начинающихся проблемах с быстродействием. Следует обнаружить, какому приложению требуется запись. Если это не ошибка администрирования, и процесс требуется для нормальной работы, то необходимо увеличение скорости дисковой подсистемы.
06. Ошибки и критические события дискового массива
Риск потери важных данных и простоя основных сервисов организации. Необходимо провести диагностику средств хранения данных и при необходимости заменить устаревшие жесткие диски. Желательно скопировать рабочую критичную информацию на внешние устройства.
07. S.M.A.R.T. - тест (основной тест работоспособности жестких дисков)
Потеря важных данных и потеря ключевых сервисов. Срочно заменить вышедшие из строя диски.
08. Изменение учетных данных
09. Доступность важнейших инфраструктурных сервисов (например, Terminal Server)
Риск простоя работы организации. При остановке работы ключевого сервиса во вне рабочее время, у специалиста технической поддержки есть возможность проактивно решить проблему. Если инциденты по критическим сервисам происходят регулярно – стоит задуматься об ИТ аудите и реорганизации инфраструктуры.

10. Запущенные процессы на сервере
Отказ доступности и некорректная работа сервисов. Проверить выполняемые процессы, если много одинаковых – выяснить причину. Перегрузка говорит о том, что один сервер совмещает слишком много ролей. Вероятно, поможет распределение функций по различным физическим устройствам.
11. Попытки удаленного входа в учетные записи
Риск взлома сети и потери, кражи важных данных. Необходимо проверить сеть на вирусы и проанализировать причину неудачных попыток подключения. При необходимости блокировать IP-адрес, с которого происходят подключения.
12. Вход в сеть под учётной записью с правами администратора
Риск взлома сети и потери, кражи важных данных а также риск простоя организации. В случае, если специалистов с правами администратора немного и в момент авторизации никто из них не работает (например ночью), необходимо срочно прервать соединение и сменить данные и порты для подключения.
13. Антивирусные службы
Риск недоступности и потери данных. Выяснить почему не запущены, запустить, проверить работу, возможно переустановить или заменить сервер централизованного управления антивирусом.
14. Недоступность внешних информационных ресурсов
Риск отказа необходимых сетевых сервисов. Проверить оборудование со своей стороны, загрузку интерфейсов, связаться с провайдером. Собрав статистику за продолжительный период времени, оценивают качество провайдерских услуг. Стабильность работы провайдера, необходимость подключения резервного провайдера, необходимость смены провайдера, расширения канала.
15. Загруженность Интернет-канала
Риск ухудшения качества работы сети Интернет и сопутствующих сервисов (почта, IP-телефония, облачные сервисы).
Необходимо проверить причину загруженности Интернет-канала, при необходимости пресечь несанкционированную активность (скачивание торрентов, просмотр видео и т.д.) и провести проверку на вирусы. Если нагрузка появляется постоянно, стоит задуматься о расширении канала связи через Интернет.
16. Расход денежных средств в ЛК провайдеров (при наличии API)
Позволяет не забывать своевременно проводить оплаты и избежать последующего простоя вследствие этого, можно отследить аномалии дневного потребления услуг, например междугородних звонков.
17. Уровень тонера/чернил в принтерах и МФУ
Позволяет своевременно менять картриджи без остановки сервиса печати.
18. Опасные события (например, добавление пользователя в группу)
Риски, связанные с нарушением ИБ: потеря или распространение конфиденциальных данных, простой работы компании вследствие остановки ключевых сервисов. Необходимо убедиться, что добавление новых прав пользователю обосновано и на это получено согласование руководства.

Система 1 окна
Решаем всевозможные задачи по организации IT инфраструктуры, а также реализуем любые IT-проекты


Работаем по SLA
Прописываем индивидуальный SLA, в котором указаны максимальные сроки взятия в работу и решения всех обращений


Фин. ответственность
За каждый день просрочки по срокам выплачиваем Вам 0,5% от суммы неисполненных обязательств


Круглосуточно
Наша техническая поддержка работает круглосуточно без перерыва на выходные и праздники


Прозрачность работы
Доступ в Service Desk c возможностью мониторинга статуса заявок


Подменное оборудование
Предоставляется на период ремонта вашей техники или покупки новой


Сокращаете затраты на IT инфраструктуру в 2 раза

Повышаете качество IT-сервисов и их эффективность

Освобождаете ваше время для основной работы
Схема нашей работы


