Мониторим ИТ @monitorim_it Channel on Telegram

Мониторим ИТ

@monitorim_it


Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)

Мониторим ИТ (Russian)

Добро пожаловать на канал "Мониторим ИТ"! Здесь вы найдете полезную информацию о мониторинге ИТ-инфраструктуры и приложений. Наш канал посвящен вопросам мониторинга и наблюдаемости в сфере информационных технологий. Если у вас возникли вопросы или вам требуется консультация, обратитесь к @antoniusfirst. Он поможет вам настроить мониторинг и ответит на все ваши вопросы. Также рекомендуем подписаться на канал @usr_bin_linux, где вы найдете информацию об ИТ-инфраструктуре, такой как Linux, Kubernetes, Docker, Terraform и многое другое. Присоединяйтесь к нашему каналу и оставайтесь в курсе последних тенденций в мире мониторинга и наблюдаемости в ИТ-сфере!

Мониторим ИТ

13 Jan, 06:30


A Guide to Deploying Jaeger on Kubernetes in Production

В этой статье рассказано, что требуется для развертывания и управления бэкендом Jaeger в продовых средах.

❗️Статья на medium.com

Мониторим ИТ

10 Jan, 15:00


When Metrics Meet vminsert: A Data-Delivery Story

Статья в блоге VictoriaMetrics о том как загружаются данные в vmstorage.

Мониторим ИТ

10 Jan, 12:42


Какие проблемы решает Observability?

Выявление аномалий в работе кластера
Мониторинг сетевой активности и предотвращение сбоев
Обеспечение соответствия политик безопасности
Снижение времени простоя за счет быстрого устранения инцидентов
Упрощение эксплуатации сложных систем с минимальными затратами

16 января в 19:00 приглашаем вас на бесплатный вебинар «Observability и k8s: полный контроль над инфраструктурой и сервисами» от учебного центра Слёрм.

Рассмотрим внутренние инструменты k8s, связанные с безопасностью и отладкой работы кластера
Так же посмотрим на инструменты, полезные для понимания работы больших систем без необходимости внедрения большого кол-ва изменений в сервисы, написанные на разных языках и фреймворках

Эксперты встречи:
🔴Виталий Лихачёв, SRE в крупном голландском тревелтехе
🔴Кирилл Борисов, SRE в VK

Когда: 16 января в 19:00 мск
Регистрация на вебинар — через бота 👈👈

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

09 Jan, 08:47


Система мониторинга 📈 — глаза 👀 и уши 👂 вашего бизнеса, от которых вполне себе напрямую зависит непрерывность рабочих процессов в организации. Правильная настройка мониторинга поможет сохранить нервы, деньги и хорошее настроение в новом году.

👨‍💻 @zabbix_ru — наш телеграм канал, чтобы всё правильно настроить. Но знаний из одного канала недостаточно, поэтому:

🎓 Приглашаем вас до краёв наполниться экспертностью по Zabbix в новом году на зимней волне тренингов.

Если вы только начинаете работу с этой системой мониторинга или уже работаете какое-то время, прохождение тренинга это возможность получить концентрированные знания за короткий период времени и сразу же их применить на практике в лабораторном окружении.

В процессе обучения вы также сможете задать любые интересующие вас вопросы и обсудить вашу инсталляцию Zabbix.

📅 Zabbix сертифицированный специалист 7.0 (ZCS 7.0) 27-31 января 2025. Программа.

📅 Zabbix сертифицированный профессионал 7.0 (ZCP 7.0) 17-19 февраля 2025. Программа.

По окончанию тренингов отправляем футболку (ZCS) и термокружку (ZCP) с лого Zabbix, чтобы вы могли спокойно попивать чай у себя в квартале.💪

Ознакомиться с полным расписанием тренингов вы можете по ссылке. Задать вопросы можно @galssoftware или в почту [email protected].

erid: 2Vtzqv9kf9k

Мониторим ИТ

09 Jan, 07:26


OpenTelemetry and Grafana Labs: what’s new and what’s next in 2025

В этой статье обзор возможностей OpenTelemetry + прогноз развития продукта на 2025 год. Читать в блоге Grafana.

Мониторим ИТ

05 Jan, 10:30


Уверены, что разбираетесь в Linux и Git? А если проверим?

Linux и Git — база для DevOps-инженера. Учебный центр Слёрм подготовил два коротких теста на знание этих инструментов 📝
Предлагаем вам пройти их и узнать, насколько вы готовы к старту в DevOps.

🫵 Сможете набрать больше 5 правильных ответов? Если нет — не расстраивайтесь. В конце теста вас ждут полезные ссылки, которые помогут структурировать знания.

📌 Узнать свой результат — ТУТ. Удачи!

#реклама
О рекламодателе
erid: 2W5zFJxDLiU

Мониторим ИТ

04 Jan, 06:30


Самописный скрипт для мониторинга системных логов

Зачем нужны все эти Loki, Elasticsearch и прочие тяжеловесные инструменты, когда есть старый добрый баш-скрипт?

Мониторим ИТ

26 Dec, 08:30


infosec - один из самых ламповых каналов по информационной безопасности, где говорят об истории ИТ, публикуют актуальные новости и пишут технический материал по разным темам:

- Как зарождалась Флибуста?
- Сервисы для обеспечения безопасности в сети;
- Каким образом "компьютерные мастера" обманывают своих клиентов?
- Бесплатный бот, который проверит файлы на предмет угроз более чем 70 антивирусами одновременно.

А еще у нас часто проходят розыгрыши самых актуальных и новых книг по ИБ. Так что присоединяйся, у нас интересно!

Мониторим ИТ

23 Dec, 05:13


Monitoring Kafka Clusters: Setup Guide for JMX Exporter, Prometheus, and Grafana

Статья-воркшоп по настройке мониторинга Kafka. Читать.

❗️Статья на medium.com

Мониторим ИТ

20 Dec, 08:58


Grafana Loki 3.3 release: faster query results via Blooms for structured metadata

Вышла версия Grafana Loki 3.3. Loki теперь использует фильтры Блума — переход от свободного текстового поиска к использованию мощи структурированных метаданных. Это упрощает поиск иголки в стоге логов, а также улучшает опыт выполнения поисковых запросов для сообщества OpenTelemetry. Читать в блоге Grafana.

Мониторим ИТ

19 Dec, 06:30


10 лучших приёмов логирования для разработчиков

Качественное логирование играет принципиальную роль для высокой производительности и целостности системы в современных сложных ИТ-средах. Эффективное логирование оптимизирует устранение сбоев, так как из лога можно получить однозначную информацию об ошибках и поведении системы. Кроме того, оно улучшает мониторинг производительности, показывая узкие места и отклонения. Надёжное логирование важно и для безопасности: оно помогает выявлять и расследовать потенциальные угрозы или случаи несанкционированного доступа.

В этой статье собраны передовые приёмы логирования, которые превращают запись логов в эффективный, действенный и масштабируемый процесс.

Мониторим ИТ

18 Dec, 14:21


File Integrity Monitoring with Zabbix

Интересная статья из блога Zabbix относительно мониторинга файлов, директорий и прочего с этим связанного.

🚀 vfs.dir.count[/etc/mysql] — количество файлов/директорий

🚀 vfs.dir.size[/etc/mysql] — размер файлов/директорий

🚀 vfs.file.exists[/etc/mysql/mariadb.conf.d/50-server.cnf] — проверка существования файла

🚀 vfs.file.cksum[/etc/mysql/mariadb.conf.d/50-server.cnf,sha256] — проверка чексуммы файла на случай, если кто-то его изменил

🚀 vfs.file.regmatch[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+)] — проверка содержимого файла на совпадение по регулярному выражению

🚀 vfs.file.regexp[/etc/mysql/mariadb.conf.d/50-server.cnf,^max_connections\s+=\s+(\d+),,,,\1] — извлечение содержимого файла по регулярному выражению

❗️Еще больше полезного о Zabbix в канале @zabbix_ru

Мониторим ИТ

18 Dec, 11:00


Мониторинг бизнес-процессов с помощью OpenTelemetry

В этой статье рассказано, как объединить несколько разных команд разработки общим Observability и с помощью исключительно технических метрик отслеживаем здоровье бизнес-процессов. Как всё это помогает мгновенно находить первопричину сбоя. Как устроен OpenTelemetry и как с его помощью рассчитать доступность приложения в девятках, а также MTTR (Mean Time to Recovery). Читать на Хабре.

Мониторим ИТ

14 Dec, 06:30


Настраиваем алерты из заббикса в телеграм

В zabbix версии 7.0 есть встроенный механизм по отправке сообщений в телеграм, но он не доработан — там нету опции отправки графиков. В этой статье как раз разобран такой сценарий.

Мониторим ИТ

11 Dec, 13:37


How vmstorage Turns Raw Metrics into Organized History

vmstorage — это компонент VictoriaMetrics, который управляет долгосрочным хранением данных мониторинга. Он получает данные из vminsert, организует данные в эффективные структуры хранения и управляет сроком хранения данных.

Еще до того, как vminsert увидит данные, их уже собирают агенты. Эти агенты собирают метрики из разных источников, хранят данные в течение некоторого времени, а затем отправляют их в vminsert партиями.

Когда vminsert получает данные, он сжимает их в пакеты для повышения эффективности передачи.

После сжатия vminsert отправляет эти пакеты в vmstorage. vmstorage хранит данные на диске организованным и оптимизированным образом. Такая структура позволяет очень быстро извлекать и запрашивать данные в дальнейшем.

Читать статью в блоге VM

Мониторим ИТ

11 Dec, 07:44


Understanding OpenTelemetry with demo example

Обзорная статья о том, как устроен Opentelemetry, для чего используется и пример его работы. Читать в статье.

❗️Статья на medium.com

Мониторим ИТ

10 Dec, 16:30


IMPulse

OnCall-утилита для управления событиями из Prometheus (Alertmanager)

Репыч на Гитхабе

Статья на Хабре с описанием

Мониторим ИТ

10 Dec, 12:36


Как внедрить наблюдаемость в микросервисное приложение с помощью OpenTelemetry, Jaeger и Prometheus

Базовая статьи о концепции наблюдаемости. Читать на Хабре

Мониторим ИТ

09 Dec, 12:30


12-15 ноября в Солт-Лейк Сити прошел ежегодный Kubecon. Несколько недель назад они выложили записи с мероприятия. Я выбрал несколько интересных выступлений с точи зрения мониторинга и ниже привожу на них ссылки.

Prometheus: Celebrating Prometheus 3.0: All You Need To Know!

Inspektor Gadget: eBPF for Observability, Made Easy and Approachable

OpenTelemetry: The Future of Network Monitoring eBPF for Low-Level Insights

OpenTelemetry: OpenTelemetry in Five Minutes

Jaeger: Distributed Tracing with Jaeger and OpenTelemetry

Shopify’s Open Source Approach to Network Monitoring with eBPF, Vector and ClickHouse

Tutorial: Simplify and Optimize Your YAML with YAMLScript

OpenTelemetry Hands-on - Automatic and Manual Instrumentation for Java and Python Apps

Cortex Intro: Multi-Tenant Scalable Prometheus

Fluent Bit: Better Pipelines for Observability

Cognitive and Self-Adaptive System for Effective Distributed-Tracing in Applications

Tame MTTR with Real-Time Anomaly Detection

Low-Overhead, Zero-Instrumentation, Continuous Profiling for OpenTelemetry

Mastering OpenTelemetry Collector Configuration

Мониторим ИТ

09 Dec, 06:30


Monitoring, troubleshooting, and query analytics for PostgreSQL on Kubernetes

Сказ про Percona Monitoring and Management (PMM) и установку этого инструмента в кластере Kubernetes. Читать статью.

Мониторим ИТ

08 Dec, 10:30


K2 Cloud выкатил кастомные реакции на Хабре!

Теперь можно выражать эмоции от статей. Для этого пройди квиз: выбери одну из ИТ-профессий и проведи миграцию в облако. В конце и реакции разблокируешь, и в розыгрыше примешь участие — K2 Cloud дарит новогодние мистери боксы и другие призы.

Квиз тут

Мониторим ИТ

06 Dec, 12:30


11 скриптов автоматизации для автоматизации конфигурации Prometheus

В этой статье 11 скриптов для автоматизации работы с Prometheus. Не спорю, что есть и Ansible и много чего ещё, но иногда бывает достаточно таких вот скриптов. Смотреть на Хабре.

Мониторим ИТ

06 Dec, 10:30


Приложения только жрут ресурсы? Заставьте их работать!

Вы знали, что Golang изначально придуман для быстрого и эффективного написания микросервисов? Go совмещает простоту Python и скорость С++, благодаря чему он идеально подходит для архитектуры системных приложений.

Если вы хотите, чтобы ваши сервисы работали с максимальной производительностью, а не только потребляли, приходите на новый поток курса «Golang для инженеров».

За 3 месяца вы научитесь:
⚡️ писать код на Go: переменные, типы данных, функции и структуры;
⚡️ создавать микросервисы, взаимодействуя с Docker и Kubernetes;
⚡️ разрабатывать и тестировать API-сервисы на языке Go;
⚡️ работать с Kubernetes, включая создание и использование операторов.

Курс подойдет DevOps-инженерам, системным администраторам, а также инженерам SRE, мониторинга и поддержки.

При покупке потока вы получите курс «Gitlab CI/CD» в подарок 😎

Старт 9 декабря.
🧲 Занять место на курсе

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

06 Dec, 06:30


Monitoring logs with Prometheus, Grafana and Fluentd

Статья-воркшоп по настройке мониторинга.

❗️Статья на medium.com

Мониторим ИТ

05 Dec, 12:30


How vmagent Collects and Ships Metrics Fast with Aggregation, Deduplication, and More

Агент VictoriaMetrics или vmagent, — это инструмент, предназначенный для сбора показателей из различных источников.

Vmagent может отправлять обработанные метрики в систему хранения, например, VictoriaMetrics или куда угодно, где поддерживается протокол записи в формате Prometheus. Он также поддерживает собственный протокол удаленной записи VictoriaMetrics, что является более эффективным способом обработки большого объема данных. Читать в блоге VM.

Мониторим ИТ

05 Dec, 06:30


Edit your Git-based Grafana dashboards locally

Grizzly — утилита командной строки для Grafana, которую можно использовать для проверки или редактирования дашбордов Grafana. Статья в блоге Grafana.

Мониторим ИТ

04 Dec, 12:30


Mastering Process and System Monitoring in Linux: Essential Tools and Techniques

В этой статье популярные утилиты для получения данных о производительности сервера Linux и примеры использования. Читать дальше.

❗️Статья на medium.com

Мониторим ИТ

04 Dec, 10:30


Бесплатный вебинар «GitOps подход к деплою приложений в кластер на примере ArgoCD»

🔹Познакомимся с концепцией GitOps, ее преимуществами и недостатками
🔹Рассмотрим ArgoCD как наиболее популярный инструмент, реализующий эту концепцию
🔹Установим ArgoCD в кластер и выполним развертывание приложения с помощью паттерна App of Apps

Эксперты встречи
➡️ Денис Лавров, Архитектор MTS AI
➡️ Кирилл Борисов, SRE в VK

🎁 Расскажем, как получить скидку на курс «Kubernetes База», который стартует уже 16 декабря.

Когда:  4 декабря в 18:00 мск
Занять место на вебинаре 👉 через бота 

#реклама
О рекламодателе
erid: LjN8KZeVo

Мониторим ИТ

04 Dec, 06:30


Jaeger v2 released

Новая версия использует фреймворк OpenTelemetry Collector в качестве основы и расширяет его возможности для реализации функций Jaeger. В статье подробности.

❗️Статья на medium.com

Мониторим ИТ

03 Dec, 06:30


Как оценить качество проекта? Внедряем DORA-метрики

В этой статье рассказано что такое DORA-метрики и как они могут помочь оценить качество проекта. Читать на Хабре.

Мониторим ИТ

02 Dec, 12:30


CMDB в ИТ-мониторинге или как устранять инциденты в 3 раза быстрей

Полностью поддерживаю тезис, что CMDB позволяет работать с системой мониторинга более эффективно. В статье рассказывают про российскую систему мониторинга Monq, в которую уже встроена CMDB. Но никто не мешает добавить ту же бесплатную CMDB iTop к вашей существующей системе мониторинга, тому же Zabbix.

Читать на Хабре.

Мониторим ИТ

02 Dec, 10:31


Машина времени для вашего IT—отдела

Система летает, инфраструктура в порядке, фичи выкатываются как по маслу, а запросы пользователей удовлетворяются на ура. Утопия? Нет, мощная команда IT-специалистов будущего. Что сделать, чтобы вырастить такую команду? Обучить самым современным направлениям.

Слёрм помогает компаниям быстро развивать разработчиков и инженеров без отрыва их от работы. А чтобы было выгодно обучать целую команду или отдел, мы собрали настоящую машину времени 👉 пакеты Универсальных доступов.

Что это такое:
🔹 от 30 универсальных доступов в пакете;
🔹55+ востребованных курса для прокачки навыков;
🔹 возможность активировать обучение в любой момент в течение года;
🔹 один договор на весь пакет доступов;
🔹 быстрый доступ студента к обучению — можно начать в день оформления договора.

Каждый курс выйдет по единой цене независимо от выбранного направления.

Успейте забрать доступы до Нового года — потом цены вырастут и обучить команду будет дороже.

Запустить вашу команду в машину времени прямо сейчас и оставить заявку на обучение можно ТУТ

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

02 Dec, 06:30


keep

Это агрегатор событий от различных систем мониторинга с открытым исходным кодом. Есть готовые интеграции с Zabbix, Kibana, Elastic, Grafana и множеством других. Еще пока не тестировал, но выглядит интересно.

Репыч на Гитхабе

Мониторим ИТ

01 Dec, 08:09


Мониторинг ipsec strongSwan

IPsec-туннели в основном используются для связи между облаками, так как инфраструктура разнесена — например, dev и prod живут у разных облачных провайдеров. Также есть интеграции со сторонними организациями, кластеры Kubernetes в AWS, GCP и т.д. Основная цель — получать алерты о падении туннеля раньше, чем сработают алерты о недоступности сервисов. Это особенно важно, поскольку Prometheus один, он живёт в одном из облаков, а prometheus-stack в Kubernetes-кластерах работают в режиме агентов. Читать дальше.

Мониторим ИТ

28 Nov, 11:06


Тариф «Спроси эксперта по Zabbix»

Некоторые из подписчиков этого канала обладают достаточными знаниями по Zabbix для его настройки, работе с ролевой моделью, созданию триггеров, вычисляемых метрик, оповещений и работы с другими полезными инструментами. Но не всегда есть возможность комплексно и системно подойти к оптимизации настроек или устранению малопонятных проблем с производительностью.

В таких ситуациях привлечение стороннего подрядчика для оптимизации чего бы то ни было или выполнения базовых настроек овер неоправданно: не хочется кого-то искать, договариваться, объяснять и прочая и прочая. Мы подумали и решили, что можем поделиться своей экспертизой в рамках короткого по времени аудита и выдачи рекомендаций. Как это будет выглядеть? Всего будет 3 этапа:


🚀 Установочная встреча. Проводим Zoom-сессию (1-3 часа). На встрече смотрим:

- какие шаблоны вы используете, как они настроены (интервалы сбора, макросы, периоды хранения, интервалы опроса, наличие нужных правил предобработки, LLD и т.д.), как распределены по узлам.

- как настроены действия по триггерам и авторегистрации (проверим условия их срабатывания и операции по ним).

- метрики производительности компонентов Zabbix (сервер, веб, прокси, БД).

- отчеты по срабатываниям триггеров, очередям.

- ролевую модель и назначение прав пользователям.

- настройки в конфигурационных файлах компонентов Zabbix.


🚀 Обработка данных. На основе собранной информации готовим предложения в формате PDF по:

- оптимизации настроек шаблонов в формате таблицы: «как сейчас» и «как лучше бы было».

- перенастройке правил срабатывания действий (поможем распутать клубок).

- изменению конфигурации сервера, прокси, веб, БД.

- оптимизации ролевой модели.


🚀 Финальная встреча. Проводим Zoom-сессию (1-1,5 часа). На встрече:

- обсуждаем предложения по оптимизации из пункта выше.

- обсуждаем дальнейшее развитие мониторинга в компании.

- отвечаем на вопросы по Zabbix и мониторингу в целом.


Вот так все интересно будет выглядеть. Общая стоимость такого предложения 60 000 рублей. Пока не знаем сколько к нам обратится заказчиков, но у нас есть определенные ограничения по ёмкости и всех взять не сможем. Заявки и вопросы можно отправить @galssoftware или в почту [email protected].

Подписывайтесь на наш канал по Zabbix @zabbix_ru

erid: 2Vtzqv9kf9k

Мониторим ИТ

26 Nov, 12:30


Tracer спустя год: новые фичи и возможности инструмента для аналитики ошибок в мобильных приложениях

Tracer — модульный инструмент для аналитики ошибок в мобильных приложениях от OK.Tech, который был представлен год назад. За это время в Tracer зарегистрировалось более 1500 организаций и 5000 пользователей. Сейчас решение обрабатывает более 1 млрд событий в день и обслуживает приложения, которые имеют суммарный DAU в 20 млн пользователей. Читать на Хабре.

Мониторим ИТ

26 Nov, 10:30


Хотите освоить Go, но не знаете, с чего начать?🫣
Дарим вам чек-лист для быстрого старта!

Это пошаговое руководство по изучению Golang: от основ синтаксиса до продвинутых фишек. Все ключевые моменты для освоения языка 一 в одном файле:

✔️ Установка и базовая настройка,
✔️ Функции и структуры данных,
✔️ Работа с API,
✔️ Обработка ошибок и логирование,
✔️ и другие необходимые навыки, чтобы писать чистый, эффективный код.

А если вы уже владеете Go, проверьте себя и структурируйте знания.

Забрать бесплатный чек-лист ➡️ по ссылке

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

26 Nov, 06:30


How do open source solutions for logs work: Elasticsearch, Loki and VictoriaLogs

Если вы используете Elasticsearch, OpenSearch, Loki или VictoriaLogs и вам интересно, почему ОС требует много оперативной памяти или выполняет полнотекстовые поисковые запросы с очень низкой скоростью, то эта статья может быть вам интересна.

❗️Статья на medium.com

Мониторим ИТ

21 Nov, 12:30


Современный on-call менеджмент: 5 основных шагов от мониторинга до постмортема

Статья от Monq (вендор одноименной системы мониторинга), где рассказывают про важность системного подхода к организации дежурств и оповещений. Про новый продукт Monq OnCall тоже рассказывают.

Поделитесь в комментах каким решением для OnCall пользуетесь и почему выбрали именно его. На сегодняшний день самым известным, наверное, является Grafana OnCall.

Мониторим ИТ

21 Nov, 11:13


Приходите на вебинар!

Проведем его 26 ноября в 20 часов по московскому времени. Поговорим о новом функционале и обсудим пора ли обновляться.

Регистрация

В программе:

🚀 Асинхронные сборщики данных

🚀 Отказоустойчивый прокси

🚀 Буфер памяти в прокси

🚀 Централизованное управление таймаутами

🚀 Синтетический мониторинг через Selenium

🚀 Новый элемент SNMP Walk

🚀 Обновление Zabbix



❗️Подписывайтесь на канал о Zabbix — @zabbix_ru

Мониторим ИТ

21 Nov, 06:59


Отправка метрик Pi-Hole в Graylog с помощью Zabbix

Перевод оригинальной статьи

Мониторим ИТ

20 Nov, 10:30


Каждый сбой системы — это потеря прибыли и удар по клиентскому доверию 🆘

Хотите выстроить непрерывное наблюдение за состоянием приложений, вовремя предотвращать инциденты, при этом не зависеть от санкций и лицензий западных вендоров? 

Тогда присоединяйтесь к нашему митапу «APM-мониторинг: почему GMonit называют “глазами бизнеса”»!

📆 Дата: 26 ноября
🕰 Время: 17:00-18:00 (Мск)


🔺 Обсудим текущую ситуацию на рынке импортозамещения инструментов мониторинга и характеристики APM-решений будущего. 
🔺 Поговорим о технических возможностях GMonit, которые полностью заменяют функционал многих иностранных продуктов. 
🔺 Расскажем, как с помощью нашего APM-мониторинга можно отследить корневые ошибки на уровне кода, быстро устранить сбои и оценить влияние ИТ на бизнес.
🔺 Поделимся кейсами внедрения GMonit в приложения компаний АШАН, Лента, Hoff Tech, Familia, Hobby World и NLStar.

В завершение — проведем QA-сессию, где вы сможете получить персональные экспертные рекомендации. 

Регистрация по ссылке 🥇

Мониторим ИТ

20 Nov, 06:30


Beginners guide - Visualizing Canvas in Grafana

А вы используете панели Canvas в Grafana? Если еще нет, то вот видео, которое покажет некоторые возможности визуализации типа Canvas в Grafana.

Мониторим ИТ

19 Nov, 12:30


v1.0.0-victorialogs

12 ноября объявили о релизе первой версии и теперь Victoria Logs в GA.

Концепция решения

Репыч на Гитхаб

Кто-то уже тестировал? Расскажите в комментариях о своём опыте.

Мониторим ИТ

19 Nov, 10:30


Ищете надежный и гибкий инструмент для управления ИТ-инцидентами и оповещениями?

Мы рады сообщить о скором запуске бесплатного облачного сервиса Monq OnCall! 🚀

Что получат пользователи?
➡️ Быстрый результат: от сбора данных до создания цепочки эскалации всего за 30 минут.
➡️ Десятки интеграций: подключайтесь к системам мониторинга, сервис-дескам и мессенджерам.
➡️ Автоматизация без кода: настраивайте систему под свои потребности с помощью инструментов low-code и no-code.
➡️ Единый экран управления инцидентами: работайте с алертами из разных систем в одном месте.

Приглашаем вас стать одним из первых пользователей Monq OnCall и принять активное участие в его развитии.

Регистрируйтесь на ранний доступ. Вместе мы создадим лучший бесплатный инструмент для нашего сообщества!

Реклама ООО «Монк Диджитал Лаб», ИНН 7730253840

Мониторим ИТ

19 Nov, 07:28


Prometheus 3.0 и OpenTelemetry: практическое руководство по хранению и запросу данных OTel

Статья в блоге Grafana

Мониторим ИТ

15 Nov, 18:00


Какие планы на 19 ноября? Приходи на OPS Talk в офис Сбера!
 
Открылась регистрация на митап для инженеров сопровождения и DevOps-специалистов «OPS Talk by Sber: от разработки до инцидента».

Вместе со спикерами из Сбера, СберТеха и HFLabs поговорим о сопровождении IT-систем, DevOps- и SRE-практиках в уютном офисе на Кутузовском проспекте, а также онлайн в прямом эфире.
 
В программе 3 доклада, интерактивы и подарки, пицца-брейк, много новых знакомств и общения!
 
👉🏻Подробная программа и регистрация – здесь.
 
И поторопись – количество очных мест ограничено!

Мониторим ИТ

15 Nov, 15:03


Переезд с Elasticsearch на OpenSearch: рассказываем про нюансы и архитектуру нашей системы логирования

В этой статье рассказано про опыт перехода с Elasticsearch на OpenSearch для работы с логами. Расскажут, почему решили это сделать, какие ключевые отличия между системами нашли, несмотря на их принципиальное сходство, и подробно описана архитектура обработки логов. Читать на Хабре.

Мониторим ИТ

15 Nov, 10:30


Чем заменить сервис New Relic, при этом сохранить контроль над данными📊, гибкость настройки и локальную поддержку?

На этот вопрос ответили на митапе GMonit вместе с экспертом из АШАН:

📌 Сравнили функционал New Relic с российским APM-инструментом мониторинга на примере observability платформы GMonit.
📌 Рассказали, как с помощью APM-инструмента можно настроить мониторинг в считанные минуты, отследить корневые ошибки на уровне кода и ускорить работу с инцидентами в несколько раз.
📌 Показали на реальном примере, как GMonit позволил компании АШАН комплексно оценить влияние ИТ на e-com и определить векторы для оптимизации работы сервисов.🔝

Видеозапись онлайн-мероприятия можно посмотреть на удобной для вас площадке:
🎥
ВКонтакте
🎥
Rutube
🎥
YouTube

Мониторим ИТ

14 Nov, 10:31


«Хакатон по кибериммунной разработке 3.0» от «Лаборатории Касперского» с призовым фондом 1 000 000 рублей!

Успейте зарегистрироваться до 15 ноября

Приглашаем аналитиков, архитекторов ПО, разработчиков, экспертов по информационной безопасности и студентов, изучающих программирование и кибербезопасность. Можно участвовать как индивидуально, так и в команде до 5 человек.

🎯 Задача хакатона — разработать ПО для каршеринга, которое позволит только аутентифицированным и авторизованным пользователям управлять автомобилем в рамках их подписки.

🎙 8 ноября состоялся митап, на котором эксперты «Лаборатории Касперского» рассказали о кибериммунном подходе и дали практические советы участникам, которые помогут им в решении задачи.

Кроме того, для участников хакатона подготовили две активности, которые погрузят в мир кибериммунитета:
1⃣ Образовательный курс из четырёх занятий.
2⃣ Игру «Огнеборец», которая будет доступна 15 ноября.

Таймлайн хакатона:
▪️15.11 — старт работы над задачей
▪️17.11 — завершение загрузки решений
▪️22.11 — награждение победителей

Оставляйте заявку на участие до 15 ноября, изучайте материалы и готовьтесь к старту хакатона

Реклама. АО «Лаборатория Касперского». ИНН 7713140469. erid: LjN8K6foi

Мониторим ИТ

14 Nov, 06:30


The ultimate guide to on-call schedules

Правильно настроить дежурства — это важно, обратная ситуация может привести к затяжным инцидентам, выгоранию сотрудников и испорченной репутации компании.В этой статье рассмотрены основы составления графика дежурств и их различные типы. Читать статью.

Мониторим ИТ

13 Nov, 14:02


📹 Новая версия СУБД РЕД База Данных 5.0. Узнайте о новых возможностях на вебинаре

21 ноября в 14:00 проводим вебинар «РЕД База Данных 5.0 – СУБД для безопасных информационных систем». Расскажем о новых возможностях администрирования и оптимизации баз данных и функциях для прикладных разработчиков.

Что нового?
— поддержка формата JSON
— международные временные зоны
— планировщик заданий
— табличные пространства
— PSQL-профайлер
— кеш компилированных запросов
— синхронно-асинхронная репликация
— решена проблема долгих транзакций

🛡 Безопасность
РЕД База Данных 5.0 соответствует новым Требованиям по безопасности информации к системам управления базами данных, утвержденных приказом ФСТЭК России.

Подробнее о деталях обновления вы можете почитать в пресс-релизе.

Спикерами выступят:
🎙 Симаков Роман, Директор Департамента развития системных продуктов, product owner РЕД Базы Данных
🎙 Дмитрий Еманов, Архитектор РЕД Базы Данных

🔥 Успейте зарегистрироваться, количество мест ограниченно!

Реклама ООО "Ред Софт" ИНН 9705000373, erid: 2VtzqwnmMiu

Мониторим ИТ

13 Nov, 12:30


beszel

Легковесная утилита для мониторинга с историческими данными и алертами.

Репыч на Гитхабе

Мониторим ИТ

13 Nov, 10:30


Дальневосточное IT-комьюнити – общий сбор 😎

Встречаемся 14 ноября во Владивостоке на митапе IT Talk by Sber. Совместно с экспертами Сбера мы поговорим об основах и принципах мониторинга, инструментах и пайплайнах построения мониторинга, управлении проблемами, рисках, инцидентах и автоматизации процессов. И, конечно, обменяемся опытом!

Темы и спикеры:
«SRE подходы в команде OPS» – Павел Степуро, исполнительный директор ДИТ «Занять и сберегать».
«Дяденька, я знаю, что у вас сломалось! Мониторинг в руках команды» – лидер группы аналитиков Виктор Семак.
«Автоматизация и поддержка ITSM-процессов» – лидер направления процессов юнита Core.Banking Вячеслав Матющенко, Александр Зайков – главный инженер по сопровождению ДИТ «Занять и сберегать».

Регистрируйся и приходи 14 ноября 💚

Мониторим ИТ

13 Nov, 09:00


tianji

Утилита все-в-одном Website analytics + Uptime Monitor + Server Status.

Репыч на Гитхабе

Мониторим ИТ

13 Nov, 07:30


🚀 Target — Платформа для Свободного и Удобного Образования! 🚀
Присоединяйтесь к Target — новой образовательной платформе, где каждый может учиться, когда и как ему удобно! 🌍 
👩‍🏫 Учителям: Создавайте курсы, делитесь своим опытом и находите учеников со всего мира! Target — это свобода творчества и возможность выстраивать собственное образовательное сообщество.
🎓 Студентам: Выбирайте интересующие курсы и обучайтесь в своём ритме! Будь то новые навыки для карьеры или хобби для души — на Target вы найдёте всё, что нужно.
💥 Скоро на платформе: Индивидуальные занятия с ведущими экспертами, дополнительные функции для взаимодействия и много других обновлений, которые сделают обучение ещё удобнее и увлекательнее!
👉 Присоединяйтесь к нашему каналу Target, следите за новостями и открывайте мир знаний на своих условиях!

Мониторим ИТ

13 Nov, 05:28


Как мы в МКБ обновляли Zabbix с 4.4 до 6.0 — проблемы и подводные камни

В этом посте рассказывают про то, почему вообще выбрали именно Zabbix для мониторинга, для чего его используют, и как решились обновиться сразу с версии 4.4 до 6.0. Читать на Хабре.

Мониторим ИТ

12 Nov, 10:30


Postmortem должен быть обвинительным. Или нет?

➡️Пройдите тест из 5 вопросов, чтобы узнать, как хорошо вы разбираетесь в SRE.

А попробовать себя в роли SRE-инженера вы можете на курсе-интенсиве от Слёрма «SRE: data-driven подход к управлению надежностью систем». Старт уже 18 ноября.

На курсе вы:

🔹 внедрите правки прямо в прод;
🔹 узнаете, как решать конкретные проблемы, связанные с надежностью сервиса;
🔹 поймете, какие метрики собирать и как это делать правильно;
🔹 научитесь быстро поднимать продакшн силами команды;
🔹 узнаете, как снизить ущерб от отказов в будущем.

📍В подарок даем видеокурс «Мониторинг в Grafana»

Узнать подробности о курсе по ссылке 🔗

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

11 Nov, 12:00


Вышла Grafana 11.3: дашборды на базе Scenes, обновления визуализаций, панелей, и многое другое

Перевод на Хабре.

Мониторим ИТ

11 Nov, 08:00


🗓 13 ноября, 18:00 мск, Среда
💻 ОНЛАЙН

🍕 Support Meet-up от HFLabs и Сравни — приглашаем инженеров поддержки

🔉О чем поговорим?
— Как устроена поддержка в HFLabs и почему у нас нет разделения на линии;
— Как чат-боты помогают инженерам сопровождения с рутинными задачами;
— Как проводить мониторинг стендов заказчиков и с какими проблемами можно столкнуться на этом пути;
— Как техподдержка Сравни использует клиентские данные и чем ей это помогает.

Спикеры: Ая Мурзагалиева, Егор Подлесных и  Анастасия Еловая — инженеры сопровождения HFLabs;
Анна Агеева, Дмитрий Бенессон — инженеры второй линии техподдержки Сравни.

→ Зарегистрироваться

Мониторим ИТ

11 Nov, 05:45


Расширенное обнаружение проблем в Zabbix: продвинутая работа с триггерами, тегами и вычисляемыми элементам

Вероятно, вы уже хорошо знакомы с Zabbix, работаете с ней не первый год и всё такое. Но не весь ее функционал лежит на поверхности. В этой текстовой расшифровке вебинара раскрыты некоторые подробности работы с триггерами, тегами и вычисляемыми элементами. В частности, вы узнаете о том, как работать с ними более продуктивно и использовать возможности Zabbix на полную. Читать на Хабре.

Мониторим ИТ

06 Nov, 13:00


Install Loki, Promtail and Grafana on Kubernetes

Эта статья — пошаговое руководство по установке.

❗️Статья на medium.com

Мониторим ИТ

06 Nov, 08:55


Как мы переехали с StatsD на Prometheus всего за месяц

Статья-перевод о процессе миграции со StatsD на Prometheus. Читать на Хабре.

Мониторим ИТ

05 Nov, 13:18


Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик

В этой статье Станислав Савостин из СберТеха рассказывает о внутреннем сервисе мониторинга «Маяк», который основан на Prometheus, но включает много доработок и «тюнинга» под их условия и стандарты работы. Расскажет как они дорабатывали мониторинг, как реагируют на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!». Читать на Хабре.

Мониторим ИТ

02 Nov, 10:30


Алерт пришел! Что делать?

Встретимся 7 ноября на вебинаре Слёрма «Прокачка алертов: как постмортемы и ранбуки меняют игру» и обсудим, как эффективно работать с инцидентами.

Расскажем и покажем:

👉 что такое постмортем, как с ним работать и извлекать выгоду
👉 зачем нужен ранбук и как его писать
👉 как обычный алёрт можно превратить в полезный инструмент с помощью постмортема и ранбука

Спикеры: Кирилл Борисов, SRE в VK, и Максим Гусев, SRE Dodo Engineering.

Уникальные кейсы из реальной практики и финансовые вопросы инцидентов в крупных компаниях — на нашей встрече!

Когда: 7 ноября в 18:00
Занять место на вебинаре — в боте

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

02 Nov, 08:56


Grafana Stack: закрываем все современные потребности Observability

Ни одна система не может функционировать без сбоев, всегда могут возникнуть ситуации, когда в работе софта возникают проблемы. И здесь важное значение имеет observability — понятие, включающее в себя мониторинг и наблюдаемость. С помощью мониторинга мы можем определить, когда возникла проблема, а наблюдаемость позволяет нам понять, почему она возникла.

В этой статье рассказано о том, как можно реализовать observability с помощью сервисов стека Grafana. Читать на Хабре.

Мониторим ИТ

01 Nov, 11:30


Приглашаем на вебинар 6 ноября в 20 часов (мск)

Расширенное обнаружение проблем в Zabbix: продвинутая работа с тегами, триггерами и вычисляемыми элементами


На вебинаре поговорим о:

🚀 возможностях использования тегов

🚀 продвинутой настройке триггеров

🚀 комплексной настройке вычисляемых элементов

🚀 методах снижения количества шумовых событий

Вебинар проведет сертифицированный эксперт и тренер Zabbix Антон Касимов.

Регистрируйтесь и до встречи на вебинаре!

Присоединяйтесь к нашему каналу @zabbix_ru

Мониторим ИТ

01 Nov, 08:30


🗣Внимание, конкурс!

Разыгрываем 7 ваучеров на бесплатное обучение и сертификацию от The
Linux Foundation. Ваучеры дают 100% скидку до 31.10.2025 — и мы хотим ими поделиться:

🟣 Каталог электронных курсов и сертификации

Их можно применить к любому:

— онлайн-курсу
— сертификационному экзамену
— или пакету (курс + сертификация)

🤝 CKA, CKS, CKAD и другие — в комплекте!

Условия розыгрыша просты: 🔵 Подпишитесь на KazDevOps и нажмите "участвую" под этим постом.

🚩 14 ноября подведем итоги и выберем 7 победителей. Каждый получит по ваучеру. Активировать ваучеры нужно до 31.10.2025. После этого у вас будет 1 год и 2 попытки, чтобы завершить обучение и/или сдать экзамен.

Go-go-go, и успехов!

#kubernetes #cka #ckad #cks #k8s #linuxfoundation #cncf

@DevOpsKaz 😛

Мониторим ИТ

30 Oct, 12:00


Grafana 11.3 release: Scenes-powered dashboards, visualization and panel updates, and more

Из интересного: выполнение действий с экрана дашбордов (вызов вебхуков и др.), настройка интеграции с AD в графическом интерфейсе. Читать подробнее в блоге Grafana.

Мониторим ИТ

30 Oct, 10:30


Как разрабатывать и настраивать Grafana Stack для эффективного визуализирования метрик и логов?

🔹Расскажем на открытом уроке «Grafana Stack: закрываем все современные потребности Observability», урок приурочен к курсу «Observability: мониторинг, логирование, трейсинг» от Otus.

Рассмотрим ключевые компоненты Grafana Stack и их роли в Observability.

Настроим интеграции с различными системами для получения актуальных данных.

Практика: Создание настраиваемых дашбордов и алертов, для эффективного управления производительности и надежности сервисов

👉 Регистрация и подробности:
https://otus.pw/gOZX/?erid=LjN8Kah51

#реклама
О рекламодателе

Мониторим ИТ

30 Oct, 06:30


Тернистый путь к единому хранилищу метрик

Метрики — один из трёх базовых типов телеметрии и основа мониторинга любого приложения. Но что, если необходимо собирать их в рамках крупной и высоконагруженной экосистемы? Как получить метрики с десятков тысяч хостов разных ЦОДов и сотен типов приложений? И заодно упростить инженерам настройку правил алертинга и создание дашбордов?

В этой статье рассказано, как команда МТС Digital реализовала централизованное управление конфигурацией агентов, удобный интерфейс для настройки алертинга и правил сбора метрик. Показано, как менялась архитектура решения с ростом нагрузки, как они боролись с отставанием и потерей данных. Рассмотрено, как это позволило собрать все метрики в единое хранилище и построить дашборды здоровья по ключевым продуктам. Читать дальше.

Мониторим ИТ

29 Oct, 12:00


Масштабируем приложение в Kubernetes от метрики в Yandex Monitoring (или от любого http-эндпоинта)

Представим, что у нас есть приложение, которое шлёт свои метрики в Yandex Monitoring, и стоит задача: масштабировать это приложение с помощью HPA в кластере Kubernetes в зависимости от метрики. Читать далее.

Мониторим ИТ

29 Oct, 06:30


Метрики и зачем они нам

Сейчас метриками никого не удивишь. Метрики повсюду, в логах приложений, в управлении проектами, в управлении продуктами, в управлении людьми, в управлении чем угодно. Можно сказать, что мы даже понимаем зачем они нужны. Но к сожалению, не все и не всегда. В статье автор обобщает базовые понятия о метриках из разных областей. Читать статью.

Мониторим ИТ

28 Oct, 12:00


Zabbix vs Prometheus. Что выбрать для гетерогенной инфраструктуры?

Плюсы, минусы, подводные камни 🙃 На самом деле в этой статье рассказано в деталях об установке обоих решений и некоторые детали по ним. Читать статью.

Мониторим ИТ

28 Oct, 10:30


Слёрм, конечно, не Хогвартс, но магия здесь тоже бывает

В преддверии Хеллоуина мы применили нашу магию к сайту и добавили функцию предсказания будущего. Встречайте наш Таро-расклад. Инструкция по применению тут — пробуйте!

А если удача будет на вашей стороне, ещё и заберёте подарки: промокод на скидку, бесплатный курс или все сразу.

Льём свет на будущее и дарим подарки ЗДЕСЬ 🎃

Единственное, стоит поторопиться — карты Таро потеряют свои магические свойства в полночь с 31 октября на 1 ноября.

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

28 Oct, 06:30


Нюансы менеджмента процессов на примере процесса «Управление инцидентами ИТ»

В этой статье рассказывается о предпосылках к созданию и внедрения процесса управления инцидентами. А еще приведен пример схемы такого процесса. Читать на Хабре.

Мониторим ИТ

25 Oct, 14:00


Build an Interactive OpenStack Compute Node Monitoring System with Prometheus, Grafana, and Telegram Bot for Real-Time and On-Demand Queries

В этой статье рассматривается, как создать интерактивную систему мониторинга узлов OpenStack с проволокой и куском изоленты Prometheus, Grafana и ботом Telegram для запроса статистики в реальном времени по требованию. В результате у вас будет решение для мониторинга, которое предоставляет информацию в реальном времени и мгновенные настраиваемые ооповещения в Telegram. Читать статью.

❗️Статья на medium.com

Мониторим ИТ

25 Oct, 11:43


Скрипт для общего мониторинга производительности Linux-системы. Быстро и просто.

#!/bin/bash
# Colors for readability
GREEN='\033[0;32m'
YELLOW='\033[1;33m'
RED='\033[0;31m'
NC='\033[0m' # No Color
echo -e "${GREEN}===== System Monitoring Script =====${NC}"
# 1. CPU Usage
echo -e "${YELLOW}\n>> CPU Usage: ${NC}"
mpstat | awk '/all/ {print "CPU Load: " $3 "% idle"}'
# 2. Memory Usage
echo -e "${YELLOW}\n>> Memory Usage: ${NC}"
free -h | awk '/Mem/ {print "Total Memory: " $2 "\nUsed: " $3 "\nFree: " $4}'
echo -e "Swap:\n"$(free -h | awk '/Swap/ {print "Total: " $2 ", Used: " $3 ", Free: " $4}')
# 3. Disk Usage
echo -e "${YELLOW}\n>> Disk Usage: ${NC}"
df -h | grep '^/dev' | awk '{print $1 ": " $5 " used, " $4 " available"}'
# 4. Network Traffic
echo -e "${YELLOW}\n>> Network Traffic: ${NC}"
ifstat -i eth0 1 1 | awk 'NR==3 {print "RX: " $1 " KB/s, TX: " $2 " KB/s"}'
# 5. Top 5 Memory Consuming Processes
echo -e "${YELLOW}\n>> Top 5 Memory Consuming Processes: ${NC}"
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head -n 6
# 6. Top 5 CPU Consuming Processes
echo -e "${YELLOW}\n>> Top 5 CPU Consuming Processes: ${NC}"
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head -n 6
# 7. System Logs Monitoring
echo -e "${YELLOW}\n>> Recent Errors in System Logs: ${NC}"
journalctl -p 3 -xb | tail -n 10
echo -e "${GREEN}===== Monitoring Completed =====${NC}"

Мониторим ИТ

24 Oct, 15:04


Как сделать простые метрики для оценки полосы пропускания сети?

Часто для решения различных задач приходится пользоваться услугами облачных провайдеров для аренды VPS(Virtual Private Server). Чаще всего, провайдеры дешевых VPS серверов никак не гарантируют полосу пропускания сети. Однако обычно это не вызывает каких-либо неудобств, особенно если ваш проект не сильно требователен к скорости интернета.

Работать все будет следующим образом. Prometheus будет с какой-то периодичностью дергать speedtest-exporter для получения данных по скорости интернета и сохрянять эти данные. Grafana будет забирать данные из Prometheus и отображать их. Читать дальше на Хабре.

Мониторим ИТ

24 Oct, 10:30


Совам, жаворонкам, родителям, digital-номадам и просто занятым людям

Приглашаем инженеров на обучение: Ansible, Golang, CI/CD с Jenkins, Grafana, Keycloak, SRE и еще более 10 востребованных направлений ждут вас в в учебном центре Слёрм.

Видеокурс ≠ папка с записанными уроками! Обучаясь на видеокурсе, вы получите:

🔹записи лекций (до 30 минут)
🔹стенды для практики
🔹доступ в Git-репозиторий
🔹помощь техподдержки
🔹доступ в закрытое комьюнити студентов и выпускников
🔹обратная связь по итоговому проекту

Цените свое время и приходите осваивать best practices и прокачивать свои навыки вместе с нами!

Подробнее — на сайте 😉

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

24 Oct, 10:14


promscale — всё?

Случайно зашел в репозиторий Promscale и увидел, что он в архиве со 2 апреля 2024 года. Интересное было решение. Кто-то его использовал в работе? Может на какой-то аналог перешли?

Мониторим ИТ

23 Oct, 13:08


28-30 октября состоится 3-дневный онлайн-интенсив по ElasticSearch🔎 Места ещё есть.

Программа курса.

Чем полезен курс:

🚀 за 3 дня вы получите структурированную информацию, которую при самостоятельном изучении нужно собирать по документации и по разным статьям в интернете.

🚀 вашему руководителю не придется привлекать субподряд для внедрения или поддержки ElasticSearch, вы сможете работать с ним самостоятельно.

🚀 в курсе множество практических заданий, после выполнения которых вы получите бесценный опыт работы с ElasticSearch, Logstash, Kibana, Beats и другими компонентами.

Запрос на участие в курсе вы можете отправить в телеграм @galssoftware, на почту [email protected], либо через форму обратной связи на странице с программой курса.

Мониторим ИТ

23 Oct, 11:40


Monitoring Failed Jobs in NetBackup with Zabbix

Мониторинг решений резервного копирования может быть трудной задачей – особенно потому, что многие инструменты резервного копирования не предоставляют API и с ними просто нелегко работать. Одно из таких решений – NetBackup. К счастью, Zabbix с его функциями низкоуровневого обнаружения (LLD) и возможностью использовать пользовательские параметры для расширения агента Zabbix поможет решить задачу мониторинга NetBackup. Подробнее в блоге Zabbix.

Мониторим ИТ

20 Oct, 14:20


Как эффективно находить и устранять проблемы в Zabbix для оптимизации мониторинга ваших систем?

🔹Расскажем на открытом уроке «Поиск и устранение проблем системы мониторинга Zabbix», урок приурочен к курсу «Observability: мониторинг, логирование, трейсинг» от Otus.

Практика: Архитектура системы мониторинга Zabbix. Научитесь быстро выявлять и устранять распространённые проблемы.

👉 Регистрация и подробности:
https://otus.pw/K8v3/?erid=LjN8KZwzm

#реклама
О рекламодателе

Мониторим ИТ

19 Oct, 12:17


Как бороться с вызовами импортозамещения в разработке?

Борьба с вызовами импортозамещения коснулась и разработчиков — с начала 2024 года западные вендоры закрывают доступ для пользователей и прекращают поддержку Atlassian, Docker Hub и других значимых решений.

Отечественный ответ зарубежным вендорам — конвейер разработки. Это комплексное предложение для рынка для безболезненной замены важных решений на всех этапах разработки.

На онлайн-митап «Запускаем конвейер: отечественные решения для всех этапов разработки» К2Тех пригласил российских вендоров, предлагающих решения для разработки. 22 октября в 11:00 на онлайн-митапе эксперты расскажут о каждом из них.

Участников ждет демо конвейера, где тестировщики в реальном времени покажут основные принципы работы с инструментами и ответят на вопросы. 

Митап будет полезен:
ИТ-директорам
Руководителям разработки
Руководителям группы тестировщиков
Скрам-мастерам
Системным аналитикам

Смотрите программу и регистрируйтесь на мероприятие

Мониторим ИТ

18 Oct, 12:00


🔹 Ищете надёжное оборудование для мониторинга серверных комнат? 👀🔍
Обратите внимание на устройства NetPing:

Компания с 2005 года разрабатывает и производит устройства для мониторинга и удаленного управления энергопитанием серверного оборудования.

🤝 Устройства NetPing будут полезны компаниям, которые используют IT-оборудование, инженерам и системным администраторам, сервисным компаниям и провайдерам, а также компаниям-интеграторам проектов IT-инфраструктуры.

Почему стоит обратить внимание на устройства NetPing?

Собственная разработка и высокотехнологичное производство,
Простота настройки и использования,
Высокая надежность на протяжении многих лет,
Непрерывный мониторинг ключевых параметров серверного оборудования и удаленное управление энергопитанием,
Универсальные и легко интегрируются с существующей инфраструктурой.

🌟NetPing помогает IT-инфраструктуре работать стабильно и безопасно. 💪💻

#удаленноеуправление #серверныекомнаты #IT-оборудование #системныеадминистраторы

Мониторим ИТ

18 Oct, 08:15


Открытый вебинар «Мифы о надёжности Kubernetes: Ошибки, которые стоят вам продакшена» от Слёрм

Когда надежное становится ненадежным и почему многие системы обречены на падение?

На вебинаре покажем самые эпичные фейлы сбоев и фатальные ошибки в настройке кластеров k8s, стоившие компаниям многих часов простоя:

- Кластеры разваливаются
- API-сервера выходят покурить
- А coredns не понимает, кто он и где

Все ошибки невыдуманные, с подробным разбором анализа, что происходило и как нашли первопричину.

Советы, как превратить ваш кластер из катастрофы в более-менее стабильную штуку, которая может прожить без падений хотя бы 2 дня, тоже будут😉

Спикеры:
- Виталий Лихачев. SRE в bооking.соm
- Всеволод Севостьянов. Staff engineer в Lokalise

Когда вебинар: 23 октября в 19:00 мск
Регистрация — через бот

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

18 Oct, 07:51


Monitoring Microsoft SQL Server with Grafana: A Comprehensive Guide

В этой статье автор делится комплексной панелью Grafana, которую он создал для мониторинга Microsoft SQL Server. Дашборд построен с использованием собственных функций MS SQL, без необходимости использования дополнительных инструментов, таких как Prometheus. Читать статью.

Статья на medium.com

Мониторим ИТ

17 Oct, 10:30


Представь: суббота, никакой рабочей суеты – только ты и онлайн-воркшоп с практикой в Linux.

За 7 часов ты узнаешь, как самостоятельно развернуть облачное хранилище на базе NextCloud и настроить его под отказоустойчивость и безопасность. А рядом будут менторы из K2 Cloud, чтобы ответить на все вопросы.

Переходи по ссылке и успевай зарегистрироваться до 21-го октября

Мониторим ИТ

16 Oct, 13:32


Как снизить расходы на мониторинг: замена Prometheus на VictoriaMetrics

Мониторинг может оказаться дорогим делом из-за огромных объемов данных, которые необходимо обрабатывать. В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов и о том, как VictoriaMetrics может в этом помочь. Читать на Хабре.

Мониторим ИТ

16 Oct, 10:41


Верить в таро не обязательно — предсказания всё равно работают

Если это онлайн-расклад от Слёрма — учебного центра для IT-специалистов.

🔮Узнайте, что вас ждёт впереди: промокод на бесплатное обучение, скидки на курсы или… всё сразу.

👉 Выбирайте карты и забирайте предсказание на будущее — спрятанные внутри промокоды дают право на бесплатные курсы или скидки на обучение.

Забирайте подарки, пока они не превратились в тыкву 🎃

Happy Halloween
Гадаем ⚡️ТУТ ⚡️

Реклама ООО «Слёрм» ИНН 3652901451

Мониторим ИТ

16 Oct, 06:30


Inside PromQL: A closer look at the mechanics of a Prometheus query

В этой автор предлагает заглянуть под капот Prometheus и лучше понять, как данные передаются от источника к конечному пункту назначения в API. Автор также прикладывает ссылку на свое выступление и слайды с PromCon 2024. Читать статью.

Мониторим ИТ

15 Oct, 17:00


Key Prometheus concepts every Grafana user should know

В этой статье автор поделится некоторыми из своих ключевых выводов из книги «Prometheus Up & Running», которые особенно актуальны для инженеров, работающих с Grafana. Читать в блоге Grafana.

Мониторим ИТ

15 Oct, 16:00


Хотите получать точные данные о работе e-commerce платформы? 📊 Ищете аналог сервиса New Relic, который предоставляет полный контроль над данными, гибкость настройки и локальную поддержку? 

Тогда присоединяйтесь к нашему митапу «GMonit для развития ритейла: АШАН заменил New Relic на российский аналог».

🗓 Дата: 24 октября
📎 Время: 17:00-18:00 (Мск)


На онлайн-мероприятии:

▪️ Сравним функционал New Relic с российским APM-инструментом мониторинга на примере observability платформы GMonit.
▪️ Расскажем, как с помощью нашего ИТ-решения можно настроить мониторинг в считанные минуты, отследить корневые ошибки на уровне кода и ускорить работу с инцидентами в несколько раз.
▪️ Покажем на реальном примере, как GMonit позволил компании АШАН комплексно оценить влияние ИТ на e-com и определить векторы для оптимизации работы сервисов.

В завершении митапа проведем QA-сессию, где вы сможете рассмотреть конкретные сценарии использования GMonit и задать вопросы по вашему кейсу.

Регистрация

Мониторим ИТ

15 Oct, 15:00


Как снизить расходы на мониторинг: более разумный подход к данным

В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов на хранение и о том, как VictoriaMetrics может в этом помочь. Читать перевод на Хабре.

Мониторим ИТ

08 Oct, 12:00


beszel

Легковесная утилита для мониторинга ресурсов сервера с историческими данными, статистикой и алертами.

Репыч на Гитхабе

Мониторим ИТ

03 Oct, 10:00


Customizing ICMP Payload in Ping Command

Ping — полезный протокол, который очень распространен при мониторинге доступности удаленных систем. В этой статье разобран механизм работы этого протокола и принципы работы таких утилит как ping, fping, hping. Статья длинная и полезная. Читать.

❗️Статья на medium.com

Мониторим ИТ

02 Oct, 13:30


How to reduce expenses on monitoring: be smarter about data

Мониторинг может стать дорогостоящим из-за огромного количества данных, которые необходимо обработать. В этой статье вы узнаете о лучших способах хранения и обработки показателей мониторинга для сокращения расходов, а также о том, как VictoriaMetrics может в этом помочь. Читать статью.

Мониторим ИТ

02 Oct, 10:30


Осень — время новых знаний! 👨‍🎓

И мы знаем, где будут прокачивать свои hard и soft skills IT-специалисты — на IT Community Day, который Сбер проведёт сразу в трёх городах:

✔️ В Санкт-Петербурге 5 октября обсудим искусственный интеллект, возможности фронтенда, новую среду разработки и мотивацию для айтишников.

✔️ В Казани 12 октября научимся управлять большими данными, укрощать искусственный интеллект, создавать успешное резюме и находить подход к карьере.

✔️ В Екатеринбурге 19 октября поговорим об интеграции LLM в приложение, методологии API-first и комбинации личного и профессионального развития.

Во всех городах вас будут ждать топовые спикеры, а после докладов — afterparty. Регистрируйтесь на IT Community Day в Санкт-Петербурге, Казани и Екатеринбурге👌

Мониторим ИТ

02 Oct, 06:30


How We Migrated from StatsD to Prometheus in One Month

Недавно мы перенесли все наши метрики инфраструктуры из StatsD в Prometheus и очень довольны результатами. Миграция потребовала много работы, и мы многому научились в процессе. Цель этого поста — пролить свет на то, почему мы перешли на Prometheus, а также описать некоторые технические проблемы, с которыми мы столкнулись в ходе процесса. Читать статью.

❗️Статья в блоге на Medium

Мониторим ИТ

01 Oct, 13:30


perses

Дашборд для визуализации данных наблюдаемости из Prometheus/Thanos/Jaeger.

Репыч на Гитхабе.

Мониторим ИТ

01 Oct, 10:30


Митап про карьерный рост в Linux

Эксперты из Orion soft, K2 Cloud и K2 Tech расскажут о ключевых шагах Linux-инженера на пути к большому ИТ.

В программе: какие навыки в Linux стоит качать, чего ждать на техническом интервью и как найти своё место в мире инфры. Полезная информация для всех, кто стремится развиваться в DevOps и не только.

Встречаемся онлайн 7 октября, в 19:00 (мск). Подробности и регистрация по ссылке

Мониторим ИТ

01 Oct, 06:30


Как мы доработали postgres_exporter для мониторинга событий в БД

В Сбере решили мониторить базы данных связкой Grafana, Prometheus и postgres_exporter. Но, во‑первых, столкнулись, с тем, что не хватает гибкости в использовании queries.yaml в postgres exporter. А, во‑вторых, так они не могли регистрировать события с таймаутом меньше 15 секунд. Поэтому они сделали свой инструмент для мониторинга — pangolin_exporter. Эта статья будет полезна тем, кто мониторит инфраструктуру с помощью postgres_exporter и хочет кастомизировать всё под свои нужды. Читать дальше на Хабре.

Мониторим ИТ

30 Sep, 15:30


OpenTelemetry с нуля до 100: пример внедрения Норвежским управлением труда и соцобеспечения

Это история о том, как внедряли OpenTelemetry в Норвежском управлении труда и социального обеспечения (NAV). Рассмотрен путь от первых коммитов до реального применения в production. А ещё рассказано о некоторых трудностях, с которыми столкнулись, и о том, как их преодолели.

В NAV используется микросервисная архитектура с тысячами сервисов, работающих в кластерах Kubernetes. С самого начала они убеждали команды перейти на Prometheus и Grafana. Увы, но они до сих пор в значительной степени полагаются на логи приложений, изучая их в Kibana.

Без надлежащего трейсинга трудно понять, как запросы проходят через систему. Это затрудняет устранение ошибок в длинных и зачастую сложных цепочках обработки данных или оптимизацию медленных запросов. Для команд, которые внедрили event-driven архитектуру на базе Kafka, этот вызов стал особо острым. Это всё равно что пытаться ориентироваться в городе без карты. Читать дальше на Хабре.

Мониторим ИТ

30 Sep, 09:15


Одна платформа, чтобы мониторить всех: как мы осуществляем трассировку, работаем с логами и метриками во всей экосистеме

В этой статье рассказывают, как мы с помощью платформы мониторинга осуществляется распределенная трассировка, сбор и хранение метрик и централизованное логирование. Читать на Хабре.

Мониторим ИТ

23 Sep, 15:30


Трассировка OpenTelemetry в 200 строк кода

Разработчики часто воспринимают трассировку как нечто загадочное, и OpenTelemetry — не исключение. Она может казаться еще более сложной из‑за множества новых концепций, с которыми сталкиваешься в базовых примерах.

Ситуация усугубляется тем, что по мере создания стабильной и надежной библиотеки для трассировки сам код усложняется, чтобы учитывать редкие случаи, поддерживать работу в разных окружениях и оптимизировать производительность, минимизируя влияние на приложения. Это особенно заметно при использовании автоматической инструментации, которая может «волшебным образом» оборачивать или изменять код, который изначально для этого не предназначен.

Неудивительно, что многие разработчики воспринимают библиотеки трассировки как «черные ящики». Мы добавляем их в приложения, надеемся на лучшее и полагаемся на них в критические моменты, например, во время инцидентов ночью.

На самом деле, трассировка гораздо проще, чем кажется. Если разобрать её на части, можно представить её как комбинацию «необычного логирования» и «распространения контекста». Читать дальше на Хабре.

Мониторим ИТ

19 Sep, 14:22


Как следить за состоянием мобильного приложения?

«Знакома ли вам ситуация, когда вы спокойно работаете, а клиентская служба передаёт вам странный репорт: несколько пользователей жалуются, что в приложении не грузятся картинки, но у вас всё работает. Или пользователь пишет в Google Play, что приложение занимает несколько гигабайт, и вы не понимаете, сколько таких пользователей и что с этим делать. Нужно ли срочно бросаться чинить, или это может подождать следующего планового релиза?»

Согласитесь, было бы здорово узнавать о проблемах раньше, чем пользователи начнут жаловаться в поддержку. В этой статье автор расскажет, как они в Циан создавали Техническую Мобильную Аналитику (ТьМА) и получили возможность в любой момент времени ответить на вопрос: «Всё ли в порядке с приложением?» Читать на Хабре.