NOdata Миша

@datamisha


Автор каждый день пытается познать данные, но у него это не получается, поэтому он пишет всякую ерунду

Я - https://t.me/MihaVeryNice

NOdata Миша

21 Oct, 14:21


ИИ в медицине

Вчера слушал подкаст подлодки о использовании ИИ в медицине и был приятно удивлен, что речь не только о каком-то далеком будущем, а уже сейчас в некоторых областях медицины искусственный интеллект активно применяется

Будущее уже наступило получается?

У подлотки, кстати, много интересных выпусков подкастов, рекомендую ознакомится если ранее этого не сделали


А какие у вас любимые подкасты?


Ютуб | Дата уроки

NOdata Миша

30 Sep, 17:10


Неочевидные плюсы работы в it

Я тут недавно задумался какие вещи мне больше всего нравятся в своей работе и некоторые из них оказались весьма неочевидными и о них я особо не знал, когда только начинал входить в it:

- Быстрый рост - рост от стажера до лида может произойти всего за несколько лет, в немногих профессиях можно так быстро вырости

- Результат на выходе - не во всех профессиях на выходе получается какой-то результат о котором потом можно повспоминать или рассказать кому-то

- Карьерная мобильность - достигнув каких-то результатов в одной из сфер it, можно перейти в другую, при этом не особо потеряв

- Много интересных околорабочих вещей - петпроекты, опен-соурс, ведение тг канала

- Сообщество - большое открытое комьюнити, которое объединено лишь сферой деятельности


А какие неочевидные плюсы сможете выделить вы?


Ютуб | Дата уроки

NOdata Миша

24 Sep, 13:44


Тысячи лет развятия человечества, а работаем мы больше чем люди в каменном веке(

Не у всех в современном мире есть возможность работать по 2-4 часа в день, а значит нужно хотя бы пытаться те 8 рабочих часов сделать максимально кайфовыми (что именно это значит каждый для себя решит сам)


А ваши рабочие часы кайфовые?


Ютуб | Дата уроки

NOdata Миша

19 Sep, 11:01


Работаю как только проснусь

Я тут недавно для себя открыл самое продуктивное время, и начинается это время как только открыл глаза с утра

Как было обычно: просыпаюсь, немного пялюсь в телефон, утренние дела, завтрак (в течении которого смотрю какой-нибудь видос), а потом работа, а работать то уже не хочется, хочется дальше ничего не делать

Как теперь: просыпаюсь, и когда мои глазки еще не полностью раскрылись, когда еще в мой мозг не пришло осознание того, что в жизни есть какие-то интересные вещи, пока этого ничего еще не произошло я сажусь за ноутбук и начинаю работать

Эти 1,5 утренних часа в голову не лезет никаких лишних мыслей, просто сидишь и на автомате работаешь. Продуктивность.


А какое для вас самое продуктивное время дня?


Ютуб | Дата уроки

NOdata Миша

10 Sep, 15:56


Я тут впервые за 3 года работы в отпуск сходил. Не назвал бы себя трудоголиком, которому хочется всегда работать и совсем не хочется отдыхать, скорее даже наооборот. Но до этого не чувствовал какой-то усталости и необходимости идти в отпуск - я ведь не устал, а потом херась и устал. Ну я и пошел

Не уставайте на работе, а если устали, то отдыхайте ❤️

NOdata Миша

25 Aug, 06:08


Выбор стула теперь реален

Все, наверное, уже видели, что случилось с многодетным отцом

Вот так вот бывает, ты либо за одних, либо ты плохой (работает в обе стороны)

И вот еще немного конспирологии: Дурова задержали после его прилета из Азербайджана, а знаете кто еще был в Азербайджане в это время - Путин

NOdata Миша

05 Aug, 12:06


Уже много уроков

7 дней бесплатного доступа к урокам, которые я выпускаю по data. Сейчас пока там по Airflow и не много clickhouse, но уроки постоянно пополняются

Вот список уроков которые там есть

Вот бесплатный доступ на 7 дней, чтобы вы посмотрели, поняли, что я ваще не шарю и отписались от канала

NOdata Миша

02 Aug, 10:03


Беги, Миша, беги

Тут рассказал о том как круто бегать, а сейчас хочу рассказать о том как у меня получается делать это регулярно:

- Я почти всю жизнь не любил бегать. Это ведь сложно. Капец как устаешь. Я лучше пройду 20 километром, чем пробегу 2. И это правда так. Для организма, который более 2 лет вообще не чувствовал, что такое бег, пробежать хотя бы пару км. является больший стрессом, а если делать это регулярно, то ваще капец не круто. Зачем так сильно напрягаться? И первый совет в том, что напрягаться сильно не стоит. Оказывается совсем не обязательно (и даже вредно) быстро бежать и становиться капец каким устаревшим. Можно просто совершать легкую пробежку, бежать медленно. Что значит медленно? С той скоростью при которой ты можешь без особых трудностей разговорить во время бега. Когда только начинаешь бегать, то ты бежишь не сильно быстрее чем люди просто идут. Тебя будут обгонять 60-летние дедушки (потом убегут вперед, там где-то развернуться, побегут тебе навстречу и помашут рукой, но рано или поздно я его сделаю)

- Второй пункт вытекает из первого. Тут тоже про то, что это не тренировочные забеги ради результатов, а вечерняя пробежка, которая преследует совершенно другие вещи. А значит если например на улице сегодня идет дождь, то вообще ничего страшного нет, если пробежки сегодня не будет. Также и регулярность пробежек, я для себя понял, что мне норм бегать 3 раза в неделю, но ничего страшного нет, если получится побегать всего 2 раза, а если захочу пробежать 4 раз, то скорее всего откажусь от этой идеи, так во время этой 4 пробежки устану и не получу удовольствие

- А что делать если не хочется? В первую очередь ответить на вопрос «Почему тебе не хочется?», и если ответ будет «Бегаю уже 2 месяца и мне это вообще не нравится», то бросать. Бег это не что-то идеальное, что подойдет абсолютна всем, и возможно вам следует поискать другие занятия. Но когда я не хотел делать вечернюю пробежку и задавал вопрос «Почему?», то ответом было «Я сегодня как-то устал во время рабочего дня, а тут еще и бежать куда-то», то есть главная причина из-за которой я бегаю в некоторых случаях пытается работать в другую сторону, но меня так просто не проведешь, я все равно бегу

Это были 3 главне вещи, которые лично мне помогают бегать. Для кого-то скорее всего поможет что-то другое, например записаться на марафон через несколько месяцев и тогда просто становится необходимо бегать постоянно. Но лично для меня вещи, которые про делать что-то (бежать) ради чего-то (условного марафона) не работают, поэтому я стараюсь концентрироваться на процессе)


Ютуб | Дата уроки

NOdata Миша

01 Aug, 05:36


Выложил на ютуб (пока он еще есть в России ) новое видео о минусах работы дата инженером
🎉🎉🎉

https://youtu.be/A3LDv8uFWiM

NOdata Миша

31 Jul, 09:55


Для чего вообще DWH?

Понятно, что ДВХ это про данные, но для чего эти данные, где они используются?

Самое частое это, конечно, различные отчеты, чаще всего в виде дашбордов в какой-нибудь Bi штуке (например в superset). Информация на этих дашбордах может быть различной, для разных потребителей:
- Маркетинговые команды могут смотреть на отчеты для анализа эффективности рекламных кампаний и повышения ROI
- Отелы продаж для оценки динамики продаж, анализа поведения клиентов и прогнозирования спроса
- Руководители для принятия каких-то важных стратегических решений

Помимо отчетов на самих дашбордах, часто кому-то необходимо просто получить какую-то небольшую инфу по нашим данным, хватает небольшого sql кода

Также данные из ДВХ нужны и дата сайентистам, которые с их помощью строят всякие модельки и ИИ, который всех нас убьет= сделает мир лучше


Ютуб | Дата уроки

NOdata Миша

25 Jul, 09:49


Бег лучшая вещь для айтишника на удаленке

Я не так давно начал бегать. И это оказалось прям круто. Не буду тут говорить о пользе для здоровья и о том, что стал лучше себя чувствовать, а хотел бы сказать о чуть менее очевидной, но весьма важной штуке - отвлечение от работы

Многим знакома ситуация, когда заканчиваешь рабочий день, но продолжаешь думать о задаче, а если работаешь на удаленке, то рабочий день в какой-то степени, вообще может не заканчиваться, ведь ты в любой момент можешь открыть ноутбук, чтобы еще что-нибудь поделать. В итоге вечерний отдых от работы, не совсем является отдыхам. (Да иногда есть супер срочные или интересные задачи на которые готовы потратить силы, но, наверное, это должна быть редкая история)

Вечерняя пробежка стала отличным решением этой проблемы. 18:00 я закрываю ноутбук и бегу. Телефон при этом остается дома, и я смогу увидеть написали ли там что-то важное в рабочем чатике только через час.
Мне это очень сильно помогает отвлечься от работы, и даже если во время рабочего дня было слишком много мыслей которые грузили меня о том, что работы много, не получается или другие подобные, то вечером их совсем нет

Если тема интересна и хотите узнать как я продолжаю бегать регулярно, то поставьте 🔥


Ютуб | OnlyFans

NOdata Миша

11 Jul, 05:57


Новый ролик на канале 🎉

Это сэкономит 90% времени программиста!
https://youtu.be/I-Rw9EO21uA

NOdata Миша

09 Jul, 12:05


Мониторинг DWH

Мониторинг в DWH - это большая тема, но я расскажу с чем сталкиваюсь конкретно я:

- Алертинг в ДАГах Airflow. В наших ДАГах используется функция, которая, в случаи падения ДАГа, посылает сообщения в корпоративный мессенджер и тэгает владельца ДАГа. Это достаточно удобно, ведь нет необходимости самостоятельно проверять отработку ДАГов

- Мониторнг в Grafana. Grafana — система визуализации данных, ориентированная на данные систем ИТ-мониторинга. Тут можно мониторить все, а не только ДАГи, ведь часто поступление данных в DWH может быть происходить без участия airflow (например из kafka сразу в clickhouse)


Ютуб | OnlyFans

NOdata Миша

02 Jul, 11:59


Опять знаменит

Завтра в 21:00 буду в гостях у DigitalBerd

Будем обсуждать:
1. Как выучиться на инженера данных
2. Сложно ли сейчас устроиться инженером данных
3. Какая в принципе сейчас ситуация на рынке РФ
4. Поговорим по поводу деятельности на ютубе.

Все приходите на стрим!
https://www.youtube.com/live/WuQO42JjNuM

NOdata Миша

01 Jul, 12:02


ETL для DWH

Недавно мы говорили про источники данных для нашего DWH
ETL это вещь благодаря которой те данные попадают в наше хранилище

Делать это можно, например с помощью Airflow
Airflow — это платформа для создания, планирования и мониторинга рабочих процессов. Она широко используется для автоматизации ETL-процессов, обработки данных и управления задачами

Т.е. пишется python скрипт, где мы пишем запрос данных, их обработку и сохранение в БД. И все это ставим на расписание, чтобы данные заливались к нам в базу в автоматическом режими

Одним из главных преимуществ Airflow является уже множество уже готовых операторов для выполнения необходимых действий. Это можно сравнить с использованием библиотек в python
Например есть оператор PostgreSql. Он предназначен для работы с постгрессом. Мы, конечно, сами можем написать необходимый код на python, где конектимся с базе, создаем курсор, выполняем нужный SQL, но намного проще будет использовать уже готовый оператор, в который лишь необходимо передать конекшен к базе и необходимый sql, все остальное он выполнит сам


Ютуб | OnlyFans

NOdata Миша

27 Jun, 09:41


Новое видео на канале 🎉

https://youtu.be/c8ZCkZN9wuY

NOdata Миша

24 Jun, 09:55


БД для DWH

База данных для DWH обычно отличается от традиционных операционных баз данных (OLTP)
Объем данных в DWH обычно большой и вряд ли условный PostgresSQL сможет справиться со всей нагрузкой, он для этого не предназначен
А вот несколько БД которые были созданы как раз для этого:

ClickHouse – это колонно-ориентированная система управления базами данных, разработанная для аналитических запросов в режиме реального времени. Она поддерживает распределенную архитектуру, позволяя эффективно обрабатывать большие объемы данных. Основные преимущества ClickHouse включают высокую скорость выполнения запросов, сжатие данных и возможность масштабирования.

Greenplum – это распределенная аналитическая база данных, основанная на PostgreSQL. Она предназначена для обработки больших данных и использует параллельную обработку для ускорения выполнения запросов. Greenplum поддерживает масштабирование за счет добавления новых узлов и предлагает инструменты для интеграции с другими системами данных, что делает ее подходящей для крупных аналитических задач.

Hadoop – это платформа с открытым исходным кодом для распределенного хранения и обработки больших данных. В основе Hadoop лежит распределенная файловая система HDFS и фреймворк MapReduce для обработки данных. Hadoop обеспечивает надежное хранение и обработку больших объемов данных, поддерживает масштабирование и интеграцию с различными инструментами и экосистемами данных.


Ютуб | OnlyFans

NOdata Миша

19 Jun, 09:01


Я у мамы инфоцыган

Я завел машину onlyfanc животное девушку собаку boosty

Планирую туда выпускать много полезного обучающего материала, а еще будет чат в телеге

Там уже есть ролики по airflow и clickhouse и будет еще много

Стоимость подписки 298 ₽ или 398 ₽ смотря какая вам больше подходит

https://boosty.to/nodata_misha

NOdata Миша

11 Jun, 11:27


IT это золотая клетка

Многие считают, что работа в it - это профессия мечты: хорошая зп, возможность удаленной работы, не особо сложная в изучении. Все так, это очень крутая область. Все те плюсы о которых говорят тут действительно есть (в той или иной степени)

И часто при выборе работы мы обращаем внимания именно на эти вещи. Ведь гораздо проще сказать, что хочешь хорошую зарплату, чем ответить на вопрос чему конкретно хочешь посвятить свою жизнь

Спустя время начинаешь задумываться, анализировать свой путь - почему сделал тот или иной выбор, выбрал ту или иную профессию. Но эти вопросы остаются лишь вопросами - клетка комфорта уже захлопнулась

NOdata Миша

04 Jun, 12:50


Откуда в DWH данные

Источники данных для DWH могут быть следующие:

- Базы данных - в компании могут быть множество разных баз данных и все данных из них мы можем забирать к себе хранилище

- Веб-сервисы и API - данные например из рекламных кабинетов и других подобных мест

- Файловые источники - не всегда приходится работать с какими-то «крутыми» данными, иногда необходимо просто иксельку загрузить

- CRM и подобные маркетинговые, бухгалтерские штуки

Конечно, у DWH может быть еще куча других источник, тут я привел только самые основные


Ютуб | Boosty