DATApedia | Data science @ds_wiki Channel on Telegram

DATApedia | Data science

@ds_wiki


Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи.

Сотрудничество: @Seyfme

DATApedia | Data science (Russian)

Добро пожаловать в канал DATApedia | Data science! Это место, где вы найдете всё, что связано с Data Science, AI и Machine Learning. Независимо от вашего уровня - будь то начинающий или опытный специалист, здесь вы найдете полезную информацию, советы и рекомендации. Мы также занимаемся переводом зарубежных статей, чтобы обеспечить вам доступ к последним тенденциям и исследованиям в этой области. Присоединяйтесь к нам, чтобы узнавать новое, обмениваться опытом и расширять свои знания в области Data Science!

По вопросам сотрудничества обращайтесь к администратору канала @Seyfme.

DATApedia | Data science

10 Jan, 07:01


​​Математические бланки // Часть 1: введение в проблему

Данная статья описывает проблему математических бланков и демонстрирует, на что способно её решение.

Читать | DATApedia | #DS_AI

DATApedia | Data science

09 Jan, 07:05


​​Оптимизация SQL запросов

В данной статье мы рассмотрим как переписать запрос, чтобы выполнялся быстрее. В статье пойдет речь о PostgreSQL, хотя применять данные советы к любой базе данных SQL Ниже будут представлены термины и операторы, о которых пойдет в данной статье.

Читать | DATApedia

DATApedia | Data science

28 Dec, 08:52


Коллеги, мы? 😢

DATApedia | Data science

27 Dec, 07:15


​​Как не нужно визуализировать данные: антипаттерны в примерах

Как делать графики понятными и наглядными? Да ещё и избежать неверных трактовок? Когда использовать круговую диаграмму, а когда нужны линейные графики или столбчатая шкала? Для этого достаточно учесть антипаттерны, которые вредят и запутывают. Разберём на «хороших» и «плохих» примерах.

Читать | BApedia

DATApedia | Data science

25 Dec, 07:01


​​Разбор и стандартизация имен, адресов и других типов пользовательских данных в миллионных базах

Ошибки в данных появляются повсюду: пользователи путают буквы, операторы торопятся, а программы для распознавания документов добавляют свои погрешности. И если вы думаете, что корректность данных легко определить, просто взглянув на них, вспомните кавээновский номер с Гадей Петрович.

Читать | DATApedia

DATApedia | Data science

24 Dec, 07:01


​​«Брендометр» Airbnb: автоматизация оценки восприятия бренда в социальных сетях с помощью ИИ

Эта статья посвящена тому, как в Airbnb, пользуясь технологиями глубокого обучения, вычисляют показатели восприятия бренда на основе данных, полученных из социальных сетей.

Читать | DATApedia | #DS_AI

DATApedia | Data science

19 Dec, 07:01


​​Google представила ИИ-генератор видео Veo 2.0: лучше ли, чем Sora и как получить доступ

Если вы впервые слышите о Veo, то это ИИ-видеомодель Google, способная генерировать видео по текстовым описаниям. Первая версия Veo была представлена в мае 2024 года, но так и не стала общедоступной. Теперь Google представила Veo 2.0 со значительными улучшениями и расширенной функциональностью.

Читать | DATApedia | #DS_AI

DATApedia | Data science

18 Dec, 07:01


​​Возможности LLM и RAG на примере реализации бота для поддержки клиентов

В этой статье я хочу рассказать об LLM и RAG, вариантах их использования на примере нашего бота для поддержки клиентов, а также о сценариях применения полученной реализации.

Читать | DATApedia

DATApedia | Data science

17 Dec, 07:01


​​Оценка RAG: Полное руководство по модульному тестированию RAG в CI/CD

В этом руководстве мы рассмотрим, как настроить полностью автоматизированный набор оценки/тестирования для модульного тестирования приложений RAG в ваших конвейерах CI/CD.

Читать | DATApedia

DATApedia | Data science

16 Dec, 07:01


​​Обучение и fine-tuning моделей простым языком: зачем, как, где

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их дообучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

Читать | DATApedia | #DS_AI

DATApedia | Data science

12 Dec, 08:08


​​История YOLO – самой известной архитектуры компьютерного зрения

Эта статья – полноценная техно-история YOLO. Мы расскажем, что представляет из себя задача детекции, как работала самая первая YOLO и как ее дорабатывали во всех последующих версиях.

Читать | DATApedia | #DS_AI

DATApedia | Data science

09 Dec, 11:18


​​Математические бланки // Часть 1: введение в проблему

Данная статья описывает проблему математических бланков и демонстрирует, на что способно её решение.

Читать | DATApedia

DATApedia | Data science

05 Dec, 07:01


​​Машинное обучение: Линейная регрессия. Теория и реализация. С нуля. На чистом Python

В этой статье я рассказываю про линейную регрессию, свойства, которыми должны обладать данные для модели, процесс обучения, регуляризацию, метрики качества. Кроме чистой теории я показываю как это все реализовать.

Читать | DATApedia

DATApedia | Data science

04 Dec, 07:01


​​Миф о чистых данных: почему ваш аналитик похож на сапёра

Представьте: вы — аналитик данных, перед вами — гора необработанных данных, и каждый неверный шаг может привести к катастрофическим последствиям для бизнеса.
Эта статья прольёт свет на эту извечную проблему и подчеркнёт критическую важность подготовки данных для получения достоверных и полезных бизнес-инсайтов.

Читать | DATApedia

DATApedia | Data science

02 Dec, 08:09


​​Машинное обучение: общие принципы и концепции

В этой статье я рассказываю про основные концепции, типы обучения, типы задач в машинном обучении и также делаю постановку задачи машинного обучения (МО). Все это я рассказываю в своем стиле и понимании.

Читать | DATApedia | #DS_AI

DATApedia | Data science

29 Nov, 09:39


​​Инфраструктура для Data-Engineer форматы файлов

В этой статье мы рассмотрим наиболее популярные форматы, научимся с ними работать и поймем, когда какой формат лучше использовать.

Читать | DATApedia

DATApedia | Data science

28 Nov, 09:01


⚡️ Успей принять участие в идеатоне Форума Инновационных Центров 2024! Мы продлили регистрацию до 28 ноября 23:59! 🔥

🔭 Если ты специалист по data science, веб-разработке, аналитике данных, кибербезопасности, DevOps или архитектуре ПО, то советуем принять участие в кейсе №2: Архитектура высоконагруженного распределенного веб-приложения.

В нём тебе предстоит:
⚙️ Разработать концептуальную архитектуру веб-приложения, способного обслуживать не менее 100 000 одновременных пользователей, с учетом требований к безопасности, защитой от кибератак, масштабируемости и высокой доступности на всей территории России.

Ожидаемые результаты:
📌 Аналитический отчет по архитектурному решению
📌 Визуализированные схемы архитектуры и диаграммы.
📌 Документация по выбору технологий, существующих платформ и баз данных по каждому из финальных решений.
📌 Рекомендации по обеспечению безопасности и защиты от кибератак.

Идеатон проходит в 2 этапа: отборочный этап — онлайн, финал — оффлайн.


❗️Важно: участие можно принять ТОЛЬКО командой, от 2 до 6 человек.

🏆Призовой фонд: 6 000 000 руб.
🔥Окончание регистрации: 28 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря

🔗 Регистрируйся по ссылке: https://фиц2024.рф/hackathon/#idcase2

DATApedia | Data science

28 Nov, 07:19


​​Человек и LLM: как построить метрики для оценки моделей

В этой статье предлагаю найти ответ на вопрос: есть ли универсальный метод оценки работы LLM‑моделей? Для этого я расскажу, какие для этого существуют бенчмарки и почему нельзя полагаться только на них, как работает Chatbot Arena LLM Leaderboard, кто такие AI‑тренеры и может ли одна модель правильно оценить другую.

Читать | DATApedia | #DS_AI

DATApedia | Data science

27 Nov, 12:13


​​Как ухватить LLM за хвост: эффективные стратегии тестирования AI-моделей

Как убедиться, что ваша LLM не выдаст полную чепуху в самый неподходящий момент? Как проверить, что она действительно понимает контекст, а не просто генерирует красивые, но бессмысленные фразы? И самое главное — как сделать это эффективно, не тратя недели на ручную проверку тысяч ответов?

Читать | DATApedia

DATApedia | Data science

25 Nov, 06:18


​​Хорошо ли искусственный интеллект пишет программный код и как мы в Fix Price используем ИИ в наших решениях

Сегодня поговорим о том, как мы используем ИИ в разработке. Начну с краткого ответа на интересующий многих вопрос, который вынесен в заголовок. ИИ отлично справляется с написанием кода, но лишь определенного кода, а именно: отдельных его фрагментов.

Читать | DATApedia

DATApedia | Data science

25 Nov, 06:14


​​Разработка и управление едиными контрактами API

Пол года назад на AnalystDays #18 я рассказывал про API-контракты, и доклад вызвал большой интерес у аудитории. Пока видео не опубликовали, решил адаптировать материал в формат статьи.

Читать | BApedia

DATApedia | Data science

23 Nov, 08:43


Нет у меня никакого выгорания, наверное

DATApedia | Data science

20 Nov, 15:10


📢 Хотите стать востребованным системным и бизнес-аналитиком? 🚀

Пройдите короткий опрос из 12 вопросов и получите 3 бесплатных урока по ключевым темам системного и бизнес-анализа! Эти темы помогут вам освоить самые важные аспекты профессии:
- Нефункциональные требованиями глазами бизнес-аналитика
- Трассировка и ведение реестра требований
- Управление изменениями требований

Представьте, что вы сможете улучшить процессы и повысить свою ценность на рынке труда! Наши бесплатные уроки помогут вам сделать первые шаги к этим результатам.

После прохождения опроса вам на почту придут все три урока! 📧
Пройти опрос: https://otus.pw/KLEz/

Также сейчас действует скидка 15% на покупку курса "Системный и бизнес-анализ" до 24.11.
Успейте приобрести курс со скидкой: https://otus.pw/EQJO/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

DATApedia | Data science

20 Nov, 10:34


Повышаем Data Quality: щепотка Soda для ваших данных

Привет! Меня зовут Александр Кудрявцев, я аналитик данных в команде Data Platform Банки.ру. Недавно мы озадачились вопросом контроля качества данных (Data Quality) и стали искать комплексное решение. Один из инструментов, который попал в поле зрения, — Soda Core. О нем и пойдет речь в материале.

Читать | DATApedia

DATApedia | Data science

19 Nov, 08:37


​​Дообучаем языковую модель GPT2 с помощью Torch

В этой статье я хочу поговорить о дообучения языковых моделей. В интернете уже много информации на эту тему, но большинство подобных статей затрагивают ее поверхностно. Сегодня я попробую разобраться в этом подробнее.

Читать | DATApedia

DATApedia | Data science

18 Nov, 14:32


Топ-10 ошибок Бизнес-Аналитиков
Присоединяйтесь к нашему открытому уроку самых частых ошибок бизнес-аналитиков и как их избежать

Ждем вас на открытом вебинаре 21 ноября в 20:00 мск.

🚀На вебинаре обсудим распространенные ошибки, которые совершают бизнес-аналитики, и дадим практические советы как их избежать или как из них выходить. Вы узнаете:
- Как устранить недопонимания с заказчиком и создавать то что “заказчик хотел”;
- Как сделать так, чтобы вы управлять требованиями, а не они вами;
- Как при этом оставаться в хороших отношениях с командой разработки вместо “опять аналитики навыдумывали”.

🎯 Вебинар будет полезен как начинающим, так и опытным аналитикам, которые хотят повысить свою профессиональную компетенцию и избежать типичных “ловушек” в работе.

🛡Спикер Валентина Уржумова — Ведущий Системный Аналитик.

Встречаемся в преддверии старта курса «Системный и бизнес-анализ».
На курс действует скидка 15% до 24.11, успейте приобрести!

Регистрируйтесь прямо сейчас, чтобы не пропустить мероприятие:
https://otus.pw/IQst/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

DATApedia | Data science

15 Nov, 09:48


Вот что ждет в Т-Банке аналитиков DWH, кроме ДМС, крутых офисов и других плюшек:

✔️Актуальный стек. Здесь следят за трендами и быстро внедряют новое.
✔️Улучшения может предложить каждый. Здесь знают, как устроен продукт, и влияют на его развитие.
✔️Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение.
✔️Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите — можете стать ментором для младших коллег.

Устраивайтесь в Т-Банк на позицию аналитика DWH до 23 декабря 2024 года и получайте приветственный бонус в размере одного оклада.

DATApedia | Data science

15 Nov, 07:34


​​Data catalog: от истории до сравнения решений

В этой статье автор подробно разбирает, что такое каталоги данных и какие они бывают, а также рассказывает об их выборе инструмента для построения каталога под запросы аналитиков данных.

Читать | DATApedia

DATApedia | Data science

14 Nov, 12:30


Как расти в Data Science: опыт Авито.

В новой статье команды data science-инженеров Авито собраны практические советы для тех, кто хочет вырасти от джуна до лида в Data Science. Ревью, знания и инициативность — что еще важно для карьерного успеха?

Читайте подробности по ссылке.

Реклама. ООО «Авито Тех».

DATApedia | Data science

14 Nov, 08:11


​​Инхаус-разметка с нуля. Реально ли это и насколько полезно?

Стоит ли создавать собственные отделы по разметке данных внутри компании или можно ограничиться краудсорсингом или аутсорсингом, расскажу о некоторых рабочих кейсах.

Читать | DATapedia

DATApedia | Data science

13 Nov, 14:49


Как избежать провалов: эффективное выявление и работа с рисками IT продуктов

Присоединяйтесь к нашему открытому уроку для обсуждения рисков IT продуктов
Ждем вас на открытом вебинаре 14 ноября в 20:00 мск.

🚀В рамках вебинара рассмотрим категоризацию рисков и способы работы с ними
Структура вебинара:
1. Что такое риск. Категоризация рисков
2. Влияния рисков на работу
3. Способы митигации рисков

🎯 Вебинар будет полезен бизнес-аналитикам, системным аналитикам, начинающим продактам или руководителям проектов. Появилось понимание что такое риски, как выявлять и управлять ими.

🛡Спикер Иван Селиванов — Ведущий Системный Аналитик.

Встречаемся в преддверии старта курса «Системный и бизнес-анализ». Все участники вебинара получат специальную цену на обучение! Регистрируйтесь прямо сейчас, чтобы не пропустить мероприятие: https://otus.pw/6OWL/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

DATApedia | Data science

13 Nov, 07:01


​​Создание плагина для IntelliJ IDE с подключением GigaChat для проверки качества кода

При разработке рабочего проекта, локальный запуск которого дело достаточно ресурсоемкое, у меня возникла идея попробовать облегчить себе работу путем создания плагина, который налету при разработке может анализировать блок кода, тем самым выдавая рекомендации по оптимизации или находя ошибки.

Читать | DATApedia

DATApedia | Data science

11 Nov, 10:08


​​Как создать датасет для машинного обучения за 6 шагов

Сегодня мы обсудим шесть шагов для создания наборов данных, которые идеально подойдут под ваши задачи, и разберем их на примере датасета, который мы собрали в Data Light.

Читать | DATApedia

DATApedia | Data science

07 Nov, 09:50


​​Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

В этой статье я расскажу о том, как создать свою собственную сверточную нейронную сеть, способную распознавать цифры на изображениях, будь то рукописные или машинописные. Мы рассмотрим основные принципы работы CNN, изучим архитектуру моделей, а также пошагово разберем процесс разработки и обучения нейросети.

Читать | DATApedia | #DS_AI

DATApedia | Data science

05 Nov, 08:45


​​GigaChat MAX — новая, сильная модель GigaChat

Данная статься позволит познакомиться с новой версией GigaChat и узнать ее особенности

Читать | DATApedia | #DS_AI

DATApedia | Data science

02 Nov, 09:01


​​Необычные вкусы покупателей: что такое товарные пары и как их исследовать

В этой статье расскажем:
- с чем обычно покупают лапшу быстрого приготовления, а с чем — детское питание;
- как география, время суток и другие факторы влияют на выбор покупателей;
- как все эти полученные знания можно применить в ассортиментных матрицах дарксторов и бизнес-процессах ритейла.

Читать | DATApedia

DATApedia | Data science

01 Nov, 07:01


​​Подключение к GigaChat API на Java: пошаговое руководство

Всем привет! В этой статье я расскажу о том, как подключиться к API GigaChat в IntelliJ IDEA на Java и настроить безопасное соединение с использованием SSL-сертификатов, чтобы получать ответы от GigaChat в своем приложении.

Читать | BApedia

DATApedia | Data science

30 Oct, 15:00


Как нужно укомплектовать команду ML для решения задачи?

🔹Расскажем на открытом уроке «Структура и построение ML команды» про композицию ML команды, различные роли в ней и их зоны ответственности

Поговорим о том, зачем нужны ролы Data Scientist, Data Analyst, BI Analyst, ML Engineer, Data Engineer. Как организовать работу команды и взаимодействие внутри нее.

Урок приурочен новому курсу «ML Team Lead» от Otus.

👉 Регистрация и подробности:
https://otus.pw/seJIf/?erid=LjN8KUyew

#реклама
О рекламодателе

DATApedia | Data science

30 Oct, 08:05


​​FlexiPrompt: Удобное создание динамических промптов в Python

Эта статья будет полезна Python-разработчикам, работающим с языковыми моделями (LLM).

Читать | DATApedia | #DS_AI

DATApedia | Data science

29 Oct, 10:25


​​Какую архитектуру конвейера данных следует использовать?

Данные извлекаются, обрабатываются и преобразуются в несколько этапов в зависимости от требований нижестоящей системы. Все этапы обработки и преобразования определяются в конвейере данных. В зависимости от требований конвейеры могут быть как простыми, состоящими из одного звена, так и сложными, включающими несколько этапов преобразования и обработки данных.

Читать | DATApedia

DATApedia | Data science

28 Oct, 10:43


​​Как оценить LLM модель

В этом блоге я предложу общую структуру, которая будет служить минимальной рекомендацией для тестирования приложений, использующих LLM, включая разговорные агенты, расширенную генерацию поиска и агентов и т. д.

Читать | DATApedia | #DS_AI

DATApedia | Data science

24 Oct, 07:01


​​Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX

Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитектуры. Вместо быстрых фиксов разработчики потратили четыре месяца на фундаментальные улучшения. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и сейчас мы с вами вместе разберемся, что изменилось и действительно ли стоило так долго ждать.

Читать | DATApedia | #DS_AI

DATApedia | Data science

22 Oct, 07:43


​​Как мы в Яндексе делаем роборуку с искусственным интеллектом

В этой статье я расскажу, как команда ML R&D в отделе робототехники Маркета создаёт роборуку и обучает нейросети, благодаря которым робот взаимодействует с физическим миром.

Читать | DATApedia | #DS_AI

DATApedia | Data science

21 Oct, 08:24


​​Краткий обзор LLM бенчмарков

За выходные я прочитал пару документов (см. ссылки в конце статьи) об оценке и бенчмаркинге LLM, и в этой статье подведу краткий итог прочитанного. Надеюсь, это будет хорошее введение для тех, кого интересует данная тема.

Читать | DATApedia | #DS_AI

DATApedia | Data science

18 Oct, 12:48


​​ООП для типовых ML задач

В данной статье НЕ будет идти речи о способах построения продвинутых моделей с различными наворотами. Рассказ пойдет о том, как автоматизировать построение типовой модели.

Читать | DATApedia

DATApedia | Data science

17 Oct, 08:31


Выбор СУБД: шпаргалка, чтобы не запутаться

Вопрос выбора СУБД для российской компании или госоргана — вопрос не праздный, тем более сейчас — когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что‑то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит?

Перейти к статье | DATApedia

DATApedia | Data science

16 Oct, 07:01


​​5 лучших инструментов для разметки данных в 2024 году

В этом руководстве мы разберем самые популярные решения для разметки данных и разберём, какой стоит выбрать именно вам.

Читать | DATApedia | #DS_AI

DATApedia | Data science

15 Oct, 14:52


Прокачиваем навыки в сфере ML — что изучать в 2024-м

Данная статья содержит подборку новых и высокооцененных специализированных курсов, книг и других тематических материалов для машинного обучения и инструментов для работы с ML-моделями

Перейти к статье | DATApedia

DATApedia | Data science

14 Oct, 07:01


​​Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Вы когда-нибудь задумывались, как нейросети учатся распознавать лица, управлять автомобилями или рекомендовать фильмы? За всем этим скрывается работа разметчиков данных — специалистов, которые буквально обучают ИИ видеть и понимать мир.
Сколько зарабатывают разметчики, какие навыки им нужны, и стоит ли вам задуматься о работе в этой индустрии? Раскроем все секреты профессии в нашей статье.

Читать | DATApedia

DATApedia | Data science

11 Oct, 12:33


Ликбез по методологиям проектирования хранилищ данных

Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.
Рассмотрим сильные и слабые стороны самых популярных методологий.

Перейти к статье | DATApedia

DATApedia | Data science

10 Oct, 11:13


Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE

Читать | DATApedia | #DS_AI

DATApedia | Data science

09 Oct, 08:38


​​Оголяем «данные» и что из этого вышло

Однажды я задался целью создать устройство, которое измеряло бы качество воздуха — не просто как-то, а с высокой точностью. Проект по разработке устройства привел к созданию NeboAir — недорогого датчика, который претендует на высокую точность. В этом материале я расскажу об испытаниях в реальных условиях и о том, что получилось в итоге.

Читать | DATApedia

DATApedia | Data science

08 Oct, 09:26


​​Контроль качества разметки на проекте: 4 секрета успеха

Как контролировать качество на проектах разметки максимально эффективно? Выстроить такие процессы непросто, но мы считаем, что у нас это получилось. Для того, чтобы гарантировать на каждом проекте высокое качество разметки, в Data Light существует отдел Контроля качества. Я, Евгений Шилкин, руководитель отдела, расскажу, что нам позволяет обеспечивать стабильно высокое качество на проектах и какие советы для эффективной валидации мы можем дать.

Читать | DATApedia

DATApedia | Data science

07 Oct, 10:05


​​Краткий гайд по квантованию нейросетей

В данной статье речь пойдет о дроблении, уменьшении и прямом урезании, иначе квантовании данных. Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.

Читать | DATApedia | #DS_AI

DATApedia | Data science

04 Oct, 08:02


​​Как оценить качество LLM модели

В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.

Читать | DATApedia | #DS_AI

DATApedia | Data science

02 Oct, 11:46


​​«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.

Читать | DATApedia | #DS_AI

DATApedia | Data science

01 Oct, 08:02


​​«Магнит» совершенствует сервис доставки: новые алгоритмы определяют лучший магазин для вашего заказа

Когда вы заказываете товары на сайте и в приложении, сервис доставки привозит их из магазинов «Магнит». Раньше для сборки заказов выбирался ближайший к покупателю магазин. Причём ближайший в буквальном смысле — по прямой. Это позволяло экономить на курьерах, но во всех магазинах разное количество сотрудников и ассортимент: где-то заказы собирали дольше, а где-то, из-за отсутствия определенных товаров, позиции в заказе меняли на аналоги. Поэтому мы решили поменять логику выбора магазинов, провели в нескольких городах пилотный проект и делимся первыми результатами.

Читать | DATApedia

DATApedia | Data science

30 Sep, 07:27


​​Corner-кейсы в разработке и разметке данных: что это такое, как с этим жить и при чем тут Достоевский?

Читать | DATApedia | #DS_AI

DATApedia | Data science

29 Sep, 14:06


Когда эйчар спрашивает, готов ли я работать в режиме многозадачности

DATApedia | Data science

28 Sep, 07:20


​​Сжатие данных в PostgreSQL: как различные методы влияют на хранение TOAST

В мире управления базами данных от эффективного хранения больших объемов информации зависит оптимизация производительности и использования дискового пространства. В этой статье разберем основные методы сжатия данных в TOAST.

Перейти к статье | SQLpedia

DATApedia | Data science

25 Sep, 07:10


​​Полный гид по бенчмаркам LLM

В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.

Читать | DATApedia | #DS_AI

DATApedia | Data science

23 Sep, 08:04


​​Не потеряться в данных: оптимизируем аналитику с помощью DataHub

Ниже расскажу о нашем опыте применения DataHub и ситуациях, в которых инструмент может пригодиться. Надеемся, будет полезно продуктовым и дата-аналитикам; руководителям, нацеленным на выстраивание порядка в процессах и всем, кто интересуется актуальным тулингом для ИТ-команд.

Читать | DATApedia

DATApedia | Data science

21 Sep, 07:14


Python Senior Developer