Canal Machinelearning @ai_machinelearning_big_data en Telegram

Machinelearning

Machinelearning
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
115,022 Suscriptores
3,167 Fotos
359 Videos
Última Actualización 11.03.2025 07:45

Canales Similares

эйай ньюз
71,386 Suscriptores
C++ Academy
17,143 Suscriptores
Knowledge Accumulator
5,127 Suscriptores

Открытые новинки в области машинного обучения и искусственного интеллекта

Машинное обучение (МЛ) и искусственный интеллект (AI) продолжают оставаться в центре внимания как в научных кругах, так и в бизнесе. С каждым годом появляются новые технологии и инструменты, способствующие развитию этих областей, что приводит к значительным изменениям в различных сферах жизни. В последнее время особое внимание уделяется open source проектам, которые предоставляют разработчикам доступ к передовым алгоритмам и библиотекам. Эти проекты призваны облегчить процесс интеграции AI в бизнес и образовательные учреждения, а также помогают стартапам и исследователям быстрее достигать своих целей. В этой статье мы рассмотрим некоторые из самых интересных новинок в области машинного обучения и AI, а также дадим рекомендации по запуску LLLm (Large Language Models) и другим технологиям, которые могут оказаться полезными для практического применения.

Что такое машинное обучение и как оно работает?

Машинное обучение — это подмножество искусственного интеллекта, которое позволяет компьютерам обучаться на основе данных без явного программирования. Вместо того чтобы следовать фиксированным алгоритмам, системы машинного обучения используют статистические методы для анализа данных и выработки прогнозов. Алгоритмы обучаются на основе обучающей выборки, чтобы затем применять полученные знания к новым данным.

Машинное обучение делится на несколько типов: контролируемое, неконтролируемое и полу-контролируемое обучение. В контролируемом обучении используются размеченные данные, в которых известны входные и выходные параметры. В неконтролируемом обучении система должна сама находить закономерности в незнакомых данных, что делает его более сложным, но также и более интересным.

Каковы основные open source проекты в области машинного обучения?

Некоторые из самых популярных open source проектов в области машинного обучения включают TensorFlow, PyTorch, Scikit-learn и Keras. TensorFlow, разработанный Google, предоставляет мощные методы для создания и обучения нейронных сетей, а также для работы с большими объемами данных. PyTorch, в свою очередь, более гибок и удобен для исследователей, что делает его идеальным для разработки и тестирования концепций.

Scikit-learn — это библиотека для обычного машинного обучения на Python, которая предоставляет множество инструментов для классической статистики и обработки данных. Keras — это высокоуровневая библиотека для нейронных сетей, позволяющая быстро и удобно создавать модели, и чаще всего используется вместе с TensorFlow.

Как запустить LLLm и какие инструменты для этого нужны?

Запуск LLLm требует наличия определённых инструментов, таких как GPU для ускорения вычислений, а также библиотек, таких как Hugging Face Transformers, которые содержат предобученные модели для работы с языком. Для начала необходимо установить необходимые библиотеки и окружения, такие как Anaconda или Docker, которые упрощают управление зависимостями.

Следующим шагом будет загрузка предобученной модели и подготовка данных для обучения или тестирования. Hugging Face предлагает простые в использовании интерфейсы, которые позволяют легко интегрировать разные LLLm в ваши приложения. После подготовки данных и модели можно начать процесс обучения или генерации текста.

Какие последние тренды в области AI и машинного обучения?

Одним из главных трендов является применение искусственного интеллекта в различных отраслях, таких как медицина, финансы и транспорт. AI помогает в диагностике заболеваний, анализе финансовых рисков и оптимизации логистики. Также наблюдается рост интереса к Explainable AI (объяснимый AI), который направлен на создание моделей, прозрачных для пользователей.

Другим заметным направлением является использование AI для создания творческого контента, включая создание музыки и графики. Модели, подобные GPT-3, уже продемонстрировали свои способности в создании текстов и даже программного обеспечения. Это открывает новые возможности для креативных профессий и вызывает дискуссии о будущем авторского права.

Каково будущее машинного обучения и искусственного интеллекта?

Будущее машинного обучения и искусственного интеллекта обещает быть многообещающим, с множеством инноваций и внедрений в повседневную жизнь. Ожидается, что AI станет более персонализированным и адаптивным, улучшая пользовательский опыт и предлагая решения, соответствующие индивидуальным потребностям.

Помимо этого, рост интереса к этическим аспектам AI будет определять его развитие. Вопросы, касающиеся приватности данных, предвзятости алгоритмов и их социальной ответственности, будут играть важную роль в будущем. Создание эффективных правовых и этических норм в этой области также станет неизбежной частью нашей жизни.

Canal de Telegram Machinelearning

Добро пожаловать на канал Machinelearning! Здесь мы погружаемся в мир машинного обучения, делимся лучшими открытыми новинками из области машинного обучения и больших данных. На канале вы найдете интересные коды, вопросы с собеседований, а также публикуем открытые курсы и гайды для тех, кто хочет погрузиться в эту увлекательную область. Если у вас возникли вопросы или предложения, не стесняйтесь обращаться к администратору канала @haarrp. Присоединяйтесь к нашему сообществу и узнавайте все о машинном обучении!

Últimas Publicaciones de Machinelearning

Post image

✔️ В сеть утекли спецификации RTX 5060 Ti и 5050.

NVIDIA RTX 5060 Ti будет использовать чип GB206-300, иметь 4608 ядер CUDA, две конфигурации GDDR7 объемом 8 ГБ и 16 ГБ, использовать 128 бит и энергопотребление в 180 Вт.

RTX 5050 построена на чипе GB207-300 с 2560 ядрами CUDA, 8 ГБ видеопамяти GDDR6, 128-битную разрядность и энергопотреблением 130 Вт. Обе видеокарты используют конструкцию печатной платы PG152.

По слухам, RTX 5060 Ti и RTX 5050 выйдут в апреле-мае, а RTX 5050 должна составить конкуренцию Intel Battlemage Arc B580.
videocardz.com

✔️ Квантовый интернет стал немного ближе к реальности.

Ученые при момощи ИИ обнаружили более простой способ формирования квантовой запутанности между субатомными частицами. Это открытие потенциально облегчит разработку квантовых коммуникационных технологий.
Исследование, опубликованное в Physical Review Letters, описывает, как разработанный ИИ-инструмент PyTheus предложил принципиально новый метод, основанный на неразличимости путей фотонов.

Это открытие упрощает процесс формирования квантовой запутанности, что в перспективе может сделать квантовые сети для безопасной передачи сообщений более осуществимыми. Хотя практическое масштабирование технологии еще предстоит оценить, исследование убедительно демонстрирует потенциал AI как инструмента для научных открытий в физике.
space.com

✔️ Similarweb: ChatGPT посещают почти 4 миллиарда человек в месяц, но рост замедляется.

Февраль 2025 года стал для ChatGPT рекордным по числу посетителей – 3,905 миллиарда, но несмотря на это, месячный прирост составил скромные 1,44%, что указывает на существенное замедление динамики.

В годовом исчислении рост остается впечатляющим - 137% по сравнению с февралем 2024 года. Эти показатели позволили ChatGPT занять 5 место среди самых посещаемых десктопных веб-сайтов в мире и 7 место с учетом мобильного трафика. Даже с таким внушительным количество пользователей, ChatGPT пока не может сравниться по объемам трафика с Google.
Similarweb в X (Twitter)

✔️ Китайские университеты расширяют прием студентов по ИИ направлениям.

Несколько ведущих университетов Китая заявили о планах по увеличению набора студентов. Данная инициатива направлена на приоритетное развитие кадров в сферах, имеющих "национальное стратегическое значение", одна из них - искусственный интеллект.

Решение последовало за запуском университетских курсов по ИИ, основанных на разработках стартапа DeepSeek, чьи успехи сравнивают со "спутником" в технологическом прорыве. Peking University добавит 150 мест в 2025 году, Renmin University - более 100, Shanghai Jiao Tong University также увеличит прием на 150 мест в специализациях по ИИ и новых технологиях. Эти меры тесно связаны со стремлением КНР стать "мощной образовательной державой".
reuters.com

✔️ Sony Music ведет масштабную борьбу с дипфейками.

Компания Sony Music отчиталась о удалении более 75 тысяч сгенерированных искусственным интеллектом материалов, в основном это подделки записей известных исполнителей. Этот объем выявленных фейков, по мнению музыкальных руководителей, является лишь вершиной айсберга.

Sony опасается, что планируемое ослабление законодательства об авторском праве в Великобритании усугубит проблему и нанесет прямой коммерческий ущерб артистам. В своем обращении к правительству Великобритании компания подчеркнула, что существующая система лицензирования интеллектуальной собственности для обучения ИИ является предпочтительной и ведет с рядом компаний переговоры.
ft.com

✔️ У китайцев вышел новый DeepSeek — супернейросеть Kimi k1.5, которая теперь доступна для всех (если у вас есть аккаунт Google).
• По бенчмаркам AIME и MATH 500 она с лёгкостью обходит OpenAI o1, предлагая сразу возможности поиска и «глубокого размышления».
•Можно загрузить до 50 файлов, а контекстное окно на 200 тысяч токенов способно обработать огромный объём данных, выдавая подробный ответ или краткий вывод.
kimi.ai

✔️ANUS (Autonomous Networked Utility System) — опенсорсную версию популярного Manus, который клонировал самого себя

GItHub

@ai_machinelearning_big_data

#news #ai #ml

11 Mar, 06:01
4,647
Post image

Приглашаем на открытый урок «Применение искусственного интеллекта в диагностике и визуализации медицинских изображений»

Познакомимся с современными методами использования ИИ для анализа медицинских изображений, включая рентгеновские снимки, МРТ и КТ на открытом уроке, посвященному курсу «Искусственный интеллект в медицине»

Рассмотрим примеры успешных внедрений и разберем алгоритмы, которые помогают врачам быстрее и точнее ставить диагнозы. 

👉 Регистрация и подробности: 
https://otus.pw/Ulm2/?erid=2W5zFGAcNja

#реклама
О рекламодателе

11 Mar, 05:03
5,224
Post image

🌟 Distill-Any-Depth: метод оценки глубины сцены по одному изображению.

Distill-Any-Depth - метод обучения моделей монокулярной оценки глубины, который сочетает кросс-контекстную дистилляцию и мульти-учительский подход для точного определения расстояния до объектов на RGB-изображении. Он предназначен для обучения моделей (например, DPT, MiDaS или DepthAnythingv2), которые учатся на псевдо-метках, сгенерированных учительскими моделями (Genpercept, DepthAnythingv2).

Метод не просто улучшает существующие алгоритмы, но и задает новый стандарт в области определения глубины. Методика может применяться в сфере автономного транспорта и AR-решений. Она может ускорить создание точных 3D-карт для навигации и улучшить реалистичность виртуальных миров за счет детализированного анализа пространства. При этом, обучение CV-моделей с Distill-Any-Depth довольно энергоэффективно — достаточно одной NVIDIA V100.

Основа Distill-Any-Depth - кросс-контекстная дистилляция, объединяющая 2 сценария:

🟠Shared-Context Distillation — модель-учитель и модель-ученик обучаются на одинаковых фрагментах изображения.

🟠Local-Global Distillation — модель-учитель анализирует локальные фрагменты, а модель-ученик предсказывает глубину для всего изображения, отвечая за глобальную согласованность сцены.

Экспериментальная модель обучалась на 50 тыс. изображений из SA-1B с разрешением 560×560. Использовались псевдо-метки от Genpercept (диффузионная модель) и DepthAnythingv2 (DINOv2). В рамках мульти-учительского подхода на каждой итерации случайно выбирался один учитель.

На тестах DIODE и ETH3D метод сократил значение AbsRel на 9.6–20% по сравнению с базовой дистилляцией. Например, при обучении модели-ученика DPT с учителями Genpercept и DepthAnythingv2 AbsRel на ETH3D составил 0.065 против 0.096 у Genpercept.

На бенчмарках NYUv2, KITTI, ScanNet модель достигла SOTA: AbsRel 0.043 (NYUv2), 0.070 (KITTI), 0.042 (ScanNet). В сравнении с DepthAnything v2 (AbsRel: 0.045 на NYUv2) и Marigold (0.055) Distill-Any-Depth показал более высокую детализацию и точность относительной глубины.

▶️В открытом доступе 3 модели, обученные с Distill-Any-Depth:

🟢Distill-Any-Depth-Multi-Teacher-Small - 24.8М параметров

🟢Distill-Any-Depth-Multi-Teacher-Base - 95.5М параметров

🟢Distill-Any-Depth-Multi-Teacher-Large - 335.3М параметров


▶️Локальная установка и инференс в Gradio:

# Create Conda env 
conda create -n distill-any-depth -y python=3.10
conda activate distill-any-depth

# Clone Repo
git clone https://github.com/rmurai0610/MASt3R-SLAM.git --recursive
cd MASt3R-SLAM/

# Install dependencies
pip install -r requirements.txt
pip install -e .

# If use hf_hub_download, you can use the following code
checkpoint_path = hf_hub_download(repo_id=f"xingyang1/Distill-Any-Depth", filename=f"large/model.safetensors", repo_type="model")

# Launch Gradio demo
python app.py


📌Лицензирование: MIT License.


🟡Страница проекта
🟡Arxiv
🟡Набор моделей
🟡Demo
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Depth #DIstillAnyDepth

10 Mar, 12:00
10,430
Post image

Курс «Практическая ML-инженерия: MLOps и разработка проектов» от магистратуры по искусственному интеллекту в ИТМО

Узнайте, как развиваться в MLOps и ML-разработке, и вывести свой AI-сервис в продакшен.

✔️ Обучение для тех, кто уже знает базу ML: можно освоить те навыки, которых не хватает.
✔️ Онлайн-занятия по вечерам: удобно совмещать с учебой, работой и личной жизнью.

Основные преимущества:
▪️ Возможность довести ML-модель до MVP. Изучайте инструменты MLOps — DVC, Airflow, MLflow, ClearML, W&B, FastAPI, PyTest, Docker, GitLab CI, чтобы выкатить свой сервис в продакшен.
▪️ Упор на практику. Работайте с реальными проектами, которые при желании можно монетизировать.
▪️ Опыт тимлидов в сфере ML. Узнавайте, что ждут от ML-инженеров нанимающие менеджеры.
▪️ Советы от старших коллег. Обсуждайте задачи и решения со специалистами ведущих компаний.
▪️ Понимание ML-продукта как единого целого. Учитесь проверять гипотезы и решать бизнес-задачи системно.
Регистрация на курс заканчивается 13 марта.
📌 Успейте подать заявку
Реклама. Университет ИТМО ИНН:7813045547 erid=2VtzqxBMfUr

10 Mar, 10:52
8,235