местный датасасер ☮️

@datasas

Пишу всякое о технологиях и моих проектах, @egorvoron

местный датасасер ☮️

21 Oct, 21:01

🔉 Мимо всех прошёл новый генератор ультра-реалистичной речи — Cartesia озвучивает любой текст на 14 языках быстрее, чем Elevenlabs! Русский поддерживается.

Сервис клонирует любой голос за 15 секунд для озвучки или дубляжа контента. Можно выбрать язык, уже готовый голос, скорость, акценты и даже эмоции. Бесплатно дают озвучку 10,000 знаков.

У Elevenlabs мощный конкурент — тут.

@notboring_tech

352

местный датасасер ☮️

08 Oct, 10:01

Нобелевку по физике дали... машинлернерам Хинтону и Хопфилду
https://www.interfax.ru/world/985736

6,627

местный датасасер ☮️

26 Sep, 13:20

Три дня назад Сэм Альтман выпустил оптимистичный манифест (скорее просто эссе) со своим видением будущего с умным ИИ (конечно же, прекрасным, а как еще)
https://ia.samaltman.com/
Меня все-таки смущает его чересчур радужный взгляд на все это

1,227

местный датасасер ☮️

12 Sep, 22:47

Ну тут я не могла пройти мимо такого названия 😂😂

Почему? Можно посмотреть по хэштегу

#o1

в моем канале

TLDR: вышла новая версия chat GPT с рассуждениями (complex reasoning)

По словам OpenAI, модель o1 анимает 89-й процентиль на Codeforces, входит в число 500 лучших студентов США в отборочном туре на математическую олимпиаду США (AIME) и превосходит точность человека с PhD по ряду задач по физике, биологии и химии ⚡

💡Идея: перед тем как выдать результат модель прорабатывает несколько сценариев-цепочек и выбирает наиболее подходящий для решения задачи. В своей работе с API LLM я делала похоже трюки, заставляя ту же обычную gpt-4o объяснять все результаты, даже если мне нужно только число.

Теперь модель улучшили насчет внутренних рассуждений перед выдачей решения. Сами рассуждения полностью доступны не будут, но вы за них будете платить при использовании по API 🥲

По API модель сейчас доступна только части пользователей, у платных - есть в интерфейсе ☕️

1,288

местный датасасер ☮️

03 Sep, 12:32

На фоне "новости" о том что бигтехи следят за нами прослушивая микрофон непрерывно, не могу не напомнить про прекрасный проект https://trackthis.link/ по обману рекламодателей через открытие сотни табов в браузере. Там, правда, не было обновлений за 5 лет и часть открываемых ссылок уже протухли, но не все. Лично я регулярно пользуюсь профилем Doomsday Prepper и ни о чём не жалею!

#privacy #mozilla #humour

1,255

местный датасасер ☮️

25 Aug, 11:15

Свободу Паше!

1,563

местный датасасер ☮️

14 Aug, 06:59

Ai видео выходят на новый уровень 🌚 взял отсюда

https://www.reddit.com/r/singularity/s/ZJDFkIUDC6

Если что это Runway

1,705

местный датасасер ☮️

08 Aug, 10:11

Дешёвые, как грязь, LLM

API-провайдеры невероятно быстро снижают стоимость использования своих LLM. При отсутствии ярко выраженного лидера по качеству моделей, главным аргументом становится цена.

➖ Google с 12 августа дропает цены на Gemini Flash на 80%. Вот и реакция на GPT-4o mini, спустя две недели после релиза. Вот бы то же самое сделали с Pro 1.5.

➖ Новая версия GPT-4o упала в цене до $2.5 input/$10 output за миллион токенов, прошлые версии стоили $5 input/$15 output за миллион токенов. Последний месяц Claude 3.5 Sonnet и Llama 3.1 405B сильно поджимали OpenAI по цене, пришлось отвечать.

➖Deepseek релизит обещанный месяц назад Context Caching. Цены поражают: стоимость токенов при попадании в кэш падает не в 2x, как у гугла, а в 10x, при этом с бесплатным хранением. DeepSeek V2 и так произвёл эффект разорвавшейся бомбы на китайском рынке три месяца назад: модель была в разы дешевле конкурентов, при лучшем качестве. А сейчас нанесли добивающий удар.

С такими темпами цена за миллион токенов станет меньше цента менее чем через год. И будем мы мерять цены в долларах за миллиард токенов.

А помните, цены на GPT-4 доходили до $60 input/$120 output?

@ai_newz

1,566

местный датасасер ☮️

24 Jul, 07:01

Сегодня хочу порекомендовать канал @dlinnlp, на который сам давно подписан
В нем есть и годные короткие разборы выходящих папиров по МЛ и просто фановые мемы.
Тем, кто заинтересован машинкой и ИИ в целом советую также папку авторских каналов, собранную @boris_again (за что ему большой респект, потому что подобрать хорошие каналы по мл и отсеять мусорные во время хайпа нейронок это большой труд)

1,508

местный датасасер ☮️

16 Jul, 15:08

Что-то все модели выпускают, а от Mistral🇫🇷давно новостей не было. Сегодня они выпустили две модели, одна заточена на математику, другая — на написание кода.

MathΣtral — компактная модель размера 7B, по архитектуре эквивалентная ранним релизам компании. Её доучили на решение сложных математических задач, требующих комплексных, многосутпенчатых логических рассуждений.

На MMLU модель показывает прирост более чем в 10% в отдельных под-категориях, и целых 15% в элементарной математике, физических задачах старшей школы/колледжей и, внезапно, машинном обучении.

Модель справилась с 2мя задачами из 30 на American Invitational Mathematics Examination (AIME). Это второй из трёх этапов отбора команды на международную олимпиаду по математике в США — тут задачки уже поинтереснее, но всё ещё не как на финалах. Кажется, что 2 задачи это мало, но из моделей сопоставимого размера лишь китайский Qwen 2 7B тоже решает 2; большинство остальных — нуль.

Проценты решений задач других олимпиад можете увидеть на картинке

Модель уже доступна на HF (не торрент!). Её, кстати, делали совместно с Project Numina — это проект, члены которого также недавно выиграли соревнование AIMO по решению олимпиадных задач LLMками (писал тут). Там победное решение использовало DeepSeek Math 7B (вторая строчка в таблице). Так что при следующем запуске соревнования можно ожидать, что результат первого места ещё подскочит вверх — просто за счёт смены одной модели на другую, чуть более мощную.

Для справки: maj@16 означает, что модель независимо генерирует 16 решений на задачу, после чего проводится голосование большинством, и выбирается тот ответ, который чаще попадался. Важно понимать, что это не означает, что система даёт 16 ответов с 16 попыток — попытка одна, а maj позволяет выбрать один ответ, который модели кажется наиболее правильным.

1,543

местный датасасер ☮️

18 Jun, 17:14

Все, nvidia теперь топ-1 по рыночной капитализации
https://www.cnbc.com/2024/06/18/nvidia-passes-microsoft-in-market-cap-is-most-valuable-public-company.html

1,212

местный датасасер ☮️

04 Jun, 16:46

Сегодня происходит много странно-интересного:
— прямо сейчас (хотя бы частично) лежат ChatGPT, Perplexity, Gemini, Claude
— ведущие AI-исследователи и бывшие/текущие сотрудники OpenAI/DeepMind подписывают открытое письмо про то, что работающие над AGI должны иметь возможность свободно выражать свое мнение и критиковать компанию без возможности компаний отобрать финансовые стимулы. А то дают миллионы долларов акций, а потом говорят «ну вот, а скажешь, что не согласен с нами — потеряешь всё!».
— недавно уволенный сотрудник OpenAI Leopold Aschenbrenner, работавший рука об руку с Ilya Sutskever в его команде, опубликовал 150+ страничную работу. Она покрывает всё: от законов масштабирования и предсказаний развития моделей до проблем Alignment'а и поведения ведущих лабораторий в преддверии достижения AGI. Читать: http://situational-awareness.ai . Если у вас есть полчасика и вы умеете читать по-английски, и вам вправду хочется понять, почему люди кричат, что к 2027-2030м годам модели реально поумнеют — начните с первых двух глав.
— ...и вместе с ним же выходит 4-часовое интервью у Dwarkesh'а, которого я уже ни раз рекомендовал. Будем смотреть по частям, об интересных вещах постараюсь написать. Покрытые темы:
1) гонка к кластеру мощностей стоимостью $1T (триллион долларов)
2) что будет в 2028-м
3) что случилось в OpenAI (не думаю, что раскроет какие-то новые детали)
4) шпионаж Китая в AGI-лабораториях

1,181

местный датасасер ☮️

30 May, 09:09

https://habr.com/ru/news/818177/
💀💀

1,014

местный датасасер ☮️

27 May, 15:02

Вау, вау, вау. Microsoft официально запилил Copilot бота для Telegram. Если кто не в курсе, то это ChatGPT в интерфейсе от Microsoft.

И это реально официалный бот от Microsoft – вот анонос. Я такого совсем не ожидал. Кажется, БигТехи начинают осознавать потенциал Телеграма, ну либо Бинг просто ищет любые дополнительные источники трафика.

Кажется, это первое появление официального представителя компании-разработчика крупных LLM в Телеге.

Пообщаться можно тут: @CopilotOfficialBot. Он, гаденыш, правда, просит телефон верифицировать – мне такое не очень нравится.

@ai_newz

986

местный датасасер ☮️

18 May, 11:38

https://www.cnbc.com/2024/05/17/openai-superalignment-sutskever-leike.html

1,014

местный датасасер ☮️

15 May, 23:58

https://3dnews.ru/1104824/odin-iz-osnovateley-openai-ilya-sutskever-obyavil-ob-uhode-iz-startapa

1,110

местный датасасер ☮️

13 May, 20:19

https://youtu.be/vgYi3Wr7v_g?si=mPQknLAtYPvSiuK2

882

местный датасасер ☮️

13 May, 19:27

Помните, была тема с дипфейком Ким Кардашьян, объясняющей коротенькие темы из математики? Так вот, эти видео никуда не делись, а продолжают регулярно выходить. 💜

Замена переменной в интеграле:
https://youtu.be/4fF6NydCNuw?si=ydOJV2NpgbYq594y

Вывод производной x² из определения:
https://youtu.be/qPhLWfn-t_4?si=-uIogJ_sufxK-FNB

Цепное правило:
https://youtu.be/ulbmQJG5GrA?si=O5IHessFBNUF2pk4

Забавно и мило 😀

#математика

862

местный датасасер ☮️

23 Apr, 09:28

Dify, a visual workflow to build/test LLM applications (Score: 150+ in 11 hours)

Link: https://readhacker.news/s/66tN8
Comments: https://readhacker.news/c/66tN8

816

местный датасасер ☮️

12 Apr, 07:54

Моя колонка ко Дню Космонавтики. Про три альтернативных реальности, где его бы не было - и которые не стали реальными по чистой и ничтожной случайности.
https://www.gazeta.ru/comments/2018/04/13_a_11716141.shtml

958