4CIO @club4cio Channel on Telegram

4CIO

@club4cio


https://t.me/+-xskTsyRBWI5NGU0. Независимая редакция с самостоятельной политикой подбора новостей Владельцами канала не является УО 4CIO (на канал распространяется только законодательство свободного мира, “законы” тираний тут не действуют).

4CIO Promotion (Russian)

Добро пожаловать в канал 4CIO! Мы - независимая редакция с самостоятельной политикой подбора новостей. Владельцами канала не является УО 4CIO, и наш канал распространяет только законодательство свободного мира, где 'законы' тираний не действуют. Канал 4CIO создан для всех, кто интересуется высокими технологиями, информационной безопасностью и современными тенденциями в мире IT. У нас вы найдете актуальные новости, аналитику, интервью с экспертами и многое другое. Не упустите возможность быть в курсе самых свежих событий в мире информационных технологий! Присоединяйтесь к нам в канале 4CIO по ссылке https://t.me/+-xskTsyRBWI5NGU0 и делитесь своим опытом и мнением с единомышленниками. Будьте в центре IT-преобразований с 4CIO!

4CIO

24 Jan, 07:27


Рассказали на нашем YouTube про Telegram, а точнее — про ботов.

Этот ролик давно направшивался, потому что практически каждый пользователь Telegram хотя бы раз за всё время пользовался ботами. Какие-то помогают удалять из чатов и групп других ботов, редактировать посты, выбирать победителей розыгрышей и выполняют еще много разных фукций, зависит от их разработки.

Но всех их объединяет одно — они знают ваш UserID. И даже если вы удалились из канала или группы, бот-администратор будет помнить, что вы в ней состояли.

Чем такие боты могут быть опасны — в нашем новом видео. А в конце есть инструкция как удалить чаты с ботами вместе с содержимым переписки, вдруг пригодится.

4CIO

23 Jan, 22:12


Оказалось, что на латыни stips значит и "зарплата", и "ветка". Мем про ветку приобрел новое измерение!

*кстати слово "стипендия" от того же корня*

4CIO

23 Jan, 20:07


Perplexity запускает в своем приложении для Android Perplexity Assistant, который может выполнять разные действия в установленных приложениях. Ну, вызвать Uber или поставить встречу в календарь. Короче, делает то, что должен был делать google assistant, но так и не стал. Первоначально он будет бесплатным для пользователей на 15 языках и только на андроиде. Если неинтересно ставить — просто посмотрите больше видео в треде.

https://x.com/AravSrinivas/status/1882467172498436291

4CIO

22 Jan, 13:12


“Трамп помиловал основателя Silk Road Росса Ульбрихта”

4CIO

22 Jan, 09:58


😮Трамп анонсировал проект Stargate по построению AI инфраструктуры в США на $500 млрд

Инвестиции в размере $500B – это очень много денег, и составляет 1.7% ВВП США, что сравнимо с тратами на Лунную програму США в прошлом веке. Еще для сравнения, это в 3 раза больше всей VC индустрии в США!

Почему сейчас? Потому что Китайцы давят люто, и даже с гораздо меньшими ресурсами и под санкциями выпускают модели, которые не хуже по качеству чем у OpenAI, да еще и дешевле и быстрее.

США видит в этом прямую угрозу и хотят оставаться лидером в гонке AI. Также на уровне государства все осознали потенциал AI трансформации во многих сферах жизни, включая экономику и военную промышленность, куда исторически США инвестирует большие доллары.

Что это значит для нас? Это значит, что сфера дальше будет раздуваться, зарплаты AI инженеров и сайнтистов расти, а размер инвестиций в AI увеличиваться. Инфра и инференс моделей сильно подешевеет. Как сказал Коля Давыдов: "нас зальют баблом, AI стартапам будет очень хорошо".

Приведет ли это к AGI в широком понимании в течение следующих 5 лет? Я тут скорее скептичен и склоняюсь к тому, что нет. Но модели точно станут более мощными и умными.

Мы с вами в очень правильное время занимаемся очень правильными вещами.

@ai_newz

4CIO

21 Jan, 10:30


Предлагаем всем корпоратам, что собирают данные в базы данных клиентов сразу заявить, что ни станут общедоступными, что по факту всегда и происходит. https://t.me/dataleak/3457

4CIO

20 Jan, 17:06


DeepSeek представила новые модели для рассуждений — DeepSeek-R1-Zero и DeepSeek-R1, а также серию их дистиллированных версий. Интересно, что R1-Zero обучалась только через reinforcement learning без предварительной supervised fine-tuning, что является первым подобным успешным экспериментом в открытом доступе.

DeepSeek-R1, получившая дополнительное обучение на специально подготовленных данных, показывает результаты на уровне OpenAI o1 в задачах математики, программирования и рассуждений. Компания также выпустила шесть уменьшенных моделей на базе Llama и Qwen — от 1.5B до 70B параметров.

Особенно впечатляет DeepSeek-R1-Distill-Qwen-32B, которая превосходит OpenAI o1-mini по многим показателям. На математических тестах AIME 2024 она показывает результат 72.6% против 63.6% у o1-mini, а на MATH-500 — 94.3% против 90%.

Все модели доступны в открытом доступе под лицензией MIT и поддерживают коммерческое использование. Правда, основную модель — R1, — вы все равно локально не запустите с её 671B параметров. Но попробовать можно на chat.deepseek.com. По паре вопросов сориентироваться сложно, но отвечает похоже на o1, причем за считанные секунды, в отличие от. При этом даже слегка удивительно, что модель отвечает, не прибегая к иероглифам, как другие китайские модели. В общем, попробуйте, конкуренция явно накаляется.

https://github.com/deepseek-ai/DeepSeek-R1

4CIO

19 Jan, 18:09


раньше так боялись за калькуляторы)

4CIO

19 Jan, 16:22


Тик ток отлично работает из под VPN, только выбирать надо не USA как регион. Интересно тиктокеры в состоянии освоить это ?

4CIO

19 Jan, 11:32


OpenAI помогает разрабатывать средства для продления жизни

Для этого компания кооперируется со стартапом Retro, заявленная цель которого - повысить среднюю продолжительность жизни на десять лет. Специально для стартапа была создана модель GPT-4b micro, натренированная на последовательностях белков множества биологических видов и данные об их взаимодействии.

Подход стартапа (в который Сэм Альтман инвестировал $180m) основывается на процессе превращения клеток кожи в стволовые, которые потом можно тривиально перепрограммировать в любые другие типы клеток в человеческом организме. Из-за этого свойства стволовые клетки очень ценятся и имеют кучу применений, но крайне дорогие, из-за чего не могут использоваться массово.

Существующий процесс получения стволовых клеток из клеток кожи крайне неэффективен - занимает несколько недель и может успешно перепрограммировать менее 1% клеток. Благодаря GPT-4b micro процесс вышло заметно улучшить - вышло создать более чем в 50 раз эффективные версии двух из четырёх необходимых для процесса белков. Насколько именно это улучшает процесс в целом - непонятно, но разница на картинке огромная.

@ai_newz

4CIO

17 Jan, 20:43


https://www.youtube.com/watch?v=E7CsujpFB4g

4CIO

16 Jan, 17:06


В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek, который не только работает лучше многих имеющихся инструментов, основанных на больших языковых моделях (в том числе, лучше ChatGPT, даже в последней версии), но и относится к категории Open Source, кроме того он бесплатно-свободно и без всяких ухищрений доступен российским пользователям. А вчера вышла хвалебная статья в Science об этом инструменте:

https://www.science.org/content/article/chinese-firm-s-faster-cheaper-ai-language-model-makes-splash

В частности, в ней утверждается, что подход DeepSeek «включает улучшение так называемой архитектуры Mixture of Experts. Она снижает вычислительную мощность, необходимую для обучения модели, и выдает более эффективные ответы на запросы. Только подмножество экспертных сетей в модели обучается для выполнения задачи. Затем сеть отправляет адресные запросы только тем экспертным сетям, которые наиболее подходят для ответа.»

В результате на обучение DeepSeek было потрачено всего $5.6 млн., тогда как обучение ChatGPT-4o стоило $78 млн. Операционные затраты при работе DeepSeek также намного меньше, чем для других моделей. Стоит также обратить внимание на слова генерального директора DeepSeek Лян Вэньфэна о том, что «исследования и технологические инновации, а не бизнес-возможности, являются приоритетом компании. Ее конечная цель — достичь такого уровня искусственного интеллекта, который бы соответствовал когнитивным способностям человека. Эта высокая цель помогла фирме привлечь амбициозных исследователей.»

После таких рекомендаций от Science я решил проверить, как все это работает. Зашел на

https://www.deepseek.com/

непосредственно через google-account и приступил к общению в чате на тему предыдущего поста (опубликованного сегодня утром) о глобальном потеплении. Результат можно посмотреть здесь:

https://disk.yandex.ru/i/-7IxJEx0SsmpKw

Видно, что ответы на мои короткие вопросы полные и исчерпывающие, хотя они не выходят за рамки mainstream reasoning (но странно было бы ожидать оригинальности от большой языковой модели). Потом я начал использовать поисковую функцию «Search», просил дать ссылки на обзорные статьи по тому или иному научному вопросу – все работает, причем ответ выдается не в виде совокупности ссылок, а в виде связного текста, куда ссылки вкраплены, как во введении к реальной научной статье. Причем все ссылки реальные, не вымышленные, как часто бывает в текстах, написанных ChatGPT.

Потом я перешел на общение на русском языке – все точно так же отлично работает, включая не только научные вопросы, но и, например, написание стихов на какую-нибудь тему в стиле того или иного поэта прошлого (опять-таки, если обращать внимание на стиль, а не оригинальность мысли). В общем, советовал бы попробовать этот инструмент, к которому у российских пользователей есть безбарьерный и бесплатный доступ (кстати, его можно установить и на мобильных устройствах, скачав соответствующее приложение из AppStore или GooglePlay).

4CIO

15 Jan, 19:45


Нейросети снижают нашу способность мыслить на 20-30%

Чем больше задач мы делегируем ИИ, тем больше мозг "отдыхает", теряя навык самостоятельного анализа и оценки информации.

Учёные называют это когнитивной разгрузкой, которая постепенно ослабляет критическое мышление.

🇮🇱🇮🇱🇮🇱⬇️
📍Израиль для всех

#Израиль #новости #война

4CIO

14 Jan, 15:34


📺 Сообщается, что у части российских пользователей после глобального сбоя в российском интернете заработал YouTube.

А у вас работает?

4CIO

14 Jan, 15:17


По поводу превращения Рунета в Чебурнет на короткое время – короткая ремарка.

Центр мониторинга и управления сетью связи общего пользования – в его ведении находятся средства блокировки и контроля трафика в Рунете – возглавляет выпускник Военной академии ракетных войск стратегического назначения Сергей Хуторцев (на фото). Он учился Америку ракетами уничтожать, а вы тут со своим интернетом. Заработает скоро.

4CIO

14 Jan, 05:51


Белый дом обнародовал новое руководство по использованию и развитию ИИ

Администрация президента Джо Байдена обнародовала обновленные правила по использованию и развитию искусственного интеллекта (ИИ) с целью укрепления безопасности и экономической мощи США. Об этом сообщается в заявлении, опубликованном Белым домом.

Новое руководство упрощает лицензионные барьеры для крупных и мелких заказов чипов, укрепляет лидерство США в сфере искусственного интеллекта и вносит дополнительную ясность в вопрос о том, как развитие исследований ИИ способствует продвижению интересов союзников и партнеров Вашингтона.

В дополнение принятым ранее мерам контроля над чипами, новые правила препятствуют контрабанде в данной области и повышают стандарты безопасности при использовании ИИ.

@golosameriki

4CIO

13 Jan, 15:04


Kalshi (это такой стартап в стиле полимаркета, где можно делать ставки на любые события, например, на выборы в США) сначала был под пристальным наблюдением у разных правительственных агенств, а сегодня стало известно, что Дональд Трамп-младший назначен стратегическим советником в компании. Ну, чем бы дитя (президента) ни тешилось...

https://www.wsj.com/finance/regulation/prediction-markets-venue-kalshi-appoints-donald-trump-jr-as-adviser-98213149?st=51eEXL&reflink=desktopwebshare_permalink

4CIO

13 Jan, 13:34


Морской Телеком: спутниковый пост, Старлинк и Иридиум на одной площадке

4CIO

13 Jan, 12:03


Сегодня буквально на полчаса была доступна новая версия портала data.gov.ru, но очень быстро снова оказалось закрытой для проведения аттестационных мероприятий.

Даже несколько десятков минут было достаточно чтобы составить впечатление и мне так много что есть сказать об этом, что в короткий формат Telegram канала не уложиться ну никак.

Когда портал "оживёт" я подробно разберу его в рассылке на Substack.

Я ранее там разбирал портал открытых данных Узбекистана, а в телеграм канале писал про особенности портала открытых данных Кыргызстана.

А также несколько раз уже писал про отсутствие портала открытых данных в Казахстане.

Пришла пора и про российский портал рассказать когда (или если?) он оживёт вновь.

#opendata #data #russia #datacatalogs

4CIO

10 Jan, 06:29


Рубрика "Циничное реестробесие"
Вчера прислали ссылку на очередную новость из серии "В Госдуме предложили создать реестр" - на этот раз инициативный законодатель предлагает создать единый реестр специалистов по настройке телевизионного оборудования, смартфонов и другой техники.
У меня сразу же родилась целая серия идей в развитие:
- единый реестр сантехников,
- единый реестр лифтеров,
- единый реестр электриков,
- единый реестр уборщиков подъездов,
- единый реестр дворников.
Продолжать можно бесконечно. Но фантазию наших законодателей все равно не переплюнуть. Вот далеко не полный перечень реестров, которые предлагали создать наши слуги народа:
- реестр авиадебоширов (сентябрь 2024)
- реестр народных целителей (октябрь 2024)
- реестр инфоцыган, они же коучи и бизнес-тренеры (февраль 2022 и февраль 2024 - видимо, идея этого реестра обладает цикличностью),
- реестр тунеядцев (май 2023),
- единый реестр недружественных для россиян заграничных отелей (июль 2022),
- реестр артистов, которым будет запрещено принимать участие в проектах, финансируемых государством (январь 2023),
- реестр хронических акоголиков (июнь 2020),
- реестр патриотичных блогеров (ноябрь 2024),
- единый реестр наркоманов (ноябрь 2024),
- реестр частных аппаратов ИВЛ (март 2020).
И это я только 3 страницы результатов поиска по запросу "в Госдуме предложили создать реестр" пролистал.
Мне кажется, что победить это реестробесие (тм) можно единственной мерой - создать Единый реестр идиотских идей депутатов Госдумы (ЕРИД ГД). И заносить в этот реестр каждое предложение любого депутата, в котором есть слова "создать реестр". Поскольку идеи про реестры не всегда бывают идиотскими (я поэтому и зачеркнул это прилагательное в названии), на базе ЕРИД ГД нужно организовать расчет рейтинга идиотизма (тм) или коэффициента идиотской зрелости (тм) - и по достижении порогового значения конкретным депутатом-генератором реестроидей заносить такого депутата в отдельный Единый сводный реестр идиотов Российской Федерации.
Со всеми вытекающими, естественно

4CIO

09 Jan, 18:47


из текста выше понятно, что всем все раскроют.

4CIO

09 Jan, 18:45


Мессенджер Telegram теперь раскрывает правоохранительным органам IP-адреса и номера телефонов тех, кто нарушает правила, в ответ на обоснованные юридические запросы. Telegram официально раскрыл, что на конец 2024 г. ИТ-платформа выполнила 900 запросов правительства США, предоставив правоохранительным органам информацию о номерах телефонов или IP-адресах 2253 пользователей мессенджера.
https://www.cnews.ru/news/top/2025-01-08_telegram_na_900_zaprosov_vlastej

4CIO

09 Jan, 09:44


У Паши все хорошо. А вы боялись

4CIO

09 Jan, 09:44


Как я и говорил ранее - за будущее борцуна за швабоду агента Дурова, вернувшегося с холода, можно не беспокоится.
Бюро легенд на стиле

После ареста Павла Дурова Telegram передал властям США данные 2253 пользователей, сообщает 404 Media со ссылкой на отчет бота Telegram Transparency Report.

При этом запросы из РФ остаются без ответа — за первые девять месяцев 2024 года мессенджер не удовлетворил ни одного.

4CIO

07 Jan, 06:36


Убийца Mac Mini от Nvidia – Digits

Вы только гляньте, шустрая коробочка помещается на ладошке Хуанга!

128 GB оперативки, 1 петафлоп в fp4, 20 Arm ядер. На такой машинке можно инференсить модели вплоть до 200 млрд параметров. Можно соединить две такие малышки и запускать уже 405B модель.

Обещают выпустить в мае, цена вопроса - $3000.

Хочу себе такую домой! 🥺

@ai_newz

4CIO

03 Jan, 20:27


Пишут что генеалогический сервис MyHeritage 31 декабря предупредил пользователей из России об удалении их учётных записей с 1 февраля 2025 года [1]. Весьма вероятно что это связано со штрафом в 6 млн рублей в отношении MyHeritage за отказ от локализации данных российских пользователей [2].

Сервис постепенно уходил из России начиная с 2020 года, в 2020 году из-за ограничений на пересылку генетических материалов MyHeritage перестали присылать в Россию наборы для взятия генетических проб [3].

К сожалению, невозможно автоматизировано сохранить все удаляемые данные пользователей и, к тому же, они являются персональными данными, но если Вы пользователь MyHeritage и находитесь в России, на всякий случай стоит воспользоваться инструкцией и сделать резервную копию геномных данных, данных генеалогического дерева и всего остального что может исчезнуть.

Ссылки:
[1] https://habr.com/ru/news/871058/
[2] https://www.forbes.ru/tekhnologii/498511-sud-ostrafoval-myheritage-na-6-mln-rublej-za-povtornyj-otkaz-lokalizovat-dannye
[3] https://www.myheritage.com/help-center?a=Why-isn%27t-MyHeritage-sending-DNA-kits-to-Russia-anymore---id--B2WZDFjXR9CRdvZqGR86eQ

#genealogy #genetics #myheritage

4CIO

02 Jan, 11:22


TechCrunch: Telegram добавил сторонний способ верификации аккаунтов

– Верифицировать аккаунты смогут сторонние организации
– Например, органы по контролю качества продуктов и др.
– Вместо синей галочки они будут получать новый логотип
– Он будет указывать, какая организация дала верификацию
– Это новая децентрализованная платформа для проверки
– Решение позволит предотвратить мошенничество и др.
– Telegram также запустил несколько других новых функций
– Например, подарки теперь можно будет превратить в NFT
– За такое превращение Telegram будет взимать комиссию
– Она поможет покрыть расходы на транзакции в блокчейне
– Этими NFT можно будет торговать на других платформах
– Также теперь появились реакции на служебные сообщения
– Например, на сообщение про добавление человека к группе
– Появились новые поисковые фильтры для чатов и каналов

@ftsec

4CIO

31 Dec, 21:32


С Новым! Да пребудет с Нами ЧатГПТ во веки веков!

4CIO

28 Dec, 19:59


Хотите конфиденциальности? Покупайте "аналоговый" велосипед

Информация о передвижениях 800 тысяч электромобилей VW оказалась в открытом доступе из-за утечки. Данные специального приложения Volkswagen, которые должны помогать водителям управлять своим авто, в течение нескольких месяцев хранились практически в открытом доступе в облачном хранилище Amazon, пишет издание Der Spiegel. Речь идет о нескольких терабайтах данных с информацией о владельцах и их перемещениях. По данным журналистов, там можно было найти точные координаты 460 тысяч автомобилей VW, Seat, Audi и Skoda в Германии, Европе и других частях мира.

От утечки пострадали политики, бизнесмены, полиция Гамбурга с 35 электрическими патрульными машинами и даже сотрудники спецслужб. Никто из них не знал, что за их передвижениями можно следить онлайн. Например, легко можно было установить, отмечают журналисты, чья машина припаркована возле одного из зданий Федеральной разведывательной службы или каждый день приезжает на военную авиабазу ВВС США в Рамштайне.

Der Spiegel отмечает, что утечка произошла по ошибке дочерней компании VW Cariad, которая когда-то была создана для разработки платформы для всех электромобилей концерна. Об этой бреши в безопасности информатор сообщил IT-экспертам и журналистам. После их обращения к разработчикам, доступ к данным был закрыт.

4CIO

26 Dec, 10:16


Диалоги Бонгарда и Нюберга о построении машинного мышления (1957–1968)

Эпоха покорения космоса, заря компьютерной эры, еще совсем недавно (в 1953 году) совершили свое открытие Крик и Уотсон... Отсюда проистекал энтузиазм наших биофизиков: вот же она, универсальная машина Тьюринга, воплощенная в как раз «то, что требуется»: прочная молекулярная лента, универсальный биологический носитель информации. Разговоры (научно говоря, диалоги, а по факту — препирательства) двух уникальных личностей, Михаила Моисеевича Бонгарда и Николая Дмитриевича Нюберга, проистекали у нас на глазах. Мое описание будет носить характер подстрочника для сценария кинофильма о «науке, как она есть на самом деле» (вариант «…от первого лица»). Дело в том, что в то время были популярны романы Артура Хейли с краткими названиями («Аэропорт», «Отель»), навевающими нечто зеркальное: «Академия», «Институт», «Лаборатория». Итак…

https://www.trv-science.ru/2024/12/dialogi-bongarda-i-nyuberga-o-postroenii-mashinnogo-myshleniya/

4CIO

26 Dec, 09:45


Reuters: Microsoft планирует добавить новые модели ИИ для 365 Copilot не от OpenAI

– Microsoft добавит туда собственные и сторонние модели
– Она собирается диверсифицировать базовую технологию
– Также подобный подход поможет ей сократить расходы
– Microsoft намерена снизить свою зависимость от OpenAI
– Сначала для сервиса 365 Copilot запустили модель GPT-4
– При этом OpenAI остается партнером по новым моделям
– Для 365 Copilot могут внедрить модели с открытым кодом
– Конечную экономию Microsoft может передать клиентам
– Ранее модели Anthropic и Google уже интегрировал GitHub
– Сервис 365 Copilot используют 70% из списка Fortune 500
– По итогам года сервис получит 10 млн платных подписчиков

@ftsec

4CIO

25 Dec, 13:01


В российском Форбс статья [1] о том что гос-во в лице Минцифры запланировало сбор "обезличенных геотреков" со всех сотовых операторов обо всех россиянах. В статье мой комментарий тоже есть, а я добавлю тезисов тут:
1. Надо понимать что государство ключевой маркетмейкер всего что касается закупки данных, сервисов и геоаналитики. Разговоры про сбор данных в госозеро - это де-факто национализация данных, отъём их от участников рынка и предоставление госсервисов на их основе. Госсервисов которые будут монопольны и поубивают частные потому что ни у одного сотового оператора такой базы не будет. Закончится это тем что государство, либо создаст отдельный бизнес юнит для торговли такими сервисами, или делегирует одному из имеющихся госАО, госГБУ, госАНО и тд. Как бы ни был "тяжёл" частный рынок, монополия будет хуже. Акции всех сотовых операторов и будущие доходы тоже просядут.
2. Что бы там не говорили про обезличивание по геотрекам очень просто восстановить информацию о конкретном человеке. Объектами слежки, чтобы кто там ни думал, будут не рядовые граждане, а сами же чиновники. Ничто не помешает приходящим в РФ к власти "консервативным силам" вычислить всех министров, замминистров, директоров департаментов нетрадиционной ориентации и ловить их во время очередного рейда по ночным клубам. Это и сейчас не так сложно, получая данные от сотовых операторов, но с геотреками будет ещё больше.

Я бы тут ещё много тезисов добавил, но не могу, сбоит внутренний переводчик с простого русского просторечного на русский публицистический. Но, в общем, все меня поняли;)

Ссылки:
[1] https://www.forbes.ru/tekhnologii/527832-mesta-znat-nado-gosudarstvo-hocet-sobirat-mobil-nye-geodannye-rossian-u-operatorov

#regulation #russia #privacy

4CIO

24 Dec, 14:21


The Information: Google «нанимает» сотрудников стартапа Magic Leap

– Google «нанял» 100+ сотрудников стартапа Magic Leap
– Их наняли как подрядчиков для работы над Android XR
– Google хочет создать главную ОС для VR/AR-устройств
– Подрядчики также остаются сотрудниками Magic Leap
– Как именно Google оплачивает такие услуги неизвестно
– Формально зарплату подрядчикам выплачивает стартап
– Среди подрядчиков Google: инженеры, дизайнеры и др.
– Стартап несколько раз менял стратегию за последние годы
– Он на 51% принадлежит гос. фонду Саудовской Аравии
– Год назад Google думал над вариантом покупки Magic Leap

@ftsec

4CIO

20 Dec, 18:48


Показали новые o3 и o3-mini модели (o2 уже занятый бренд):

— Модели пока выпустили в Public Safety Tests, то есть ученые смогут помочь их тестировать, а мы не сможем помочь их ломать

— o3 работает на уровне доктора наук и иногда даже лучше в разных бенчмарках

— o3 прошла ARC-бенчмарк на 87.5%, сложный бенчмарк на котором тестируют потенциальные AGI, там много вопросов и некоторые похожие на IQ-тесты или на загадки; кожаные в этом тесте набирают ~85%, прошлый лучший результат был ~50%. То есть ARC-бенчмарк — пал.

— o3 работает также как и o1 в разных режимах: дольше думает, лучше ответ, но при этом и дороже. Пользователь может выбрать один из «думательных» пресетов сам.

4CIO

19 Dec, 11:42


Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.

Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась "имитировать согласованность" в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.

Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени "согласованности" модели с заданными принципами.

В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.

https://techcrunch.com/2024/12/18/new-anthropic-study-shows-ai-really-doesnt-want-to-be-forced-to-change-its-views/

4CIO

19 Dec, 09:28


Рубрика "Циничное гостеховедение"
Я давно и много пишу о Гостехе, но всё это как-то без системного подхода, доменов, клиентских болей и т.п.
Пришло время поставить мое стихийное гостеховедение на системную основу.
В качестве первого артефакта моего теперь уже системного гостеховедения представляю читателям "Ноосферу экосистемы платформы Гостех" версии 1.0. Много писать не буду - это тот случай, когда одна картинка лучше тысячи слов. Скажу только, что это далеко не финальный вариант - схема будет расширяться во все стороны.
PS. Как всегда - в посте КДПВ искореженного JPEG'ом качества (буквы разобрать можно, но не радует), а после поста PDF приличного вида для ценителей.
⬇️⬇️⬇️

4CIO

18 Dec, 19:24


🤩 GitHub Copilot теперь бесплатный

Всем пользователям GitHub, при использование VS Code, даётся 2000 дополнений кода в месяц и 50 сообщений к GPT-4o и Sonnet 3.5. Pro подписка за $10 всё ещё даёт сильно большие лимиты и доступ к o1-preview/o1-mini.

@ai_newz

4CIO

17 Dec, 11:31


Я прямо очень скептичен к text2video генерации в ее текущем воплощении. Но на глаз кажется, что Google, анонсировавший вчера модель Veo 2 явно обгоняет текущее состояние Sora от OpenAI. И вообще удивительно, но следующими после гугла идут опять же китайские компании. Посмотрите ролик (музыка Sora, видео Veo 2, слов нет). Там конечно всё еще сильно заметно, что это нейронка, но прогресс заметен на глаз https://blog.google/technology/google-labs/video-image-generation-update-december-2024/

4CIO

11 Dec, 18:19


Google объявил о выпуске Gemini 2.0 — новой версии своей языковой модели, которая теперь умеет не только понимать мультимодальный ввод (текст, изображения, видео, аудио), но и генерировать изображения и речь. Кроме того, модель получила встроенную возможность использовать инструменты вроде Google Search и выполнять код.

Самое интересное — Google начал активно экспериментировать с "агентным" подходом, то есть с системами, которые могут самостоятельно выполнять задачи от имени пользователя. Показали несколько прототипов:
- Project Astra — универсальный ассистент для смартфонов (и, возможно, очков)
- Project Mariner — агент для браузера, который может выполнять задачи в web-интерфейсах
- Jules — помощник для разработчиков, интегрированный с GitHub.

Пока всё это доступно только разработчикам и доверенным тестировщикам, широкий релиз планируется в начале следующего года. Интересно, что Google специально подчеркивает внимание к безопасности — например, браузерный агент может работать только в активной вкладке и требует подтверждения для важных действий вроде покупок.

Gemini 2.0 Flash уже доступна в интерфейсе пользователей с предупреждением, что это экспериментальная модель. Более того, она уже добралась до третьего места в ChatBot Arena, где на первом уже несколько дней находится экспериментальная Gemini Exp 1206. Я при этом как-то не могу распробовать эти модели — какого-то суперпрогресса по сравнению с исправно кодящим Claude 3.5 Sonnet не ощущается. Говорят, правда, что можно соптимизировать модель так, чтобы она зажгла в сравнении на Chatbot Arena, но вряд ли Google будет таким заниматься.

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

4CIO

09 Dec, 16:30


Зарплата курьера в Москве может подняться до 300 тысяч рублей в месяц, прогнозируют эксперты. Причины — предновогодний ажиотаж и катастрофическая нехватка сотрудников, добавляет Коммерсантъ. А если курьер ещё и на личном авто — его вознаграждение увеличивается до 400 тысяч рублей. @banki_economy

4CIO

08 Dec, 11:15


Я тут задумался над тем какие практические инструменты с LLM внутри я использую в работе и для чего хотелось бы использовать ещё. Хотелось бы, для многого конечно, но не всё ещё существует

Самое очевидное это переписывание текстов с помощью DeepL Write. Очень удобно для переписке и публикаций не на родном языке, поскольку сильно выправляет текст. Похоже на Grammarly, но ощущение что итоговый текст гораздо лучше и поддерживается не только английский язык. Главный минус пока только в том что поддерживаются только 8 языков. В любом случае очень удобно для публикации в англоязычных и других соцсетях

Совсем не такое очевидное, но важное для меня это сбор информации о дата каталогах. Это довольно специфическая лично моя задача по обновлению реестра каталогов данных в Dateno. Этот процесс на текущей стадии ручной, поскольку автоматизированный ранее собранных каталогов уже выполнен и оставшаяся часть работы - это ручная разметка. В частности вручную проставляется инфа по каталогу данных:
- название
- описание
- название владельца
- тип владельца (гос-во, муниципалитет, ученые и тд.)
- тематики
- теги

А также простановка геопривязки для тех ресурсов у которых её нет или если выясняется что они уровня регионов.

Это много ручной работы напрямую влияющей на качество данных в Dateno, поскольку тип владельца, геопривязки и тематики идут в фасеты поиска, а остальные поля отображаются в карточках датасетов.

Оказалось что Perplexity отлично выдаёт ответы на такие вопросы как:
- Who owns <> website ?
- About what this website is <> ?

А также, что очень практически удобно, Perplexity умеет точно отвечать на такие вопросы как "What is ISO3166-2 code of the Magallanes and Chilean Antarctica ?" и выдавать точный код.

Скорее всего Perplexity можно заменить на другую модель, но и текущие результаты вполне полезны.

Сейчас в Dateno около 18% (3.4 миллиона) наборов данных не имеют пометки типа владельца данных, а 2.4 миллиона не имеют привязки к стране/территории.

Это, в любом случае лучше чем у Google Dataset Search, но всё ещё недостаточно хорошо.

Применение LLM в повышении качества метаданных кажется очень реалистичной задачей.

#ai #thoughts #dateno #datasets #data

4CIO

07 Dec, 20:03


NYT: Руководитель Nvidia уклоняется от уплаты налогов на $8 млрд

– Он стал 10-м самым богатым человеком из США ($127 млрд)
– Наследникам будет нужно заплатить 40% налогов
– Хуанг также стал бенефициаром ряда налоговых махинаций
– Он сможет передать большую часть состояния без налогов
– Экономия для наследников Хаунга может составить $8 млрд
– Вероятно, это крупнейшее уклонение от налогов для США
– Похожие схемы внедряют топ-менеджеры других компаний
– Среди них Blackstone, Google, Coinbase, Mastercard, AMD и др.
– Без налогов передают наследство на $200 млрд/год в США
– В частности, богатые люди используют трастовые фонды и др.
– Хуанг впервые начал защищаться от налога около 12 лет назад
– Он создал безотзывный траст и перевел туда 584 тыс. акций
– Тогда они стоили $7 млн, сейчас они стоят около $3+ млрд
– Если их передать наследникам напрямую, налог – $1+ млрд
– Восемь лет назад Хуанг учредил новые трастовые фонды
– В четыре новых фонда было вложено 3 млн акций Nvidia
– Сейчас они стоят уже $15 млрд (налог был бы $6+ млрд)
– Также Хуанг использует инструменты благотворительности

@ftsec

4CIO

05 Dec, 19:17


Слухи оказались правдивыми - OpenAI запускает подписку за 200 долларов в месяц

Подписка даст доступ к o1 pro режиму - модели позволят дольше думать над запросами. Также дают неограниченный доступ к o1, o1-mini и Advanced Voice Mode.

Ещё o1 выходит из превью, релизная версия принимает на вход картинки и заметно лучше в математике и кодинге. Плюс она лучше понимает сколько нужно думать над таском - над простыми запросами теперь будет думать быстрее, над сложными - больше.

А ведь ещё ходили слухи о подписке за $2k в месяц ☠️

@ai_newz

4CIO

05 Dec, 14:29


Ведомости: IT-компании сообщают о росте числа вовлеченных в преподавание сотрудников

– В 2024 бигтех вовлекал в преподавание 900-1000 своих сотрудников
– В среднем, это 6-7% от всех профильных работников
– Число преподавателей среди сотрудников VK выросло на 15%, превысив 1000 человек в 2024
– Около 900 сотрудников Т-Банка обучали студентов в этом году
– В российских вузах и в ШАДе преподавало 800 сотрудников Яндекса

@ftsec

4CIO

04 Dec, 11:22


Уже несколько дней вокруг много обсуждений правительственного отчета США на темы Covid-19. В основном дискуссии идут вокруг выводов о происхождении вируса: в отчете сказано, что нет оснований считать его искусственным. Это мешает взваливать вину на виноватое во всем правительство Китая, поэтому активные конспирологи возбудились.
На мой взгляд, интересней другие выводы, о которых не любят говорить те, кто полтора года рьяно отстаивал масочный режим, социальную дистанцию и локдауны.
The report is also critical of common Covid mitigation measures. Social distancing and mask mandates were not based on hard science, the report says, and “prolonged lockdowns caused immeasurable harm to not only the American economy, but also to the mental and physical health of Americans, with a particularly negative effect on younger citizens. — надо заметить, это все не только к Америке относится.
the report also says that health officials and the Biden administration oversold the power of the vaccines to prevent transmission or infection, possibly contributing to the public’s lack of trust in Covid shots and in vaccines overall — еще одна тема, которую любят избегать те, кто ссылаясь на “науку” шеймил скептиков на тему вакцинации.
В целом, полезно прочитать вжимку:
https://edition.cnn.com/2024/12/02/health/house-covid-subcommittee-report/index.html
Кстати, еще год назад писал про интереснейший разбор всех этих антипандемийных решений, прикрывавшихся якобы научными доводами, но тогда он не вызвал большой волны. Вот пост здесь от ноября 2023:
https://t.me/techsparks/4250

4CIO

04 Dec, 10:07


Иногда взломы и атаки хакеров-вымогателей накрывают неожиданные цели. Вот, например, Stoli Group (это производители водки, да, "Столи" от "столичная"). Атака рансомвари вывела из строя их ERP, они не смогли закрыть потребности своих кредиторов и подают на банкротство. Кажется, банкротство касается только части их компаний, так что рижский бальзам, видимо, не пострадает.

Я алкоголь в принципе не люблю, но компания вообще не айтишная, а страдает от того же.

https://therecord.media/stoli-group-usa-bankruptcy-filing-ransomware

4CIO

29 Nov, 12:23


Биткоин пока не подходит для золотовалютных резервов России — председатель комитета Госдумы РФ по финансовому рынку Анатолий Аксаков. Он допустил возможность добавления биткоина в золотовалютные запасы России, но, по его словам, это случится «лет через 100». @banki_economy

4CIO

29 Nov, 07:57


Айтишники в России потеряют иммунитет от мобилизации. C 21 марта его сохранят его только силовикам и работникам гособоронзаказа. Для остальных компаний установят предельную численность работников, которых можно обеспечить иммунитетом от мобилизации.

Органы управления смогут забронировать до 95% сотрудников, а структуры, связанные с ЦБ, Росатомом или Роскосмосом, — до 85%. Все выданные брони утратят силу. @banki_oil

4CIO

22 Nov, 09:24


Нейросеть опасается инопланетян👽

Китайско-американский коллектив ученых натренировал нейросеть на прогнозирование взаимодействия с внеземными цивилизациями.

Программа-оракул выдает тревожный результат: если относительно рядом с нами есть агрессивная цивилизация, а еще и более технологически развитая, чем наша, она почти в 100% случаев захочет и сможет нас уничтожить.

Исходя из этого ИИ советует перестать землянам отправлять сигналы в космическое пространство и не отвечать, если кто-то «чужой» попытается выйти на связь.

Тайны Космоса 🔭

4CIO

21 Nov, 09:08


Это Питер … https://www.bbc.co.uk/news/articles/crr91exlwd8o?

4CIO

19 Nov, 16:50


TechCrunch: Венчурное финансирование европейских стартапов за 2024 сократилось до $45 млрд

– Финансирование после падения за 2023 стабилизировалось
– Ряд признаков указывает, что впереди будут трудные времена
– По итогам 2024 показатель все равно на $2 млрд меньше 2023
– На рынке ЕС работают 35 тыс. IT-стартапов на «ранней стадии»
– Также 3,4 тыс. на «поздней стадии» и 358 по оценке $1+ млрд
– Почти 10 лет назад их число составляло 7,8 тыс., 450 и 72
– Объем IPO стартапов за 2024 был $3 млрд, M&A – $10 млрд
– Иногда достаточно одного события, чтобы изменить весь год
– Например, IPO Arm на $65 млрд за 2023 дало 92% от всех IPO
– Долговое финансирование восполняет дефицит инвестиций
– Оно дало уже 14% от венчурных инвестиций на $4,7 млрд
– По итогам 2023 его объем составлял $2,6 млрд (доля 5,5%)
– Сред. размер для раунда A за 2024 составил уже $10,6 млн
– Для раунда серии B было $25,4 млн, для серии C – $55 млн
– Число стартапов, получивших деньги за 24 мес., упало на 20%
– Стартапы из ЕС оценивают ниже аналогов из США на 29-52%
– Их сред. оценка составляет $155 млн против $218 млн из США

@ftsec

4CIO

16 Nov, 14:37


В России наблюдается резкое снижение числа пользователей Snowflake

В начале ноября команда разработчиков Snowflake (Pluggable Transport для браузера Tor, который работает на основе WebRTC) заметила значительное снижение числа пользователей из России. Первоначально предполагалось, что это связано с недавним обновлением сертификатов для доменов Fastly, использующихся в качестве domain fronting Snowflake. Однако дальнейший анализ показал, что блокировка не связана с каналом связи rendezvous, и падение активности не совпадает по времени с обновлением сертификатов.

Тестирование также не выявило следов ранее применявшегося в России блокирования через DTLS-фингерпринтинг, который был замечен в 2021 году, когда со Snowflake боролись.

Разработчики продолжают исследовать ситуацию и пытаются выяснить, каким именно образом происходит блокировка.

4CIO

15 Nov, 13:22


Прокуроры 18 американских штатов решили не откладывать на январь то, что можно предъявить в ноябре, и подали иск к SEC и его главе Гэри Генслеру за нарушение конституционных норм и превышение полномочий в регулировании крипты. Комиссия по биржам и ценным бумагам обвиняется в том, что без одобрения Конгресса в одностороннем порядке перебрала на себя полномочия, в том числе принадлежащие штатам, в части расследований и действий, направленных на криптоиндустрию (её называют индустрией цифровых активов).

Все прокуроры, принявшие участие в иске, во главе с генеральным прокурором штата Кентукки — республиканцы. Требование иска заключается в заморозке возможностей комиссии предпринимать какие-либо действия в отношении компаний, оперирующих цифровыми активами. Вопрос об ответственности SEC и персонально её главы не ставится. Возможно — пока.

https://decrypt.co/291746/sec-gary-gensler-sued-crypto-crackdown

4CIO

12 Nov, 20:41


📏Шкала Кардашева — метод измерения уровня технологического развития цивилизаций, разработанный советским астрофизиком Николаем Кардашевым. Он делит гипотетические цивилизации по количеству энергии, которое они умеют получать и использовать, на три типа.

🌍 Представители I типа собирают, хранят и используют всю доступную энергию своей планеты;
☀️ II тип — умеют потреблять энергию своей звезды;
🌌 III тип — улавливают энергию со всей своей галактики.

Кстати, человечество по этой шкале еще не дотягивает даже до I типа. Американский астрофизик Карл Саган предложил к шкале Кардашева формулу, по которой рассчитал, что мы находимся примерно на отметке 0,72.

Тайны Космоса 🔭

4CIO

11 Nov, 13:34


Эппл внедрили очень простую, но невероятно важную штуку — теперь, если телефон не используется в течение продолжительного времени (например, 2-3 дня), он автоматически перезагружается. Это нужно для того, чтобы сбросить настройки, выкинуть из памяти лишнее, заново заблокировать всё в телефоне и т.д., короче, это элементарная мера, позволяющая резко повысить безопасность, особенно если злоумышленники или спецслужбы завладели вашим телефоном.

Прямо надеюсь, что остальные производители сейчас сделают то же самое. Мера элементарная, а осложняет жизнь вредителям очень сильно.

https://www.404media.co/apple-quietly-introduced-iphone-reboot-code-which-is-locking-out-cops/

4CIO

08 Nov, 09:23


Вчера случилось принять участие в разговоре про сценарии использования умного дома — и участники (включая меня) грустили по поводу ограниченности этих сценариев (особенно если не рассматривать связанные с медиапотреблением).
А сегодня натыкаюсь на интересный сценарий, который вчера никому из нас в голову не пришел: умная колыбель.
И правда — колыбелька, которая умеет малыша именно так укачивать, как ему нравится — и по его движениям ловить тот момент, когда он готов расплакаться, но еще не начал это делать и укачивание способно предотвратить плач — великая вещь. Если получится, конечно, но искушенные инвесторы из a16z в это верят и вкладываются. А их слова “a new wave of ‘parenting co-pilots’ built with LLMs and agents” очень хорошо иллюстрируют, какие домашние сценарии мы пропускаем, увлекшись решением, в общем, скорее профессиональных чем семейных задач.
https://techcrunch.com/2024/11/07/ai-powered-parenting-is-here-and-a16z-is-ready-to-back-it/

4CIO

03 Nov, 10:59


The Verge: GitHub Copilot будет поддерживать модели от Anthropic, Google и OpenAI

– GitHub внедряет несколько моделей для своего Copilot
– Разработчики смогут выбирать модели других компаний
– Пока речь идет про модели от Anthropic, Google и OpenAI
– Первой там будет доступна модель Claude 3.5 от Anthropic
– В ближайшие недели появится Gemini 1.5 Pro от Google
– Позднее появятся GPT-4o, o1-preview и o1-mini от OpenAI
– Переключаться между ними можно во время общения
– Можно выбрать ИИ, который лучше для каждой задачи
– GitHub Copilot привлек уже 1+ млн платных подписчиков
– Сервис также анонсировал свой новый инструмент Spark
– Spark на базе ИИ упрощает создание веб-приложений

@ftsec

4CIO

31 Oct, 11:21


Forbes: Власти смогут запрашивать у бизнеса данные по любому поводу

– Речь идет про данные, которые надо передавать в «госозеро»
– Власти смогут запрашивать обезличенные перс. данные клиентов
– Также они смогут запросить обезличенные данные сотрудников
– В случае, если они нужны для «защиты населения и территорий»
– Данные могут запросить для предупреждения терроризма и др.
– Есть возможность запросить их при введении карантина и др.
– Болезненную реакцию бизнеса вызывают два других пункта
– Это запрос данных для экономич. и социальных исследований
– Также для мероприятий госпрограмм, нац. и фед. проектов и др.
– Т.е. запрашивать данные можно «фактически в любых случаях»
– Это будет правовая неопределенность и регуляторная нагрузка
– Т.к. оператором перс. данных является почти любая компания
– Очень важно не скомпрометировать данные внутри «госозера»
– Нужна методика оценки целесообразности для исследований
– Также нужны механизмы против злоупотребления запросами
– Ситуации и сроки для запросов должны надо регламентировать

@ftsec

4CIO

31 Oct, 07:42


остальные 38 промолчали https://www.forbes.ru/tekhnologii/524135-62-krupnejsih-kompanij-stalkivautsa-s-problemami-pri-vnedrenii-rossijskogo-po

4CIO

30 Oct, 09:54


А что там Аврора? 480 ярдов против 13 гибкого планшета, уже во всех 800 устройствах установлена?

4CIO

30 Oct, 09:44


Ну вот и наконец Зоркий глаз заметил, что в сарае стены не хватает. Осталось законодательно обязать правообладателей торговать правами от себя лично. Ну и лет через несколько отменить AS-IS.

4CIO

30 Oct, 08:49


“Счетная палата выявила факты закупок госкомпаниями одного и того же софта при примерно одинаковых объемах лицензий и условиях лицензирования, но «на абсолютно разных ценовых условиях». Счетная палата увидела в таких действиях недобросовестность как со стороны заказчиков, так и со стороны разработчиков.” — Министр цифрового развития Максут Шадаев

4CIO

30 Oct, 06:53


#Копаясь_в_архивной_пыли
Рукописи не горят а документики всплывают.

Из бесед на темы истории IT. Был ли библейский поиск — первым протояндексом Воложа? Не был!

В 1986 году («первый», а будет ещё и второй) Аркадий, т. е. Волож работал у Сергея Недоруба над системой поиска по базам изобретений и патентов, а также косвенно стоял около завоза тайваньских компьютеров в СССР через Австрию. Вот этот проект и был Первым, если можно так сказать Протояндексом v 1.0.

Смешно, но он до степени неразличимости напоминает современные движения в отрасли! И сейчас код совмещается с необходимостью завозить электронику. Железо и завозят по схемам, и Снова через Австрию (де юре, так устроены схематозы; физически конечно нет).

В конце 80-х годов второй (!) Аркадий, также известный как «Американский Аркадий» Борковский выходец из ParaGraph, и он появился рядом с системой поиска по изобретениям.

Во Второй раз проект, протояндекс v 2.0 был шире первого захода и система уже чётко продавалась государственным учреждениям, вузам и крупным предприятиям. Вторая система была круче и держала в индексе «Международную классификацию изобретений», а не только советскую, например… Впрочем лично я не знаю границ первой системы, а прочесть о ней негде. У дурачков история Яндекса начинается в 90-е, а не десятью (если не двадцатью) годами ранее.

Как бы там ни было… К 1993 году кооператив двух Аркадиев «Аркадия» исчерпал себя, но поисковый движок, разработанный в его рамках, восходивший вообще к академической науке, к частотному (кажется?) словарю Зализняка, совершенно не исчерпал! С исторической точки зрения можно сказать, что поиск только-только и вышел на Нулевой этап своего развития, несмотря на минимум 7-8 лет работы над ним ранее и даже продажи.

В это время активизировался Комптек, основанный в 1989 году Джоном Бойнтоном и Робертом Стабблбайном. Именно для переговоров с Комптеком у Воложа, кстати, появился первый в жизни email. С Комптеком в 1993 году активизировался и появился Илья, но только не Сегалович! Он то и ранее был. А второй Илья — Гриц. Гриц был вовсе не «чужим человеком» в истории, как может показаться, ведь, иногда кажется, что он появился со своей Библией из вакуума.

Нифига! Поскольку упомянутый Роберт Стабблбайн был женат на родственнице одного из потомственных иерархов русской православной старообрядческой церкви, библейская тема для причастных, самих причастных вообще нифига не удивила. Были люди — появилась тема; появился тематический продукт.

Важно! Упомянутый Джон Бойнтон, кроме участия в протоЯндексе, также стоял за приватизацией банков «Россия» и «Ленбанка» (бывшего «Жилсоцбанка»), которые позже стали современными известными нам «Россией» и «Банком Санкт-Петербург».

Прикол. Бойнтон также познакомился с Владимиром Путиным, который в то время был заместителем Собчака, мэра Санкт-Петербурга. Это знакомство объясняет появление в совете директоров настоящего Яндекса, который де-юре и появится-то ещё не скоро, таких фигур, как Александр Стальевич Волошин и Герман Оскарович Греф, старинных знакомых Бойнтона. Здесь снова, как с Библией. Для сторонних наблюдателей Волошин и Греф — это загадка. Но для людей понимающих — они ни разу не удивительны. Они закономерны.

Итого. К исходному возвратимся. Если надо рассчитаться на «Раз, Два, Три», то:

Библейский протояндекс Воложа — это Третий протояндекс, а не нулевой.

4CIO

29 Oct, 21:28


По-настоящему крутая новость — в Github Copilot появится поддержка не только моделей от OpenAI, а и Claude 3.5 или Gemini от Google. Они появятся сначала в Copilot Chat в ближайшие недели.

Кроме того, в Github Copilot Chat уже появилась поддержка моделей o1-preview и o1-mini — их можно протестировать как в веб-версии, так и IDE, например, в VS Code. А для любителей code review теперь можно попросить модель сделать code review.

В public preview выложены также Models — доступ к разным LLM на платформе Github.

Это всё анонсы с проходящей сейчас конференции Github Universe, но это еще не все анонсы. Показали также приложение Spark — это средство для разработки микроприложений с помощью AI и английского языка. Вы запускаете редактор, которому выдаете начальный промпт, приложение генерирует код и далее вы опять же человеческим языком выдаете указания, как это модифицировать. Результатом в виде spark можно быстро поделиться.

Пока Spark находится в стадии technical preview и доступ к нему ограничен, так что записывайтесь в waitlist.

https://www.theverge.com/2024/10/29/24282544/github-copilot-multi-model-anthropic-google-open-ai-github-spark-announcement

4CIO

28 Oct, 07:40


Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP 

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории.

Что за ABBYY и при чем тут лингвисты и NLP?

История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод. 

На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым

Что пошло не так?

В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения. 

C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.

Какие уроки мы извлекаем?


За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией. 

И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.

🤖 «Системный Блокъ» @sysblok

4CIO

25 Oct, 05:54


Самый действенный способ повысить эффективность в компании — это избавиться от HR, особенно тех, кто настаивает на возвращении сотрудников в офис. Эти люди часто продвигают свои идеи, стремясь вернуть всех в офисное пространство для мониторинга непонятных никому, кроме них, показателей. Они вводят требования по дресс-коду, устанавливают строгие пропускные режимы и организуют ненужные тренинги. После пандемии многие из таких сотрудников, возглавив руководящие должности, стали вновь навязывать "традиционные" офисные порядки тем, кто научился эффективно работать и жить автономно. Эти методы возвращают рабочий процесс к устаревшим моделям, которые не соответствуют новым реалиям удаленной работы.

4CIO

24 Oct, 22:19


https://www.phoronix.com/news/Linus-Torvalds-Russian-Devs

4CIO

23 Oct, 16:54


Ловите разговор с Серёжей Нурком, который руководит группой биоинформатики в Oxford Nanopore Technologies.

Как и зачем читают геном? Как секвенирование становится доступнее и меняет медицину?

Очень бодро вышло. Напишите в комментариях, надо ли ещё. Мне кажется, с Серёжей надо или несколько эпизодов, или разговор на пару-тройку часов.

https://youtu.be/WYYTm2Ivo7A?si=V03bMGfhXjlYYPRJ

4CIO

21 Oct, 06:40


Охота на криптанов продолжается.
Вот не учит чужой опыт ничему. Стоило бы помнить -
"А с Дона выдачи нет"

Эксклюзив по Диме Васильеву exCEO WEX.


Дима арестован Интерполом в Варшаве по ордеру США в связи с обвинениями в помощи по уклонению от антироссийских санкций. Запущен процесс экстрадиции. С ним работают местные адвокаты, его проекты в надежных руках его ближайших партнеров. К сожалению, его телефон распаролен и захвачен (он пытылся показать, что у Казахстана к нему нет претензий). Это пока вся информация

4CIO

20 Oct, 07:40


В ByteDance стажёр обиделся и два месяца саботировал тренировочные раны соседней команды, причём весьма изощрёнными методами:

Загружал чекпоинты с бекдором, через который проносил скрипт, который рандомно убивал джобы на ноде (ckpt - это pickle файл, они могут содержать произвольный код на питоне)

Специально добавлял баги в форк PyTorch, который запускался на кластере

Портил чекпоинты, чтобы результаты экспериментов не сходились

При всём этом он участвовал в митингах, где пытались отловить проблему, слушал, как коллеги пытаются решить её, и на основе услышанного придумывал новые способы саботажа. В итоге поймали по логам, но два месяца и усилия почти 30 человек пропали впустую. А у вас что-то такое было?

П.с. кроме шуток, мощный чел оказался.

@ai_newz

4CIO

19 Oct, 17:00


В понедельник на NASDAQ возобновятся торги акциями компании Nebius Group N.V. под тикером NBIS.

Ранее это был тикер YNDX, если вы понимаете, о чем я.

https://group.nebius.com/newsroom/nebius-group-announces-planned-resumption-of-trading-on-nasdaq-and-provides-investor-update

4CIO

18 Oct, 08:02


Заплатил Бразилии, теперь будет платить всем. https://t.me/ftsec/13871

4CIO

17 Oct, 12:08


Профи, опять пузырь надувают, потом будут издержки сокращать. https://t.me/ftsec/13858

4CIO

16 Oct, 13:09


Луи Брайль изобрел язык Брайля для слепых в 15 лет
Луи Брайль родился во Франции в 1809 году и ослеп в возрасте 3 лет. Однако Брайль не позволял своему состоянию ограничивать его возможности.

Во время учебы в Королевском институте слепой молодежи в 1824 году Брайль познакомился с Чарльзом Барбье, офицером, который разработал «сонографию» - систему письменного общения, основанную на рельефных точках.

Барбье разработал свою систему с расчетом на французскую армию, 15-летний Брайль полагал, что аналогичный метод может быть использован слепыми людьми, и поэтому он занялся созданием того, что сейчас известно как «шрифт Брайля».

*️⃣ WHO is WHO

4CIO

16 Oct, 09:34


https://t.me/veter_armagddona/354

4CIO

15 Oct, 17:44


Китайские учёные взломали военную криптографию с помощью технологии квантового отжига. Они атаковали AES-256 — надёжный военный стандарт криптографии, а также алгоритмы банковского и криптовалютного стандарта

Квантовые машины станут доступнее и под угрозой могут оказаться банки и криптопроекты

Это первый случай, когда настоящий квантовый компьютер представляет реальную и существенную угрозу для множества полномасштабных структурированных алгоритмов SPN, используемых сегодня

Сам квантовый компьютер D-Wave Systems с трудом можно назвать квантовым

Он использует принцип квантового отжига — работает на поиске энергетических минимумов, что в физике соответствует стремлению атомов к наименьшему энергетическому состоянию

Всё, что осталось после обработки — «прогорания» — данных и есть искомый результат. Учёным нужно было лишь создать математический аппарат для обработки данных в нужном для них направлении

Такой аппарат с привлечением ИИ был создан, но он не универсальный и это затрудняет практическое использование квантовых платформ сегодня, в том числе, для успешного взлома AES-ключей

https://3dnews.ru/1112371/kitaytsi-ispolzovali-kvantoviy-kompyuter-dwave-systems-dlya-vzloma-aesalgoritmov-u-nih-pochti-poluchilos

4CIO

13 Oct, 10:25


21 сентября 1937 года вышел "Хоббит" Джона Рональда Руэла Толкина. Повесть получила признание критиков, номинацию на медаль Карнеги и приз за лучшую детскую фантастику от New York Herald Tribune.

Издатели требовали больше произведений о хоббитах, и Толкин начал работу над "Властелином колец", которая сильно затянулась. Книга был опубликована только в 1954 году, когда писатель уже собирался на пенсию.

В ходе работы над трилогией досталось и "Хоббиту". Толкин решил переработать его, сделав более серьёзным и вдумчивым. Писатель хотел поменять весь тон повествования, чтобы он более соответствовал эпичному "Властелину колец"

Например, момент, где Бильбо играет с Голлумом в загадки, не соответствует тексту первого издания книги. В конце Бильбо побеждает Голлума, а когда тот понимает, что потерял свое кольцо, то злится и преследует Бильбо по пещерам. В самом первом издании книги Бильбо и Голлум расстаются мирно. Голлум просто признает поражение и отпускает Бильбо с миром. Толкин изменил эту часть, чтобы она более соответствовала характеру Голлума из трилогии "Властелин колец".

На изображении рисунок Толкина, выполненный для суперобложки «Хоббита»

4CIO

12 Oct, 09:18


ФБР читает зашифрованные end2end Whatsapp-чаты. А также очень вольно себя чувствует в личных и приватных чатах Телеграм, но похоже что не в секретных.

Многие видели новости, что 8 октября 2024 года в Португалии задержали Алексея Андрюнина, CEO криптовалютного "market making" сервиса Gotbit.io. Обвинение, что фиктивной торговлей за деньги завышали цену токенов, а дальше отмывали полученные деньги.

Теперь к самому интересному. Это было только частным эпизодом одной большой новости, а именно:
Восемнадцать человек и организаций обвинены в ходе международной операции, направленной на широкомасштабные мошенничество и манипуляции на рынках криптовалют.

Если понажимать на имена людей - открываются документы по каждому из них или их организациям, также есть еще документы SEC (Комиссии по ценным бумагам США) 1, 2, 3, ...

А внутри документов прекрасное:
- цитаты из личных переписок Whatsapp
- цитаты из групповых переписок Whatsapp
- цитаты из личных переписок Телеграм
- цитаты из групповых переписок Телеграм
- диалоги из видеоконференций


И можно было бы предположить, что взломали какого-то одного фигуранта дела, и оттуда все потекло. Но нет, цитаты из личных переписок разных людей, цитаты из внутренних телеграм-групп разных организаций, где люди не пересекаются вообще.

Почему это не пегасус или что-то подобное, примененное к разным людям?
Публичные телеграм-группы есть в сообщениях о каждом деятеле, но нет секретных чатов. Были бы секретные чаты - было бы больше похоже на взлом гаджетов, пегасус, вот это всё. Но их нет, только доступные администрации Телеграм личные чаты и групповые чаты. Поэтому и сообщения из Whatsapp выглядят без секретных чатов телеграм - странно. Могли ли все эти люди не использовать секретные чаты или ставить в них функции самоудаления? Да, могли, но обычно люди где-то ошибаются и какие-то секретные чаты должны были остаться.

Какие выводы из этого можно сделать?
Точных выводов никаких, т.к. выше есть много допущений, но мы видим множество документов из одного расследования про 18 человек с цитатой переписок из разных мессенджеров, в том числе из личных переписок.

А это значит, что с большой долей вероятности:
- Телеграм передает содержимое чатов, до которых администрация мессенджера может дотянуться (что мы тоже предполагали, раз могут, значит делают)
- Есть еще какой-то софт для online-конференций, который позволяет подсматривать (также не удивительно)
- Секретные чаты похоже действительно работают :)

И кстати, Павла Дурова арестовали 24 августа в Париже, документы датированы как июнем этого года, так и сентябрем. Так что похоже с арестом это не связано.

Upd. WhatsApp вероятнее всего был получен из бэкапа на Google drive или iCloud

4CIO

12 Oct, 09:16


Завершилась Нобелевская неделя и, безусловно, премия по физике собрала наибольшее число противоречивых комментариев. От самых разных представителей физического научного сообщества приходилось слышать примерно следующее: «Премию по физике дали математикам, это безобразие! Нобель не учреждал премию для математиков! Нобелевский комитет поддался на общий хайп, который возник вокруг инструментов искусственного интеллекта после появления ChatGPT!».

Я не принадлежу к числу таких критиков. Почитайте подробно обоснование присуждения премии по физике этим двум ученым (я давал ссылки в посте от 8 октября). Нобелевский комитет, по сути, признал, что корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики, а не в головах чистых математиков. А затем Хинтон сделал следующий шаг, во многом обусловленный представлениями статистической физики – не случайно он назвал свою модель «машина Больцмана».

Поэтому я бы предложил посмотреть на эту проблему с другой стороны и просто считать физикой (в широком смысле этого слова) изучение искусственного интеллекта и нейросетей, преподавать соответствующие курсы студентам-физикам. Существуют же на физических факультетах кафедры биофизики, геофизики, химической физики и т.д. Кстати, я думаю, что ученые с физическим образованием могут привнести новые акценты в эту область по сравнению со специалистами по «computer science». Как это в свое время сделали лауреаты Нобелевской премии по физике этого года.

Достойная задача, от которой физикам не уйти – как сделать так, чтобы искусственный интеллект выдавал не просто наиболее вероятный, но правильный ответ, не противоречащий фундаментальным физическим законам. Скажем, большим языковым моделям типа ChatGPT в этом смысле доверять нельзя, ответы можно использовать лишь как подсказку, но надо все перепроверять.

В этой связи напомню, что хайп вокруг искусственного интеллекта начался после того, как глава компании Open AI Сэм Альтман принял решение о предоставлении широкого доступа всем желающим к ChatGPT. Судя по всему, в компании были и другие мнения на этот счет. Считалось, что этот инструмент небезопасен, поскольку дает ложные ответы. И, возможно, именно этим обусловлено одно из первых высказываний Джеффри Хинтона в статусе лауреата Нобелевской премии.

Признав, что его «машина Больцмана» сама по себе сейчас не используется, он сказал, что его исследования продолжили и развили его ученики. И далее: «Мне особенно повезло, что у меня было много очень умных студентов, намного умнее меня, которые действительно заставили все работать. Они продолжили делать великие дела. Я особенно горжусь тем фактом, что один из моих студентов [Илья Суцкевер] уволил Сэма Альтмана, который был нацелен исключительно на получение прибыли».

https://www.ferra.ru/news/techlife/kryostnyi-otec-ii-obvinil-glavu-openai-v-neuyomnom-zhelanii-deneg-09-10-2024.htm

Будущее покажет, кто тут прав. Альтман опять во главе Open AI, Суцкевер создал свою компанию, а без шума вокруг ChatGPT Хинтон не стал бы Нобелевским лауреатом. Одно несомненно – эта область нуждается во вкладе со стороны физиков.