Приключения социолога и единороги @dubr1kkk Channel on Telegram

Приключения социолога и единороги

06 Feb, 10:24

Был обнаружен Сергей Владимирович

Приключения социолога и единороги

06 Feb, 05:37

А где новые посты?
А вот и он

Сегодня выступаю на дне науки Академии с новым механизмом по обработке данных о работе преподавателей, ну вернее о работе преподавателей глазами студентов, так что по классике ждите кружочки со сцены 😜

471

Приключения социолога и единороги

02 Feb, 10:47

Ну надо же, смотрите, что Яндекс сделал с редактором документов своих.
Навели красоту, так сказать

906

Приключения социолога и единороги

30 Jan, 19:09

Фото со вчера были
А сегодня я вот так выглядел...

787

Приключения социолога и единороги

30 Jan, 13:41

А вот и фотографии со вчера)

744

Приключения социолога и единороги

30 Jan, 10:44

Маленькому Серёже огромный бейдж Сергея Владимировича

715

Приключения социолога и единороги

30 Jan, 10:13

Вчера был в Сенеже рассказывал про ИИ и общался с коллегами по педагогическому цеху! Очень рад, что тема вызывает живой интерес и продолжает обрастать дискуссиями.

Сегодня еду в национальный центр Россия разгонять про ИИ и пользовательский опыт.

Учебный год ещё не начался, а я вот уже на таком движе, что хочу кофе в вену.
Держу в курсе 😎

700

Приключения социолога и единороги

17 Jan, 21:53

Немного о стратегиях заработка великих и неповторимых OpenAI

419

Приключения социолога и единороги

13 Jan, 09:28

Вот, кстати, да всех, кто хочет играться в текстовые нейронки классно и бесплатно — есть вот такой сервис

Сайт предоставляет удобный интерфейс и несколько моделей семейства Qwen. Работает без VPN, поддерживает русский язык, документы, картинки и видео для анализа.

Qwen зарекомендовали себя очень хорошо и с точки зрения знаний, и с точки зрения качества ответов на русском языке, так что рекомендую.

849

Приключения социолога и единороги

09 Jan, 19:52

Знаете, так уж сложилось, что все локальные языковые модели я традиционно тестирую через просьбу рассказать анекдот

Не знаю как вам, но мне кажется это подлинный восторг

Входит мужик в бар и говорит: "Два пива, пожалуйста!" Бармен отвечает: "У нас сейчас акция — одно пиво бесплатно при покупке двух." Мужик задумывается и говорит: "Тогда давайте три!"

Надеюсь, это вызвало улыбку! Если хотите услышать что-то другое или на определённую тему, дайте знать.

А пошутила модель t-pro-it от Т-Банка

1,055

Приключения социолога и единороги

09 Jan, 10:13

Этот канал вместе со мной торжественно возвращается из отличного отпуска, в рамках которого я очень неплохо отдохнул.
Готов поделиться первой разработкой в этом году, смысл которой в том, что она читает текстовые работы, оценивает их по загруженной системе оценивания, собирает таблицу с результатами по критериям и фидбэк по каждой работе.

Пытаюсь понять: я воскресаю как препод или, наоборот, умираю как препод)))
Ну и скриншот для затравки

823

Приключения социолога и единороги

03 Jan, 17:25

Новый год начался с приключений

Ну в самом деле это был бы не я, если бы все просто было круто и классно.

2 января 2024 года, то есть ровно год назад, я обновил видеокарту и поставил себе RTX 3090 в комп. Для всех непосвященных: видеокарта используется в компьютере для вывода изображений и выполнения огромного количества математических операций, которые нужны при работе с искусственным интеллектом и анализом данных. Все было хорошо: Whisper распознавал аудиофайлы, Stable Diffusion рисовал крутые картинки, я в этот момент улыбался и радовался. Как вы знаете, я сильно загорелся исследованиями в области генеративных моделей искусственного интеллекта, но не научными, а скорее так... проверяю границы возможностей на примере своих задач и задач моих коллег и студентов. Параллельно что-то постоянно выдумываю и тестирую. В общем, все это привело к тому, что компьютер дома работал 24/7, а я, перемещаясь по Москве и России, постоянно заставлял его мне что-то считать и так далее.

Наступил значит 25 год, 2 января, я сижу за компьютером и думаю: пока идут новогодние праздники, почему бы не вызвать мастера, ведь я уже давно подумывал сменить охлаждение на процессоре, заменить термоинтерфейсы на видеокарте, чтобы она чуток поменьше грелась, ну и по мелочи пыль вычистить, радиаторы почистить.

И вот приезжает значит мастер и говорит, что компьютер в очень грустном состоянии, весь зарос пылью, блок питания скоро может бахнуть из-за огромного количества пыли внутри, а у видеокарты протекли те самые термоинтерфейсы, и вся видеокарта покрылась влагой. И это все при том, что я слежу за своими игрушками, а тут кажется недооценил масштаб проблемы.

Ну я расстроился, ясное дело, и начали мы с мастером думать, что делать.

Примерно через час, а время было около 18:00, уже была найдена новая карта RTX 4080 и отправлена мне курьером из загородного отеля Radisson (это вообще отдельная песня, благо знакомые продавцы возят железо с собой). Мастер же уехал в свою мастерскую пилить корпус (потому что новое охлаждение в него не залезало), чистить внутрянку компа и блок питания.

Сегодня с утра, когда мастер приехал с буквально новым компом, в котором все было прочищено, смазано, поставлено новое охлаждение, мое расстройство сменилось на восторг, которым с вами делюсь! А вы накидайте реакций.

Кстати, мастера зовут Юрий, оставляю его телеграм. Если честно, это самый рукастый и приятный в общении мастер, с которым мне доводилось сотрудничать.

С новым годом!

1,267

Приключения социолога и единороги

02 Jan, 10:55

Одно из последних в 24 году... Когда нужно срочно закончить проект 😁

808

Приключения социолога и единороги

31 Dec, 21:03

С новым годом!!

819

Приключения социолога и единороги

31 Dec, 18:46

На самом деле мне было охренительно сложно начать писать этот пост, но всё же пора поставить точку в этом году.

Прежде всего хочется сказать, что в 2024 году у меня появилась новая розовая шапка, а это говорит о том, что несмотря на возросшее количество обращений ко мне по имени и отчеству, серьёзнее я не стал, и это мне нравится. Жизнь по-прежнему остаётся для меня приключением. Правда, в этом году я осознал, насколько оно может быть непростым.

Вчера моя психотерапевтка Анастасия Павловна Уколова (минутка полезной рекламы) помогла мне убедиться в том, что год получился неплохим: я наконец-то научился ценить себя, говорить "нет" и не ввязываться в бесполезные истории. И речь не о том, что я стал законченным эгоистом. Скорее, высвободил больше ресурсов для осознанного альтруизма, за что говорю себе огромное спасибо!

Первая половина года выдалась тяжёлой. Я дважды лежал в больнице: сначала на фоне физического и эмоционального истощения на работе, затем сделал операцию на нос и выяснил, что дышать полной грудью — это действительно прекрасно.

Ещё из важного: мы с замечательной командой начали развивать бакалаврскую программу "Цифровые коммуникации и искусственный интеллект". В рамках повышения квалификации совместно с Исследовательским центром искусственного интеллекта обучили студентов и преподавателей осознанному использованию современных цифровых технологий и ИИ.

В этом году я участвовал в нескольких исследованиях в области искусственного интеллекта, не забыв про социально-гуманитарные корни. Вместе с моими хорошими подругами мы провели клевое исследование по актуальным компетенциям в медиасфере.

Начал активно развивать публичность, выступил на крутых конференциях в области социологии и ИИ, посетил несколько городов России и наконец-то побывал в отпуске. Кстати, понял, что это нужная и важная штука))

В этом учебном году начал преподавать новые дисциплины по акторно-сетевой теории и технологиям искусственного интеллекта, а также столкнулся с серьёзным, но интересным вызовом под названием "Отделение гуманитарных и социальных наук", но об этом — в следующем году.

Наконец-то научился разграничивать рабочее и личное пространство.

В этом году я чётко определил, каких людей хочу видеть рядом, а с кем даже не стану пить кофе. Я рад, что из моей жизни ушли некоторые люди, от которых было больше проблем, чем тепла. Это позволило открыть новые горизонты своих человеческих и интеллектуальных способностей.

К концу года увлёкся программированием и написал несколько программ, связанных с основной работой, но об этом расскажу в новом учебном году.

Хочу поблагодарить себя за этот год, всех, кто был рядом и поддерживал: семью, друзей, коллег, студентов. Даже в моменты, когда я сам себя не выносил.

Спасибо всем читателям канала. Невероятно приятно осознавать, что мои мысли, идеи и трешовые истории находят отклик.

В Новый год вступаю с единомышленниками и замыслами, дальше — больше. А всё остальное плохое торжественно оставляю в 2024-м.

После точки обязательно будет новое предложение, и оно будет лучше, круче и насыщеннее.

865

Приключения социолога и единороги

31 Dec, 16:22

https://music.yandex.ru/album/34423300/track/133960400

А вот и трек к новому году!)
Всем веселья, дорогие!

737

Приключения социолога и единороги

31 Dec, 12:49

29 лет ощущается как 28
А 28 ощущалось как 27
И так до 16

Душой то все еще на 16, кстати! Так что мне уже в 13 раз вроде 16)

В новом году цель объяснить это своим уставшим ногам и будет вообще нормально!

С наступающим новым годом🎄
Может быть я даже созрею на итоги года, но это не точно...

742

Приключения социолога и единороги

27 Dec, 16:58

Прямо перед новым годом делюсь с вами записью эфира по ИИ
У меня там странный голос, но получилось неплохо

973

Приключения социолога и единороги

27 Dec, 09:51

Сергеи Владимировичи уверенно заканчивают этот 24 год

960

Приключения социолога и единороги

26 Dec, 07:00

В последние дни было непросто: стресс и переживания буквально сбивали с ног. Даже писать сюда не хотелось. Но, кажется, постепенно выбираюсь из-под этого эмоционального завала. Год подходит к концу — и это радует!

За последние пару дней мне удалось написать множество строк кода, связанных с обработкой количественных данных и аналитикой с помощью языковых моделей.

А вообще последние две недели происходит ад какой-то и те редкие моменты, в которые мне удаётся в полной тишине побыть за компьютером — настоящий релакс!
Я создал несколько маленьких продуктов, которые работают здесь и сейчас. Удивительно осознавать, что они не просто функционируют, но и приносят реальную пользу.

Коллеги из разных вузов, студенты отправляют тексты и таблички для тестов— все делятся обратной связью, идеями, и это мотивирует двигаться дальше. В моменты тотальной грустинки, я просто сижу и бесконечно исправляю, оттачивая код до совершенства.

Отдельная история — такси. Кажется, водители думают, что я хакер: в пробках я достаю ноутбук, ставлю его на колени и увлечённо печатаю. Эта картина, наверное, выглядит со стороны забавно, но для меня это просто ещё одна возможность быть продуктивным, несмотря на все происходящее.

976

Приключения социолога и единороги

25 Dec, 09:55

2024, уходи, пожалуйста, скорее
Нужна радикальная перезагрузка мозгов

1,175

Приключения социолога и единороги

23 Dec, 08:34

Смеюсь
Я видимо навсегда остался в 2007 году

1,148

Приключения социолога и единороги

23 Dec, 08:01

Ну чего!! Последний рывок до чекпоинта
Тащим, дорогие!

952

Приключения социолога и единороги

22 Dec, 09:19

Продолжаю делиться радостью… Вчера у меня наконец состоялся выходной. Это было круто! И в кровати потупить успел, и в комп поиграть. :)

Помимо этого, я обиделся на компанию Anthropic (создатели Claude) за то, что у меня за месяц заблокировали три оплаченных аккаунта. Это чертовски грустно на самом деле, потому что Claude закрывал много моих профессиональных задач. Но ничего, я бы не был собой, если бы ничего с этим не придумал. Теперь работаю с Claude через множество промежуточных шлюзов.

Из плюсов: работает без VPN.
Из минусов: дорого, блин, но всё равно дешевле, чем постоянно оплачивать аккаунты, которые блокируют.

838

Приключения социолога и единороги

19 Dec, 10:09

Хочу поделиться двумя важными историями для меня.
Начну с первой, а вторую напишу вам потом)

Позавчера я закончил читать довольно насыщенный курс по искусственному интеллекту для 4 курса наших психологов.

Цель курса была в том, чтобы показать различные штуки, которые умеют современные компьютеры и не только. Мы обсуждали, как поднимать серверы на Linux-дистрибутивах, как эти серверы настраивать и использовать для повседневных нужд, как поднимать телеграм-ботов для решения прикладных задач. Также мы разбирали, из чего вообще состоят языковые модели, как различные элементы моделей взаимосвязаны, ведь, понимая это, ты начинаешь понимать, как писать промпты и эффективно взаимодействовать с нейросетями. Мы обсудили различные сценарии применения нейросетей: от поиска источников до полноценного анализа количественных и качественных данных, подискутировали о том, для чего сегодня годятся глобальные сервисы типа ChatGPT, а в каких задачах хватает локально размещённых моделей ИИ.

Мы вообще много о чём говорили: обсуждали генерации разнообразного контента, создание дипфейков, обсуждали сложности, с которыми сталкиваются сегодня студенты на учёбе и на работе, и как/куда здесь можно интегрировать цифровые технологии. Более того, их сложности мотивировали меня придумывать всякие новые штуки, но о них расскажу во второй истории.

В конце я попросил студентов поделиться фидбеком о курсе в формате, что им понравилось, а чего не хватило. И, честно говоря, в момент дискуссии по фидбеку мне стало так тепло на душе. Мне было приятно осознать, что я дал полезный материал, а также понял, над чем мне нужно думать, где нужна более качественная структура или в каких случаях нужен подход с точки зрения донесения информации.

Но в целом, в каком же я, блин, в восторге от курса! Единственное, многое не удалось обсудить, потому что командировок в этом семестре было очень много, но мы договорились быть с ребятами на связи и нивелировать данный недостаток.

С наступающим новым годом!

951

Приключения социолога и единороги

18 Dec, 17:49

Мои хорошие друзья и коллеги из Исследовательского центра искусственного центра Института общественных наук Академии продолжают развивать бенчмарк SLAVA.
Подробнее об успехах можете почитать тут.

Похвастаюсь, что принимал участие в разработке шкалы провокативности. И если уж прям совсем честно, я невероятно горжусь быть частью этой команды!

862

Приключения социолога и единороги

17 Dec, 18:26

Кажется, только благодаря телеграм-каналу я до сих пор не разучился писать😁

803

Приключения социолога и единороги

17 Dec, 18:23

На самом деле очень круто, что Сбер выходит на опенсорс-сцену и выкатывает свои модели.
Сценариев применения подобным решениям много: помимо простых генераций текстов, которыми уже никого не удивишь, подобные языковые модели неплохо отыгрывают роли, умеют в анализ документов и много чего ещё, но...
На данный момент я хорошенько потестировал языковую модель 1) GigaChat Lite и модель для транскрибации аудио 2) GigaAMv2, и вот что мне сказать:

1) Работает неплохо, очень неплохо, но потребляет очень много видеопамяти/оперативной памяти, и не сказать, что гораздо лучше по качеству ответов нашумевшей на прошлой неделе модели от Т-Банк t-lite-it. И да, понятно, что модель GigaChat Lite позиционируется как сделанная с нуля, а T-lite основана на Qwen 2.5. Но тут я подсвечиваю исключительно реальные сценарии использования (анализ входных инструкций, анализ документов, следование инструкциям), в которых t-lite быстрее, где-то умнее, а ещё работает гораздо шустрее на слабеньком железе.

2) На страничке приводится табличка с бенчмарками, в которой разные модельки сравниваются с GigaAM. Возможно, у меня файлы кривые какие-то, но у меня обычный Whisper Large v2 справляется гораздо лучше. Ещё и имена распознаёт, знаки препинания расставляет и работает с длинными аудио- и видеозаписями полностью локально. Решение Сбера работает с длинными файлами, разбивая их на маленькие части, вообще не расставляет знаки препинания. В общем, с Whisper'а пока уходить рано.

768

Приключения социолога и единороги

17 Dec, 08:18

Утро добже, селяне!

Не могу не поделиться апейтом Gemini. В Русский оно пока только в тексте, зато бодро балакает на языке "условного противника", умеет смотреть в вашу вэбку, наблюдать за экраном и давать подсказки! Все это бесплатно.

Требуется ВПН... Но для кого это сейчас проблема. У меня, например, стабильно работает через сервера UK, London.

Короче, айда тестить. Штучка явно потупее чем ЧатГПТ но зато в разы меньше цензуры и шире диапазон тем на которые можно болтать. Ну и то, что оно смотрит на ваш экран — топ.

И, еще раз, ЭТО ПОКА ВООБЩЕ БЕСПЛАТНО. Успейте потестить. Нужен гугол оккант.

https://aistudio.google.com/live

717

Приключения социолога и единороги

17 Dec, 08:18

И вот вам рекомендация от моего друга Андрея Киселева.
Хочу отметить, что Gemini помимо документов на вход может брать аудио и видео для распознавания.

Гугл аккаунт не забудьте перевести на английский язык, это важно.

700

Приключения социолога и единороги

17 Dec, 08:03

AI Journey 2024 оказалась очень богата на новые AI-продукты от Сбера. В частности банк выложил в открытый доступ сразу 3 своих новых генеративных модели.

GigaChat Lite рассчитана на простые обыденные задачи. Это первая по-настоящему российская open-source модель. Поэтому она максимально стабильная и не требует больших мощностей. Ее преимущество - скорость.

GigaAMv2 признали лучшим в РФ AI-инструментом для распознавания речи. Ее можно дообучать.

GigaEmbeddings создавалась для RAG и других задач, где требуется серьезная производительность. Превосходит большинство конкурентов по производительности и надежности.

744

Приключения социолога и единороги

17 Dec, 08:03

Делюсь с вами интересным из области ИИ
Сбер молодцы, хорошо раскачали индустрию под конец 2024, но не все так очевидно.
В течение дня будет критический обзор.

662

Приключения социолога и единороги

14 Dec, 17:17

Несколько дней назад я писал здесь о том, что написал код для последовательного анализа текстов. Под капотом было заложено обращение к серверам OpenAI, что создавало определенные проблемы при анализе чувствительных данных и кушало мои доллары.
Здесь мог бы быть длинный текст о том, что, по-хорошему, использовать подобное решение для анализа разных чувствительных данных нельзя, потому что есть риск утечки данных, но здесь об этом не будет, потому что суббота и превращать этот текст в лекцию мне лень.

Но важно другое... Я поспал и переписал код, теперь мое хитрое решение может работать локально, без интернета, а еще оно бесплатное.
Это здорово, так что знайте, что я не только умею кружочки записывать. Пойду дальше субботой наслаждаться.

722

Приключения социолога и единороги

14 Dec, 12:53

А ведь новогоднее настроение появляется потихоньку. Очень потихоньку, но все же.
Еду в машине, смотрю в окно, вижу все эти ёлки и огонёчки и настроение подымается)

668

Приключения социолога и единороги

28 Nov, 10:02

Совет для школьников, которые хотят попросить у родителей или Деда Мороза новую видеокарту на Новый год:
аргумент про желание играть в новые игрули в 4K может не сработать. Но если вы объясните, что видеокарта нужна для того, чтобы стать топовым ML-исследователем с зарплатой миллион чего хотите в месяц, шансы на успех значительно возрастут.
Дерзайте и не благодарите

346

Приключения социолога и единороги

28 Nov, 08:39

По следам мероприятия в Нижнем оставляю ссылки на каналы чуваков, которые дообучают топовые языковые модели для адекватного использования на русском языке.

Если максимально просто, именно благодаря этим спецам модели, которые можно при желании запускать даже на микроволновках, отлично работают с русским языком: пишут тексты, считают данные, суммаризируют информацию. А чтобы всем этим пользоваться, достаточно загрузить Lmstudio и начать работать.

Старый Авгур или IlyaGusev — развивает модели Saiga, пишет крутые статьи про нейронки на Arxiv и активно двигает индустрию. На мой строго субъективный взгляд, предлагает на сегодняшний день лучшие решения для самых разных задач.

Vikhr или Вихрь — группа энтузиастов, которые также дообучают модели, предлагая широкий спектр решений, включая запуск на мобильных устройствах.

ruadapt — команда из лаборатории анализа информационных ресурсов НИВЦ МГУ. Они проводят исследования и адаптируют крупные нейронки, например Qwen 2.5 32B, для использования на русском языке.

401

Приключения социолога и единороги

28 Nov, 07:04

В Нижнем Новгороде классно
Насыщенно, классно, интересно
Жаль, что мало (( и погулять толком не успел
Но зато есть повод вернуться!

431

Приключения социолога и единороги

26 Nov, 17:21

Ссылка как-то криво прикрепилась, держите нормальную

548

Приключения социолога и единороги

26 Nov, 17:20

Сегодня в Нижнем Новгороде вместе с Андреем Киселевым разгоняли про перспективы использования локально размещенных больших языковых моделей в повседневную и профессиональную жизни)
Получилось круто, да и аудитория кайф. Несмотря на болезнь, мероприятие меня зарядило!
В конце мы рассказали про то, как можно интегрировать нейро модельки с собственной базой знания из Obsidian.
Давненько я обещал ролик на эту тему, и вот он наконец вышел.

553

Приключения социолога и единороги

26 Nov, 12:14

Смотрите какие хорошие😍

639

Приключения социолога и единороги

25 Nov, 20:02

Беру в командировку самое важное

663

Приключения социолога и единороги

25 Nov, 13:51

Пропал из-за совершенного отсутствия настроения.
В ночь с субботы на воскресенье меня взломали. Причём угнали всё: почты, стим, дискорд, телеграм и денюжку с криптокошеля.
Уже 2 дня я думаю о том, как это вообще было возможно технически, учитывая, что везде двухэтапная аутентификация, пароли такие, которые с помощью перебора не подобрать.

Я никогда нигде не логинюсь на чужих компах. В общем, единственное, на что думаю, — это комп на винде, который, видимо, подхватил где-то вирус. Но не знаю, какая-то дичь. Причём вот вроде бы всё удалось вернуть, но ощущение поганое.

Мораль в чем: берегите себя и свои аккаунты.

647

Приключения социолога и единороги

22 Nov, 06:56

import os
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
from deeppavlov import build_model, configs
from tkinter import Tk, filedialog

# Загрузка необходимых ресурсов NLTK
nltk.download('punkt')
nltk.download('stopwords')

# Инициализация модели NER
try:
    print("Инициализация модели...")
    morph_model = build_model(configs.ner.ner_ontonotes_bert_mult, download=True)
    print("Модель успешно загружена.")
except Exception as e:
    print(f"Ошибка при загрузке модели: {e}")
    raise

def clean_transcript(transcript):
    """
    Очищает транскрипт, оставляя только предложения с смысловой нагрузкой.
    """
    sentences = sent_tokenize(transcript, language='russian')
    meaningful_sentences = []

    if not sentences:
        print("Текст не содержит предложений.")
        return ""

    for sentence in sentences:
        print(f"Обрабатывается предложение: {sentence}")  # Отладка
        try:
            ner_analysis = morph_model([sentence])
            tags = ner_analysis[1][0]  # Теги
            print(f"Теги: {tags}")  # Отладка тегов

            # Сохраняем предложение, если оно содержит смысловые теги
            if any(tag != 'O' for tag in tags):  # 'O' означает отсутствие сущности
                meaningful_sentences.append(sentence)
            # Дополнительно: сохраняем длинные предложения как потенциально значимые
            elif len(word_tokenize(sentence, language='russian')) > 5:
                meaningful_sentences.append(sentence)

        except Exception as e:
            print(f"Ошибка обработки предложения '{sentence}': {e}")

    # Проверка перед возвратом
    if not meaningful_sentences:
        print("Не найдено смысловых предложений.")
    else:
        print(f"Найденные предложения: {meaningful_sentences}")

    return '\n'.join(meaningful_sentences)

if __name__ == "__main__":
    # Создание интерфейса для выбора файлов
    print("Выберите файлы для обработки.")
    root = Tk()
    root.withdraw()  # Скрыть основное окно
    input_files = filedialog.askopenfilenames(
        title="Выберите файлы",
        filetypes=(("Text files", "*.txt"), ("All files", "*.*"))
    )

    if not input_files:
        print("Файлы не выбраны. Завершение работы.")
    else:
        for input_file in input_files:
            print(f"Обработка файла: {input_file}")
            base, ext = os.path.splitext(input_file)
            output_file = f"{base}_cleaned{ext}"

            try:
                # Чтение транскрипта из файла
                with open(input_file, 'r', encoding='utf-8') as file:
                    transcript = file.read()

                # Проверка на пустой входной файл
                if not transcript.strip():
                    print(f"Текст файла {input_file} пустой или состоит только из пробелов.")
                else:
                    # Очистка транскрипта
                    print("Начало очистки транскрипта...")
                    cleaned_transcript = clean_transcript(transcript)

                    # Сохранение очищенного транскрипта в новый файл
                    if cleaned_transcript.strip():
                        with open(output_file, 'w', encoding='utf-8') as file:
                            file.write(cleaned_transcript)
                        print(f"Очищенный транскрипт сохранен в файл: {output_file}")
                    else:
                        print(f"Очищенный текст пустой. Файл {input_file} не записан.")
            except FileNotFoundError:
                print(f"Файл {input_file} не найден. Проверьте путь.")
            except Exception as e:
                print(f"Произошла ошибка при обработке файла {input_file}: {e}")

839

Приключения социолога и единороги

22 Nov, 06:55

Недели две назад столкнулся с интересной задачей. Мне нужно было выгрузить все сообщения из нескольких телеграм-чатов для анализа часто встречающихся групп слов. Задача вполне простая, когда мы говорим про выгрузку данных: сообщения выгружаются либо в HTML, либо в JSON форматах. Для анализа был выбран JSON формат, но вот незадача - он содержал множество блоков, которые были не нужны для анализа. В связи с этим я написал скрипт на Python вместе с ChatGPT, который эти блоки вырезает, и получил размеченную простыню текста.

В целом, дальше дело техники: загружаем в любую LLM и кодируем, считаем, интерпретируем - и готово. На этом моменте мне пришла в голову идея: а что если примерно таким же образом можно вычищать машинные транскрипты интервью от бесполезных слов, групп слов, которые сами по себе да и в контексте не несут смысловой нагрузки и просто забивают контекстное окно любой нейромодельки? Из-за этого любая нейромоделька начинает беспощадно тупить, галлюцинировать и делать все то, что мы с вами так любим.

Естественно способ с чисткой блоков здесь не нужен совершенно, так как никаких блоков в простых текстовых файлах, в которых лежат транскрипты просто нет.

Вот тут-то и началось приключение, и я начал читать про решения в области обработки естественного языка (NLP) и наткнулся на библиотеку DeepPavlov, которая гипотетически могла мне помочь. Посидел, попытался реализовать - не получилось, и я отложил эту историю. А вчера, когда ехал в такси, меня осенило: я набросал небольшой код, отредактировал его с помощью нейронок и попробовал запустить дома. Ясное дело, сначала ничего не получилось, а потом как получилось - и я как обрадовался!

Так вот, дорогие причастные, делюсь с вами скриптом, который вычищает транскрипты от всяких лишних словечек, при этом структурирует информацию, делит её на сегменты и выплёвывает вычищенный файл, который можно использовать в анализе, используя локальные или закрытые сервисы.

Тестировалось на Windows, с маками пока разбираюсь.
Запускает скрипт, выбираете txt файл и наслаждаетесь

Результаты работы ниже

736

Приключения социолога и единороги

20 Nov, 16:42

Мама, я буквально 15 минут и дальше работать.
15 лет все ждали ждали и снова ждали, ну посмотрим

773

Приключения социолога и единороги

20 Nov, 12:56

Позвали в Вышечку про нейро модельки поболтать
Сейчас как поболтаю

774

Приключения социолога и единороги

20 Nov, 10:09

Как-то раз в Академии в 2022 году я читал лекцию о том, как уход платежных систем из РФ повлиял на то, как мы занимаемся реорганизацией наших потребителських привычек и практик. На ту лекцию в онлайне прилетело огромное количество неадекватов, которые желали мне "закрыть свой поганый рот" и "как можно скорее сдохнуть". Тогда я поймал себя на мысли, что это признание, наородная любовь, не меньше.

То, что сейчас происходит в комментариях над постом выше, вернуло меня в те воспоминания, сижу, ностальгирую и выражаю благодарность всем неравнодушным к моему контенту. Приятно осознавать, что некоторые люди тратят существенное количество времени на мой канал.

802

Приключения социолога и единороги

19 Nov, 17:18

Да-да, мама, я был в телеке
Вся глубина тут, дорогие, на нашем любимом ВК Видео

799

Приключения социолога и единороги

19 Nov, 16:36

Небольшой апдейт по тому, над чем сейчас работаю

Самая большая проблема нейронок сейчас заключается в том, что они обучены на огромном количестве данных. Зачастую именно этот фактор приводит к довольно общим и поверхностным ответам по узкоспециализированным темам, которые мы получаем от популярных сервисов, используемых каждый день.

Эту проблему, на самом деле, можно неплохо решить с помощью промтов, но часто этого оказывается недостаточно, особенно когда горят дедлайны.

Сегодня мы со студентами обсуждали, как интегрировать всю базу знаний в Obsidian с нейронками, которые работают через интернет или локально.

В данном случае Obsidian выступает в роли прослойки, содержащей все ваши замыслы, тексты и идеи. Именно через эту прослойку любая языковая модель формирует ответ на ваш запрос.

Это работает!
И это войдет в видео, которое должно выйти в конце недели.

806

Приключения социолога и единороги

18 Nov, 20:17

Культурный вечер в новой студии у друзей Андрея и Сергея Сергеевича

778

Приключения социолога и единороги

18 Nov, 11:25

Кстати, важный вопрос, а у вас youtube работает без всяких потусторонних способов? А то у меня совсем нет, но при этом я радостные новости читаю и вот думаю. Это я сломанный или youtube...

809

Приключения социолога и единороги

18 Nov, 11:22

В общем, делюсь с вами приключениями.
Сегодня принял участие в дискуссии, которая была посвящена запретам социальных сетей детям до 14 лет. Ну вы мою позицию знаете. Я за запрет запретов. Завтра поделюсь с вами ссылочкой, а пока держите материал, в котором я есть сегодня.

И тут и там, в общем))

629

Приключения социолога и единороги

16 Nov, 17:24

Спонсор фото — моя любимая дама!

727

Приключения социолога и единороги

16 Nov, 09:11

Есть такая компания, которая считается одним из лидеров в области развития ИИ-технологий. Называется компания Anthropic. Именно эти чуваки разработали Claude. И именно этим чувакам я донатил около 40$ в месяц за подписку + поддержание работы API для своих ботов в Телеграме.

И вот вам прикол. Вчера они меня заблокировали, то ли за VPN, то ли за мои запросы, в которых я обычно прошу мне всякие книжки анализировать по философии. Ну то есть вы, мои подписчики, можете заметить, что тут ну ВООБЩЕ нет никакого криминала.

Но мы идём дальше. Вчера, без всяких уведомлений, предупреждений меня просто взяли и заблокировали. То есть я больше не могу писать запросы в эту нейронку, но и это не конец.
Несмотря на то, что пользоваться нейронкой я не могу, деньги они у меня продолжают списывать, но пользоваться нейронкой я не могу.

Тут вы, конечно, можете мне сказать: "Чел, ну есть же тех. поддержка", и я скажу: "Ну да, есть". Они получили множество милейших сообщений от меня, но ни на одно не ответили. Деньги-то ведь списывать проще, чем отвечать на сообщения.
Вот такой вам пост моей злобы!!
Написал, аж лучше стало.

707

Приключения социолога и единороги

14 Nov, 18:55

он пытался поесть

809

Приключения социолога и единороги

14 Nov, 04:41

Тут ребята из МГУ прорывом в области ИИ поделились!
Кайф, дообученной модельки Qwen под русский язык ждали давно.

Вообще, за последний год эта индустрия с моделями мощно скакнула вперед!

Ну а я пытаюсь проснуться

806

Приключения социолога и единороги

12 Nov, 16:20

Сегодня у меня были пары по ИИ для психологов, в рамках которых я рассказывал о том, как и для чего можно использовать локально размещенные open source решения.

Во время обсуждений я собрал ещё несколько кейсов применения подобных решений.
В частности, речь шла о том, как можно продуктивно использовать нейросети без лишней цензуры.

Классно, что всего пару месяцев назад уровень опенсорсных решений был гораздо сильнее ограничен.

А сегодня — и отыгрыш ролей, и чёткое следование промтам, никаких долларов за подписки, отсутствие лимитов, а также без необходимости использовать интернет и VPN.

На выходе: работа с документами, анализ таблиц, ну и генерация контента, кода, разумеется практически на любом железе.

В ближайшее время будет видос про всё это! Ждите 🤪

923

Приключения социолога и единороги

11 Nov, 17:36

Он пытался заниматься непотребствами под мою лекцию, но в итоге просто задремал

878

Приключения социолога и единороги

11 Nov, 09:47

Сижу готовлюсь к парам по социологии, радостно перечитываю Латура с "карандашом" и вспоминаю, почему я вообще все это люблю.
Другое дело, ну как вообще социологию можно считать скучной?

Держите мудрость, дорогие, и каждый раз, когда вы заходите написать текст, помните, что если он описательный, значит он скучный.

910

Приключения социолога и единороги

08 Nov, 12:39

Дорогие, у меня тут коллеги запускают бесплатный курс для студентов. Называется "Рассвет"

За месяц вы:
• Прокачаетесь в одном из направлений: SMM, дизайн, видео, фото или журналистика
• Соберете портфолио с реальными проектами
• Пообщаетесь с топовыми экспертами индустрии 🔥

Как проходит обучение:
📹 Видеоуроки
🤝 Живые встречи
💪 Командная работа над кейсами
Бонусы для самых активных:
📜 Сертификаты
🎁 Подарки от партнеров
⚡️Есть возможносться залететь в последний вагон и зарегистрироваться до 23:59 8 ноября!

Поддержите ребят)

1,158

Приключения социолога и единороги

08 Nov, 08:35

Увидел тексты, спрятался в домике

1,021

Приключения социолога и единороги

08 Nov, 05:16

Готовлю любопытный контент по нейронкам, дорогие.

Вчера целый день возился с интеграцией локальных моделей по обработке естественного языка в систему.
В итоге получил довольно крутые результаты по суммаризации текстов, анализу данных, RAG.

А если на простом языке: взаимодействие с документом на русском, получение разумных ответов на русском, интеграция а-ля Copilot от Microsoft, только нормальный и гибко настраиваемый. Но главное — работа на компьютерах с 16 ГБ оперативной памяти и без интернета (актуально для тех областей, в которых критично относятся к утечкам данных)

821

Приключения социолога и единороги

05 Nov, 14:13

А вот знаете, кто больше всех любит снег? Джекуля, вот кто!

1,075

Приключения социолога и единороги

04 Nov, 10:57

собрался поработать, увидел единорога, не смог поработать 🦄

892

Приключения социолога и единороги

03 Nov, 13:53

После двух дней адских тусовок на форуме решили устроить семейную прогулку по лесу

936

Приключения социолога и единороги

02 Nov, 14:36

А вот и наш Андрей и Сережа тоже

983

Приключения социолога и единороги

01 Nov, 08:40

Сегодня ловите на конференции «Открытые данные» 😝

1,041

Приключения социолога и единороги

29 Oct, 08:14

Активно налетаем, дорогие! Рекомендуем друзьям)

На хабре вышло исследование от друзей из исследовательского центра искусственного интеллекта института общественных наук)

1,287

Приключения социолога и единороги

28 Oct, 11:02

Полезный пост про Obsidian, который написан в Obsidian

В общем-то, с момента блокировки Notion в РФ, вернее, от РФ, хотел написать данный пост, и все никак не доходили руки, а тема-то важная, особенно для тех, кто любит писать полновесные тексты и заметки, посты в соцсети, научные статьи, курсовые, ВКР и прочие невероятно важные тексты. Также можно это все между собой связывать, объединять, расставлять теги, по сути превращая все ваши тексты в полноценную базу знаний с нормальным и доступным интерфейсом.

Obsidian — совершенно потрясная гибко настраиваемая среда, которая при самом поверхностном приближении представляет собой самый обычный текстовый процессор на основе Markdown. Для тех, кто не знает Markdown — это история, которая позволяет делать вот так или вот так

Однако если копнуть глубже — Obsidian — это инструмент, границы применения и настройки которого зависят от воображения автора, потому что тут есть буквально огромная куча плагинов, которые, например, позволяют интегрировать базы данных (как в Notion) или интегрировать ИИ прямо внутрь редактора заметки, намутить гибкую систему поиска по текстам внутри картинок или PDF-файлов, которые импортированы в библиотеку Obsidian.

Ну и самое важное: вся ваша библиотека будет лежать у вас на компьютере или телефоне, ведь приложение кроссплатформенное и синхронизируемое, а файлы, созданные в Obsidian, без труда можно открыть в любом приложении-блокноте.

1,116

Приключения социолога и единороги

28 Oct, 10:00

Вот он адский комфорт

972

Приключения социолога и единороги

28 Oct, 08:28

Делюсь интересной презентацией коллег из сервиса "Антиплагиат".
Классно, что тема применения генеративок в академических текстах волнует не только преподавателей-энтузиастов.
Ну и радует, что если Антиплагиат подсветил текст, как сгенерированный, это еще не повод не допускать студентов к защите!

Здравый смысл восторжествовал.

1,021

Приключения социолога и единороги

25 Oct, 05:11

Если вдруг кто-то из вас полагал, что я бездельник, то вот держите
Небольшой отчет из Красноярска подъехал. Даже с фотографией, где я сижу со своими друзьями компьютерами

Все ещё бездельник, бунтарь и просто хороший парень, который ненавидит вставать в 7 утра 😜

1,400

Приключения социолога и единороги

24 Oct, 13:54

Ура, через 10 минут уже станет понятно, кто возьмёт премиумы
Такие дела, розыгрыш потихонечку подходит к концу
Но ничего, впереди будет крутой контент!)
Треш, угар и нейросети 😋

1,370

Приключения социолога и единороги

24 Oct, 06:10

Коргиролл этим утром

1,289

Приключения социолога и единороги

22 Oct, 18:16

Продолжаю покорять форбс кстати

1,463

Приключения социолога и единороги

22 Oct, 18:16

Мама, я на форбсе

https://www.forbes.ru/forbeslife/523482-paradoks-henry-pocemu-vysokooplacivaemye-sotrudniki-ne-cuvstvuut-seba-bogatymi

1,467

Приключения социолога и единороги

22 Oct, 17:46

Тема такая, ребята, сэкономлю ваше время
Я узнал сегодня, что для того чтобы стать успешным, нужно быть честным!

Так что если вы не самые успешные, то будьте просто чуть честнее и все чётко будет

1,456

Приключения социолога и единороги

22 Oct, 17:44

Такая вот работа
Эксперт типа 😎

1,427

Приключения социолога и единороги

22 Oct, 14:57

Целый день работал над своей публичностью на совещаниях, а сейчас еду учить публичности дядь и тёть из бизнеса
Вот это жизнь, конечно, бизнесовая

1,420

Приключения социолога и единороги

21 Oct, 14:55

В общем, я не знаю, что вам рассказать, но скажу так: я искренне не понимаю, почему так получается, что количество всей моей работы в течение 7 дней просто меркнет с ее количеством по понедельникам. Это треш какой-то, дорогие.
Я еду домой с какой-то невероятно опухшей головой, а ведь только середина дня и у меня ещё пары впереди

Я пожаловался, а вы поддержите сердечком

Спасибо!

1,250

Приключения социолога и единороги

21 Oct, 07:05

Дорогие, у нас тут Андреем Киселевым конкурс все еще идет полным ходом!
Заходим, подписываемся, кайфуем! Осталось 3 дня!

1,241

Приключения социолога и единороги

18 Oct, 10:56

На днях нашел крайне интересную имплементацию Whisper, которая работает, как веб-приложение, а если что-то работает как веб-приложение, значит оно может без всяких сложностей запускаться на любом компьютере и пробрасываться в интернет
Что это нам дает? А это дает крайне удобную возможность использовать наш домашний компьютер (или любой сервер), как полноценное устройства для транскрибации, которое будет доступно из любой точки мира с любого устройства. Выглядит это примерно вот так.

Помимо этого данное решение может быть запущено на любом компе под Windows или macOS

Загружается файл, транскрибируется и скачивается. Дорогие студенты, знайте, что так можно крайне эффективно работать с лекциями.

1,503

Приключения социолога и единороги

18 Oct, 06:51

Вчера сыночек приболел, а сегодня уже поправляется потихоньку

1,475

Приключения социолога и единороги

17 Oct, 11:13

Тут наши коллеги делают крутую штуку, и я предлагаю вам их поддержать!
Голосуйте за проект Павла Шерстнева. Знание Python становится все более востребованным навыком)

1,436

Приключения социолога и единороги

16 Oct, 10:56

Честно скажу, естественного интеллекта тут гораздо больше, чем искусственного, но это не точно 😜

1,414

Приключения социолога и единороги

16 Oct, 10:55

Уважаемые подписчики, смотрите, я все еще немного ученый исследователь
Вот вам отчет

1,422

Приключения социолога и единороги

16 Oct, 08:10

На конфе в Красноярске, вместе с Сергеем Владимировичем.

1,395

Приключения социолога и единороги

16 Oct, 07:35

Дорогие все, просыпаться во время начала встречи — очень плохая идея. Очень тяжело мозги в кучку собирать

Ну а вообще не слушайте меня, ведь встречи можно просто просыпать... Помните, не надо меня слушать 😁

1,271

Приключения социолога и единороги

15 Oct, 20:10

✨Суббота — не повод отказываться от интересных встреч. Для ребят из Центра ИИ, например, это возможность переключить нейроны собственного мозга на «Выходной нейрон: НейроМитап в Центре искусственного интеллекта».

👩🏼‍💻🧑🏼‍💻В прошедшие выходные в ИКИТ была организована площадка, где молодые учёные могли пообщаться на профессиональные темы, обменяться опытом и обзавестись новыми контактами с представителями индустрии. 💡Помимо очевидной практической пользы, это шаг в сторону популяризации современных технологий, а ещё — возможность научиться применять свои знания на практике.

📍Среди спикеров митапа:
• директор департамента промышленного ИИ РУСАЛ ИТЦ Валентин Шахматов
• основатель и генеральный директор продуктовой компании и стартап студии «Фабрика Решений» Анатолий Фомин
• социолог, эксперт в области внедрения нейросетевых решений в исследовательскую деятельности ИОН РАНХиГС Сергей Дубровский
• основатель студии sintez.space Андрей Киселев

👩🏼‍💼«Обсуждали применение ИИ в промышленности, диффузионные нейросети в креативных индустриях, генеративные нейросети в проектировании исследований и анализе данных, а также бизнес-решения с искусственным интеллектом. Встреча определённо удалась. Где ещё начинающие учёные и специалисты в сфере ИИ так просто и без лишних условностей пообщаются с экспертами и будущими работодателями», - сказала руководитель Центра ИИ Анна Пятаева.

1,330

Приключения социолога и единороги

Приключения социолога и единороги (Russian)

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги

Приключения социолога и единороги