После того, как мы закончим работу над деревом знаний (доведем его до состояния, в котором оно само будет дальше расти), мы возьмемся за еще одну задачку.
Мы сделаем бота, который в ответ на вопрос, заданный в свободной форме, будет выдавать ответ в виде короткой нарезки из всех наших роликов.
Кто и что может спрашивать?
- Школьник, пытающийся разобраться с какой-то темой или решить какую-то задачу.
- Учитель, готовящийся к очередному уроку.
- Инженер, пытающийся разобраться с физическими аспектами кого-либо механизма или процесса.
- Просто любознательный человек, интересующийся миром физикой, толком не знающий что именно спросить.
Понятно, что в основе такого бота будет лежать нейросеть (в общем случае — искусственный интеллект), которую предстоит натренировать и дать ей возможность тренироваться постоянно, собирая и анализируя обратную связь.
Очень качественных роликов, из которого можно собрать все необходимые ответы, у нас много (Андрей с Алексеем уже обсудили и очень хорошо рассказали все что только можно). Пользователей, на которых тестировать и тренироваться — тоже много.
Если (когда) получится — случится прорыв. Так мы сделаем весь наш контент интерактивным и переведем Андрея с Алексеем из разряда лекторов в разряд учителей, взаимодействующих с учениками.
Уточним, что идея в том, чтобы в ответ выдавать не какой-то один существующий ролик, а фрагменты из роликов, склеенные в один. Это не так просто. Выбор тех фрагментов, которые лучше всего подходят под определение ответа — сложная задача.
Понятно, что стартовать нужно не с нуля, а опираться на ChatGPT, накормив его, например, транскрибацией всех наших видео. Но дальше нужно будет понять, как найти начала и концы тех фрагментов, которые иллюстрируют ответ.
При этом нужно иметь в виду, что фрагменты роликов более или менее хорошо типизируются: есть «говорящая голова», объясняющая концепции, есть фрагменты с демонстрацией экспериментов (важная часть) и есть всякие схемы и иллюстрации.
Кроме того, есть возможность немного менять сами фрагменты. Например, мы умеем «говорящую голову» заставлять говорить более или менее произвольный текст и мы умеем анализировать «что изображено на схеме» и вносить в нее мелкие правки — это некая комбинация ChatGPT, MidJourney и им подобных.
Следующий шаг — запоминать контекст задающего вопросы и адаптировать ответы под него.
Если вам эта затея интересна и хотите / можете принять участие в ее реализации или просто что-нибудь посоветовать — пишите!