Open AI
31.12.2022 Техно

Почему выстрелил ChatGPT и может ли он заменить поиск в интернете

Фото
Jonathan Raa / NurPhoto via Getty Images

30 ноября американская лаборатория искусственного интеллекта OpenAI, в числе совладельцев которой Илон Маск, представила чат-бота ChatGPT на базе продвинутой нейросетевой языковой модели GPT-3.5, способной создавать новую информацию. ChatGPT набрал популярность на удивление быстро: спустя всего неделю после запуска СЕО компании Сэм Альтман отчитался в своем Twitter об 1 млн пользователей. Чем этот чат-бот привлек аудиторию и за счет чего он показывает такие результаты? Рассказывает корреспондент Forbes Роман Рожков.

 

На что способен

Огромная популярность ChatGPT — следствие его возможности давать ответы на поставленные вопросы, пояснения, принимать уточняющие запросы, «создавать» новое (стихи, рассказы и эссе на заданную тему), работать с кодом (писать, отвечать и находить ошибки в написанном) и многое другое. «Действительно, ChatGPT показывает невероятные результаты по возможностям общения, — говорит Дмитрий Ермилов, руководитель департамента машинного обучения и искусственного интеллекта дирекции по ИИ и цифровым продуктам «Билайна». — По совершенно небольшим неперсонализированным кускам текстовой информации ChatGPT может выдавать адекватные и развернутые ответы, даже писать сочинения».

ChatGPT позволяет подробно отвечать на вопросы пользователя, включать в ответы логические рассуждения и обоснования ответа, тем самым предоставляя полный набор фактов, известных модели, указывает исполнительный директор по исследованию данных Сбербанка Андрей Кузнецов. Среди интересных, по его мнению, применений модели — окраска текста в соответствии с требуемым стилем, генерация кода, поиск простейших ошибок в коде, перефразирование текста, решение специфических логических задач и т.п. «ChatGPT справляется с такими задачами уже достаточно хорошо, а при вероятном выпуске новых доработанных версий, что OpenAI, скорее всего, сделает, будет справляться еще лучше», — полагает ведущий аналитик CleverData (входит в группу «Ланит») Александр Потемкин.

Еще один не самый очевидный способ применения ChatGPT придумали пользователи из TikTok, которые использовали нейросеть для общения в Tinder, заметил ресурс «Код Дурова»: бот пишет вступительное сообщение на базе интересов пользователя (например, стихотворение), тот отправляет его понравившейся девушке — и метод работает.

ChatGPT открывает «ошеломляющие перспективы» для бизнеса, рекламы и коммуникаций, рассуждает руководитель практики Data Science CleverData Анастасия Семенова. Для широкой российской аудитории, впрочем, ChatGPT недоступен, подключаться к нему можно только через защищенные каналы VPN. «У России нет официального доступа к ChatGPT, — подтверждает Дмитрий Ермилов. — Мы его можем использовать через VPN, но как его применять в продуктовых задачах — пока непонятно. Нам неизвестны детали его API и архитектура, поэтому в свои сервисы ChatGPT мы встроить не сможем».

Конъюнктура и перспективы развития

По собственным данным, OpenAI взимает с разработчиков, использующих его технологии по лицензии, около $0,01 или чуть больше за генерирование 20 000 слов текста и около $0,04 — за создание изображения по запросу. О внушительных перспективах компании и ее продукта свидетельствуют планы по выручке в уже недалеком будущем: так, OpenAI рассчитывает заработать до $200 млн в 2023 году и $1 млрд в 2024 году, сообщал ранее в декабре Reuters со ссылкой на трех собеседников, знакомых с презентацией OpenAI для инвесторов.

OpenAI привлекла венчурное финансирование на сумму более $1 млрд с крупнейшим инвестором в лице Microsoft, свидетельствуют данные Crunchbase. Microsoft также предоставляет OpenAI вычислительные мощности. Среди других совладельцев компании — Khosla Ventures, Sequoia Capital, Tiger Global, Y Combinator и Bedrock Capital. Сообщалось также, что софтверный гигант рассматривал возможность увеличения своей доли в OpenAI, полагая, что его AI-технология может создать новые возможности для облачного бизнеса Microsoft, поскольку все больше компаний автоматизируют операции, используя в том числе ИИ.

Искусственный интеллект в целом является одним из наиболее активно финансируемых секторов на венчурном рынке. По данным Crunchbase, объем инвестиций в проекты в области AI в последние годы составляет до 10% от всего вложенного венчурного капитала, а в прошлом году AI-стартапы по всему миру были проинвестированы на сумму почти в $70 млрд.

В чем сила и как устроен

У ChatGPT есть несколько преимуществ перед другими языковыми моделями, объясняют эксперты. Первое — она учитывает контекст разговора и одновременно дообучается, взаимодействуя с пользователем (reinforcement learning), в результате может решать так называемые «reasoning задачи»: отвечать на вопрос, используя то, что мы называем «здравым смыслом», объясняет директор RnD центра Big Data МТС Никита Зелинский. «Второе преимущество заключается в том, что она обучалась не только на объемах обычного пользовательского текста, но и на коде, математических задачах и художественной литературе, — продолжает он. — Эти две особенности позволяют ей решать специфические задачи, например, пересказать технический текст простым языком, решить математическую задачу, написать эссе или стихотворение или создать программный код на основе текстового описания».

ChatGPT — разработка OpenAI на основе алгоритмов обработки естественного языка GPT. Эта серия моделей славится тем, что общается практически как человек благодаря текстовым авторегрессионым алгоритмам, говорит директор по AdTech Big Data МТС Михаил Степнов. По его словам, ChatGPT отличается от остальных моделей семейства GPT тем, что использует не одну модель, а их совокупность с применением Reinforcement Learning from Human Feedback — обучения с подкреплением от человека: «Похожая механика уже используется в других разработках, например, в генеративно-состязательных сетях (Generative adversarial network, сокращенно GAN), но там одна модель генерирует варианты изображений, а другая — пытается это изображение распознать, чтобы убедиться, что оно соответствует запросу».

Узкие места

Важная проблема, которую имеет ChatGPT сейчас, — это механизм модерации запросов, который находится на стороне OpenAI, обращают внимание специалисты: ChatGPT старается уйти от ответа на «чувствительный» вопрос вместо того, чтобы предоставить пользователю решение о том, готов ли он следовать советам модели. «Тут и возникают вопросы этики. Первое: по какому принципу происходит модерация тем? — размышляет Александр Потемкин. — Второе: почему бы не делать еще больший акцент на том, что только от пользователя зависит, следовать ли советам ИИ или нет?»

Анастасия Семенова также призывает обратить внимание на слабые места модели. «Можно проследить, как происходит ее обучение. На supervised и reinforcement этапах контроль осуществляет человек, а людям свойственно ошибаться. Так что, несмотря на потрясающие ответы модели, по моему мнению, сложно утверждать их истинность и достоверность или найти критерий ошибки», — говорит она, добавляя, что немаловажна и ограниченность базы знаний для модели (например, событиями до какой-то конкретной даты). Есть и момент, связанный с тем, что понятие контента обесценивается легкостью его генерации и невозможностью модерации, заключает она.

Кроме того, возникает вопрос, как преподавателям оценивать работы учеников и студентов, которые стали активно применять ChatGPT в учебе, что подрывает их мотивацию учиться и развиваться.

Почему не «убьет» поиск и разработку

Несмотря на ограниченность чат-бота, десятки проектов на базе AI и корпораций он уже заставил двигаться в усиленном темпе и искать свой ответ на то, что предлагает аудитории ChatGPT. Как утверждает The New York Times, выпуск продукта от OpenAI заставил объявить тревогу даже Google, чье руководство всерьез считает, что бот может нанести значительный удар по бизнесу интернет-гиганта. Если с помощью чат-бота пользователи могут находить ответы на все свои вопросы, к тому же, как уверяют многие, и лучшего качества, чем у Google, то зачем тогда поисковик?

Впрочем, опрошенные Forbes эксперты совсем не уверены в том, что угроза для традиционного поиска реальна. Такая нейросеть не может заменить поисковик или полноценно работать в колл-центре — так же, как не может заменить поисковик «Википедия» или знаток «Что? Где? Когда?», убежден Михаил Степнов. «Принцип работы ChatGPT — подбор наиболее вероятного ответа: именно вероятного, а не самого правильного или точного. Грубо говоря, у модели есть статистика о том, какие слова обычно употребляют вместе, и исходя из этого знания она подбирает наиболее вероятный ответ, — рассуждает он. — Но самый вероятный ответ — не всегда самый точный. Чтобы модель могла давать проверенные точные ответы на запрос, ее нужно дополнять технологией knowledge graph — как раз тем механизмом, который используют поисковики».

Нейросеть — намного более «тяжелый» метод обработки информации, чем knowledge graph поисковиков, продолжает Никита Зелинский: «Задача масштабировать использование нейросети в тех же масштабах, в каком используют Google, практически невыполнима или как минимум требует многомиллиардных вложений».

Но самая главная «фича», которая получила резонанс в IT-сообществе — это способность написания кода, считает Дмитрий Ермилов. Из-за возможности получить на свою просьбу от ChatGPT практически готовый код и возникло обсуждение в отрасли — действительно ли в скором времени нейронные сети заменят программистов. Но в ближайшие «лет десять» этого точно не случится, полагает эксперт. По его мнению, хоть ChatGPT и пишет код, чтобы получить вменяемый результат, нужно настолько точно и детально описать этот код словами, «что вы бы уже давно написали его сами»: «То есть чтобы кастомизировать запрос ChatGPT под конкретную реализацию, нужно потратить столько же времени на описание того, что вы хотите, сколько и на создание самого кода». Поэтому ChatGPT — это теоретический и технологический прорыв, имеющий довольно посредственное отношение к практике, резюмирует Ермилов.

Сейчас ChatGPT в основном используют для всякого рода экспериментов. Руководитель OpenAI Сэм Альтман признает: ChatGPT невероятно ограничен, но в некоторых вещах достаточно хорош, чтобы создать обманчивое впечатление величия. «Было бы ошибкой полагаться на него в чем-то важном прямо сейчас. Это превью прогресса; нам предстоит проделать большую работу над надежностью и правдивостью», — написал он в Twitter (заблокирован в России).

«Вероятно, модель можно будет применять и в коммерческих целях для ускорения работы копирайтеров, маркетологов, программистов или сотрудников кол-центров, но ей все равно будет требоваться «человеческая» проверка или дополнительные модели, которые смогут нивелировать ее недостатки», — Никита Зелинский. ChatGPT действительно может использоваться для автоматизации рутинных процессов, связанных с текстом и кодом, «но мир она, скорее всего, не перевернет», согласен Михаил Степнов: «Ждем GPT-4».

Авторизуйтесь, чтобы оставлять комментарии