ИИ эволюционирует от инструмента быстрого, но послушного, к нерасторопному, но самостоятельному. Направление, в котором последние два года происходит развитие систем искусственного интеллекта, четко обозначилось как отказ от гонки скоростей в пользу более медленной, но более вдумчивой генерации результатов машинного мышления. Об этом говорится в обзоре венчурного фонда Sequoia, с которым ознакомился и пересказал корр. «Эксперта» Игорь Серебряный.
Тише едешь — клубничней мыслишь
В обзоре Sequoia даже предлагается не использовать кавычки в слове «мышление» применительно к ИИ, поскольку процесс его реагирования на запросы перестает основываться на пусть и стремительном, но механическом переборе возможных вариантов. У самых продвинутых больших языковых моделей (LLM) он всё отчетливее приобретает черты «настоящего» мышления — когда ответ создается не из заложенных в процессе обучения готовых ответов и их комбинаций, а на генерации действительно новых конструкций, которым машину изначально не обучали.
В качестве примера супер-ИИ аналитики приводят модели AlphaGo, Strawberry («Земляника») и о1 (ее ранняя версия называлась Q*). Они, напоминают в Sequoia, проявляют четкие когнитивные признаки: способны решать задачи, пути решения которых прямо либо даже путем сложной комбинаторики не следуют из имеющихся в их памяти данных.
По быстродействию такие модели (System 2) несколько проигрывают моделям, генерирующим ответы путем перебора вариантов (System 1). Однако в эволюционном смысле между ними разница, как между видом Homo Sapiens и неандертальцем. AlphaGo и ее «одноклассники» обладают «копирайтом» на свои решения, в то время как модели ранних поколений всего лишь «собирают заказы» из имеющегося в наличии информационного ассортимента.
Супер-ИИ демонстрирует качества, до сих пор являвшиеся монополией человеческого мозга: память о собственном прошлом, самооценку, способность принимать решения, не основанные на предыдущем опыте, а исходя из ситуации здесь и сейчас. Более того, в ряде случаев System 2 способна мыслить способами, человеку несвойственными: например, визуализировать абстрактные процессы, такие как математические формулы.
Эволюционным отличием моделей System 2 от «GPT-неандертальцев» аналитики называют то, что они вообще не нуждаются в предварительном обучении. Эти модели работают по принципу «тише едешь — дальше будешь» (в оригинале — stop and think), генерируя собственные ответы, никакими вариантами не предусмотренные. Продолжая аналогию: ранние LLM выбирали готовые блюда из меню a la carte, а супер-ИИ готовит их по оригинальным рецептам.
Например, если System 1 для шахматного компьютера оперирует колоссальным, до 30 млн, но всё-таки конечным запасом возможных ходов, то System 2 находит варианты самостоятельно, и число таких вариантов стремится к бесконечности. Если речь идет об игре до падающего флажка, Strawberry, возможно, проиграет обычному сопернику (System 1 или даже человеку). Но при неограниченном запасе времени у противников System 2 нет шансов.
Чем дешевле, тем дороже
Эволюционный скачок, происходящий с ИИ у нас на глазах, ставит вопрос перед самими разработчиками: как определять качество конкретной работы LLM? Одно дело — оценивать итоги шахматной партии, результаты инфраструктурного проекта или эргономичность производственного процесса, предложенные ИИ. Но в каких единицах измерять качество литературного текста, музыкальной пьесы или визуального изображения, сгенерированных компьютером, обладающим когнитивными способностями? Иными словами, когда LLM берется за решение задач, не основанных на логике, она вступает на территорию, до сих пор принадлежавшую психологам и бихевиористам, а не математикам.
Эволюция ИИ идет в направлении от сугубо вычислительных к когнитивным способностям, подтвердил в комментарии «Эксперту» профессор Института системной и программной инженерии и информационных технологий НИУ МИЭТ Евгений Портнов: «Всё более важное значение приобретает способность компьютеров к распознаванию объектов материального мира, чем скорость абстрактных вычислений. Область применения таких способностей безгранична: супер-ИИ человека в ближайшие годы точно не заменит, но станет незаменимым помощником в огромном количестве отраслей — от медицины до гуманитарных профессий. Несколько упрощая, можно описать это так, что новые модели будут уметь слышать и видеть, в то время как старые умели только считать».
Как в любом эволюционном процессе, эволюция ИИ тоже выводит из игры тупиковые и более слабые ветви, оставляя на рынке наиболее приспособленные к окружающей среде (в данном случае к потребностям пользователей) виды. В Sequoia указывают, что развивать и поддерживать модели, обладающие суперинтеллектом, способны только компании, имеющие достаточный для этого финансовый ресурс — эра «партизанского маркетинга», когда великие технологические прорывы совершались в гаражах, ушла в прошлое.
Сфера разработок супер-ИИ консолидируется: чем дешевле становится конечный продукт для пользователей, тем дороже обходится его разработка и обслуживание. Список кандидатов на выживание, который публикуют аналитики, сюрпризов не содержит: это Microsoft, Amazon, Meta (запрещена в РФ) и Google. Пространство для вхождения на этот рынок новых софтверных и SaaS-компаний стремительно сужается.
Хорошей же новостью для компаний, не входящих в этот суперклуб, является то, что для огромного числа задач применение супер-ИИ избыточно. Для любых промптов, ответ на которые может быть описан в бинарной системе «да или нет», моделей System 1 более чем достаточно: не требуется долго размышлять и проявлять креативность для ответа на запрос, какой город является столицей России.
Гонка скоростей между разработчиками искусственного интеллекта в самом деле исчерпала себя, соглашается Евгений Портнов: «Для большинства практических задач, для решения которых используются модели ИИ, достигнутого быстродействия уже хватает с избытком. Быстродействие остается критически важным фактором, например, в военном деле, где требуется моментально определить траекторию вражеской ракеты. Но и можно просто объединить в одну батарею несколько процессоров, уменьшив тем самым общую скорость принятия решения. Однако и в этом примере нет принципиальной разницы: получите вы ответ на свой запрос через миллисекунду или через наносекунду».