Человек и ИИ
29.11.2024 Техно

Большая догоняющая модель: Россия зависит в сфере ИИ от Запада

Фото
Shutterstock

Сейчас страны борются за технологическую независимость, одним из ключевых драйверов которой выступает генеративный искусственный интеллект (ИИ). Россия предлагает несколько конкурентоспособных по глобальным меркам решений, но эти продукты нежизнеспособны без западных кодов и оборудования. «Эксперт» проанализировал, чем грозит отставание в сфере искусственного интеллекта и почему создание полноценной индустрии в одиночку не под силу ни одной стране, а тем более компании.

Почему России нужен национальный ChatGPT

Первая глава истории искусственного интеллекта уже написана, заявил в июле 2024 года в своей колонке для The New York Times Сэм Альтман, глава американской OpenAI — крупнейшей научно-исследовательской организации в сфере ИИ, создавшей, в частности, ChatGPT. Прогнозов относительно следующей главы господин Альтман не строит, но подчеркивает, что США и их союзники обязаны добиться лидерства на этом поле. «Другого мнения быть не может», — пишет он. Авторитарные режимы уже включились в гонку и дышат в спину, предупреждает Альтман.

«Тот, кто станет лидером в этой (ИИ — „Эксперт“) сфере, будет властелином мира», — прогнозировал Владимир Путин в 2017 году. Глава OpenAI спустя семь лет вторит его прогнозу.

Для большинства людей генеративный ИИ пока ограничивается чат-ботами, которые могут давать простые и обобщенные ответы на вопросы пользователя или рисовать картинки по нехитрому описанию. Но абсолютно та же технология, которую мы видим в ChatGPT или его аналогах, используется, например, для автоматического сканирования документов, распознавания эмоций по голосу и мимике, предсказания цен на акции и в военной индустрии.

Хотя массовую популярность LLM приобрели только в начале 2023 года — с выходом ChatGPT на широкую аудиторию, существовали они задолго до этого. Упрощенно: суть их работы сводится к генерации наиболее вероятного набора слов в продолжение или в ответ на предшествовавший ему текст. Через матричный алгоритм проходит огромный массив подготовленных текстов, после чего полученная модель пытается произвести нечто связное по форме и по содержанию. Этот подход активно использовался уже с 2018 года, но наиболее впечатляющие результаты он стал давать, когда число уникальных слов, заложенных в модели, выросло с сотен миллионов до миллиардов. Считается, что модель «обретает сознание», когда число слов достигает 6 млрд. Именно этим OpenAI покорила глобальную ИТ-индустрию.

Вопрос о том, когда же большие языковые модели заменят человека, часто повторяется в медиа в последние годы: начиная с сериалов и заканчивая научными журналами. И хотя его до сих пор можно услышать от разных изданий и институтов, наиболее красноречивый ответ подготовила компания, которая одной из первых присоединилась к ажиотажу вокруг ИИ, — Apple.

В октябрьском исследовании специалисты корпорации отмечают, что даже последние крупнейшие модели вроде GPT-4o, Mistral и Llama-3 до сих пор испытывают большие сложности в имитации человеческого мышления. Например, если дать модели задачу сложить два красных яблока, которые мы купили вчера, и два зеленых яблока, которые мы купили сегодня, она с большой вероятностью запутается и сообщит, что у нас не четыре, а всего два яблока.

Способность мыслить, обобщать, принимать решения и брать ответственность за них до сих пор остается за человеком. Тем не менее LLM все лучше показывают себя как инструмент исполнения этих решений. С их помощью решаются задачи в таких сферах, как управление персоналом, документооборот, юриспруденция, они внедряются в качестве виртуальных помощников для школьников средних классов.

Одно из ключевых применений искусственного интеллекта в промышленности и предпринимательстве — это маркетинг, указывает вице-президент Международного конгресса промышленников и предпринимателей Максим Белопотапов. ИИ используется в воронках продаж, для корректировки речи сотрудников, для составления скриптов, по которым они общаются с клиентами. Компании фактически могут работать круглосуточно с максимальным охватом лидов: работники отдела продаж просыпаются — и у них уже фактически горячие заказы, контракты, продолжает эксперт.

Кроме того, модели активно внедряются в производство: при помощи датчиков и видеокамер они помогают следить за расходом материалов, за эффективностью сотрудников, выявлять брак продукции, следить за «усталостью» металлоконструкций, перечисляет Белопотапов. Потенциал автоматизации с помощью LLM очень велик, и любой новый прорыв в этой сфере поможет компаниям значительно увеличить прибыли, считает он.

Большая догоняющая модель

Как Россия зависит от Запада

Флагманы рынка ИИ, в частности LLM, — американские компании. Они предлагают зарекомендовавшие себя модели ChatGPT (OpenAI), LLaMA (Meta AI — принадлежит компании Meta, которая признана экстремистской и запрещена в РФ), Claude (Meta AI — принадлежит компании Meta, которая признана экстремистской и запрещена в РФ), Gemini (Google) и так далее. Не отстает и Китай с моделями Yi Large и Tongyi Qianwen. Нацеленный на разработку ИИ холдинг G42 из ОАЭ еще весной получил $1,5 млрд инвестиций от Microsoft.

Российские компании в целом не выпадают из гонки в области ИИ. Наиболее известными стали GigaChat и Kandinsky от Сбера и YandexGPT от «Яндекса».

В гонке ИИ воспроизведение и даже опережение достижений конкурентов в разработке софта — это не всегда самая сложная задача. Значительная часть технологий больших моделей находится в режиме Open Source, то есть является открытым знанием. Крупнейшие агрегаторы кодов также американские компании. Уже готовые решения в открытом доступе предлагают, например, GitHub и Huggin Face.

Пока услуги этих сервисов в целом доступны для российских компаний. Например, в марте 2022 года представитель GitHub заверял, что «сервис является домом для всех разработчиков вне зависимости от места их проживания». Однако компания ограничивает доступ в Крыму, на Кубе, в Иране, Северной Корее и Сирии. За последние два года российские разработчики неоднократно жаловались на блокировку.

Более тяжелая проблема — это инфраструктура для работы LLM, по сути, центры обработки данных (ЦОД). Модели работают на специальных чипах — графических процессорах (Graphics processing unit, GPU). Крупнейший производитель GPU — американская NVIDIA. Поставки ее продукции в Россию запрещены с 2022 года. Более того, компания уже грозилась ограничить обновления драйверов для российских пользователей, у которых уже есть видеокарты NVIDIA. Американские видеокарты чаще всего используются для обучения LLM при помощи набора программных инструментов CUDA. Хотя есть и другие, не американские производители, модели на других GPU работают с большими сложностями.

Еще одна проблема — ограниченность наборов данных для LLM на русском языке. Хотя уже давно существуют такие крупные открытые проекты, как «Национальный корпус русского языка» и OpenCorpora, число уникальных слов в них не превышает нескольких сотен миллионов — это крохотная часть того, что «знают» крупнейшие зарубежные LLM. В большинстве случаев это оставляет российских разработчиков один на один с задачей сбора собственных датасетов всеми доступными способами.

Чтобы создавать передовые решения, нужен доступ не только к текстам, но и к аудио- и видеоинформации, добавляет генеральный директор Future Crew Евгений Черешнев. Большое преимущество здесь имеют компании, у которых такая информация уже накоплена за долгое время, например Google, владеющая YouTube, и OpenAI, располагающая огромным разнообразием контента из запросов пользователей, отмечает эксперт. Эти компании тем более сильны, что могут ограничивать доступ к своим ресурсам для других игроков на рынке: недавно выяснилось, что NVIDIA тайно и без разрешения скачивала с YouTube миллионы видеороликов, чтобы тренировать свои модели, Google в ответ сильно ужесточила свои системы защиты от таких действий, отмечает Черешнев. Российским разработчикам в отсутствие таких возможностей приходится проявлять изобретательность, добавляет он.

В России зависимость признают и оценивают риски такого отставания. Платформы развития искусственного интеллекта формируются за рубежом, отметил Владимир Путин на заседании Валдайского клуба 7 ноября 2024 г. «Мы должны понимать это и развивать свой суверенный искусственный интеллект. Конечно, нужно пользоваться всем что есть, но и развивать свои направления», — заявил он.

На данный момент зависимость российских компаний от западных решений есть, но она обусловлена более высоким уровнем развития зарубежных продуктов с LLM, которые перетягивают на себя пользователей, считает архитектор решений группы компаний DатаРу Дмитрий Тонких. В случае внезапной потери доступа к зарубежным моделям использовавшие их компании быстро перестроятся на отечественные, ведь их API (интерфейсы для взаимодействия через программный код) очень близки друг к другу, считает он.

Проблема заключается не в зависимости от выпущенных на рынок иностранных решений, добавляет инженер Центра компетенций Национальной технологической инициативы (НТИ) «Цифровое материаловедение: новые материалы и вещества» МГТУ им. Н. Э. Баумана Александр Кольцов. Российские компании, например «Яндекс» и Сбер, выпускают вполне конкурентные продукты, к тому же лучше адаптированные к потребностям российского рынка. Проблема в том, насколько быстро растут возможности лидеров индустрии, отметил он. Пока мы через воспроизведение по открытым источникам достигаем тех показателей качества, которые LLM демонстрировали еще несколько лет назад, построенные на базе более свежих исследований модели увеличивают технологический разрыв, распространяются на новые области применения, рассуждает эксперт. «Мы догоняем, а разрыв растет», — говорит Артем Кольцов.

Все самые интересные технологии — Llama, Mixtral, Huggingface и т. п. — есть в открытом доступе, по крайней мере пока, отмечает руководитель отдела науки о данных в Hybe.io Алексей Калабурдин. Но для работы с более сложными и специфическими сценариями, рассчитанными на решение бизнес-задач, большие модели необходимо обучать на своих данных, и здесь риски ощутимые — нужны либо импортные GPU, либо доступ к облаку с LLM без санкционных блокировок, указывает он.

Большая догоняющая модель

Что нужно для создания LLM

Для создания большой языковой модели необходимы четыре вещи: экспертиза в этой области, инфраструктура для обучения LLM, то есть ЦОДы с чипами GPU, доступ к максимально качественным большим данным (то есть размеченным, нормализованным, очищенным от мусора), кредитная линия на финансирование НИОКР без жесткой привязки к прибыли, указывает Черешнев. То есть компания-разработчик должна иметь возможность позволить себе комфортно с точки зрения отчетов P&L и OIBDA заниматься ИИ, понимая, что возврата инвестиций в ближайшие годы может не случиться, пояснил он. В России есть всего три-пять компаний, более или менее отвечающих этим требованиям, отмечает Евгений Черешнев.

Проблема датасетов вообще краеугольная в обучении LLM, уверен Тонких. Рост качества ответов больших языковых моделей ограничен доступностью очищенных и размеченных корпусов текстов, и преодолеть эту проблему можно единственным способом — кропотливым сбором качественных данных для обучения. Результат этой работы не заставит себя ждать, считает эксперт.

Что предложит Россия

Российские LLM находятся на стадии активного развития, как, впрочем, и вся отрасль, считает Тонких. Некоторые модели демонстрируют хорошие результаты в сравнении с зарубежными аналогами, но в целом пока отстают. Главное преимущество отечественных LLM — лучшее понимание русского языка благодаря более качественному корпусу текстов на русском, добавляет эксперт.

Российские модели достаточно конкурентоспособны в сравнении с западными аналогами как минимум в части русского языка и языков народов СНГ, указывает Алексей Калабурдин. В определенных нишах российские компании достигают выдающихся результатов, например в нише легких LLM с 7–8 млрд параметров, добавляет эксперт.

Полный цикл производства LLM — это процесс, который требует очень больших инвестиций, на данный момент этим наиболее серьезно занимаются только Сбер и «Яндекс», другим компаниям это не под силу Лариса Малькова, управляющий директор практики «Данные и прикладной ИИ» Axenix

Ограничения инфраструктуры, в частности доступ к GPU, сильно давят на разработчиков, добавляет она. Единственная возможность для России в сравнительно небольшие сроки совершить прорыв в этой области — это объединить ресурсы и крупнейших компаний, и государства, полагает Малькова. В России в целом это понимают: пять крупнейших компаний — «Яндекс», Сбер, Mail.ru Group, «Газпром нефть», МТС — и госфонд РФПИ создали альянс в сфере ИИ, напомнила она. Но после подписания декларативных документов значимых сообщений о развитии этого объединения не было.

Запуск собственного, независимого производства GPU в России — это крайне капитало- и наукоемкая задача, согласен Черешнев. Во-первых, это требует запуска предприятия, способного выпускать микроэлектронику по современным топологическим нормам — от 2 до 10 нм. Во-вторых — подготовки большого числа профильных кадров, способных работать не только непосредственно на предприятии, выпускающем конечные продукты, но и заниматься разработкой кремниевых пластин, процессоров, систем охлаждения и других необходимых для микроэлектронной индустрии комплектующих. В-третьих, с учетом того, что такой завод рискует стать убыточным, если его сбыт будет ограничен только российским рынком, проект потребует выхода на внешние рынки, например рынки стран БРИКС, указывает эксперт. Подобная инициатива будет требовать большой государственной поддержки, отмечает он.

На это указывает и опыт США: тайваньская TSMC (выпускает чипы в том числе и для NVIDIA) строит три завода по производству чипов в Аризоне на $65 млрд. Проект субсидируется властями США в рамках реализации специально принятого закона «О чипах и науке» (CHIPS and Science Act), главная цель которого — обеспечить США суверенитет в вопросе производства чипов. То есть даже глобальный лидер индустрии не может реализовать подобные инициативы без поддержки властей, заключает он.

Создание LLM само по себе сталкивается с проблемой колоссальных капиталовложений. Например, по данным «Отчета об индексе ИИ» (Artificial Intelligence Index Report 2024), подготовленного Стэнфордским университетом, стоимость обучения нейросети Gemini Ultra составила $191 млн, ChatGPT — $78,4 млн, PaLM — $12,3 млн.

На российском рынке не так много компаний, способных направлять в ИИ-проекты подобные инвестиции, указывает Черешнев. Кроме того, развитие и запуск подобных проектов требуют штучных специалистов, которых в России не так много, добавляет он. Поэтому в таких условиях российским игрокам было бы разумно не пытаться создать десятки одинаковых моделей, а идти по пути кооперации, запускать совместные проекты и дополнять экспертизу друг друга, уверен он.

Впрочем, проблема доступа к вычислительным мощностям GPU кажется надуманной, считает ведущий эксперт Центра компетенций НТИ «Искусственный интеллект» на базе МФТИ Александр Родин. В Россию видеокарт будет ввезено столько, сколько нужно — правда, экономическая эффективность «тяжелых» решений, в частности инвестиций в ЦОДы на дорогих чипах, не всегда очевидна. Поэтому для страны на ближайшие десятилетия крайне актуальны решения в области ИИ, которые можно было бы реализовать на относительно скромной аппаратной базе, полагает эксперт.

Большая догоняющая модель

Дефицит графических вычислителей является общей, а не сугубо российской проблемой, добавляет Кольцов. Заблуждением будет считать, что механическое наращивание доступных вычислительных мощностей автоматически позволит сократить технологический разрыв и что именно отсутствие обеспеченности техникой является основным препятствием для достижения лидирующих позиций, подчеркивает эксперт.

В реальной жизни, как правило, не нужно, чтобы LLM могла отвечать «все обо всем», поэтому, например, очень популярна RAG-архитектура, которая позволяет улучшить качество генерации за счет внутренних баз знаний компаний — благодаря этому зачастую получается обходиться без участия разработчиков модели, рассуждает управляющий директор практики «Данные и прикладной ИИ» Axenix Лариса Малькова.

У наших разработчиков есть большое преимущество — недорогие энергетические ресурсы, которые могут обеспечить работу дата-центров, подчеркивает Белопотапов.

«Технологии развиваются, и их себе могут позволить те, у кого будет больше всего доступа к энергии. Чем она будет дешевле и чем ее будет больше, тем будет больше шансов пользоваться этими технологиями», — говорит Белопотапов.

Впрочем, и у российской, и у глобальной индустрии искусственного интеллекта, несмотря на все различия, есть общая проблема — это дефицит талантов, который будет только усугубляться

Еще в 2023 году McKinsey по итогам опроса сотрудников 1,5 тыс. компаний писала, что внедрение искусственного интеллекта в бизнесе замедляется не из-за насыщения рынка или достижения пределов возможностей технологии, а из-за нехватки квалифицированных сотрудников, способных внедрять в процессы генеративный ИИ.

Так, по мнению аналитиков McKinsey, типичный проект в области ИИ требует высококвалифицированной команды, включающей специалиста по работе с данными, инженера по работе с данными, инженера по машинному обучению, менеджера по продукту и дизайнера, а квалифицированных специалистов просто не хватает даже с учетом недавнего спада в технологической отрасли.

К похожим выводам пришли аналитики Bain & Company. В отчете компании за прошлый год сказано, что 39% опрошенных руководителей компаний называют отсутствие технических навыков самым большим барьером при получении выгоды от внедрения ИИ. Поэтому инвестиции в развитие талантов сотрудников, пишут аналитики, станут целью крупнейших компаний по всему миру.

В России, по различным оценкам, дефицит ИИ-специалистов уже достигает порядка 10 тыс. сотрудников и будет расти. В таких условиях крупнейшие экосистемные игроки IT-рынка инвестируют в совместные проекты с вузами для подготовки кадров. Так, например, весной этого года МТС объявила об открытии магистратуры «Исследования и предпринимательство в искусственном интеллекте» на факультете компьютерных наук Высшей школы экономики. Образовательная программа включает изучение больших языковых моделей, генеративных нейросетей, а также инструментов компьютерного зрения и распознавания естественного языка.

По словам первого вице-президента МТС по технологиям Павла Воронина, помимо таких дисциплин, как обработка естественного языка, глубинное обучение для текстовых данных, теоретический анализ методов ИИ и т. д., учебный курс включает предметы, цель которых научить студентов привлекать инвестиции, разбираться в вопросах прав и этики, финансовом планировании и многому другому. В итоге на выходе у них есть релевантный опыт, который можно применить и в большой компании, и в стартапе.

Для качественной работы с LLM нужны не только большие датасеты, кадры и мощное «железо», но и консалтинг, который дает конкретное понимание, где наиболее эффективно можно будет внедрить нейросети, какие задачи они смогут закрывать и какой результат от них можно получить в перспективе, добавляет руководитель направления LLM-продуктов MTS AI Сергей Пономаренко.

«В каком-то смысле нам предстоит повторить подвиг советской прикладной математики 60–70-х годов прошлого века, создавшей чрезвычайно эффективные алгоритмы в условиях серьезного отставания СССР в вычислительной технике, на достижениях которой во многом базировалось взрывное развитие информационных технологий в 1990-х», — резюмировал Александр Родин.

ПЕРСПЕКТИВА

Глобальные Инвестиции

Искусственный интеллект все глубже проникает во все сферы жизни человека и продолжает привлекать значительные инвестиции, несмотря на некоторое падение интереса к нему с 2023 года. Глобальный рынок ИИ увеличился со $142 млрд в 2022 году до $207 млрд в 2023-м и вырастет до $298 млрд в 2024-м, следует из прогнозов Statista. При этом значительную часть этого рынка составляет генеративный ИИ — на 2024 год его доля оценивается в $68,34 млрд, и ожидается, что он вырастет до $496,82 млрд к 2031 году, оценивают эксперты Coherent Market Insights.

29
Авторизуйтесь, чтобы оставлять комментарии