«От больших языковых моделей к общему ИИ»: управляющий директор - начальник Управления Сбербанка встретился с гостями Научного фестиваля


«От больших языковых моделей к общему ИИ»: управляющий директор - начальник Управления Сбербанка встретился с гостями Научного фестиваля

13 октября в рамках Всероссийского фестиваля Наука 0+ в Фундаментальной библиотеке МГУ состоялась лекция «От больших языковых моделей к общему ИИ: передовой край исследований в области искусственного интеллекта». Управляющий директор – начальник Управления ПАО «Сбербанк» Сергей Минаев рассказал гостям фестиваля о прогрессе, достигнутом в области искусственного интеллекта за последние 10 лет, а также о современных трендах и актуальных проблемах. 

В начале лекции спикер отметил необходимость установить точное определение обсуждаемого термина: «Искусственный интеллект - направление науки и технологий, которое занимается автоматизацией интеллектуальных задач… Здесь важно понимать, что под термином искусственный интеллекта часто понимается не вся область исследований, а только её фронтир. То есть только те задачи, которые либо пока что ещё не удалось решить, либо те, которые удалось решить относительно недавно». 

Впервые термин «искусственный интеллект» ввел в оборот Джон Маккарти в 1956 году на летнем семинаре в Дартмут-колледже.  «Времена тогда были романтические. Было ощущение, что пройдет еще 5 лет и мы будем строить колонии на Луне, а через 10 лет на Марсе. Если бы вы спросили человека, будет ли настоящим универсальным искусственным интеллектом машина, которая обыграет чемпиона мира в шахматы, вам бы ответили “да”», – рассказал ученый. 

Спикер отметил, что индустрия сильно изменилась за последние 10 лет. «Когда я читал эту лекцию 10 лет назад, я мог позволить себе сказать, что искусственный интеллект делится на два класса: прикладные системы, достигающие сверхчеловеческой эффективности за счет узкой специализации,  и универсальные, чисто гипотетические, способные решать любые интеллектуальные задачи. Нынешние системы, ChatGPT или GigaChat куда более универсальные», –  поделился Сергей Минаев.

С развитием технологий увеличиваются риски. Говоря о потенциальных угрозах, спикер поделился опасением, что в современном мире  «апокалипсис стремительно дешевеет»: «В 19 веке если бы хотели навредить планете, у нас не было бы для этого инструментов, а в середине 20 века у нас появилось атомное оружие. Сейчас активно развиваются биотехнические технологии». Однако отказываться от развития искусственного интеллекта – «добровольна лоботомия». По мнению исследователя, поскольку человеческий мозг ограничен в своих возможностях, нейросети призваны контролировать другие развивающиеся технологии. 

На данный момент искусственный интеллект превосходит человеческий мозг по скорости вычислений, по количеству задач, которые могут решаться параллельно, а также по возможности накапливать данные. По оценкам исследователей IDC в 2025 году у человечества будет 175 зэта-байт оцифрованной информации. Как объясняет  Сергей Минаев, если перенести эту информацию на DVD-диски и сложить их вместе, то полученная стопка выйдет высотой в 12295082 км, что равно 32 расстояниям до Луны.

На взлет развития искусственного интеллекта повлиял “трансформер”, технология машинного обучения. Благодаря ей нейросети гораздо быстрее обрабатывают запросы, так как модель позволяет распараллеливать задачу. Данная технология наиболее эффективна в машинном переводе и реферировании. Многие нейросети работают по принципу языковых моделей, то есть на основе имеющейся информации предсказывают вероятность последовательности слов. Как заметил исследователь, на первый взгляд данная функция кажется мало полезной, однако любой запрос можно представить как задачу по продолжению заданного текста. 

В продолжении лекции спикер рассказал о тенденциях в развитии технологии. Разработчики всё чаще делают тратят большую часть ресурсов не на увеличение количества параметров нейросети, а на её обучение. Говоря об актуальных проблемах, Сергей Минаев отметил, что на данный момент компании столкнулись с проблемой «бутылочного горлышка»: «В человеческом мозге нейрон является и местом хранения, и местом обработки информации. В машинах же есть память, в которой хранятся данные, они перегоняются через щину в регистр процессора, где происходит обработка этих данных, после чего опять через шину информация перегоняется обратно. И эта шина, через которую перегоняются данные, становится “узким горлышком”».

С развитием нейросетей, всё чаще в медиа звучат опасения относительно угроз искусственного интеллекта для человека. Сергей Минаев заверил: взрыва ждать не нужно. В ближайшее время у нас не будет достаточно электроэнергии, чтобы обучить систему до уровня ML-специалиста(machine learning engineer). Помимо этого любая технология сталкивается с принципом Ландауэра, согласно которому любая информация физична и требует материального носителя. Потеря одного бита информации же ведет к выработке тепла, следственно обработка данных, накопленных человечеством, будут вызывать сильное энерговыделение.

В конце лекции Сергей Минаев поделился планами по развитию GigaChat, нейросети от Сбера. На данный момент разработчики занимаются технологиями обработки речи, генерации видео, музыки и пения. Нововведения стоит ужинать уже в этом году. В будущем планируется, что искусственный интеллект сможет выполнять коды, отрисовывать графики, генерировать 3D по текстовому промпту.

Автор текста: Мария Ефимова