Ко Дню математики представляем авторскую колонку Валерина Юрова, доцента Института высоких технологий, старшего научного сотрудника лаборатории математического моделирования сложных и нелинейных систем, кандидат физико-математических наук БФУ им. И. Канта. Автор характеризует жанр своего теста как диатриба, жанр античной литературы, ораторская речь, произнесённая часто с апелляцией к эмоциям:
Математика — язык Вселенной
«Давайте начнем наш разговор с несколько неожиданной точки — с могущества человеческих языков. Любой разговорный язык (будь то русский, английский, суахили или любой другой из почти семи тысяч существующих ныне языков) — это удивительная система, одинаково пригодная для передачи и сухой статистической информации, и тысяч тончайших оттенков чувств и ощущений. Человеческий язык почти всемогущ, когда мы пытаемся отразить мир таким, как мы его воспринимаем или хотим воспринять. Но увы, это всемогущество осыпается как сухая хвоя с елки после Старого нового года, стоит лишь Вам задаться целью отразить Вселенную такой, какой она есть на самом деле.
Впервые с этой проблемой столкнулись ученые, занимавшиеся так называемой натуральной философией в эпоху раннего модерна (поздний XVII век). Тогда любые научные работы, посвященные, например, движению планет, притяжению тел к Земле, сущности электрических зарядов и т.п., было принято писать в виде трактатов — многостраничных изложений различных постулатов, и вытекающих из них логических последствий. Загвоздка заключалась в том, что для максимально точной передачи мысли ученым приходилось в буквальном смысле слова «ломать язык через колено»: давать предельно точные определения, сурово вырезать любые намеки на метафоричность и безжалостно давить двусмысленность, столь присущую любому из человеческих языков…
И что же? Даже после всех этих экзекуций оказалось, что точно выразить процесс электромагнитного дрейфа в проводнике, или коллапса выгоревшей сверхмассивной звезды, или структуры морских волн на мелководье всё равно не удаётся без математики. Выяснилось, что человеческие языки идеально приспособлены для общения человека с человеком — но они совершенно не предназначены для разговора с природой. Вселенная просто не понимает нашего языка. Верно и обратное: если мы хотим понять, как устроена Вселенная, на каких принципах, можно ли эти принципы употребить на пользу человеку — нам кровь из носу нужно научиться хотя бы самым основам языка Вселенной — математике.
Я мог бы много и горячо рассказывать о том, как и почему именно математика оказалась ключевым инструментом для познания Вселенной, но об этом уже много и интересно сказал Артем Валерианович Юров, поэтому я ограничусь только одним, но при этом очень показательным примером.
Неприятности с ИИ
Я думаю, все наши читатели слышали о стратосферном взлёте так называемых больших языковых моделей (или, иначе, LLM: Large Langue Models) типа GPT, YandexGPT и Gemini. Все современные LLM основаны на математических моделях, разработанных еще в 60-70-х годах прошлого века, натренированы на гигантских корпусах текстовой информации (от 10 гигабайт для GPT-1 в 2018 году до нескольких терабайт для GPT-4) и способны на удивительные вещи. Например, написать за вас поздравление коллеги с Новым Годом. Или сочинить научно-фантастический рассказ. Или создать сценарий еженедельного новостного подкаста! Конечно, особых наград такие рассказы на заработали (но получали обвинения в плагиате), да и интерес к такого рода подкастами у публики тоже быстро исчез, но сам факт их существования все же весьма примечателен.
Нас, однако, интересует один аспект LLM, который стараются пореже упоминать в хвалебных одах «искусственному интеллекту» (ИИ), а именно: почти полная непригодность больших языковых моделей для серьезной научной работы. Да, ИИ может составить Вам выжимку основных выводов опубликованной статьи или переписать фрагмент уже написанного текста в другом стиле. Но стоит Вам поставить перед ним хоть сколько-нибудь нетривиальную научную задачу, особенно если эта задача принципиально новая и в литературе практически не отражена, как начинаются большие неприятности.
Показателен здесь пример языковой модели Galactica, который был натренирован на большом корпусе научной литературы (около 48 миллионов научных статей, книг и учебников) и, по замыслу создателей, должен был избавить ученых от необходимости листать справочную литературу для научной работы. Galactica была с большой помпой открыта в 2022 году и проработала 3 дня, после чего была тихо свернута и больше никогда и нигде не упоминалась. За эти три дня Galactica вызвала ожесточенную критику ученых и породила целый ряд перлов – например, сообщила, что Сергей Королев в 1957 году на борту Спутника-2 запустил в космос карликовую карельскую медведицу по имени Барс (!). По-видимому, ключевой причиной этого фиаско стала фундаментальная проблема и ограничение больших языковых моделей. Дело в том, что, в отличие от обычного разговорного языка, позволяющего строить любые сколь угодно абсурдные утверждения (см. стихотворение Бармаглот из повести «Алиса в Зазеркалье» Льюиса Кэррола), корректное описание Вселенной накладывает очень жесткие ограничения на форму и содержание утверждения — собственно, в уяснении этих ограничений и заключается работа любого математического физика. Но LLMы математику не понимают, а умеют только в человеческий язык, что и привело к печальному инциденту с моделью Galactica.
Математический язык универсальнее человеческого
Вместо заключения я хотел бы подчеркнуть, что мое эссе — вовсе не попытка принизить бесспорные и всем очевидные достоинства человеческих языков: на одном из этих языков оно, кстати, и было написано. Вместо этого моя цель — привлечь внимание читателей к одному ключевому, но часто игнорируемому факту: тому, что русский, французский, китайский и другие языки в первую голову предназначены для общения между людьми (Homo Sapiens Sapiens), и справляются с этой задачей замечательно.
Проблема возникает, когда мы пытаемся приладить столь совершенные в своем роде инструменты для несвойственных им задач: например, при попытке описать поведение электрона в сильно неоднородном магнитном поле (опыт Штерна-Герлаха). Не менее сложная задача возникает, когда мы пытаемся расшифровать сигналы других высокоорганизованных живых существ. Человечество с 1967 года изучает феномен «песен» китов (в первую очередь горбатых китов). Мы знаем их общую структуру и интервал частот, используемых для отдельных слов-импульсов, и что каждая фраза песни состоит из двух десятисекундных полу-фраз по 4-6 отдельных «слов-импульсов» каждая. Нам известно, что киты повторяют каждую фразу несколько раз на протяжении нескольких минут, что во время всей песни фразы постепенно модифицируются, а потом вся песня повторяется, и длится это несколько часов или даже дней. И только одного мы до сих пор не знаем: что это все должно означать?.. Выглядит сие как средство коммуникации, но даже если это язык, мы его абсолютно не понимаем. Не исключено даже, что мы никогда его до конца и не сможем понять, просто потому, что создан он существами, живущими в совершенно иной среде и ведущими предельно отличный от нас образ жизни.
И все-таки даже в этом, безусловно, самом печальном случае, у нас по-прежнему будет хотя бы одно средство коммуникации, общее и для приматов, и для китообразных, и даже для не вполне представимых гипотетических обитателей газовых гигантов типа Юпитера. Это универсальное средство, которое работает всегда и в любых, сколь угодно экстремальных условиях, есть ни что иное, как язык математики.
Личный кабинет для
Личный кабинет для cтудента
Даю согласие на обработку представленных персональных данных, с Политикой обработки персональных данных ознакомлен
Подтверждаю согласие