Може ли изкуственият интелект да революционизира математиката?*

Една безделна октомврийска вечер преди година Мехтааб Соуни се връща към старо свое занимание — разглеждането на задачите на Паул Ердьош. В сайта erdosproblems.com са събрани 1 179 хипотези, оставени от прочутия унгарски математик — от дребни любопитни въпроси до централни отворени проблеми в теорията на числата и комбинаториката.

Соуни, математик в Колумбийския университет, попада на задача №339, която му се струва твърде елементарна, за да остане нерешена почти две десетилетия след смъртта на Ердьош. И преди му се е случвало подобно нещо: дадена хипотеза изглежда достъпна, но формално продължава да се води „отворена“. В миналото той просто търсел в Google, докато не открие публикация с решение.

Този път обаче решава да използва ChatGPT като инструмент за преглед на литературата. Моделът бързо му посочва препратка към решение. Успехът го насърчава да се свърже с Марк Селке, който по това време работи в OpenAI. Заедно използват модела, за да издирят изгубени решения на още девет задачи на Ердьош, както и частични решения на други единайсет.

Оттогава активността около задачите на Ердьош рязко нараства. Според информация, обобщена от Терънс Тао, AI инструменти са помогнали около сто задачи да преминат в графата „решени“ само за няколко месеца. В повечето случаи става дума за усъвършенствано търсене в научната литература — откриване на стари публикации или забележки, които експертите са пропуснали. Но понякога езиковите модели правят и нещо повече: комбинират съществуващи теореми и идеи в диалог с математици, за да оформят нови или подобрени решения. В поне два случая модел е създал оригинално и валидно доказателство на задача, която дотогава не е била решавана.

Задачите на Ердьош се оказват удобен „бенчмарк“ за възможностите на Large Language Model (LLM). Те са много на брой и често са сравнително изолирани — решението им невинаги има по-широки последици. Затова и успешното им разрешаване често остава незабелязано и рядко достига до водещи списания. За един езиков модел обаче това няма значение. Той може да претърсва огромни масиви от текстове, включително слабо цитирани или трудно откриваеми материали. Така например Gemini открива мимоходом направена забележка в статия от 1981 г., която на практика решава задача №1089.

Според Андрю Съдърланд е грешка да се твърди, че тези системи са „просто търсачки“. В отделни случаи те са го насочвали към резултати, които са му позволявали да завърши доказателство, на което е бил зациклил. Макар помощта често да съдържа пропуски и неточности, потенциалът е очевиден: моделите вече функционират като полезни изследователски асистенти.

Подобни наблюдения стоят и зад инициативата First Proof — експеримент за тестване на математическите умения на AI. Единайсет водещи математици формулират отделни части от непубликувани доказателства и ги представят като предизвикателство към езиковите модели. Задачите обхващат различни области и варират по сложност. Идеята е проста: ако една система може да реши всички тях за седмица, тя би била изключително полезна за професионалната общност.

Още в първите дни организаторите са залети от предполагаеми решения, изпратени по имейл и споделяни в социалните мрежи и Discord. Вълнението е осезаемо. Но бързо се появяват и познатите трудности. В един случай онлайн изниква решение на задача на Мартин Хайрер — носител на Медала „Фийлдс“ и член на екипа — което се оказва частично доказателство, публикувано преди време на личния му сайт и архивирано от Wayback Machine. Така става ясно колко трудно е да се гарантира, че даден проблем наистина не съществува в обучителните данни.

По-сериозният проблем обаче е проверката. Моделите почти винаги генерират някакъв отговор и го представят уверено. Според Лорън Уилямс това прави верификацията изключително трудоемка. Даниел Лит отбелязва, че повечето „доказателства“ са несъстоятелни, макар понякога да се появяват и коректни решения. Впечатляващо е, че моделите изобщо успяват да стигнат до правилни отговори — но заедно с тях произвеждат и огромно количество грешки.

Независимо от конкретния изход на First Proof, през последните месеци се натрупват сигнали, че LLM ще станат част от стандартния инструментариум на математиците. През януари Рави Вакил публикува препринт съвместно с други изследователи, в който описват как езиков модел на Google им е помогнал да достигнат до нови идеи и доказателство по проблем, свързан с неговата работа. Според него въпросът вече не е дали да се използват такива инструменти, а как разумно ще изглежда математическата практика след пет години.

Засега обаче няма доказателство, създадено с помощта на AI, което да предизвика сериозен научен отзвук само по себе си. Някои резултати са били преекспонирани в интернет. Други остават нишови. Карло Пагано подчертава, че задачите на Ердьош не са идеалният тест — важно е моделите да се прилагат и върху проблеми с по-широко значение.

Въпреки това редица математици предполагат, че 2026 г. може да бъде повратна — година, в която резултати с официално посочено участие на AI ще преминат успешно през рецензиране в престижни списания. Междувременно някои от изследователите вече правят професионални избори в тази посока: Соуни излиза в академичен отпуск, за да работи в OpenAI, а Пагано започва съвместна позиция в Google DeepMind.

Общото усещане е, че предстои структурна промяна. Езиковите модели все още не могат да решават големите отворени проблеми на математиката и не застрашават ролята на математикът човек. Но те променят начина, по който се търси, комбинира и проверява знанието. Ако досега математикът е разчитал предимно на собствената си интуиция и на бавното претърсване на литературата, сега разполага с инструмент, който може да синтезира огромни масиви от информация за секунди.

В този смисъл въпросът вече не е дали AI ще участва в математическите изследвания, а колко дълбоко и по какъв начин. И мнозина смятат, че промяната ще се случи по-скоро, отколкото очакваме.

*Текст на Джоузеф Хаулет за изданието Scientific American




Имате възможност да подкрепите качествените анализи, коментари и новини в "Икономически живот"