Лауреат Филдсовской премии Тимоти Гауэрс заявил, что ChatGPT 5.5 Pro смогла самостоятельно получить новые результаты по открытым задачам в теории чисел. По его словам, модель выполнила работу уровня «PhD-level» менее чем за два часа, а его собственный математический вклад был нулевым.
Гауэрс, занимающий кафедру комбинаторики в Collège de France и являющийся fellow Trinity College Cambridge, дал модели задачи из статьи математика Мела Натанcона. В ней рассматривались возможные размеры множеств целочисленных сумм и способы построения множеств с заданными свойствами.
ChatGPT улучшила математическую границу за 17 минут
В одной из задач Натансон доказал экспоненциальную границу и поставил вопрос, можно ли её улучшить. По словам Гауэрса, ChatGPT 5.5 Pro размышляла 17 минут 5 секунд и предложила оптимальную конструкцию с квадратичной границей.
Ключевой ход модели состоял в том, что она заменила один компонент в доказательстве Натанcона более эффективным вариантом, известным в комбинаторике, но неочевидным для применения именно в этой задаче. После этого ChatGPT оформила аргумент как LaTeX-препринт за 2 минуты 23 секунды.
Гауэрс проверил доказательство, затем дал модели связанную вариацию задачи. С ней ChatGPT 5.5 Pro также справилась без дополнительных математических подсказок.
Во второй задаче результат улучшился с экспоненциального до полиномиального
Более сложной оказалась обобщённая версия задачи, по которой ранее работал Исаак Раджагопал, студент MIT. Он получил экспоненциальную зависимость. Гауэрс передал ChatGPT 5.5 Pro работу Раджагопала и попросил найти улучшение.
Через 16 минут 41 секунду модель предложила первый шаг. Раджагопал счёл его корректным, но назвал рутинной модификацией своей работы. После этого Гауэрс попросил модель попробовать получить значительно более сильную оценку.
Через 13 минут 33 секунды ChatGPT сообщила, что видит перспективный путь, но две технические части ещё нужно проверить. Ещё через 9 минут 12 секунд проверка была завершена. Финальный препринт был готов за 31 минуту 40 секунд, а зависимость улучшилась с экспоненциальной до полиномиальной.
Раджагопал назвал ключевую идею модели «quite ingenious» и отметил, что, насколько он может судить, она была «completely original». По его словам, такую идею человек-математик мог бы с гордостью получить после недели или двух размышлений, тогда как ChatGPT нашла и доказала её менее чем за час.
Гауэрс: планка вклада в математику меняется
Гауэрс оценил результат как «вполне разумную главу в PhD по комбинаторике». При этом он подчеркнул, что не считает его выдающимся математическим прорывом: работа сильно опиралась на идеи Раджагопала и является нетривиальным расширением, а не полностью новым направлением.
Главный вывод Гауэрса шире конкретной задачи. Он считает, что нижняя планка вклада в математику меняется: теперь будет недостаточно доказать то, что раньше никто не доказал, если это уже способна сделать LLM. Более важным станет умение получать результаты, которые модель не может вывести самостоятельно.
Эта мысль перекликается с идеей Теренса Тао об «industrial-scale mathematics», где большие команды и ИИ-инструменты помогают вести исследования шире и быстрее, чем одиночные математики, работающие над узкими задачами годами.
Почему к результату всё равно нужно относиться осторожно
Случай с ChatGPT 5.5 Pro не означает, что большие языковые модели уже стабильно решают любые открытые математические задачи. Препринты, о которых говорит Гауэрс, ещё не описаны как прошедшие полноценное независимое рецензирование. Формулировки вроде «almost certainly correct» показывают, что речь идёт о сильной, но всё же предварительной оценке участников.
Кроме того, человеческая роль не исчезла полностью. Гауэрс выбрал задачи, передал модели нужные статьи и проверил результат. Его тезис о нулевом вкладе относится именно к математическому содержанию доказательств, а не ко всей исследовательской процедуре.
Важный контраст даёт опыт DeepMind Aletheia. По данным статьи, при тестировании на 700 открытых математических задачах только 6,5% ответов системы оказались пригодными. Поэтому отдельный сильный успех показывает потенциал ИИ в математике, но не доказывает его надёжную автономность во всех случаях.
Для AI research это всё равно заметный сдвиг. Если оценки Гауэрса и Раджагопала подтвердятся, ChatGPT 5.5 Pro окажется не просто инструментом поиска идей, а системой, способной самостоятельно строить нетривиальные доказательства в формальных науках.
Источник: The Decoder
