Средство для поиска новых решений по математике и информатике с использованием LLM и оценщика
Процесс FunSearch.LLM показывает выбор лучших программ, которые он генерировал до сих пор (извлечен из базы данных программ), и попросил генерировать еще лучше.Программы, предложенные LLM, выполняются автоматически и оцениваются.Лучшие программы добавляются в базу данных для выбора в последующих циклах.Пользователь в любой момент может получить программы с наибольшей оценкой, обнаруженные до сих пор.Кредит: DeepMind: https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematic-sciences-using-large-lage-models/ 🔗
В своей статье, опубликованной в журнале Nature, группа описывает свои идеи, как они были реализованы, и о том, какие выводы, производимые новой системой.
Исследователи по всему научному сообществу приняли к сведению то, что люди делают с LLMS, такими как CHATGPT, и многим из них произошло, что LLMS может быть использовано, чтобы помочь ускорить процесс научного открытия.Но они также отметили, что для этого необходим метод для предотвращения конфигуляций, ответы, которые кажутся разумными, но являются неправильными - им нужен вывод, который поддается проверке.Чтобы решить эту проблему, команда, работающая в Великобритании, использовала то, что они называют автоматизированным оценщиком, чтобы оценить ответы, данные LLM.
После того, как LLM генерирует ответ, он отправляется оценщику.Затем оценщик анализирует ответ, а затем отправляет его обратно в LLM с предложениями о том, как улучшить его результаты.Этот процесс повторяется несколько раз, и ответ становится все более точным.Исследовательская группа называет свою систему Funsearch (сокращение для поиска функционального пространства).При тестировании системы исследователи обнаружили, что она была способна предоставить проверяемые результаты.
Для дальнейшего тестирования FunSearch, исследовательские группы использовали его для поиска новых открытий для того, что известно как задача на установке CAP-проблема математики, которая включает в себя обнаружение наибольшего набора точек в многомерной сетке, где на одной линии нет трех точек.ПолемFunsearch смог генерировать решения, которые не были найдены ранее - все в форме компьютерных программ из -за характера LLM, которую они использовали.
Исследовательская группа признает, что FunSearch не подходит для оказания помощи во всех видах исследовательских усилий, но предполагает, что он представляет собой шаг на пути к использованию LLMS, чтобы либо найти решения проблем, либо стимулировать исследователей, ищущих новые способы атаки старых проблем.
Больше информации: Bernardino Romera-Paredes et al., Математические открытия из программного поиска с большими языковыми моделями, Nature (2023).Doi: 10.1038/s41586-023-06924-6
DeepMind: DeepMind.google/discover/blog/… rge-language-dels/
© 2023 Science X Network
Нашли ошибку в тексте? Напишите нам.