Модели машинного обучения могут дать надежные результаты даже с ограниченными данными обучения
Эллиптические методы обучения PDE могут быть эффективными.Кредит: Материалы Национальной академии наук (2023).Doi: 10.1073/pnas.2303904120
Исследователи определили, как создавать надежные модели машинного обучения, которые могут понимать сложные уравнения в реальных ситуациях, используя гораздо меньше учебных данных, чем обычно ожидается.
Исследователи, из Кембриджского университета и Корнелльского университета, обнаружили, что для частичных дифференциальных уравнений - класса физических уравнений, которые описывают, как вещи в мире природы развиваются в пространстве и времени - модели обучения мачине могут дать надежные результаты, даже когда они предоставляютсяс ограниченными данными.
Их результаты, сообщаемые в процессах Национальной академии наук, могут быть полезны для создания большего количества моделей машинного обучения по времени и экономичным обучениям для таких приложений, как инженерное и климатическое моделирование.
Большинство моделей машинного обучения требуют больших объемов учебных данных, прежде чем они смогут начать возвращать точные результаты.Традиционно человек будет аннотировать большой объем данных, например, как набор изображений, например, для обучения модели.
«Использование людей для обучения моделей машинного обучения эффективно, но это также трудоемкое и дорогое»,-сказал первый автор доктор Николас Булле из Института математических наук Исаака Ньютона.«Нам интересно точно знать, как мало данных нам действительно нужно для обучения этих моделей, и при этом получить надежные результаты».
Другие исследователи смогли обучать модели машинного обучения с небольшим количеством данных и получить отличные результаты, но то, как это было достигнуто, не было хорошо разоблаченным.Для их исследования Булле и его соавторы, Диана Халикиас и Алекс Таунсенд из Корнелльского университета, сосредоточены на частичных дифференциальных уравнениях (PDE).
«PDE похожи на строительные блоки физики: они могут помочь объяснить физические законы природы, такие как то, как устойчивое состояние проводится в плавлении льда»,-сказал Булле, который является постдокторским научным сотрудником Фонда Ини-Симонса.«Поскольку они являются относительно простыми моделями, мы могли бы использовать их, чтобы сделать некоторые обобщения о том, почему эти методы искусственного интеллекта были настолько успешными в физике».
Исследователи обнаружили, что PDE, которые моделируют диффузию, имеют структуру, которая полезна для разработки моделей ИИ.«Используя простую модель, вы можете обеспечить соблюдение некоторой физики, которую вы уже знаете, в набор учебных данных, чтобы получить лучшую точность и производительность», - сказал Булле.
Исследователи построили эффективный алгоритм для прогнозирования решений PDE в различных условиях, используя короткие и дальние взаимодействия.Это позволило им построить некоторые математические гарантии в модель и точно определить, сколько данных потребовалось для получения надежной модели.
«Это зависит от поля, но для физики мы обнаружили, что вы действительно можете многое сделать с очень ограниченным количеством данных», - сказал Булле.«Удивительно, как мало данных вам нужно, чтобы получить надежную модель. Благодаря математике этих уравнений мы можем использовать их структуру, чтобы сделать модели более эффективными».
Исследователи говорят, что их методы позволят ученым -ученым открыть «черный ящик» многих моделей машинного обучения и разработать новые, которые могут интерпретироваться людьми, хотя будущие исследования все еще необходимы.
«Мы должны убедиться, что модели изучают правильные вещи, но машинное обучение для физики - это захватывающая область - есть много интересных вопросов по математике и физики, которые ИИ может помочь нам ответить», - сказал Булле.
Больше информации: Nicolas Boullé et al., Elliptic PDE Learning, доказуемое эффективным, процессом Национальной академии наук (2023).Doi: 10.1073/pnas.2303904120
Нашли ошибку в тексте? Напишите нам.