Обучение искусственных нейронных сетей для обработки изображений с точки зрения ребенка
Схематический обзор экспериментов.Кредит: Интеллект природы (2024).Doi: 10.1038/s42256-024-00802-0
Исследователи из Нью-Йоркского университета недавно намеревались изучить возможность обучения искусственных нейронных сетях на этих моделях без индуктивных предубеждений, специфичных для домена.Их статья, опубликованная в сфере интеллекта Nature Machine, в конечном итоге решает один из старейших философских вопросов, а именно дилемму «природы против воспитания».
Природа против воспитания дилеммы оспаривают, обладают ли люди врожденные индуктивные предубеждения, влияющие на то, как они воспринимают объекты, людей и мир вокруг них в целом, или они изначально являются «пустым сланцем», развивающими уклон в результате их опыта.Некоторые из гипотетических врожденных смещений связаны со способностью классифицировать и маркировать объекты.
Команда Нью -Йоркского университета решила исследовать эту дилемму с современной точки зрения.Для этого они обучили современные самоотверженные глубокие нейронные сети на большом наборе данных, содержащем видео, снятые с точки зрения маленьких детей, используя головные мыши (камеры, прикрепленные к шляпе или шлему).
«Маленькие дети разрабатывают сложные внутренние модели мира, основанные на их визуальном опыте», - написали А. Эмин Орхан и Бренден М. Лейк в своей статье.”Можно ли извлечь такие модели из визуального опыта ребенка без сильных индуктивных предубеждений?. ”
Орхан и озеро обучили два типа методов глубокого обучения, а именно модели внедрения и генеративных моделей, примерно на 200 часов видеозаписей с головой, собранной у одного ребенка в течение двухлетнего периода.После предварительного обучения более 70 из этих моделей они протестировали свою производительность в серии задач компьютерного зрения и распознавания объектов, сравнивая их с другими современными моделями компьютерного зрения.
«В среднем, лучшие модели встраивания работают при респектабельных 70% высокопроизводительной модели, обученной ImageNet, несмотря на существенные различия в учебных данных»,-написали Орхан и Лейк.«Они также изучают широкие семантические категории и возможности локализации объектов без явного надзора, но они менее ориентированы на объект, чем модели, обученные всем ImageNet.
«Генеративные модели, обученные теми же данными, успешно экстраполируют простые свойства частично маскированных объектов, такие как их грубый контур, текстура, цвет или ориентация, но борются с более тонкими деталями объекта».
Чтобы подтвердить свои результаты, исследователи провели дальнейшие эксперименты с участием двух других маленьких детей.Их результаты соответствовали результатам, собранным во время их первого эксперимента, что позволяет предположить, что визуальные представления более высокого уровня можно извлечь из уникального визуального опыта ребенка без интеграции сильных индуктивных предубеждений.
Результаты этой недавней работы Orhan и Lake могут послужить вдохновением для психологов и нейробиологов, информируя дальнейшие исследования, изучая дилемму природы и воспитания с использованием компьютерных инструментов.В целом, команда предполагает, что смещения категоризации объектов зависят от уникальных характеристик визуальной системы человека, которые приводят к отличным изображениям, от тех, которые обычно используются для обучения моделей глубокого обучения.
«Мы надеемся, что наша работа вдохновит новое сотрудничество между машинным обучением и психологией развития, поскольку влияние современного глубокого обучения на психологию развития до сих пор было относительно ограниченным», - заключаются в своей статье Орхан и Лейк.
«Будущие алгоритмические достижения, в сочетании с более богатыми и более крупными наборами данных по развитию, могут быть оценены с помощью того же подхода, дополнительно обогатив наше понимание того, что можно узнать из опыта ребенка с минимальными индуктивными предубеждениями».
Больше информации: А. Эмин Орхан и др., Изучение визуальных представлений высокого уровня с точки зрения ребенка без сильных индуктивных предвзятостей, интеллект машины природы (2024).Doi: 10.1038/s42256-024-00802-0
Нашли ошибку в тексте? Напишите нам.