Изучение деталей энергетического чипа ИИ
Обзор предложенного макроса IMC для операций Mac.A Материальный стек Fefets.b Многобиточный Fefet может быть запрограммирован на разные состояния для хранения веса синапса.C Предыдущие работы7, 8, 11 рассматривали только бинарные или или или XNOR Operations для вычисления однобийной операции умножения.D Наша предложенная 2-битная операция умножения с входной кодировкой и 2-битной хранением показана.Соответствующий выход активируется в разные случаи времени.e Экодер обеспечивает напряжение затвора в зависимости от входного значения, которое изменяется между тремя уровнями в разных случаях времени.f Выход умножения входного состояния и хранящегося состояния в ячейке зависит от времени, в которое активируется одна ячейка, которая накапливается и отображается с использованием декодера.g Показано распределение четырех состояний для кривых IDS - VGS.H В зависимости от времени активации и количества ячеек, активируемых в определенное время, накоплено напряжение на конденсаторе, соединенном с столбцом ячеек, что линейно соответствует выходу MAC и имеет минимальное влияние вариации базового устройства.I Accelerators IMC облегчают операции MAC для рабочих нагрузок, где можно использовать предлагаемый нами проект.J Соответствующая операция Mac выполняется в перекладине, накапливая выход в напряжении конденсатора.Кредит: Природная связь (2023).Doi: 10.1038/s41467-023-42110-y
Hussam Amrouch разработал готовую архитектуру, которая в два раза больше мощности, чем сопоставимые подходы к вычислительным вопросам в памяти.Как сообщается в журнале Nature Communications, профессор Технического университета Мюнхена (TUM) применяет новую вычислительную парадигму с использованием специальных цепей, известных как транзисторы эффекта сегнетоэлектрического поля (FEFET).В течение нескольких лет это может оказаться полезным для генеративного ИИ, алгоритмов глубокого обучения и роботизированных приложений.
Основная идея проста: в отличие от предыдущих чипов, где были выполнены только расчеты по транзисторам, теперь они также являются местоположением хранения данных.Это экономит время и энергию.«В результате также повышается производительность чипсов», - говорит Хуссам Амруш, профессор процессора искусственного интеллекта в техническом университете Мюнхена (TUM).Транзисторы, на которых он выполняет расчеты и хранит данные, измеряет только 28 нанометров, причем миллионы из них размещены на каждом из новых чипов ИИ.
Чипы будущего должны быть быстрее и эффективнее, чем более ранние.Следовательно, они не могут нагреться так же быстро.Это важно, если они должны поддержать такие приложения, как расчеты в реальном времени, например, в полете, например, в полете.«Подобные задачи чрезвычайно сложны и жаждет энергии для компьютера»,-объясняет профессор.
Эти ключевые требования для чипа математически подводят суммирование вершин параметров/w: «Операции TERA в секунду за ватт».Это можно рассматривать как валюта для чипов будущего.Вопрос в том, сколько триллиона операций (вверху) процессор может выполнять в секунду, когда предоставляется один ватт (w) власти.
Новый чип ИИ, разработанный в сотрудничестве между Bosch и Fraunhofer Imps и поддерживается в производственном процессе компанией US GlobalFoundries, может обеспечить 885 вершин/w.Это делает его вдвое мощным, чем сопоставимые чипы ИИ, включая чип MRAM Samsung.Чипы CMOS, которые в настоящее время обычно используются, работают в диапазоне 10–20 топов/Вт.
Исследователи позаимствовали принцип современной архитектуры чипа у людей.«В мозге нейроны обрабатывают обработку сигналов, в то время как синапсы способны запомнить эту информацию», - говорит Амруш, описывая, как люди могут изучать и вспоминать сложные взаимосвязи.Для этого чип использует «сегнетоэлектрические» (FEFET) транзисторы.
Это электронные переключатели, которые включают в себя специальные дополнительные характеристики (обращение полюсов при применении напряжения) и могут сохранять информацию, даже при отключении от источника питания.Кроме того, они гарантируют одновременное хранение и обработку данных в транзисторах.
«Теперь мы можем создавать высокоэффективные чипсеты, которые можно использовать для таких приложений, как глубокое обучение, генеративное ИИ или робототехника, например, где должны обрабатывать данные, где они генерируются», - говорит Амруш.
Цель состоит в том, чтобы использовать чип для запуска алгоритмов глубокого обучения, распознавать объекты в пространстве или данные процесса из беспилотных летательных аппаратов в полете без задержки времени.Тем не менее, профессор из интегрированного Мюнхенского института робототехники и машинного интеллекта (MIRMI) в TUM считает, что пройдет несколько лет, прежде чем это будет достигнуто.
Он думает, что это будет от трех до пяти лет, в ближайшее время, до того, как первые чипы в памяти, подходящие для реальных приложений, станут доступны.Одна из причин этого, среди прочего, заключается в требованиях безопасности промышленности.Например, до того, как технология такого рода может использоваться в автомобильной промышленности, ее недостаточно, чтобы она функционировала надежно.Он также должен соответствовать конкретным критериям сектора.
«Это снова подчеркивает важность междисциплинарного сотрудничества с исследователями из различных дисциплин, таких как информатика, информатика и электротехника», - говорит эксперт по оборудованию Amrouch.Он видит в этом особую силу Mirmi.
Больше информации: Taha Soliman и др., Первая демонстрация вычислительной перекладины в памяти с использованием многоуровневых ячеек Fefet, Nature Communications (2023).Doi: 10.1038/s41467-023-42110-y
Нашли ошибку в тексте? Напишите нам.