Dsps power deep learning socs - новости

Dsps power deep learning socs - новости
Dsps power deep learning socs - новости
Anonim

DSP Power Deep Learning SoCs

DSP отмечают третий надежный выбор кремния для продуктов глубокого обучения, особенно встроенных систем, которые требуют недорогих и маломощных решений.

Графические процессоры (или графические процессоры) и в некоторой степени ПЛИС, как правило, были развернуты для обучения моделей в сетях нейронных сетей глубокого обучения. И интенсивный процесс оценки и обучения часто выполняется автономно в крупных фермах серверов.

Затем эти обучаемые модели переведены в фактические производственные среды с использованием гибридных процессоров и графических процессоров или гибридных процессоров и ПЛИС. Но как насчет встроенных систем в автомобильной, потребительской и промышленной среде, которые очень чувствительны к затратам и потреблению энергии? "Src =" // www.allaboutcircuits.com/uploads/articles/CEVA_CDNN_Brain_illustration_1000px_041015.jpg" />

DSP обеспечивают возможность глубокого обучения для встроенных приложений. Изображение предоставлено CEVA

Два примера

Возьмите CEVA, поставщик сердечников DSP для маломощных встроенных систем, который недавно продемонстрировал 24-слойную сверточную нейронную сеть (CNN), оснащенную процессором Vision XM4. Согласно CEVA, основанный на DSP механизм CNN смог обеспечить почти в три раза большую производительность по сравнению с типичным гибридным процессором / графическим процессором.

Кроме того, помимо потребления в 30 раз меньше мощности, чем у графического процессора, CEVA заявила, что двигатель DSP сохранил почти одну пятую пропускной способности памяти. Наряду с процессором обработки изображений и визуализации CEVA-XM4 компания предлагает сетевой генератор, который переводит обучаемую сеть в экономически эффективное исполнение CNN.

CEVA обеспечивает глубокое обучение встроенному пространству, беря нейронную сеть, которая была настроена и обучена на рабочей станции и преобразует ее для работы на своем процессоре XM4 на базе DSP. Поставщик ядра DSP преобразует операции с плавающей запятой из рабочей станции в инструкции с фиксированной точкой, чтобы они могли работать более эффективно с ядром DSP.

Решения Phi Algorithm, основанные на Торонто, используют инфраструктуру глубокой нейронной сети CEVA (CDNN) для встроенных систем и процессор XM4 для реализации глубокого обучения в алгоритме универсального объектного детектирования. Алгоритм теперь доступен для таких приложений, как ADAS, обнаружения пешеходов и распознавания лиц.

Image
Image

Cadence нацеливается на DSP DSP Tensilica Vision P6 в приложениях CNN. Изображение предоставлено Cadence

Cadence - еще один заметный игрок в DSP-лагере, который вкладывает значительные средства в глубокое обучение и приложения CNN. Фирма утверждает, что процессор глубокого обучения, основанный на своем ядре DSP Tensilica Vision P6 DSP, может вдвое увеличить частоту кадров изображения при более низком потреблении энергии по сравнению с коммерчески доступными графическими процессорами.

Возможности в векторной SIMD-обработке P6 DSP, инструкции VLIW и быстрая гистограмма и разброс / сбор данных - делают его по своей сути более подходящим для требующей глубокой учебной среды. Процессор сочетает энергоэффективную реализацию алгоритмов CNN с сжатием данных на лету, что существенно снижает требования к памяти и пропускной способности для уровней нейронной сети.

Ядро Vision P6 DSP, основанное на архитектуре Xtensa от Tensilica, поддерживает библиотеки OpenCV и OpenVX.

Ниже приведены ссылки на две предыдущие статьи о том, как кремниевые технологии формируют мир глубокого обучения.

Глубокое изучение способа GPU

Глубокое обучение с FPGA