Google раскрывает технические детали и обосновывает экономическую целесообразность процессора TPU

 

Плата с процессором TPU google

Фото: google

Несмотря на то, что тензорный вычислительный элемент Google (TPU) используется для глубокого обучения в компании с 2015 года, про процессор было известно очень мало. На этой неделе веб-гигант опубликовал описание чипа и пояснил, почему он на порядок быстрее и эффективнее с точки зрения потребления энергии, чем CPU или GPU.

 

 

Подробнее...

Applied Micro объявляет о готовности чипа ARM третьего поколения, меряясь силами с Intel Xeon

 

Функциональная схема X-Gene 3

Фото: Applied Micro

Корпорация Applied Micro объявъявила, что тестирует X-Gene 3, свою новую ARM SoC-архитектуру третьего поколения для серверов. По сообщению The Linley Group новая платформа предложит сопоставимую с последними Intel Xeon производительность, но по существенно более скромной цене.

 

 

Подробнее...

Завершено проектирование front-end 96-ядерного процессора MALT-Cv1

 

 Фабрика TSMC

 Фото: TSMC

 

Завершено проектирование front-end процессора архитектуры MALT-Cv1 для изготовления СБИС в технологическом базисе 28 нм HPC+ компании TSMC (Тайвань). Данный базис предназначен для проектирования высокопроизводительных интегральных схем (high-performance computing, HPC). Разработанный процессор принадлежит к семейству MALT-C, содержит 9 RISC ядер общего назначения и 96 SIMD процессорных элементов. Оценочная площадь кристалла 12 мм2, энергопотребление 1,2 Вт на частоте 0,8 ГГц. Ориентировочная дата поступления образцов: январь 2018 года.

 

 

Подробнее...

Intel расширяет сферу своих интересов новыми ПЛИС для дата-центров на базе процессоров ARM

 

ПЛИС Stratix 10

Фото: intel

Корпорация Intel заявила, что апробирует Stratix 10 FPGA — новейшее семейство программируемых логических интегральных схем, специально разработанное для повышения производительности дата-центров. Новые устройства, которые Intel называет «наиболее серьезной ПЛИС-инновацией за последние десять лет», содержат современные продвинутые компоненты: 64-битные ARM-процессоры, память второго поколения — High Bandwidth Memory (HBM2) и DSP-блоки.

 

Рынок приложений, на который нацелено семейство Stratix 10, в некотором смысле уже занят акселераторами GPU от Nvidia и AMD, а также собственной платформой Intel - Knights Landing Xeon Phi. Однако в Intel считают, что такие нагрузки, как обработка сигналов, компрессия данных, шифрование, архивное хранение и обработка видео, переживают трудные времена во всех серверных приложениях, у которых главным критерием является производительность. Дополненные DSP-блоком, который даёт много дополнительных аппаратных FLOP, эти устройства также могут быть использованы для высокопроизводительных вычислений.



Подробнее...

Выпущен комплект инструментальных средств для MALT

 

 Фото: maltsystem.com

 

Выпущена первая версия комплекта инструментальных средств для разработки и отладки программного обеспечения для процессоров MALT. Инструментальные средства включают эмулятор, отладчик и профайлер. Эмулятор позволяет запускать и отлаживать программы для MALT на компьютерах общего назначения под управлением Unix-like операционных систем. Эмулятор и встроенные в него отладчик GDB и профайлер значительно упрощают разработку и перенос программ на систему MALT, а также дают возможность оценить эффективность реализации алгоритмов на MALT без их запуска на реальном "железе".

 

 

Подробнее...

Kilocore - первый 1000-процессорный кристалл

 

Image: The University of California

Кристалл, который содержит 1000 независимых программируемых процессоров, был разработан командой Калифорнийского Университета (Департамент электроники и компьютерной инженерии).

 

 

Подробнее...

Конференция ISC High Performance 2016

 

ISC Hight Performance 2016

Фото: isc-hpc.com

 

19 - 23 июня 2016 во Фракфурте прошла международная конференция по суперкомпьютерам. ISC High Performance - старейшая и наиболее передовая ежегодная конференция, история которой началась в 1986 году.

 

 

Подробнее...

Разработан C-компилятор программируемого ускорителя для MALT-Сv1


 

Разработан компилятор подмножества языка Си, который генерирует оптимизированный код для архитектуры программируемого ускорителя. На целевых задачах производительность сформированного компилятором кода составляет 80% от производительности кода, реализованного программистом на языке ассемблера.

 

 

Подробнее...

Команда проекта существенно выросла!

 

 Лаборатория интеллектуальной электроники

 Фото: maltsystem.com

 

Команда проекта MALT растет. Мы переехали в новую лабораторию. Новые компьютеры, современный интерьер, кофемашина, в общем все, что нужно для плодотворной работы. В команде появляются новые разработчики: специалисты по VHDL и системному программированию. Нас уже двенадцать! И это только сотрудники, работающие на полную ставку, не считая совместителей и наших коллег, работающих удаленно и/или сдельно. Текущий уровень инвестиций позволяет нарастить темп работ и охватить более широкий круг задач. Новые специалисты позволят больше сил уделять прикладному и системному ПО, в необходимом темпе вести работы по проектированию СБИС MALT-C первого поколения.

Спроектирован процессорный элемент Леопард векторного сопроцессора MALT

 

Фото: maltsystem.com

 

Завершено проектирование процессорного элемента векторного ускорителя Леопард. Архитектура процессорных элементов выбиралась исходя из требований максимальной гибкости (с точки зрения программирования) при высокой производительности и энергоэффективности на целевых задачах. В итоге была выбрана архитектура на основе древовидного АЛУ.

 

 

Подробнее...

Начато проектирование MALT-процессоров с векторной и смешанной архитектурами

 

Сравнение вариантов процессорных элементов на предмет соотношения "производительность-гибкость"

Изображение: maltsystem.com

 

 

 

Начато проектирование MALT-процессоров с векторной и смешанной архитектурами.

 

 

Подробнее...

Участие в выставке ИННОПРОМ-2015

 

Сергей Елизаров (справа)

Фото: maltsystem.com

8-9 июля 2015 года Проект принял участие в главной промышленной выставке России - ИННОПРОМ 2015 в рамках стенда Физического факультета МГУ имени М.В. Ломоносова на экспозиции госкорпорации Ростех.

 

 

Подробнее...

Разработан первый прототип на ПЛИС MALT со специализированными ускорителями

 

Распределение ресурсов ПЛИС Xilinx Virtex 2000T
для процессора с 49 ядрами общего назначения
и 490 спецвычислителями

Фото: maltsystem.com

 

Производительность и энергоэффективность достигается с помощью специализации, простота программирования - с помощью универсальных конструкций. Мы попробовали объединить два эти подхода и разработали прототип на ПЛИС многоядерного процессора архитектуры MALT со специализированными ускорителями.

 

 

Подробнее...