Начато проектирование процессора MALT-Cv2
- Информация о материале
- Опубликовано: 06.05.2017, 16:14
Спроектирован процессорный элемент 2-ого поколения.
Спроектирован процессорный элемент 2-ого поколения.
Плата с процессором TPU google Фото: google |
Несмотря на то, что тензорный вычислительный элемент Google (TPU) используется для глубокого обучения в компании с 2015 года, про процессор было известно очень мало. На этой неделе веб-гигант опубликовал описание чипа и пояснил, почему он на порядок быстрее и эффективнее с точки зрения потребления энергии, чем CPU или GPU.
Функциональная схема X-Gene 3 Фото: Applied Micro |
Корпорация Applied Micro объявъявила, что тестирует X-Gene 3, свою новую ARM SoC-архитектуру третьего поколения для серверов. По сообщению The Linley Group новая платформа предложит сопоставимую с последними Intel Xeon производительность, но по существенно более скромной цене.
Фабрика TSMC Фото: TSMC |
Завершено проектирование front-end процессора архитектуры MALT-Cv1 для изготовления СБИС в технологическом базисе 28 нм HPC+ компании TSMC (Тайвань). Данный базис предназначен для проектирования высокопроизводительных интегральных схем (high-performance computing, HPC). Разработанный процессор принадлежит к семейству MALT-C, содержит 9 RISC ядер общего назначения и 96 SIMD процессорных элементов. Оценочная площадь кристалла 12 мм2, энергопотребление 1,2 Вт на частоте 0,8 ГГц. Ориентировочная дата поступления образцов: январь 2018 года.
Суперкомпьютер Sunway TaihuLight Фото: SUNWAY TAIHULIGHT SYSTEM REPORT |
Страна положила начало проекту построения самого быстрого суперкомпьютера в мире к концу 2017 года.
ПЛИС Stratix 10 Фото: intel |
Корпорация Intel заявила, что апробирует Stratix 10 FPGA — новейшее семейство программируемых логических интегральных схем, специально разработанное для повышения производительности дата-центров. Новые устройства, которые Intel называет «наиболее серьезной ПЛИС-инновацией за последние десять лет», содержат современные продвинутые компоненты: 64-битные ARM-процессоры, память второго поколения — High Bandwidth Memory (HBM2) и DSP-блоки.
Рынок приложений, на который нацелено семейство Stratix 10, в некотором смысле уже занят акселераторами GPU от Nvidia и AMD, а также собственной платформой Intel - Knights Landing Xeon Phi. Однако в Intel считают, что такие нагрузки, как обработка сигналов, компрессия данных, шифрование, архивное хранение и обработка видео, переживают трудные времена во всех серверных приложениях, у которых главным критерием является производительность. Дополненные DSP-блоком, который даёт много дополнительных аппаратных FLOP, эти устройства также могут быть использованы для высокопроизводительных вычислений.
Фото: maltsystem.com |
Выпущена первая версия комплекта инструментальных средств для разработки и отладки программного обеспечения для процессоров MALT. Инструментальные средства включают эмулятор, отладчик и профайлер. Эмулятор позволяет запускать и отлаживать программы для MALT на компьютерах общего назначения под управлением Unix-like операционных систем. Эмулятор и встроенные в него отладчик GDB и профайлер значительно упрощают разработку и перенос программ на систему MALT, а также дают возможность оценить эффективность реализации алгоритмов на MALT без их запуска на реальном "железе".
Суперкомпьютер Post-K, разрабатываемый Fujitsu Фото: Fujitsu |
Разработчик процессоров ARM заявил о создании нового дизайна кристалла для суперкомпьютеров.
Image: The University of California |
Кристалл, который содержит 1000 независимых программируемых процессоров, был разработан командой Калифорнийского Университета (Департамент электроники и компьютерной инженерии).
Суперкомпьютер Sunway TaihuLight Фото: Sunway report |
Июнь 2016 года. Китайский суперкомпьютер Sunway TaihuLight стал лидером Top-500.
ISC Hight Performance 2016 Фото: isc-hpc.com |
19 - 23 июня 2016 во Фракфурте прошла международная конференция по суперкомпьютерам. ISC High Performance - старейшая и наиболее передовая ежегодная конференция, история которой началась в 1986 году.
Разработан компилятор подмножества языка Си, который генерирует оптимизированный код для архитектуры программируемого ускорителя. На целевых задачах производительность сформированного компилятором кода составляет 80% от производительности кода, реализованного программистом на языке ассемблера.
Начата разработка netlist’a процессора MALT 1-ого поколения по техпроцессу фабрики TSMC 28 nm HPC+ (high-performance computing - высокопроизводительные вычисления)
Собран 96-ядерный прототип MALT со смешанной архитектурой на ПЛИС Xilinx Virtex7.
Разработан ассемблер, поддерживающий алгебраический синтаксис, сходный с используемым в языке Си.
Лаборатория интеллектуальной электроники Фото: maltsystem.com |
Команда проекта MALT растет. Мы переехали в новую лабораторию. Новые компьютеры, современный интерьер, кофемашина, в общем все, что нужно для плодотворной работы. В команде появляются новые разработчики: специалисты по VHDL и системному программированию. Нас уже двенадцать! И это только сотрудники, работающие на полную ставку, не считая совместителей и наших коллег, работающих удаленно и/или сдельно. Текущий уровень инвестиций позволяет нарастить темп работ и охватить более широкий круг задач. Новые специалисты позволят больше сил уделять прикладному и системному ПО, в необходимом темпе вести работы по проектированию СБИС MALT-C первого поколения.
Фото: maltsystem.com |
Завершено проектирование процессорного элемента векторного ускорителя Леопард. Архитектура процессорных элементов выбиралась исходя из требований максимальной гибкости (с точки зрения программирования) при высокой производительности и энергоэффективности на целевых задачах. В итоге была выбрана архитектура на основе древовидного АЛУ.
Сравнение вариантов процессорных элементов на предмет соотношения "производительность-гибкость" Изображение: maltsystem.com
|
Начато проектирование MALT-процессоров с векторной и смешанной архитектурами.
Сергей Елизаров (справа) Фото: maltsystem.com |
8-9 июля 2015 года Проект принял участие в главной промышленной выставке России - ИННОПРОМ 2015 в рамках стенда Физического факультета МГУ имени М.В. Ломоносова на экспозиции госкорпорации Ростех.
Распределение ресурсов ПЛИС Xilinx Virtex 2000T Фото: maltsystem.com |
Производительность и энергоэффективность достигается с помощью специализации, простота программирования - с помощью универсальных конструкций. Мы попробовали объединить два эти подхода и разработали прототип на ПЛИС многоядерного процессора архитектуры MALT со специализированными ускорителями.