Процессор arm® cortex™-a57 с технологией eda

Технические особенности ARM Cortex-A53 и Cortex-A57

Разработчики и пользователи еще не успели по достоинству оценить преимущества Cortex-A15, как процессор уже устарел. Корпорация ARM раскрыла детали новой 64-разрядной архитектуры Cortex-A53 и Cortex-A57.

На конференции TechCon 2012, которая проходила на прошлой неделе в Санта-Клара (США), корпорация ARM представила первые сведения о готовящемся к выпуску процессоре Cortex A57. Данный процессор будет обеспечивать наиболее высокую производительность в секторе процессоров для портативных устройств, однако в сферу его применения входит сетевое оборудование и серверы.

Характеристики Cortex-A57

Основные характеристики Cortex A57:

· поддержка исполнения команд с изменением последовательности;

· ядро ARMv8 с поддержкой 32- и 64-разрядных вычислений;

· 44-разряная виртуальная адресация памяти;

· поддержка до 16 Тбайт ОЗУ (от LPDDR3 до DDR4);

· 48 Кбайт кеш-памяти L1 для инструкций и 32 Кбайт кеш-памяти L1 для данных;

· исправление одиночных и обнаружение двойных ошибок, контроль четности, отслеживание системных ошибок

· от 512 Кбайт до 2 Мбайт кеш-памяти L2 (с поддержкой ECC);

· оптимизированная по потреблению дешифрация команд с использованием локальной дешифрации;

· интерфейс CCI-400 и CCN-504.

Структура Cortex A57

Ядро поддерживает неупорядоченное выполнение команд. Производительность на 1250 SpecInt2000 на 1,7 ГГц, т.е. на 25-30% выше, чем у 32-разрядных А15. Максимальная тактовая частота составляет 2,5 ГГц, техпроцесс 20 нм. Производительность 16 ядер, соединенных шиной CoreLink, в 10 раз превышает производительность А15.

Сравнение производительности А57 и А15

Процессоры A57 более эффективно расходуют энергию, чем А15, однако имеют на 30% большую площадь. Эффективность расхода энергии в 32- и 64-разрядном режимах одинакова.

Табл. 1. Отличительные особенности Cortex-A57

Архитектурные особенности Cortex-A57

Особенность

Преимущество

Глубокое переупорядочение последовательности команд

Более широкий спектр возможностей увеличения пропускной способности. При блокировке команды процессор переключается на другую команду.

Одновременное выполнение 128 команд (любой разрядности, 32 или 64)

Расширенные возможности дешифрации

Дублирование исполнительных ресурсов для увеличения производительности. Оптимизированная по потреблению дешифрация команд, 3 варианта длины слова

Ассоциативный кеш L2 (16 ассоциаций)

Доступ к кешу L2 может осуществлять несколько процессоров, принадлежащих к одному кластеру

Буфер быстрого преобразования адреса (1024 entry mail TLB)

Повышенное быстродействие при сложных схемах доступа к памяти (например, при просмотре веб-страниц); поддержка больших страниц памяти

Большой буфер uTLB

48 uTLB для инструкций для одновременной обработки нескольких страниц памяти.

32 ассоциативных буфера данных D-TLB с поддержкой больших страниц памяти

Буфер ветвления 2K-4K (BTB – Branch Target Buffer) с нулевой задержкой.

Блок разрешения ветвления позволяет выполнять ответвления вне очередности.

Алгоритмы восстановления после неверных предсказаний

Оптимизированная память данных

Многопотоковая предварительная выборка в кеше первого уровня. Исчерпывающие возможности хранения и пересылки данных для увеличения производительности

Преимущества 64-разрядной архитектуры

Основными отличиями 64-разрядной архитектуры от 32-разрядной являются

· Векторные вычисления с плавающей запятой и двойной точностью (возможность выполнения большего набора алгоритмов)

· 64-разрядная виртуальная адресация (возможность увеличения виртуальной памяти)

· 64-разрядные регистры (увеличение производительности, меньшее использование стека)

· Указатели с тегами (используются в Javascript; не предусмотрены в 32-разрядной архитектуре)

· Новый принцип обработки исключений, упрощающий операционную систему и гипервизор

· Модернизированное устройство кеш-памяти (пользовательское пространство, функция обнуления данных)

Сравнение процессоров в концепции big.LITTLE (большие и производительные процессоры против экономичных и компактных)

«Младший собрат» — Cortex-A53

Одновременно с А57 был представлен второй процессор семейства, А53. Основные особенности Cortex-A53:

  • поддержка исполнения команд с изменением последовательности;
  • ядро ARMv8 с поддержкой 32- и 64-разрядных вычислений;
  • 40-разрядная виртуальная адресация памяти;
  • поддержка до 1 Тбайт ОЗУ (от LPDDR3 до DDR4);
  • от 8 до 64 кбайт кеш-памяти L1 для инструкций и 8-64 кбайт кеш-памяти L1 для данных;
  • мультимедийный SIMD-процессор NEON;
  • от 128 кКбайт до 2 Мбайт кеш-памяти L2 (с поддержкой ECC);
  • интерфейс 128-разрядный CoreLink (CCI-400 и CCN-504).

Структура CortexA53

Производительность А53 сопоставима с производительностью Cortex-A9. При производстве на том же техпроцессе 32 нм ядро A53 будет занимать на 40% меньше площади по сравнению с A9. Если же сравнивать 20-нм ядро A53 с 32-нм A9, то первое будет в 4 раза меньше по площади, а также выигрывает по энергопотреблению.

Применение связки Cortex-A53/А57

Процессоры класса big рекомендуется сочетать с процессорами LITTLE (см. выше).

Приводим пример использования связки А53/А57 в серверных системах и в качестве платформы для мобильных устройств.

Пример применения А53/А57 в сетевом оборудовании или сервере

Для работы серверной системы достаточно производительности 16 ядер (4 кластера по 4 ядра).

Пример применения А53/А57 в мобильных устройствах

Среди компаний, которые уже заявили о намерении использовать ядра Cortex-A53/A57, отмечены AMD, Broadcom, Calxeda, HiSilicon/Huawei, Samsung Electronics и STMicroelectronics. Первые устройства на основе A53/A57 появятся в 2014 г.

ARM выпустила процессоры нового поколения, которые ускорят искусственный интеллект в 50 раз

Первые процессоры нового поколения

Компания ARM, ведущий мировой разработчик процессоров для мобильных устройств, представила два первых процессорных ядра Cortex-A75 и Cortex-A55 на базе новой мультиядерной процессорной микроархитектуры DynamIQ, которая на ближайшие годы станет основой всех новых процессоров семейства Cortex-A.

Новая микроархитектура DynamIQ, впервые представленная компанией в марте 2017 г., пришла на смену предыдущей технологии big.LITTLE, впервые представленной ARM в 2011 году и успешно зарекомендовавшей себя за пять с лишним лет. В ARM отмечают, что DynamIQ является дальнейшим эволюционным развитием идей и технологий big.LITTLE.

По словам представителей ARM, новые процессорные ядра Cortex-A75 и Cortex-A55 с технологией DynamIQ обеспечат оптимизацию для 50-кратного повышения производительности вычислений в области искусственного интеллекта в течение следующих трех-пяти лет, и 10-кратное увеличение производительности с применением интегрированных аппаратных акселераторов.

В ARM подчеркивают, что в отличие от прежнего позиционирования своих вычислительных ядер для определенных узких рынков – например, для мобильных устройств, с выпуском микроархитектуры DynamIQ компания начинает переход к гибкой универсальной платформе с огромными возможностями масштабирования, поддерживающей интеллектуальные решения для практически любых применений, от облаков и сетей до гаджетов.

Нандан Найямпали (Nandan Nayampally), глава ARM Compute Products Group, отметил: «По мере усложнения вычислительных систем, нам необходимо переосмысление мультипроцессорной обработки данных. Это означает не только гибкую обработку данных в CPU, но также совершенствование и интеграцию гетерогенных вычислений в виде, более близком к разнообразным, дифференцированным решениям. С новой архитектурой вы можете настраивать производительность как на уровне кластеров, так и отдельных процессорных ядер, устанавливая для каждого подходящий уровень производительности и характеристик потребления энергии».

Вместе с первыми процессорными ядрами Cortex-A на платформе DynamIQ компания также представила новое графическое ядро ARM Mali-G72. Список улучшений новой графики включает расширенную поддержку игровых и VR-технологий, а также специфические возможности в области машинного обучения.

Графика ARM Mali-G72 ориентирована на использование в мобильных устройствах премиального сегмента и обещает увеличение производительности на 40% по сравнению с предыдущим поколением.

Обновленное семейство процессорных ядер Cortex-A: что нового

Процессорная технология DynamIQ унаследовала от архитектуры предыдущего поколения ARM big.LITTLE проверенную временем организацию вычислительных мощностей – когда экономичные процессорные ядра сочетаются в одном кристалле с несколькими высокоэффективными ядрами. Это позволяет сконструировать мобильный процессор, способный при необходимости значительно наращивать производительность, и экономить заряд батареи мобильного устройства в остальное время.

Развивая идею «правильный процессор для правильной задачи», архитектура DynamIQ поддерживает до 8 процессорных ядер на один вычислительный кластер, при этом кластеров в финальном чипе может быть практически бесконечно много.

Каждый вычислительный кластер, в свою очередь, обеспечивает определенный уровень производительности. В отличие от традиций big.LITTLE, где использовалось только попарное ускорение мощных и экономичных ядер (2+2, 2+4, 4+4 и т.п.), архитектура DynamIQ может работать с любыми сочетаниями экономичных и мощных ядер – от 1+3 или 1+7 до любых других.

Читайте также  Индикатор радиоактивности ультра-микрон 4.08 (изменения)

Благодаря микроархитектуре DynamIQ, каждое ядро кластера может иметь различные показатели производительности и энергопотребления. Новая архитектура DynamIQ также поддерживает ряд новых инструкций, оптимизированных для ускорения процесса машинного обучения и для работы с приложениями искусственного интеллекта.

Дополнительную гибкость новой вычислительной архитектуре придает переделанная подсистема памяти, которая обеспечивает более быстрый доступ к данным при одновременном снижении энергопотребления.

Архитектура DynamIQ способна обеспечить низкое энергопотребление благодаря быстрому переключению между различными уровнями состояния и точному управлению уровнями производительности.

Особенности ARM Cortex-A75

Производительное процессорное ядро ARM Cortex-A75 обеспечивает значительный прирост производительности и энергоэффективности по сравнению со своими предшественниками Cortex-A72 и Cortex-A73. Чип обладает улучшенной примерно на 20% производительностью при работе с целыми числами, значительными улучшениями при работе с числами с плавающей запятой и задачами с большой нагрузкой на подсистему памяти.

Для процессора Cortex-A75 характерна пиковая производительность при однопоточных нагрузках благодаря наличию симметричного трехстороннего суперскалярного конвейера варьируемой длины с полностью произвольной (out-of-order) выборкой команд.

Ядра Cortex-A75 обладают распределенным кластером кэша L3, поддержкой асинхронных частот и практически независимых напряжений питания для различных ядер внутри многоядерного процессора или кластера. Ядра Cortex-A75 также оснащены отдельной кэш-памятью L2 на каждое ядро с уменьшенной вдвое латентностью по сравнению со своими предшественниками.

В сочетании с распределенным модулем DynamIQ (DynamIQ Shared Unit, DSU), процессор Cortex-A75 позволяет обеспечить необходимый уровень производительности для широкого спектра системы и рынков – от смартфонов и умных домов до серверов и автомобильной электроники.

Благодаря базовому исполнению на уровне микроархитектуры ARMv8-A, вычислительные ядра Cortex-A75 обладают полной обратной совместимостью со всей экосистемой операционных систем, инструментов и приложений, разработанных для этой платформы, обеспечивая в то же время новые возможности для разработчиков систем с искусственным интеллектом.

Особенности ARM Cortex-A55

Экономичное процессорное ядро ARM Cortex-A55, по данным компании, обеспечивает лучшее в серии сочетание энергоэффективности и производительности в своем классе. Чип также базируется на технологиях DynamIQ и архитектуре ARMv8-A с поддержкой самых последних ее расширений в области машинного обучения.

Ядро Cortex-A55 обеспечивает на 18% лучшую производительность при работе с целыми числами, на 20% с числами с плавающей запятой, на 40% при расчетах NEON SIMD, на 15% при работе с JavaScript и на 200% при расчетах с большой нагрузкой на память при уменьшенном на 15% потреблении энергии по сравнению со своим предшественником Cortex-A53.

Ядро Cortex-A55 также обладает интегрированным конфигурируемым кэшем L2 на каждое ядро с более чем на 50% сниженной латентностью при обращении к подсистеме памяти. Ядра Cortex-A55 поддерживают кэш-память L3, распределяемой на кластер из 8 ядер.

На горизонте – новый мобильный флагман Qualcomm Snapdragon 845

В Сети уже появилась информация о том, что в Qualcomm работают над созданием следующего за Snapdragon 835 нового флагманского 8-ядерного процессора Snapdragon 845, выполненного на представленных сегодня ядрах Cortex-A75 и Cortex-A55. По аналогии с чипом Snapdragon 835, новый Snapdragon 845 также будет производиться с нормами 10-нм техпроцесса.

Для Snapdragon 845 ожидается рост производительности примерно на 30% при однопоточных вычислениях и ориентировочно на 70% при мультипоточных вычислениях.

Сроки официального анонса чипа Snapdragon 845 пока не известны, но аналитики прогнозируют это событие на конец 2017 г.

Первые смартфоны на DynamIQ: уже в 2018

По данным ARM, компания в последние четыре года поставила своим партнерам порядка 50 млрд 64-битных чипов, и в следующие пять лет планирует как минимум удвоить это число. Ожидается, что большинство из этих 100 млрд чипов, которые компания планирует поставить до 2021 года, будут ARM-ядрами на основе Dynamiq или из экономичных семейств Cortex-R и Cortext-M.

Согласно заявлению ARM, компания работает с «многочисленными партнерами» над практическим внедрением технологий DynamIQ. По мнению представителей руководства ARM, микроархитектура Dynamiq может появиться во множестве различных смартфонов в ближайшие два года.

Процессор ARM Cortex A7: характеристики и отзывы

В этом материале пойдет речь о процессорной архитектуре ARM Cortex A7 . Полупроводниковые продукты на ее основе можно встретить в смартфонах, роутерах, планшетных ПК и прочих мобильных устройствах, где она до недавних пор занимала ведущие позиции в этом сегменте рынка. Сейчас же ее постепенно вытесняют более новые и свежие процессорные решения.

Краткая справка о компании ARM

История компании ARM началась в 1990 году, когда она была основана Робином Саксби. Основой же для ее создания стала новая микропроцессорная архитектура. Если до этого господствующие позиции на рынке ЦПУ занимала х86 или CISC , то после образования данной компании появилась достойная альтернатива в виде RISC. В первом случае выполнение программного кода сводилось к 4 этапам:

Получение машинных инструкций.

Выполнение преобразования микрокода.

Поэтапное выполнение микроинструкций.

О сновная же идея архитектуры RIS С состояла в том, что обработку программного кода можно свести к 2 этапам:

Получение RISC- инструкций.

Обработка RISC- инструкций.

К ак в первом, так и во втором случае есть как плюсы, так и существенные недостатки. х86 успешно завоевала компьютерный рынок, а RISC ( в том числе и ARM Cortex A7 , представленная 2011 году) — рынок мобильных устройств.

История появления архитектуры Cortex A7. Ключевые особенности

В качестве основы для «Кортекс А7» выступала «Кортекс А8». Основная идея разработчиков в данном случае сводилась к тому, чтобы увеличить производительность и значительно улучшить энергоэффективность процессорного решения. Именно это в конечном итоге и получилось у инженеров компании ARM . Еще одной важной особенностью в данном случае стало то, что появилась возможность создавать ЦПУ с технологией big.LITTLE. То есть полупроводниковый кристалл мог включать 2 вычислительных модуля. Один из них был нацелен на решение наиболее простых задач с минимальным энергопотреблением и, как правило, в этой роли и выступали ядра «Кортекс А7». Второй же был предназначен для запуска наиболее сложного софта и базировался на вычислительных блоках «Кортекс А15» или «Кортекс А17». Официально «Кортекс А7» была представлена, как было отмечено ранее, в 2011 году. Ну а первый процессор ARM Cortex A7 увидел свет годом позже, то есть в 2012 году.

Технология производства

Изначально полупроводниковые продукты на основе А7 производились по технологическим нормам 65 нм. Сейчас эта технология безнадежно устарела. В дальнейшем были выпущены еще два поколения процессоров А7 по нормам допуска уже 40 нм и 32 нм. Но и они сейчас уже стали неактуальными. Наиболее свежие модели ЦПУ на основе этой архитектуры изготавливаются уже по нормам 28 нм, и именно их пока еще можно встретить в продаже. Дальнейший переход на более новые технологические процессы с новыми нормами допуска и устаревшей архитектурой ожидать вряд ли стоит. Чипы на базе А7 сейчас занимают наиболее бюджетный сегмент рынка мобильных устройств и их постепенно вытесняют уже гаджеты на основе А53, которая практически при той же энергоэффективности параметрах имеет более высокий уровень быстродействия.

Архитектура микропроцессорного ядра

1, 2, 4 или 8 ядер может входить в состав ЦПУ на базе ARM Cortex A7. Характеристики процессоров в последнем случае указывают на то, что в состав чипа входят, по существу, 2 кластера по 4 ядра. 2-3 года процессорные продукты начального уровня основывались на чипах с 1-им или 2-мя вычислительными модулями. Средний уровень занимали 4-ядерные решения. Ну а премиум-сегмент был за 8-ядерными чипами. Каждое микропроцессорное ядро на основе такой архитектуры включало следующие модули:

Читайте также  Iar ewarm. stm32f030f4p6. микроконтроллер отсутствует в списке...

Б лок обработки чисел с плавающей запятой ( FPU).

Блок NEON для оптимизации работы ЦПУ.

Вычислительный модуль ARMv7.

Также были следующие общие компоненты для всех ядер в составе ЦПУ:

Блок управления ядрами CoreSight.

Контроллер шины управления данными АМВА с разрядностью 128 бит.

Возможные частоты

Максимальное значение тактовой частоты для данной микропроцессорной архитектуры может изменяться от 600 МГц до 3 ГГц. Также необходимо отметить, что этот параметр, который указывает максимальное влияние на производительность вычислительной системы, изменяется. Причем на частоту оказывает влияние сразу три фактора:

Уровень сложности решаемой задачи.

Степень оптимизации программного обеспечения под многопоточность.

Текущее значение температуры полупроводникового кристалла.

В качестве примера рассмотрим алгоритм работы чипа МТ6582, который базируется на А7 и включает 4 вычислительных блока, частота которых изменяется от 600 МГц до 1,3 ГГц. В режиме простоя у этого процессорного устройства может находиться лишь только один блок вычислений, и он функционирует на минимально возможной частоте в 600 МГц. Аналогичная ситуация будет и в том случае, когда будет запущено простое приложение на мобильном гаджете. Но когда же в списке задач появиться ресурсоемкая игрушка с оптимизацией под многопоточность, то автоматически включатся в работу все 4 блока обработки программного кода на частоте 1,3 ГГц. По мере нагрева ЦПУ наиболее горячие ядра будут понижать значение частоты или даже отключаться. С одной стороны, такой подход обеспечивает энергоэффективнсть, а с другой — приемлемый уровень быстродействия чипа.

Кеш-память

Всего лишь 2 уровня кеша предусмотрено в ARM Cortex A7. Характеристики полупроводникового кристалла, в свою очередь, указывают на то, что первый уровень в обязательном порядке разделен на 2 равные половинки. Одна из них должна хранить данные, а другая — инструкции. Суммарный р азмер кеша на 1-ом уровне по спецификациям может быть равен 64 Кб. Как результат, получаем 32 Кб для данных и 32 Кб для кода. Кеш 2-го уровня в этом случае будет завис е ть от конкретной модели ЦПУ. Наименьший объем его может быть равен 0 Мб (то есть отсутствовать), а наибольший — 4 Мб.

Контроллер оперативной памяти. Его особенности

Встроенным контроллером оперативной памяти комплектуется любой процессор ARM Cortex A7. Характеристики технического плана указывают на то, что он ориентирован на работу в связке с ОЗУ стандарта LPDDR3. Рекомендованные частоты функционирования оперативной памяти в данном случае равны 1066 МГц или 1333 МГц. Максимальный же размер ОЗУ, который можно встретить на практике, для данной модели чипа равен 2 Гб.

Интегрированная графика

Как и положено, данные микропроцессорные устройства имеют интегрированную графическую подсистему. Компания-производитель ARM рекомендует использовать в сочетании с этим ЦПУ графическую карту собственной разработки Mali — 400MP2 . Но ее производительности чаще всего недостаточно для того, чтобы раскрыть потенциал микропроцессорного устройства. Поэтому разработчики чипов применяют в сочетании с этим чипом более производительные адаптеры, например, Power VR6200.

Программные особенности

Три вида операционных систем нацелено на процессоры ARM:

Android от поискового гиганта Google.

Windows Mobile от «Майкрософт».

Все остальное системное программное обеспечение пока не получило большого распространения. Наибольшую долю на рынке такого софта, как не сложно догадаться, занимает именно Android. Эта система имеет простой и понятный интерфейс и устройства на ее основе начального уровня являются очень и очень доступными. До версии 4.4 включительно она была 32-битной, а с 5.0 стала поддерживать 64-разрядные вычисления. Эта ОС успешно функционирует на любом семействе ЦПУ архитектуры RISC , в том числе и ARM Cortex A7. Инженерное меню — это еще одна важная особенность данного системного софта. С ее помощью можно существенно перенастроить возможности ОС. Доступ же к этому меню можно получить с помощью кода, который для каждой модели ЦПУ индивидуален.

Еще она важная особенность этой ОС — установка всех возможных обновлений автоматически. Поэтому даже новые возможности могут появиться на чипах семейства ARM Cortex A7. Прошивка их может добавить. Вторая система нацелена на мобильные гаджеты компании APPLE. Такие устройства в основном занимают премиум — сегмент и имеют соответствующие уровни быстродействия и стоимость. Последняя ОС в лице Windows Mobile пока не получила большого распространения. Устройства на ее основе есть в любом сегменте мобильны гаджетов, но вот малое количество прикладного софта в данном случае является сдерживающим фактором для ее распространения.

Модели процессоров

Наиболее доступными и наименее производительными в этом случае являются 1-ядерные чипы. Наибольшее распространение среди них получил МТ6571 от компании МедиаТек. На ступеньку выше находятся двухъядерные ЦПУ ARM Cortex A7 Dual Core. В качестве примера можно привести МТ6572 от все того же самого производителя. Еще больший уровень быстродействия обеспечивали Quad Core ARM Cortex A7. Наиболее популярным чипом из этого семейства является МТ6582, который сейчас даже можно встретить в мобильных гаджетах начального уровня. Ну а наибольший уровень быстродействия обеспечивали 8-ядерные центральные процессоры, к которым принадлежал МТ 6595.

Дальнейшие перспективы развития

Пока еще можно встретить на прилавках магазинов мобильные устройства в основе которых лежит полупроводниковое процессорное устройство на базе 4X ARM Cortex A7. Это и МТ6580, МТ6582 и «Снапдрагон 200». Все эти чипы включают 4 вычислительных блока и имеют отменный уровень энергоэффективности. Также стоимость в этом случае очень и очень скромная. Но все же лучшие времена это микропроцессорной архитектуры уже позади. Пик продаж продукции на ее основе припал на 2013-2014 года, когда на рынке мобильных гаджетов у нее практически не было альтернативы. Причем в этом случае речь идет как о бюджетных устройствах с 1 или 2 вычислительными модулями, так и с флагманскими гаджетами с 8-ядерным ЦПУ. На текущий момент ее постепенно с рынка вытесняет «Кортекс А53», которая по существу является модифицированной 64-битной версией А7. При этом основные преимущества своей предшественницы она сохранила целиком и полностью, и будущее уж точно за ней.

Мнение экспертов и пользователей. Реальные отзывы о чипах на базе данной архитектуры. Сильные и слабые стороны

Безусловно, знаковым событием для мира мобильных устройств стало появление архитектуры микропроцессорных устройств ARM Cortex A7. Наилучшим доказательством этого стало то, что устройства на ее базе уже успешно продаются более 5 лет. Конечно, сейчас уже возможностей ЦПУ на основе А7 уже недостаточно даже для решения задач среднего уровня, но вот наиболее простой программный код на таких чипах и по сей день успешно функционирует. В перечень такого софта входит воспроизведение видео, прослушивание аудиозаписей, чтение книг, веб-серфинг и даже наиболее простые игрушки в этом случае запустятся без особых проблем. Именно на этом и акцентируют внимание на ведущих тематических порталах, посвященных мобильным гаджетам и девайсам как ведущие специалисты такого плана, так и обычные пользователи. Ключевой минус А7 — это отсутствие поддержки 64-битных вычислений. Ну а к основным плюсам ее можно отнести идеальное сочетание энергоэффективности и производительности.

Итоги

Безусловно, архитектура ARM Cortex A7 — это целая эпоха в мире мобильных устройств. Именно с ее появлением мобильные устройства стали доступными и достаточно производительными. И один тот факт, что она уже более 5 лет успешно продается, лишнее тому подтверждение. Но если вначале гаджеты на ее базе занимали средний и премиум сегменты рынка, то сейчас за ними остался лишь бюджетный класс. Эта архитектура устарела и постепенно уходит в прошлое.

Читайте также  Двухрежимный автомат для насоса

ARM анонсировала новые процессоры Cortex-A75, A55 и Mali-G72

Сегодня на технологической конференции Computex 2017 компания ARM представила новые процессоры, которые планирует вывести на рынок в течение года. Это мощный процессор Cortex-A75 и энергоэффективный процессор Cortex-A55, а также новый графический процессор Mali-G72.

Cortex-A75 и A55 стали первыми чипами с технологией DynamIQ big.LITTLE, о которой рассказывали ранее. Она специально оптимизирована для приложений ИИ, которые станут обычным делом в смартфонах будущего, для новых интерфейсов (управление голосом) и виртуальной реальности. Наверное, аппаратная поддержка ИИ полезна ещё и для единой распределённой системы ИИ, которая может работать на миллиардах смартфонов Android — такую систему разработала и сейчас начинает опробовать компания Google.

С аппаратной поддержкой машинного обучения и ИИ разработчикам станут доступны новые специальные процессорные инструкции (например, вычисления с ограниченной точностью). Новые процессоры обеспечат значительную прибавку производительности в приложениях ИИ, в сравнении с нынешними системами на базе Cortex-A73.

ARM big.LITTLE — это гетерогенная вычислительная архитектура, где на CPU выделено место для специальных аппаратных ускорителей приложений машинного обучения. Особенность состоит в наличии процессорных ядер двух типов: относительно медленных, энергоэффективных (LITTLE) и относительно мощных и прожорливых (big). Фоновые задачи на смартфоне или другом устройстве удобно решать с маленькими ядрами, которые потребляют очень мало энергии. В случае необходимости процессор активирует мощные прожорливые ядра, которые в многопоточном режиме, работая сообща, демонстрируют особенно высокую производительность. В принципе, у всех ядер есть доступ к общей памяти, так что задачи можно ставить для выполнения на обоих типах ядер одновременно. То есть большие и маленькие переключаются на лету.

DynamIQ big.LITTLE — эволюционный шаг вперёд. Новая архитектура позволяет задействовать разнообразные сочетания больших и малых ядер, которые раньше не были возможны. Например, 1+3, 2+4 или 1+7. В каждом кластере может располагаться до восьми ядер. Кластеры DynamIQ практически неограниченного масштаба с общей памятью — это предложение создавать мощные вычислительные системы самого разного назначения.

Cortex-A75 (4 больших ядра + 4 маленьких)

Процессор Cortex-A75 (3 ГГц), по заявлению британской компании, обеспечивает производительность уровня современного ноутбука, потребляя не больше энергии, чем нынешние смартфоны. Процессор идёт на смену Cortex-A73 (2,8 ГГц), и по тесту SPECint2006 его производительность на 20-40% превышает предшественника.

Cortex-A75 предполагается использовать не только в смартфонах и планшетах, но и в ноутбуках (вроде хромбуков), автомобилях и других устройствах с большим экраном — везде, где нужна высокая производительность.

Cortex-A55 (1 большое ядро + 7 маленьких)

Cortex-A55 — совсем другая птица. Он оптимизирован для экономии энергии и потребляет в 2,5 раза меньше, чем процессоры нынешнего поколения Cortex-A53 (прибавка производительности 14-97%). Его будут использовать в тех же смартфонах и планшетах, если высокая производительность не требуется, а также в разнообразных устройствах Интернета вещей.

Cortex-A55 (16 нм) заменит Cortex-A53 (28 нм) — уже относительно старый CPU, который стал самым популярным 64-битным процессором в истории компьютерной техники.

В обоих процессорах есть нативная поддержка HDR и новой подсистемы безопасности CryptoCell-712.

Mali-G72

Новый графический процессор Mali-G72 обещает на 40% большую производительность, чем процессоры и устройствах 2017 года выпуска, и на 25% лучшую энергоэффективность.

Графический процессор специально разработан с расчётом на виртуальную реальность. Например, он поддерживает Multi-View — продвинутую функцию рендеринга, которая используется в шлемах виртуальной реальности Samsung Gear VR, поддерживает технику Foveated Rendering для слежения за направлением взгляда в шлемах VR, а также адаптивное масштабируемое сжатие текстур (ASTC), мультисэмпловое сглаживание (MSAA) и сглаживание углов объектов.

Этот чип тоже оптимизирован на приложения ИИ — например, умножения матриц (GEMM) здесь на 17% эффективнее, заявила ARM. Предполагается, что в устройствах графика Mali-G72 будет использоваться вместе с процессором Cortex-A75 или Cortex-A55. По статистике ARM, в прошлом году 50% проданных смартфонов и 50% шлемов VR работали на графике Mali.

У производителей аппаратных устройств новые чипы должны появиться в I кв. 2018 года.

ARM Cortex-A57 и Intel Silvermont стали самыми эффективными ядрами

FireStream

Для печати

В настоящее время существуют около полдюжины различных процессорных ядер общего назначения для различных маломощных SoC решений. Есть среди них и высокопроизводительные, и с низким энергопотреблением. Но если учитывать все показатели, ARM и Intel имеют огромное преимущество над своими соперниками.

Массивная популяризация мобильных и других устройств с высокой степенью интеграции и необходимость дифференцировать спрос, привели не только к появлению пользовательских прикладных процессоров с эксклюзивными возможностями и уникальными архитектурами, но и к повышению производительности и функциональности процессоров специального назначения. В результате, несколько разработчиков SoC в последние годы представили свои собственные конструкции ядер общего назначения, которые должны оптимизировать производительность и энергопотребление, а также позволить им конкурировать на развивающихся сегментах рынка, которые имеют новые требования (например, серверы, автомобили, и т.д.).

Linley Group, консалтинговая компания, недавно сравнила производительность, размер и энергопотребление различных процессорных ядер общего назначения для мобильных и высоко-интегрированных устройств, в том числе ARM Cortex-A57, ARM Cortex-A53, Apple Cyclone+, Intel Silvermont, Nvidia Denver а также Qualcomm Krait.

Самым маленьким из мобильных процессорных ядер общего назначения является высокопроизводительный ARM Cortex-A57, которое также обеспечивает достаточно высокую производительность и широко используется в современных мобильных устройствах. В 32-битном режиме, Cortex-A57 обеспечивает на 20% более высокую производительность, чем ее 32-битный предшественник, Cortex-A15. Silvermont от Intel Corp. имеет примерно такой же размер, как и Cortex-A57 и обеспечивает одинаковую производительность. Тем не менее, на максимальных тактовых частотах, x86 использует чуть больше энергии, немного отставая в энергетической эффективности.

Apple Cyclone+ и Denver Nvidia, которые используются внутри устройств Apple, A8 и Tegra K1-64 соответственно, гораздо больше по размеру, чем Cortex-A57, но обеспечивают большую производительность на одно ядро, чем последний, оправдывая свою большую площадь. Ядро Cyclone+ ​​работает на частоте 1.40 — 1.50GHz, чтобы минимизировать потребление энергии. В отличие от него, для обеспечения высокой производительности, Nvidia Denver работает на частоте 2.30GHz и потребляет больше энергии, чем любой из конкурентов в сравнении. Это неудивительно, так как Nvidia изначально планировали сделать Denver с помощью техпроцесса 16nm FinFET, не 28nm. Кроме того, целью проекта Denver было предоставить максимально возможную производительность с определенным тепловым коэффициентом, а не низкое энергопотребление.

По данным исследования Linley Group, процессоры Qualcomm Krait компактны и энергоэффективны, однако им не хватает 64-разрядных возможностей. Тем не менее, имея в виду, что Krait предлагает более высокую производительность, чем Cortex-A15, это является неплохой альтернативой как A15, так и A57.

Cortex-A53 является наименее прожорливым ядром ​​среди рассмотренных. В то время как A53 является одним из самых производительных ядер, когда-либо созданных, его производительность, естественно, значительно ниже по сравнению с высокопроизвоительными ядрами. Кроме того, Linley Group утверждает, что A53 также в два раза больше 32-битного Cortex-A7, гораздо больше, чем ожидалось.

Главным из выводов Linley Group является то, что Intel наконец-то удалось почти догнать ARM в плане производства процессорных ядер общего назначения с низким энергопотреблением, сохраняя при этом способность обеспечивать более высокую производительность. Процессоры следующего поколения от Intel под кодовым названием «Cherry Trail», которые вскоре появятся в устройствах, будут изготавливаться с применением 14nm технологии FinFET для снижения мощности, что позволит Intel предложить более высокую производительность и низкое энергопотребление по сравнению с SoC ARM.