Мультиядерные процессоры компании Texas Instruments семейства 66АК2х

№ 2’2016
PDF версия
Компания Texas Instruments (TI), являясь одним из лидеров западной электронной промышленности, предлагает широкий спектр различных процессоров и проектных решений, оптимизированных для разработки и построения практически любых встроенных систем. В обзоре представлены выпускаемые в настоящее время компанией TI процессоры и уделено особое внимание новому мультиядерному семейству 66АК2х.

На рис. 1 показан обобщенный перечень выпускаемых процессоров, а также место в этом перечне семейства 66АК2х.

Перечень процессоров, выпускаемых компанией TI

Рис. 1. Перечень процессоров, выпускаемых компанией TI

Процессоры для специальных применений включают два подсемейства: для автомобильных приложений и для коммуникационного оборудования.

Основной упор в процессорах автомобильного применения делается на реализацию полного информационно-развлекательного функционала. В этом плане компания TI предлагает очень большой портфель решений для построения аналоговых и цифровых систем обработки звука, систем навигации, мониторинга и диагностики состояния автомобиля, информационно-развлекательных комплексов, АМ/FМ радио, USB- и Bluetooth-интерфейсов. При этом, предлагаемые решения сочетают весь функционал в едином модуле.

В области построения коммуникационного оборудования TI предлагает решения для беспроводных систем, цифрового радио, общественной безопасности, военного применения. Предлагаемые решения обладают относительно низкой стоимостью, высокой производительностью, масштабируемостью, низким энергопотреблением и охватывают широкую область инфраструктуры связи.

Процессоры Sitara предназначены для построения масштабируемых серверных решений на базе платформы ARM Cortex-Ax, при этом реализуется широкий набор периферийных модулей и вариантов подключения, а также обеспечивается поддержка Linux и систем реального времени.

Компания TI предлагает четыре поколения данного процессора, обеспечивая оптимальный баланс стоимости, производительности и функциональности. Основные характеристики каждого поколения приведены в таблице 1.

Таблица 1. Основные характеристики процессоров Sitara

Семейство

AM335x

AM437x

AM57x

AM5K2Ex

Ядро

Cortex-A8

Cortex-A9

Cortex-A15 + C66x DSP

Cortex-A15

Тактовая частота, МГц

300/600/800/1000

800/1000

Cortex-A15: 500/1500

C66x: 500/750

1250/1400

Производительность, DMIP

до 2000

до 2500

до 10 500

до 19 600

Графическая подсистема

SGX530

SGX530

SGX544 (3D), GC320 (2D), 1080p60

нет

Память

LPDDR1/DDR2/DDR3(L)

LPDDR2/DDR3(L)

DDR3(L)

DDR3(L) w/ECC

Сопроцессор

2-ядерный PRU-ICSS

4-ядерный PRU-ICSS

4-ядерный PRU-ICSS

нет

Операционная система

Linux/Android/Windows CE/StarterWare/RTOS

Linux/Android/
Windows CE/RTOS

Linux/Android/
Windows CE/RTOS

Linux/RTOS

Периферия

LCD, CAN, Gigabit Eth., 2×USB w/PHY, 3D, Crypto,
ADC, Gigabit EMAC

ADC, QSPI, Gigabit Eth., 2×USB w/PHY, 2×CAN, 2×McASP, 6×UART, 5×SPI, 3×I2C, HDQ, 6×PWM

2×PCIe, SATA, 2×Gigabit Eth., USB 3.0, USB 2.0, 2×DCAN, QSPI,
10×UART, 8×McASP, 5×I2C

8×Gigabit Eth., 2×Gigabit Eth., 2×USB 3.0, 2×PCIe, 2×UART, 3×SPI, 3×I2C

Стоимость (за 1000 шт.), $

от 5,7

от 9

от 28,17

от 85

Цифровые сигнальные процессоры (DSP), выпускаемые компанией TI, обладают высокой производительностью, обеспечивают обработку сигналов в реальном времени, реализуют возможность эффективного управления энергопотреблением и позволяют проектировать масштабируемые решения. Процессоры предназначены для систем обработки аудио- и видеоданных, систем биометрии, валютных детекторов, мобильных радиостанций, оборудования индустриальной автоматики, систем машинного зрения, портативных медицинских приборов, тестирующего и измерительного оборудования, авионики, высокопроизводительных вычислительных кластеров для обработки сигналов различной природы.

Кроме самих процессоров, компания TI предлагает дополнительное программное обеспечение, а также развитую систему технической поддержки, что облегчает программирование новых устройств, повышает их производительность и сокращает срок разработки изделий в целом.

Выпускаются пять подсемейств DSP:

  1. Процессоры со сверхнизким энергопотреблением.
  2. Одноядерные процессоры.
  3. Многоядерные процессоры.
  4. Мультимедийные процессоры.
  5. Мультиядерные процессоры.

Основные характеристики каждого подсемейства приведены в таблице 2.

Таблица 2. Основные характеристики процессоров семейства DSP

Семейство

Со сверхнизким потреблением (C55x)

Одноядерные (C674x)

Многоядерные (C66x)

Мультимедийные (DaVinci и OMAP)

Мультиядерные (OMAP-1x и 66AK2x)

Тактовая частота, ГГц

0,05–0,3

0,2–0,456

0,85–0,14

ARM: 0,135–1,2
DSP: 0,3–1,1

ARM: 1,25–1,4
DSP: 1,25–1,4

Производительность

до 600 MMACS

до 2,7 GFLOPS
до 3,6 GMACS

до 179 GFLOPS
до 358 GMACS

до 8000 DMIPS
до 6 GFLOPS

до 19 600 DMIPS
до 67,2 GFLOPS
до 44,8 GMACS

Потреб. мощность, Вт

0,02–0,3

не более 0,5

2–10

не более 3

5–12

Память

SDRAM

DDR2/mDDR

(LP)DDR3
w/ECC

(LP)DDR2/DDR3

(LP)DDR3
w/ECC

Операционная
система

CSL

TI RTOS

TI RTOS

Linux/Android/Windows CE/TI RTOS

Linux/TI RTOS

Периферия

USB, UART, I2C, McSPI, EMIF, ADC, LDO, LCD

LCD, USB2, SATA, EMAC,
Video in/out, uPP

PCIe Gen2, Serial RapidIO, GigE with integrated switch, Hyperlink

USB, UART, I2C, SPI, Video Port

2×10GigE, 1×GigE, PCIe Gen2, TSIP, Hyperlink, JESD204B

Стоимость (за 1000 шт.), $

от 1,95

от 6,3

от 33,6

от 12,63

от 123

Цифровые сигнальные процессоры со сверхнизким энергопотреблением предназначены в первую очередь для реализации всевозможных носимых устройств — от различных гаджетов вроде аудиоплееров, «умных» часов и прочего до биометрических датчиков и различных медицинских устройств.

К особенностями семейства относится сверхнизкое энергопотребление (следует заметить, сверхнизкое относительно других DSP), выполнение вычислений с фиксированной точкой, наличие аппаратного ускорителя БПФ, аудио- и речевых кодеков, большой библиотеки математических функций, интегрированного регулятора LDO, а также малые размеры.

Одноядерные DSP обладают большей производительностью, но в то же время и большим энергопотреблением, чем предыдущее семейство. Основные области применения для них — биометрия, медицинские приборы, мобильное радио, детекторы валют.

Данные процессоры отличаются сравнительно низким (с учетом обеспечиваемой производительности) энергопотреблением, возможностью повторного использования программного кода процессоров предыдущего поколения C64x/C67x, наличием сопроцессора PRU, пиновой совместимостью с процессорами OMAP-Lx (не путать с OMAP из мультимедийного семейства), возможностью защиты программного кода.

Многоядерные процессоры реализуют новую многоядерную и многослойную архитектуру систем на чипе (SoC). Они являются основой семейства процессоров, ориентированных на построение сложных приложений коммуникационной инфраструктуры, например, на их основе может быть реализован функционал базовых станций для мобильной связи.

Интеграция модулей, выполняющих операции с фиксированной и плавающей запятой в одном ядре, позволяет фундаментально изменить построение алгоритмов. Стало возможным переносить алгоритмы, разработанные с плавающей точкой в таких программах, как Matlab, без кропотливой работы по их приведению к фиксированной точке.

Мультимедийные процессоры включают два класса: DaVinci и OMAP.

Процессоры DaVinci предназначены для проектирования и построения таких приложений, как кодирование/декодирование/перекодирование видео, систем видеонаблюдения, устройств для видеоконференций, оборудования для медиасерверов.

Ключевая особенность процессоров DaVinci состоит в наличии нескольких сопроцессоров обработки видео и изображения формата HD (HDVICP2). Каждый сопроцессор может кодировать/декодировать один видеопоток кодеком H.264 в формате 1080p60 или несколько видеопотоков в более низком разрешении либо с более низкой частотой кадров.

Кроме того, процессоры DaVinci включают ядро ARM с расширением NEON. Наличие ядра ARM позволяет разработчикам реализовать алгоритм управления функционалом обработки видео- и аудиосигналов на ядре DSP.

Процессоры OMAP характеризуются низким энергопотреблением, обеспечивают поддержку нескольких операционных систем. Их архитектура основана на использовании ядер Cortex-A8/9/A15 и содержит сопроцессоры для ускоренной обработки графики, ядра ARM Cortex-M3/4, контроллер дисплея, блок управления памятью (MMU) и модуль виртуальных прерываний, позволяющий реализовать функционал гипервизора.

Основная область применения — промышленность, автомобильные информационно-развлекательные системы, создание сенсорных экранов и систем обработки видео.

И наконец, мультиядерные. Эти процессоры построены на двух типах ядер — DSP и ARM. Семейство состоит из двух классов: OMAP-Lx и 66AK2x.

Особенностью процессоров OMAP-Lx является использование ядер ARM9 и C674x, что позволяет реализовать раздельное проектирование системы управления и обработки на одном чипе. Кроме того, процессоры обладают сравнительно низким энергопотреблением, совместимы по выводам с процессорами TMS320C674x и обеспечивают подключения по интерфейсам USB2.0, Ethernet 10/100, SATA, имеют видеопорт и поддерживают защиту кода.

Основные области применения процессоров OMAP-Lx — построение аудиосистем, создание малогабаритных радиостанций, оборудование индустриальной автоматизации, детекторы валют, биометрия, тестирующие и измерительные приборы, системы защиты электропитания, портативное медицинское оборудование, системы сбора и первичной обработки данных различного типа.

Основные характеристики процессоров OMAP-Lx представлены в таблице 3.

Таблица 3. Основные характеристики мультиядерных процессоров OMAP-Lx

Семейство

OMAP-L138

OMAP-L132

C6748

C6746

C6742

Ядро DSP, МГц

456

200

456

456

200

Ядро ARM, МГц

456

200

нет

нет

нет

Сопроцессор PRU

2

2

2

2

нет

Память, кбайт

488

488

448

320

128

Ключевая периферия

EMAC, MMC/SD, USB 2.0/1.1, Video I/O, uPP, LCD Ctr, SATA

EMAC, USB 2.0, MMC/SD, UART,
LCD Ctr., SATA, I2C

EMAC, USB 2.0/1.1, MMC/SD, Video I/O, uPP, LCD Ctr, SATA

EMAC, USB 2.0, MMC/SD, Video I/O, uPP

PWM, McASP, SPI, UART, I2C

Программная и пиновая совместимость процессоров

Процессоры 66AK2x являются одним из самых мощных и универсальных решений, предлагаемых компанией TI. В их архитектуре используются ядра DSP C66x и ARM Cortex-A15, чье количество варьируется в зависимости от модификации. Процессоры могут включать до четырех ядер ARM с сопроцессором NEON и до восьми ядер DSP C66x, выполняющих вычисления с фиксированной и плавающей точкой, имеют большой объем встроенной памяти, сетевой сопроцессор (NetCP), модуль криптозащиты, встроенный модуль быстрого преобразования Фурье, поддерживают широкую номенклатуру быстрых внешних интерфейсов (Gigabit Ethernet, PCIe, Serial RapidIO, USB 3.0 и т. д.).

Данное семейство предназначено для использования в авионике, оборонной промышленности, устройствах связи и телекоммуникации, высокоточных измерительных и тестирующих приборах, медицине, облачных вычислениях — словом, во всех областях, где требуются высокопроизводительные вычисления с возможностью распараллеливания алгоритмов и их разделения на управляющую и обрабатывающую части.

Перечень всех выпускаемых на момент написания статьи процессоров 66AK2x и их краткие характеристики приведены в таблице 4.

Таблица 4. Основные характеристики мультиядерных процессоров 66AK2x

Процессор

66AK2E02

66AK2E05

66AK2H06

66AK2H12

66AK2H14

66AK2L06

Тактовая частота, ГГц/ядро

1,25–1,4

1–1,4 (ARM); 1–1,2 (DSP)

1,2

Количество ядер ARM Cortex-A15

1

4

2

4

2

Производительность ядер ARM, DMIP

4900

19 600

9800

19 600

8400

Количество ядер DSP C66x

1

4

8

4

Max GMACs (From C66x DSP)

44,8

153,6

307,2

153,6

Max GFLOPs (DSP+NEON)

33,6

67,2

99,2

198,4

96

КЭШ уровня L1, кбайт/ядро

32D/32P

32D/32P (ARM)
64D/64P (DSP)

Общий КЭШ уровня L2, Мбайт

4

1

Общая память типа SRAM, Мбайт

2

6

3

Тип поддерживаемой памяти DDR (с ECC)

64b 1600 МГц

2×64b 600 МГц

2×64b 1600 МГц

Интерфейс, Гбит Ethernet

есть

Интерфейс, 10 Гбит Ethernet

есть

нет

есть

нет

Интерфейс, PCI Express Gen 2

есть

Интерфейс, Serial RapidIo

нет

есть

нет

Процессоры 66AK2Hx представляют собой систему-на-кристале (SoC), основанную на мультиядерной архитектуре компании TI второго поколения (KeyStone II). Блочная схема этой архитектуры показана на рис. 2.

Мультиядерная архитектура KeyStone

Рис. 2. Мультиядерная архитектура KeyStone

Базовыми элементами архитектуры KeyStone являются пакеты ядер ARM и DSP (ARM CorePac/DSP CorePac), пакет аппаратных ускорителей (AccelerationPac), система управления общей памятью (Multicore Shared Memory Controller — MSMC), система управления пакетами ядер и акселераторов (Multicore Navigator), шина обмена данными (TeraNet), коммутатор периферии и входов/выходов (Switching and I/O).

Архитектура KeyStone предоставляет уникальные возможности для реализации неоднородных высокопроизводительных приложений на основе многоядерной инфраструктуры. Контроллер общей памяти (MSMC) обеспечивает минимальное время доступа при выполнении операций чтения/записи. Шина TeraNet имеет высокую пропускную способность и поддерживает неблокирующую передачу данных между отдельными модулями процессора. Система управления пакетами ядер (Multicore Navigator) предоставляет прямой доступ к памяти (DMA) и позволяет эффективно управлять ресурсами ядер ARM и DSP, планировать задания и выполнять диспетчеризацию при создании программного кода. Коммутатор периферии гибко конфигурирует интерфейсные модули и вводы/выводы процессора под решение конкретной задачи.

Кроме самой физической платформы, архитектура KeyStone для получения максимального эффекта дополнена пакетом программного обеспечения Multicore Software Development Kit (MCSDK). Этот пакет помогает разработчику значительно сократить время выхода его продукции на рынок за счет предоставления набора базовых программных компонентов, необходимых при создании кода изделия, простого API и демонстрационных примеров. Предоставляемый программный код уже оптимизирован с точки зрения его применения на многоядерной элементной базе.

MCSDK поддерживает операционные системы SYS/BIOS RTOS от TI для ядер C66x DSP и Linux для ядер ARM. Кроме того, предоставляются низкоуровневые драйверы, оптимизированные библиотеки для различных математических функций, библиотеки для анализа, отладки и мониторинга в реальном времени. На рис. 3 показаны основные компоненты MCSDK.

Основные компоненты MCSDK

Рис. 3. Основные компоненты MCSDK

Подробно все составляющие програм-много пакета MCSDK рассматривать не будем. Это тема для отдельной статьи, и даже не для одной. Но хотелось бы отметить главное. Пакет поддерживает межъядерные связи (inter-core communication — IPC) и запуск программ в режиме реального времени (Open Even Machine — OpenEM).

Наличие программной и аппаратной поддержки межъядерных связей, которая базируется на управлении общей памятью и процессорными ядрами, является основой мультиядерного программирования, а в сочетании с OpenEM позволяет легко реализовать поддержку стандарта программирования OpenMP (Open Multi-Processing) и платформы OpenCL (Open Computing Language).

Как уже отмечалось, семейство 66AK2Hx использует многоядерную архитектуру второго поколения (KeyStone II). В отличие от предыдущих, данные процессоры действуют на тактовых частотах до 5,6 ГГц для ARM-ядер и до 9,6 ГГц для DSP-ядер. Такая производительность сочетается с возможностью безопасной обработки и коммутации пакетов Ethernet, меньшей потребляемой мощностью по сравнению с многокристальными решениями. Кроме того, процессоры сочетают обработку с плавающей и фиксированной точкой, обеспечивая производительность свыше 63 GFLOPS с двойной точностью и более 198 GFLOPS с одинарной точностью — это лучший показатель отношения «производительность на ватт» в отрасли!

Помимо высокой производительности, для потребительских приложений критична и доставка данных пользователю. Процессоры 66AK2Hx включают в свой состав не только высокоскоростные сетевые интерфейсы, но и сетевые коммутаторы: имеется пятипортовый коммутатор для сети 1 Гбит и трехпортовый для сети 10 Гбит, причем на аппаратном уровне, не задействуется ресурс ядер ARM и DSP, реализовано шифрование и дешифрование пакетов данных. Поддерживаются и другие высокоскоростные интерфейсы, такие как RapidIO и PCIe.

Для того чтобы реализовать весь потенциал мультиядерной архитектуры, спроектирована шина TeraNet, поддерживающая скорость обмена свыше 2 Тбит/с. Дополняет шину контроллер общей памяти (MSMC), который выполняет неблокируемую передачу данных с коррекцией ошибок и поддерживает работу памяти на скорости процессорных ядер.

Обмен данными между несколькими чипами, построенными на архитектуре KeyStone, обеспечивает интерфейс HyperLink. Он позволяет передавать данные на скоростях до 50 Гбод.

В заключение этого краткого обзора приведем три модификации архитектуры процессоров семейства 66AK2x, выпускаемых в настоящее время: 66AK2Hx, 66AK2Lx и 66AK2Ex. Эти модификации показаны на рис. 4.

Модификации архитектуры KeyStone II процессоров 66AK2x

Рис. 4. Модификации архитектуры KeyStone II процессоров 66AK2x:
а) 66AK2Hx;
б) 66AK2Lx
в) 66AK2Ex

Отличие заключается в различном наборе ядер ARM, DSP, модулей периферии, размере памяти и количестве акселераторов. Модификация 66AK2Hx предлагает максимальную производительность, 66AK2Lx делает акцент на реализацию классических задач цифровой обработки сигналов, а 66AK2Ex — это процессор, предназначенный в первую очередь для решения задач промышленной автоматизации.

Кроме самих процессоров и программного обеспечения, компания TI обеспечивает всю свою продукцию широким ассортиментом аппаратных отладочных средств. Процессоры 66 АК2х не исключение. Для изучения самих процессоров и их возможностей, а так же для разработки своих решений на их базе предлагается три отладочные комплекты:

  • 66AK2Ex Development board Evaluation Module (EVM);
  • 66AK2Hx Development board Evaluation Module (EVM);
  • 66AK2Lx Development board Evaluation Module (EVM).

Как ясно из названия, комплекты представляют три основные модификации архитектуры KeyStone II процессоров 66 АК2х.

В состав наборов включено такое программное обеспечение, как Code Composer Studio Integrated Development Environment version 5 (CCS v5), Multicore Software Development Kit (MCSDK) с поддержкой Linux для ядер ARM, система реального времени (SYS/BIOS RTOS) от TI для ядер DSP, библиотеки поддержки чипа, программные инструменты для разработки сетевых приложений, демонстрационные примеры. На самих платах имеются сетевые порты, UART, USB, PCIe и SATA. Кроме этого, платы включают DDR3, NAND и NOR память, обеспечивают возможность подключения внешнего эмулятора.

Отладочные комплекты предоставляют разработчику универсальный и гибко настраиваемый инструмент для решения практически любой реальной задачи. В следующих статьях предполагается более подробно рассмотреть состав и возможности одного из комплектов.

Литература
  1. Accelerate multicore application development with KeyStone software.
  2. 66AK2Hx KeyStone Multicore DSP+ARM System-on-Chips.
  3. Realizing full multicore entitlement.
  4. TMS320C66x DSP generation of devices.
  5. ti.com/lsds/ti/processors/overview.page
  6. ti.com/lsds/ti/processors/dsp/overview.page
  7. ti.com/lsds/ti/processors/dsp/c6000_dsp-arm/66ak2x/overview.page
  8. ti.com/ww/ru/prod_dsp_keystone_arm_ovw.html
  9. ru.wikipedia.org/wiki/OpenCL
  10. ru.wikipedia.org/wiki/OpenMP

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *