Обзор SRAM SigmaQuad-III/IV и SigmaDDR-III/IV от GSI Technology

№ 4’2018
PDF версия
Микросхемы GSI Technology семейств SigmaQuad-III/IV и SigmaDDR-III/IV разработаны для увеличения производительности SigmaQuad-II/II+ и SigmaDDR-II/II+. Сегодня это самые высокопроизводительные микросхемы данного типа на рынке.

Введение

Микросхемы SigmaQuad

Рис. 1. Микросхемы SigmaQuad

Оба поколения семейств SigmaQuad (рис. 1) и SigmaDDR, третье и четвертое (табл. 1), производятся в двух конфигурациях — х18 и х36, а также в трех вариациях:

  • Quad B2 (Separate I/O, Burst of 2);
  • Quad B4 (Separate I/O, Burst of 4);
  • DDR B2 (Common I/O, Burst of 2).
Таблица 1. Сравнение семейств SigmaQuad и SigmaDDR

 

SigmaQuad

SigmaDDR

Type II

Type II+

Type III

Type IV

Type II

Type II+

Type III

Type IV

Объем, Мбит

18–288

18–288

72–288

144

18–288

18–288

72–288

144

Шина данных

x8/9/18/36

x8/9/18/36

x18/36

x18/36

x8/9/18/36

x8/9/18/36

x18/36

x18/36

Блок коррекции ошибок
(ECC)

Нет

72 Мбит

144 Мбит

Да

Нет

72 Мбит

144 Мбит

Да

Количество банков памяти

Один

Много

Один

Много

Data Bus

Раздельные I/O

Раздельные и общие I/O

Общие I/O

Длина Burst

2, 4

2, 4

2

Максимальная
частота тактирования, МГц

278–400

450–633

500–833

933

1333

333–400

450–633

675–833

933

1333

Address Rate

B2: DDR

B4: SDR

SDR

Data Rate

DDR

DDR

Read Latency

1,5 такта

2 или 2,5 такта

3 такта

5 тактов

6 тактов

1,5 такта

2 или 2,5 такта

3 такта

5 тактов

6 тактов

Read Data Clks (CQ)

Да

Да

Write Data Clks (KD)

Нет

Да

Нет

Да

On-Chip ODT

Нет

Да

Нет

Да

Vdd, В

1,8

1,2–1,35

1,25–1,3

1,8

1,2–1,35

1,25–1,3

Vddq, В

1,5 или 1,8

1,2–1,5

1,2–1,3

1,5 или 1,8

1,2–1,5

1,2–1,3

Тип I/O

HSTL

HSTL

Корпус

165-BGA

260-BGA

165-BGA

260-BGA

13×15 мм или 15×17 мм

14×22 мм

13×15 мм или 15×17 мм

14×22 мм

Микросхемы Quad B2 могут выполнять чтение и запись данных за один цикл тактирования, а Quad B4 и DDR B2 могут за один цикл осуществлять только чтение или запись. Следовательно, на одной и той же частоте Quad B2 обеспечивает в два раза более высокую скорость доступа к данным (transaction rate), чем Quad B4 или DDR B2. Полоса пропускания (data bandwidth) каждого в отдельности вывода данных одинакова для всех вариаций. Поскольку скорость доступа к данным становится целевым параметром при выборе SRAM, то вариация Quad B2 является фокусной для применения в телекоммуникационном и сетевом оборудовании.

 

Обзор SigmaQuad-III и SigmaDDR-III

Третье семейство SigmaQuad-III и SigmaDDR-III предназначено для увеличения в два раза производительности предыдущего семейства SigmaQuad-II/II+ и SigmaDDR-II/II+. Минимальный объем памяти микросхем третьего семейства составляет 72 Мбит, а максимальный 288 Мбит. Для увеличения производительности были внесены некоторые архитектурные изменения:

  • для уменьшения энергопотребления понижено напряжение питания (Vdd) до 1,35 В (во II и II+ семействах было 1,8 В);
  • для улучшения целостности сигналов и уменьшения потребляемой мощности понижено напряжение питания сигналов данных I/O (VDDQ) до 1,2 В (HSTL);
  • выделены отдельные линии тактирования для захвата данных во время записи;
  • эхо-сигнал тактирования выровнен по центру выходного сигнала данных;
  • добавлен гибко конфигурируемый блок On-Die Termination (ODT) на всех высокоскоростных линиях: Clock, Data, Address и Control;
  • появилась возможность программно выставлять длительность задержки чтения (RL) — два или три цикла тактирования;
  • микросхемы производятся в новом корпусе 260‑BGA (рис. 2), который дал возможность повысить целостность сигналов путем значительного уменьшения индукционных наводок между выводами в сравнении с используемым корпусом 165‑BGA в семействах II и II+.
Корпус 260-BGA

Рис. 2. Корпус 260-BGA

Новый корпус и вышеперечисленные функциональные особенности, присутствующие во всех вариациях третьего семейства, позволяют работать на частоте до 833 МГц, обеспечивать полосу пропускания 1,66 Гбит/с на каждом отдельном выводе данных и скорость доступа 1,6 ГТ/с (млрд транзакций/с) во всем адресном пространстве (табл. 2).

Таблица 2. Рабочие характеристики SigmaQuad-III и SigmaDDR-III

 

SigmaQuad-III и SigmaDDR-III

Quad B2

Quad B4

DDR B2

Рабочая частота, МГц

800

833

833

Объем, Мбит

72, 144, 288

72, 144, 288

72, 144, 288

Скорость случайного доступа к данным, млрд транзакций/с

1,6

0,833

0,833

Полоса пропускания одного вывода данных, Гбит/c

1,6

1,66

1,66

Полоса пропускания микросхемы при архитектуре x36, Гбит/c

115

120

60

 

Обзор SigmaQuad-IV и SigmaDDR-IV

Четвертое семейство SigmaRAM было разработано с целью вдвое повысить производительность третьего. В настоящее время GSI Technology выпускает в этом семействе микросхемы объемом только 144 Мбит. Для увеличения производительности были внесены значительные изменения в архитектуру и добавлены функциональные возможности, ранее не предусмотренные в третьем семействе, а именно:

Для увеличения производительности в два раза массив памяти был разделен на несколько логических банков. Массив памяти третьего семейства состоит из одного банка памяти. Поэтому, прежде чем произойдет очередной доступ к массиву памяти третьего семейства, необходимо, чтобы была завершена предыдущая процедура обращения записи или чтения. Соответственно, в однобанковом массиве не существует ограничений на установку адреса при последовательных операциях. Однако 933 МГц — это максимальная частота, которая может быть достигнута для однобанковой архитектуры в вариации Quad B2. По этой причине для удвоения производительности в четвертом семействе массив памяти сегментирован в восьми логических банках. Благодаря этому, очередное обращение к ячейкам может выполняться, не дожидаясь завершения предыдущего. Однако, отрицательная сторона этого подхода в том, что при последующем обращении возникают ограничения в выборе адресного пространства, поскольку может происходить частичное совпадение задействованных адресов с предыдущими обращениями. Более точную информацию об ограничениях для каждой микросхемы четвертого семейства необходимо уточнять в datasheets. Очевидно, что ограничения в Quad B2 будут носить более сложный характер, чем в Quad B4 или DDR B2, поскольку Quad B2 выполняет две операции за один цикл, а Quad B4 и DDR B2 — только одну.

Добавлен регистр MRW (Mode Register Write) для облегчения конфигурации SRAM.

Добавлен специальный режим (Loopback Mode) для калибровки по времени каждого вывода Address, Control и Data outputs5.

Интегрированный блок фазовой автоподстройки частоты (PLL) увеличивает окно захвата данных.

Конфигурируемая задержка чтения (RL) на пять или шесть циклов тактирования.

Такая комбинация архитектурных изменений и появления новых функциональных возможностей во всех трех вариациях четвертого семейства позволяет работать на частоте до 1333 МГц и обеспечивать полосу пропускания 2,66 Гбит/с на каждом выводе данных (табл. 3). Для Quad B2 максимальная скорость доступа к данным (transaction rate) составляет 2,66 ГT/с.

Таблица 3. Рабочие характеристики SigmaQuad-IV и SigmaDDR-IV

 

SigmaQuad-IV и SigmaDDR-IV

Quad B2

Quad B4

DDR B2

Рабочая частота, МГц

1333

1333

1333

Объем, Мбит

144

144

144

Скорость случайного доступа к данным, млрд транзакций/с

2,66

1,33

1,33

Полоса пропускания одного вывода данных, Гбит/c

2,66

2,66

2,66

Полоса пропускания микросхемы при архитектуре x36, Гбит/c

192

192

96

 

Однобанковые и многобанковые SigmaQuad/DDR-IV

Многобанковая память работает с меньшей задержкой на обращение к данным TCYC, чем задержка, присущая однобанковой архитектуре TRC. Новый доступ к данным может быть инициирован с задержкой TCYC в случае, если обращение происходит к разным банкам, но не быстрее чем TRC, если очередное обращение происходит к тому же банку. Например, выражение TRC = 4TCYC справедливо только для последовательного обращения к четырем независимым банкам памяти. Во время обращения к очередному банку он может может быть уже занят, что создает ограничения в работе микросхемы с многобанковой архитектурой.

Трудности с использованием многобанковой SRAM также возникают в задачах, где необходим случайный доступ к данным, поскольку случайные запросы должны быть соответствующим образом упорядочены для предотвращения обращений к банку, уже находящемуся в работе. Только после учета этого обстоятельства будет достигнута максимальная производительность. Большинство задач, которые выполняют современные сетевые устройства, требуют случайного доступа к данным.

Для упорядочивания обращений в IP-контроллере создаются специальные буферы re-order buffers. Новый доступ к банку может быть инициирован только после его освобождения от предыдущей задачи. Такое решение всего лишь исключает вероятность стопорения программы, однако не может гарантировать его полного исключения и создает дополнительную задержку.

В задачах, где однобанковая память способна работать на нужной частоте, для достижения максимальной производительности и упрощения алгоритма работы всегда лучше использовать именно SRAM с одним банком памяти. Компания GSI Technology приложила большие усилия, чтобы разработать однобанковую SRAM с максимальной частотой тактирования 933 МГц, что является еще одним рекордом в этом семействе.

 

Корпус SigmaQuad-III/IV и SigmaDDR-III/IV

Старый корпус 165‑BGA для SigmaQuad-II/II+ и SigmaDDR-II/II+ изображен на рис. 3а. Он был разработан еще в 1990‑х годах для шестислойных плат, едва преодолевших барьер в 100 МГц. При его конструировании учитывались требования к облегчению топологии печатной платы, поэтому все выводы питания и «земли» размещены в центре. Корпус получился очень удобным для трассировки, но с плохими показателями целостности сигналов. С появлением третьего семейства была создана новая концепция расположения выводов в корпусе для всех современных SRAM (рис. 3б).

Рис. 3. Сравнение корпусов II/II+ и III/IV семейств SRAM: а) 165-BGA; б) 260-BGA

Рис. 3. Сравнение корпусов II/II+ и III/IV семейств SRAM: а) 165-BGA; б) 260-BGA

Новый корпус 260‑BGA для SigmaQuad-III/IV и SigmaDDR-III/IV обладает улучшенными характеристиками:

  • 13х20 контактных площадок с шагом 1 мм;
  • размер корпуса 14х20 мм (такой же, как и для 119‑BGA и 209‑BGA);
  • диагональные пары выводов питания и «земли» облегчает топологию под корпусом;
  • распределенная сеть выводов питания и «земли» создает местные пути возврата для каждого высокоскоростного сигнала;
  • достаточное количество выводов питания в середине для работы с несогласованной нагрузкой на линиях;
  • наличие зарезервированных выводов для расширения конфигурации микросхемы (отмечены желтым цветом).

Благодаря новому корпусу окно захвата данных увеличено до 76% (рис. 4).

Глазковая диаграмма

Рис. 4. Глазковая диаграмма

 

IP-контроллер

Самостоятельно разработать IP-контрол-лер для управления SRAM достаточно сложно. Поэтому большинство специалистов используют универсальные IP-контроллеры, предоставляемые производителями ПЛИС. Однако это вызывает определенные неудобства в настройках IP-контроллера под конкретную задачу и выбранную SRAM. С практической точки зрения выгоднее сначала выбрать IP-контроллер, а затем подобрать SRAM под него. Такой подход приводит к неоптимальному расходу ресурсов системы и навязывает использование более дорогих микросхем памяти.

GSI Technology разрабатывает IP-контрол-леры и отлаживает их на оценочных платах собственного производства. IP-контроллеры GSI обладают интегрированной возможностью автоматической калибровки каждой сигнальной линии, а также имеют блок коррекции ошибок ECC. Эти функции редко можно встретить в IP-контроллерах от производителей ПЛИС или NPU (Network Processor Unit). Выбрав микросхему SRAM-памяти и IP-контроллер GSI Technology, клиент получает готовое решение от одного производителя. При заказе микросхемы GSI Technology IP-контроллер предоставляется бесплатно. В случае необходимости компания GSI Technology может помочь с конфигурацией IP-контроллера для конкретной задачи. Доступные на сегодняIP-контроллеры для Xilinx UltraScale приведены в таблице 4.

Таблица 4. SRAM IP-контроллеры для Xilinx UltraScale

ПЛИС

SRAM

Тактовая частота

Задержка чтения

R/W Rate, max

Data BW, x36, peak

KU040

SQ-III Quad B2 144 Мбит

800 МГц

3 цикла

1,6 млрд Т/с

115 Гбит/с

KU13P

SQ-IV Quad B2 144 Мбит

933 МГц

5 циклов

1,86 млрд Т/с

134 Гбит/с

Наличие IP-контроллера и оценочной платы для других ПЛИС можно уточнить в представительстве GSI Technology на территории России и СНГ — в компании Semicom.

Литература
  1. Павлюкович  Е. Микросхемы высокопроизводительной памяти от GSI Technology // Компоненты и технологии. 2017. № 9.
  2. Application note AN1023. SigmaQuad/DDR IIIe/IVe SRAM Overview. GSI Technology, 2012.
  3. Leading-Edge Memory Solutions for UltraScale & UltraScale+ FPGAs. GSI Technology, 2017.
  4. Performance without Compromise: SigmaQuad-IIIe and SigmaDDR-IIIe SRAMs. GSI Technology, 2015.
  5. Performance without Compromise: SigmaQuad-IVe and SigmaDDR-IVe SRAMs. GSI Technology, 2015.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *