Обзор SRAM SigmaQuad-III/IV и SigmaDDR-III/IV от GSI Technology
Введение
Оба поколения семейств SigmaQuad (рис. 1) и SigmaDDR, третье и четвертое (табл. 1), производятся в двух конфигурациях — х18 и х36, а также в трех вариациях:
- Quad B2 (Separate I/O, Burst of 2);
- Quad B4 (Separate I/O, Burst of 4);
- DDR B2 (Common I/O, Burst of 2).
|
SigmaQuad |
SigmaDDR |
||||||||
Type II |
Type II+ |
Type III |
Type IV |
Type II |
Type II+ |
Type III |
Type IV |
|||
Объем, Мбит |
18–288 |
18–288 |
72–288 |
144 |
18–288 |
18–288 |
72–288 |
144 |
||
Шина данных |
x8/9/18/36 |
x8/9/18/36 |
x18/36 |
x18/36 |
x8/9/18/36 |
x8/9/18/36 |
x18/36 |
x18/36 |
||
Блок коррекции ошибок |
Нет |
72 Мбит 144 Мбит |
Да |
Нет |
72 Мбит 144 Мбит |
Да |
||||
Количество банков памяти |
Один |
Много |
Один |
Много |
||||||
Data Bus |
Раздельные I/O |
Раздельные и общие I/O |
Общие I/O |
|||||||
Длина Burst |
2, 4 |
2, 4 |
2 |
|||||||
Максимальная |
278–400 |
450–633 |
500–833 |
933 |
1333 |
333–400 |
450–633 |
675–833 |
933 |
1333 |
Address Rate |
B2: DDR B4: SDR |
SDR |
||||||||
Data Rate |
DDR |
DDR |
||||||||
Read Latency |
1,5 такта |
2 или 2,5 такта |
3 такта |
5 тактов |
6 тактов |
1,5 такта |
2 или 2,5 такта |
3 такта |
5 тактов |
6 тактов |
Read Data Clks (CQ) |
Да |
Да |
||||||||
Write Data Clks (KD) |
Нет |
Да |
Нет |
Да |
||||||
On-Chip ODT |
Нет |
Да |
Нет |
Да |
||||||
Vdd, В |
1,8 |
1,2–1,35 |
1,25–1,3 |
1,8 |
1,2–1,35 |
1,25–1,3 |
||||
Vddq, В |
1,5 или 1,8 |
1,2–1,5 |
1,2–1,3 |
1,5 или 1,8 |
1,2–1,5 |
1,2–1,3 |
||||
Тип I/O |
HSTL |
HSTL |
||||||||
Корпус |
165-BGA |
260-BGA |
165-BGA |
260-BGA |
||||||
13×15 мм или 15×17 мм |
14×22 мм |
13×15 мм или 15×17 мм |
14×22 мм |
Микросхемы Quad B2 могут выполнять чтение и запись данных за один цикл тактирования, а Quad B4 и DDR B2 могут за один цикл осуществлять только чтение или запись. Следовательно, на одной и той же частоте Quad B2 обеспечивает в два раза более высокую скорость доступа к данным (transaction rate), чем Quad B4 или DDR B2. Полоса пропускания (data bandwidth) каждого в отдельности вывода данных одинакова для всех вариаций. Поскольку скорость доступа к данным становится целевым параметром при выборе SRAM, то вариация Quad B2 является фокусной для применения в телекоммуникационном и сетевом оборудовании.
Обзор SigmaQuad-III и SigmaDDR-III
Третье семейство SigmaQuad-III и SigmaDDR-III предназначено для увеличения в два раза производительности предыдущего семейства SigmaQuad-II/II+ и SigmaDDR-II/II+. Минимальный объем памяти микросхем третьего семейства составляет 72 Мбит, а максимальный 288 Мбит. Для увеличения производительности были внесены некоторые архитектурные изменения:
- для уменьшения энергопотребления понижено напряжение питания (Vdd) до 1,35 В (во II и II+ семействах было 1,8 В);
- для улучшения целостности сигналов и уменьшения потребляемой мощности понижено напряжение питания сигналов данных I/O (VDDQ) до 1,2 В (HSTL);
- выделены отдельные линии тактирования для захвата данных во время записи;
- эхо-сигнал тактирования выровнен по центру выходного сигнала данных;
- добавлен гибко конфигурируемый блок On-Die Termination (ODT) на всех высокоскоростных линиях: Clock, Data, Address и Control;
- появилась возможность программно выставлять длительность задержки чтения (RL) — два или три цикла тактирования;
- микросхемы производятся в новом корпусе 260‑BGA (рис. 2), который дал возможность повысить целостность сигналов путем значительного уменьшения индукционных наводок между выводами в сравнении с используемым корпусом 165‑BGA в семействах II и II+.
Новый корпус и вышеперечисленные функциональные особенности, присутствующие во всех вариациях третьего семейства, позволяют работать на частоте до 833 МГц, обеспечивать полосу пропускания 1,66 Гбит/с на каждом отдельном выводе данных и скорость доступа 1,6 ГТ/с (млрд транзакций/с) во всем адресном пространстве (табл. 2).
|
SigmaQuad-III и SigmaDDR-III |
||
Quad B2 |
Quad B4 |
DDR B2 |
|
Рабочая частота, МГц |
800 |
833 |
833 |
Объем, Мбит |
72, 144, 288 |
72, 144, 288 |
72, 144, 288 |
Скорость случайного доступа к данным, млрд транзакций/с |
1,6 |
0,833 |
0,833 |
Полоса пропускания одного вывода данных, Гбит/c |
1,6 |
1,66 |
1,66 |
Полоса пропускания микросхемы при архитектуре x36, Гбит/c |
115 |
120 |
60 |
Обзор SigmaQuad-IV и SigmaDDR-IV
Четвертое семейство SigmaRAM было разработано с целью вдвое повысить производительность третьего. В настоящее время GSI Technology выпускает в этом семействе микросхемы объемом только 144 Мбит. Для увеличения производительности были внесены значительные изменения в архитектуру и добавлены функциональные возможности, ранее не предусмотренные в третьем семействе, а именно:
Для увеличения производительности в два раза массив памяти был разделен на несколько логических банков. Массив памяти третьего семейства состоит из одного банка памяти. Поэтому, прежде чем произойдет очередной доступ к массиву памяти третьего семейства, необходимо, чтобы была завершена предыдущая процедура обращения записи или чтения. Соответственно, в однобанковом массиве не существует ограничений на установку адреса при последовательных операциях. Однако 933 МГц — это максимальная частота, которая может быть достигнута для однобанковой архитектуры в вариации Quad B2. По этой причине для удвоения производительности в четвертом семействе массив памяти сегментирован в восьми логических банках. Благодаря этому, очередное обращение к ячейкам может выполняться, не дожидаясь завершения предыдущего. Однако, отрицательная сторона этого подхода в том, что при последующем обращении возникают ограничения в выборе адресного пространства, поскольку может происходить частичное совпадение задействованных адресов с предыдущими обращениями. Более точную информацию об ограничениях для каждой микросхемы четвертого семейства необходимо уточнять в datasheets. Очевидно, что ограничения в Quad B2 будут носить более сложный характер, чем в Quad B4 или DDR B2, поскольку Quad B2 выполняет две операции за один цикл, а Quad B4 и DDR B2 — только одну.
Добавлен регистр MRW (Mode Register Write) для облегчения конфигурации SRAM.
Добавлен специальный режим (Loopback Mode) для калибровки по времени каждого вывода Address, Control и Data outputs5.
Интегрированный блок фазовой автоподстройки частоты (PLL) увеличивает окно захвата данных.
Конфигурируемая задержка чтения (RL) на пять или шесть циклов тактирования.
Такая комбинация архитектурных изменений и появления новых функциональных возможностей во всех трех вариациях четвертого семейства позволяет работать на частоте до 1333 МГц и обеспечивать полосу пропускания 2,66 Гбит/с на каждом выводе данных (табл. 3). Для Quad B2 максимальная скорость доступа к данным (transaction rate) составляет 2,66 ГT/с.
|
SigmaQuad-IV и SigmaDDR-IV |
||
Quad B2 |
Quad B4 |
DDR B2 |
|
Рабочая частота, МГц |
1333 |
1333 |
1333 |
Объем, Мбит |
144 |
144 |
144 |
Скорость случайного доступа к данным, млрд транзакций/с |
2,66 |
1,33 |
1,33 |
Полоса пропускания одного вывода данных, Гбит/c |
2,66 |
2,66 |
2,66 |
Полоса пропускания микросхемы при архитектуре x36, Гбит/c |
192 |
192 |
96 |
Однобанковые и многобанковые SigmaQuad/DDR-IV
Многобанковая память работает с меньшей задержкой на обращение к данным TCYC, чем задержка, присущая однобанковой архитектуре TRC. Новый доступ к данным может быть инициирован с задержкой TCYC в случае, если обращение происходит к разным банкам, но не быстрее чем TRC, если очередное обращение происходит к тому же банку. Например, выражение TRC = 4TCYC справедливо только для последовательного обращения к четырем независимым банкам памяти. Во время обращения к очередному банку он может может быть уже занят, что создает ограничения в работе микросхемы с многобанковой архитектурой.
Трудности с использованием многобанковой SRAM также возникают в задачах, где необходим случайный доступ к данным, поскольку случайные запросы должны быть соответствующим образом упорядочены для предотвращения обращений к банку, уже находящемуся в работе. Только после учета этого обстоятельства будет достигнута максимальная производительность. Большинство задач, которые выполняют современные сетевые устройства, требуют случайного доступа к данным.
Для упорядочивания обращений в IP-контроллере создаются специальные буферы re-order buffers. Новый доступ к банку может быть инициирован только после его освобождения от предыдущей задачи. Такое решение всего лишь исключает вероятность стопорения программы, однако не может гарантировать его полного исключения и создает дополнительную задержку.
В задачах, где однобанковая память способна работать на нужной частоте, для достижения максимальной производительности и упрощения алгоритма работы всегда лучше использовать именно SRAM с одним банком памяти. Компания GSI Technology приложила большие усилия, чтобы разработать однобанковую SRAM с максимальной частотой тактирования 933 МГц, что является еще одним рекордом в этом семействе.
Корпус SigmaQuad-III/IV и SigmaDDR-III/IV
Старый корпус 165‑BGA для SigmaQuad-II/II+ и SigmaDDR-II/II+ изображен на рис. 3а. Он был разработан еще в 1990‑х годах для шестислойных плат, едва преодолевших барьер в 100 МГц. При его конструировании учитывались требования к облегчению топологии печатной платы, поэтому все выводы питания и «земли» размещены в центре. Корпус получился очень удобным для трассировки, но с плохими показателями целостности сигналов. С появлением третьего семейства была создана новая концепция расположения выводов в корпусе для всех современных SRAM (рис. 3б).
Новый корпус 260‑BGA для SigmaQuad-III/IV и SigmaDDR-III/IV обладает улучшенными характеристиками:
- 13х20 контактных площадок с шагом 1 мм;
- размер корпуса 14х20 мм (такой же, как и для 119‑BGA и 209‑BGA);
- диагональные пары выводов питания и «земли» облегчает топологию под корпусом;
- распределенная сеть выводов питания и «земли» создает местные пути возврата для каждого высокоскоростного сигнала;
- достаточное количество выводов питания в середине для работы с несогласованной нагрузкой на линиях;
- наличие зарезервированных выводов для расширения конфигурации микросхемы (отмечены желтым цветом).
Благодаря новому корпусу окно захвата данных увеличено до 76% (рис. 4).
IP-контроллер
Самостоятельно разработать IP-контрол-лер для управления SRAM достаточно сложно. Поэтому большинство специалистов используют универсальные IP-контроллеры, предоставляемые производителями ПЛИС. Однако это вызывает определенные неудобства в настройках IP-контроллера под конкретную задачу и выбранную SRAM. С практической точки зрения выгоднее сначала выбрать IP-контроллер, а затем подобрать SRAM под него. Такой подход приводит к неоптимальному расходу ресурсов системы и навязывает использование более дорогих микросхем памяти.
GSI Technology разрабатывает IP-контрол-леры и отлаживает их на оценочных платах собственного производства. IP-контроллеры GSI обладают интегрированной возможностью автоматической калибровки каждой сигнальной линии, а также имеют блок коррекции ошибок ECC. Эти функции редко можно встретить в IP-контроллерах от производителей ПЛИС или NPU (Network Processor Unit). Выбрав микросхему SRAM-памяти и IP-контроллер GSI Technology, клиент получает готовое решение от одного производителя. При заказе микросхемы GSI Technology IP-контроллер предоставляется бесплатно. В случае необходимости компания GSI Technology может помочь с конфигурацией IP-контроллера для конкретной задачи. Доступные на сегодняIP-контроллеры для Xilinx UltraScale приведены в таблице 4.
ПЛИС |
SRAM |
Тактовая частота |
Задержка чтения |
R/W Rate, max |
Data BW, x36, peak |
KU040 |
SQ-III Quad B2 144 Мбит |
800 МГц |
3 цикла |
1,6 млрд Т/с |
115 Гбит/с |
KU13P |
SQ-IV Quad B2 144 Мбит |
933 МГц |
5 циклов |
1,86 млрд Т/с |
134 Гбит/с |
Наличие IP-контроллера и оценочной платы для других ПЛИС можно уточнить в представительстве GSI Technology на территории России и СНГ — в компании Semicom.
- Павлюкович Е. Микросхемы высокопроизводительной памяти от GSI Technology // Компоненты и технологии. 2017. № 9.
- Application note AN1023. SigmaQuad/DDR IIIe/IVe SRAM Overview. GSI Technology, 2012.
- Leading-Edge Memory Solutions for UltraScale & UltraScale+ FPGAs. GSI Technology, 2017.
- Performance without Compromise: SigmaQuad-IIIe and SigmaDDR-IIIe SRAMs. GSI Technology, 2015.
- Performance without Compromise: SigmaQuad-IVe and SigmaDDR-IVe SRAMs. GSI Technology, 2015.