• Разгон — это просто: оперативная память. Ускоряем память или меньше не значит лучше Что такое command rate 1t или 2t

    Наконец мы подошли к самой главной части сегодняшнего обзора – разгону. Итак, первым делом давайте проверим, какую частоту покорит память при своем номинальном напряжении 1.65v и номинальных таймингах 7-7-7-20:

    На 7-7-7-20 память разогналась с номинальных 1333 до 1630 МГц и стабильно отработала свои 30 минут в тесте. Это очень хороший результат, учитывая, что напряжение на память установлено всего 1.65v. На 6-6-6-18 разгон дал стабильные 1403 МГц. И на 8-8-8-24 частота составила 1835 МГц.

    реклама

    Теперь увеличим напряжение на память до 1.8v. В этом случае была принята обязательная мера - напряжение Uncore было поднято до 1.35v. Смотрим на диаграмму:

    Ну что сказать, просто великолепный результат! Хотя подобного и следовало ожидать, т.к. чипы Micron очень хорошо отзываются на рост напряжения и могут довольно сильно прибавлять в разгоне. Подумайте только – 1516 МГц с таймингами 6-6-6-18 и всего при 1.8v! Не часто такое увидишь. На 7-7-7-20 стабильная частота составила 1750 МГц по сравнению со своей номинальной частотой в 1333 МГц. А вот на 8-8-8-24 результат получился очень странный: по сравнению со своими 1835 МГц, которые были получены при 1.65v – и при 1.8v разгон не принес совершенно никаких плодов. Немного забегая вперед, скажу, что и на 1.9v результат был такой же – те же 1835 МГц. Все это казалось очень странно, и я был уверен, что проблема кроется не в памяти, а в чем-то другом. После небольшого анализа все-таки удалось найти причину, по которой происходила подобная ерунда. Виноват оказался процессор, и все упиралось в частоту UCLK, а точнее в какую-то одну из ее составляющих - L3 кэш или контроллер памяти. Мне не удалось точно выяснить что именно, но подозрения пали на L3 кэш, т.к. увеличение напряжения на память совершенно не увеличивало разгон (это напряжение питает также и контроллер памяти в процессоре). А вот поднятие напряжения Uncore до 1.55v давало все же небольшую прибавку в разгоне UCLK и как следствие самой памяти. Правда эта прибавка была небольшой, всего 10 МГц, а повышать Uncore свыше 1.55v было уже довольно рискованно. К тому же увеличение этого напряжения дополнительно нагревало процессор, и не слабо – примерно + 3-4 градусов по Цельсию.

    Особый интерес представляет возможность повысить производительность системы с помощью настройки работы памяти (другой часто используемый термин "твикинг" памяти, от tweaking). Соответствующее иследование мы провели на примере платы Abit KX7-333 , как имеющей один из самых богатых наборов различных настроек памяти доступных через BIOS.

    В тестовой системе было использовано следующее оборудование:

    • Материнская плата Abit KX7-333;
    • 256 Мбайт PC2100 DDR SDRAM, производства Samsung;
    • Процессор AMD Athlon XP 1600+
    • Видеокарта MX440 на чипе NVidia GeForce4 64Mb (NVIDIA Detonator v28.32);
    • Звуковая карта Creative Live 5.1;
    • Жесткий диск IBM DTLA 307030 30Gb;
    • блок питания PowerMan 250W;
    • Операционная система Windows 2000 English SP1

    Для демонстрации возможностей тонкой настройки памяти использовался тест Sisoft Sandra 2002 и игра Quake3 (производительность которой очень сильно зависит от пропускной способности памяти). Для большей наглядности я буду изменять каждый параметр отдельно и приводить значение производительности.

    Тест с установками по умолчанию

    Итак, начальные параметры:
    • CAS Latency = 2.5Т
    • Bank Interleave = Disable
    • DRAM Command Rate = 2T
    • Trp = 3T
    • Tras = 6T
    • Trcd = 3T
    • Частота FSBЧастота работы памяти = 133Мгерц133Мгерц
    Тест Значение
    Sandra (Int) 1907
    Sandra (Float) 1776
    Quake3 (Fastest) 218,1 fps

    Bank Interleave - 2 Bank

    Изменяем параметр Bank Interleave, устанавливаем значение 2 Bank. Вообще этот параметр предназначен для управления доступом к открытым банкам памяти. Возможные значения: None, 2 Bank, 4 Bank (иногда 2-Way/4-Way). Наиболее производительным является 4 Bank.

    DRAM Command Rate - 1Т

    Далее изменяем параметр DRAM Command Rate. Устанавливаем значение 1Т, при этом оставляем Bank Interleave равным 4 Bank. Параметр DRAM Command Rate появился еще в чипсете KT266. С его помощью мы можем вручную изменять задержки при передачи данных между чипсетом и памятью. Возможные значения 2T, 1T (наиболее быстрым является 1Т). Отметим, что это один из тех параметров, которые существенно влияют на производительность подсистемы памяти.

    Тест Значение
    Sandra (Int) 1965
    Sandra (Float) 1864
    Quake3 (Fastest) 235,0 fps

    CAS Latency - 2Т

    Следующим изменяем параметр CAS Latency. Устанавливаем значение 2Т, при этом остальные настройки не трогаем (т.е. Bank Interleave=4 Bank, DRAM Command Rate=1Т). CAS Latency - это то количество тактов, через которое память реагирует на запрос чтения. Чем меньше это значение, тем лучше. Возможные варианты: 2.5Т, 2Т. Наиболее важный, с точки зрения производительности, параметр работы памяти.

    Тест Значение
    Sandra (Int) 2024
    Sandra (Float) 1901
    Quake3 (Fastest) 239,7 fps

    Итак, мы имеем оптимально настроенную подсистему памяти, с точки зрения стабильности и скорости. Однако, если Вы имеете качественную память, то изменяя параметры Trp (Precharge to Active), Tras (Active to precharge) и Trcd (Active to CMD), мы можем получить еще небольшую прибавку в скорости.

    Trp =2T, Tras=5T и Trcd=2T

    Модуль памяти 256 Мбайт PC2100 DDR SDRAM, производства Samsung, за все время тестирования (был куплен в январе этого года) зарекомендовал себя самым положительным образом. Поэтому я смело установил следующие значения: Trp =2T, Tras=5T и Trcd=2T (значения по умолчанию 3Т, 6Т и 3Т).

    Тест Значение
    Sandra (Int) 2039
    Sandra (Float) 1906
    Quake3 (Fastest) 245,0 fps

    Итак, после тонкой настройки памяти прирост производительности составил ~7.5 процентов по тесту Sandra и более 12 процентов в игре Quake3!

    DDR333 (PC2700)

    А теперь давайте посмотрим, что может дать установка памяти в режим DDR333 (или PC2700). Тестовый модуль памяти смог заработать на такой частоте только на следующих таймингах:

    • CAS Latency = 2Т
    • Bank Interleave = 4 Bank
    • DRAM Command Rate = 1T
    • Trp = 3T
    • Tras = 6T
    • Trcd = 3T
    • Частота FSB Частота работы памяти = 133Мгерц 166 Мгерц
    Тест Значение
    Sandra (Int) 2052
    Sandra (Float) 1932
    Quake3 (Fastest) 255,1 fps

    Сводная таблица

    Для более удобного восприятия этой информации, я оформлю результаты в виде таблицы:

    No Частота
    FSB MEM
    (Мгерц)
    Тайминги Sandra Quake3 (fps) Прирост в Q3(%) Частота
    процеcсора
    (рейтинг)
    1 133133 Dis, 2T, 2.5T-3T-6T-3T 1907 / 1776 218,1 - XP 1600+
    2 133133 2 Bank, 2T, 2.5T-3T-6T-3T 1911 / 1791 222,9 2,2 XP 1600+
    3 133133 4 Bank, 2T, 2.5T-3T-6T-3T 1925 / 1806 227,3 4,2 XP 1600+
    4 133133 4 Bank, 1T, 2.5T-3T-6T-3T 1965 / 1864 235,0 7,7 XP 1600+
    5 133133 4 Bank, 1T, 2T-3T-6T-3T 2024 / 1901 239,7 9,9 XP 1600+
    6 133133 4 Bank, 1T, 2T-2T-5T-2T 2039 / 1906 245,0 12,3 XP 1600+
    7 133166 4 Bank, 1T, 2T-3T-6T-3T 2052 / 1932 255,1 16,9 XP 1600+
    8 166166 4 Bank, 1T, 2T-3T-6T-3T 2426 / 2272 307,2 40,8 XP 2100+

    Выводы

    Стандартными настройками являются следующие параметры:

    • CAS Latency = 2Т
    • Bank Interleave = 4 Bank
    • DRAM Command Rate = 1T
    • Trp = 3T
    • Tras = 6T
    • Trcd = 3T

    Поэтому конфигурации с 1 по 4 интересны только с теоретической точки зрения. Правда иногда неопытные сборщики не выставляют правильные параметры, и пользователь теряет значительную часть производительности. В другом случае, попытка сэкономить деньги на качестве оперативной памяти так же приводит к потере до 5-10% производительности. Причем это очень большие цифры; для примера разница в 5-10 fps в тесте Quake3 (Fastest), это разница между процессорами XP1600+ и XP1700+ (разница в рейтинге 100, в реальной частоте процессора - 66Mhz).

    Обратите внимание на разницу в производительности 5 и 7 конфигурации, она приблизительно равна 6.5%. Это приблизительный прирост производительности при переходе на DDR333 (пример: апгрейд с KT266A на KT333).

    Обращаем внимание на последнюю строчку - на показатели теста Sandra. Вот какой значительный прирост производительности можно получить, установив синхронный режим работы процессора и памяти (166 и 166 Mhz). Показатели теста Quake3 здесь беcполезны, так как процессор разогнан с 1400 до 1750 Mhz.

    В этом режиме отсутствуют задержки при согласовании сигналов и, начиная с частоты 166 Мгерц, используется делитель 1/5 для частоты PCI (2/5 для AGP), что автоматически означает работу контроллера жестких дисков на стандартной частоте PСI (33 Mhz).

    Естественно, весь этот материал имеет ценность только для компьютерного энтузиаста, цель которого - выжать максимум из имеющегося в наличии железа. А для большинства обычных пользователей, я думаю, вполне достаточно знать то, что можно установить все тайминги в значения, определенные производителем памяти. Для этого предназначен параметр "DRAM Timing". Возможные значения: "Manual" - параметры устанавливаются вручную, "By SPD" - устанавливаются по умолчанию (SPD = Serial Presence Detect). Конечно, производители памяти немного подстраховываются и несколько завышают тайминги работы. В результате производительность несколько меньше, чем при ручной установке параметров.

    Как может заметить читатель, я изменял не все имеющиеся в нашем распоряжении параметры. А параметров работы памяти у платы Abit KX7-333 наибольшее количество (больше чем у плат Epox). Скажу следующее - все рассмотренные параметры есть практически в каждой плате среднего и высшего класса, этакий "джентльменский набор". Другие параметры (за исключением Queue Depth) - это довольно специфические параметры, которые слабо влияют на производительность, но иногда очень полезные для улучшения стабильности работы памяти разных производителей (есть даже такие тонкости) и работы в разных конфигурациях модулей памяти.

    И последнее. Для достижения стабильной работы при агрессивных (низких) таймингах очень полезно повышать напряжение на памяти (Vmem). Правда, при этом повышается тепловыделение, но для предотвращения перегрева можно использовать радиаторы для памяти.

    Оверклокеру важно помнить и то, что очень часто препятствием для разгона становится неспособность памяти работать на высоких частотах. Поэтому, иногда есть смысл повысить тайминги памяти (производительность чуть упадет), но за счет этого появляется возможность достигнуть более высоких частот FSB (возросшая частота процессора даст куда большую прибавку производительности).

    Мы уже рассказывали о том, как разгонять процессоры и видеокарты. Еще один компонент, достаточно ощутимо влияющий на производительность отдельно взятого компьютера, - оперативная память. Форсирование и тонкая настройка режима работы ОЗУ позволяют повысить быстродействие ПК в среднем на 5-10%. Если подобный прирост достигается без каких-либо денежных вложений и не влечет риски для стабильности системы - почему бы не попробовать? Однако начав готовить данный материал, мы пришли к выводам о том, что описания собственно процесса разгона будет недостаточно. Понять, почему и для чего надо изменять определенные настройки работы модулей, можно, лишь вникнув в суть работы подсистемы памяти компьютера. Потому в первой части материала мы кратко рассмотрим общие принципы функционирования ОЗУ. Во второй приведены основные советы, которых следует придерживаться начинающим оверклокерам при разгоне подсистемы памяти.

    Основные принципы функционирования оперативной памяти одинаковы для модулей разных типов. Ведущий разработчик стандартов полупроводниковой индустрии JEDEC предоставляет возможность каждому желающему ознакомиться с открытыми документами, посвященными этой тематике. Мы же постараемся кратко объяснить базовые понятия.

    Итак, оперативная память - это матрица, состоящая из массивов, именуемых банками памяти. Они формируют так называемые информационные страницы. Банк памяти напоминает таблицу, каждая ячейка которой имеет координаты по вертикали (Column) и горизонтали (Row). Ячейки памяти представляют собой конденсаторы, способные накапливать электрический заряд. С помощью специальных усилителей аналоговые сигналы переводятся в цифровые, которые в свою очередь образуют данные. Сигнальные цепи модулей обеспечивают подзарядку конденсаторов и запись/считывание информации.

    Алгоритм работы динамической памяти можно описать такой последовательностью:

    1. Выбирается чип, с которым будет осуществляться работа (команда Chip Select, CS). Электрическим сигналом проводится активация выбранной строки (Row Activate Selection). Данные попадают на усилители и могут быть считаны определенное время. Эта операция в англоязычной литературе называется Activate.
    2. Данные считываются из соответствующей колонки/записываются в нее (операции Read/Write). Выбор колонок проводится командой CAS (Column Activate Selection).
    3. Пока строка, на которую подан сигнал, остается активной, возможно считывание/запись соответствующих ей ячеек памяти.
    4. При чтении данных - зарядов конденсаторов - их емкость теряется, поэтому требуется подзарядка или закрытие строки с записью информации в массив памяти (Precharge).
    5. Конденсаторы-ячейки со временем теряют свою емкость и требуют постоянной подзарядки. Эта операция - Refresh - выполняется регулярно через отдельные промежутки (64 мс) для каждой строки массива памяти.

    На выполнение операций, происходящих внутри оперативной памяти, уходит некоторое время. Именно его и принято называть таким знакомым словом «тайминги» (от англ. time). Следовательно, тайминги - временные промежутки, необходимые для выполнения тех или иных операций, осуществляющихся в работе ОЗУ.

    Схема таймингов, указываемых на стикерах модулей памяти, включает в себя лишь основные задержки CL-tRCD-tRP-tRAS (CAS Latency, RAS to CAS Delay, RAS Precharge и Cycle Time (или Active to Precharge)). Все остальные, в меньшей мере оказывающие влияние на скорость работы ОЗУ, принято называть субтаймингами, дополнительными или второстепенными таймингами.

    Приводим расшифровку основных задержек, возникающих при функционировании модулей памяти:

    CAS Latency (CL) - пожалуй, самый важный параметр. Определяет минимальное время между подачей команды на чтение (CAS) и началом передачи данных (задержка чтения).

    RAS to CAS Delay (tRCD) определяет интервал времени между подачей команд RAS и CAS. Обозначает число тактов, необходимых для поступления данных в усилитель.

    RAS Precharge (tRP) - время, уходящее на перезарядку ячеек памяти после закрытия банка.

    Row Active Time (tRAS) - временной промежуток, на протяжении которого банк остается открытым и не требует перезарядки.

    Command Rate 1/2T (CR) - время, необходимое для декодирования контроллером команд и адресов. При значении 1T команда распознается за один такт, при 2T - за два.

    Bank Cycle Time (tRC, tRAS/tRC) - время полного такта доступа к банку памяти, начиная с открытия и заканчивая закрытием. Изменяется вместе с tRAS.

    DRAM Idle Timer - время простоя открытой информационной страницы для чтения данных с нее.

    Row to Column (Read/Write) (tRCD, tRCDWr, tRCDRd) напрямую связан с параметром RAS to CAS Delay (tRCD). Вычисляется по формуле tRCD(Wr/Rd) = RAS to CAS Delay + Rd/Wr Command Delay. Второе слагаемое - величина нерегулируемая, определяет задержку на выполнение записи/чтения данных.

    Пожалуй, это базовый набор таймингов, зачастую доступный для изменения в BIOS материнских плат. Расшифровку остальных задержек, как и детальное описание принципов работы и определение влияния тех или иных параметров на функционирование ОЗУ можно найти в спецификациях уже упомянутой нами JEDEC, а также в открытых datasheet производителей наборов системной логики.

    Таблица соответствия реальной, эффективной частоты работы и рейтинга разных типов ОЗУ
    Тип памяти Рейтинг Реальная частота
    работы памяти, МГц
    Эффективная частота
    работы памяти
    (DDR, Double Data Rate), МГц
    DDR PC 2100 133 266
    PC 2700 167 333
    PC 3200 200 400
    ЗС 3500 217 434
    PC 4000 250 500
    PC 4300 266 533
    DDR2 PC2 4300 266 533
    PC2 5400 333 667
    PC2 6400 400 800
    PC2 8000 500 1000
    PC2 8500 533 1066
    PC2 9600 600 1200
    PC2 10 400 650 1300
    DDR3 PC3 8500 533 1066
    PC3 10 600 617,5 1333
    PC3 11 000 687,5 1375
    PC3 12 800 800 1600
    PC3 13 000 812,5 1625
    PC3 14 400 900 1800
    PC3 15 000 933 1866
    Отметим, что числовое обозначение рейтинга в данном случае согласно спецификациям JEDEC указывает на скорость в миллионах передач в секунду через один вывод данных.
    Что касается быстродействия и условных обозначений, то вместо эффективной частоты работы правильнее говорить, что скорость передачи данных в два раза больше тактовой частоты модуля (данные передаются по двум фронтам сигналов тактового генератора).

    Объяснение одного из таймингов tRP (Read to Precharge, RAS Precharge) с помощью типичной схемы в datasheet от JEDEC. Расшифровка подписей: CK и CK - тактовые сигналы передачи данных, инвертированные один относительно другого (Differential Clock); COMMAND - команды, поступающие на ячейки памяти; READ - операция чтения; NOP - команды отсутствуют; PRE - подзарядка конденсаторов - ячеек памяти; ACT - операция активации строки; ADDRESS - адресация данных к банкам памяти; DQS - шина данных (Data Strobe); DQ - шина ввода-вывода данных (Data Bus: Input/Output); CL - CAS Latency в данном случае равен двум тактам; DO n - считывание данных со строки n. Один такт - временной промежуток, необходимый для возврата сигналов передачи данных CK и CK в начальное положение, зафиксированное в определенный момент.


    Упрощенная блок-схема, объясняющая основы работы памяти стандарта DDR2. Она создана с целью демонстрации возможных состояний транзисторов и команд, которые их контролируют. Как видите, чтобы разобраться в столь «простой» схеме, потребуется не один час изучения основ работы ОЗУ (мы уже не говорим о понимании всех процессов, происходящих внутри чипов памяти).

    Основы разгона оперативной памяти

    Быстродействие ОЗУ в первую очередь определяют два показателя: частота работы и тайминги. Какой из них окажет большее влияние на производительность ПК, следует выяснять индивидуально, однако для разгона подсистемы памяти нужно использовать оба пути. На что же способны ваши модули? С достаточно высокой долей вероятности поведение плашек можно спрогнозировать, определив названия используемых в них чипов. Наиболее удачные оверклокерские микросхемы стандарта DDR - Samsung TCCD, UCCC, Winbond BH-5, CH-5; DDR2 - Micron D9xxx; DDR3 - Micron D9GTR. Впрочем, итоговые результаты будут зависеть и от типа РСВ, системы, в которой установлены модули, умения владельца разгонять память и просто от удачи при выборе экземпляров.

    Пожалуй, первый шаг, который делают новички, - повышение рабочей частоты ОЗУ. Она всегда привязана к FSB процессора и выставляется с помощью так называемых делителей в BIOS платы. Последние могут выражаться в дробном виде (1:1, 1:1,5), в процентном выражении (50%, 75%, 120%), в режимах работы (DDR-333, DDR2-667). При разгоне процессора путем увеличения FSB автоматически возрастает частота работы памяти. К примеру, если мы использовали повышающий делитель 1:1,5, то при изменении частоты шины с 333 до 400 МГц (типично для форсирования Core 2 Duo) частота памяти поднимется с 500 МГц (333×1,5) до 600 МГц (400×1,5). Поэтому, форсируя ПК, следите, не является ли камнем преткновения предел стабильной работы оперативной памяти.

    Следующий шаг - подбор основных, а затем дополнительных таймингов. Их можно выставлять в BIOS материнской платы или же изменять специализированными утилитами на лету в ОС. Пожалуй, самая универсальная программа - MemSet, однако владельцам систем на базе процессоров AMD Athlon 64 (K8) очень пригодится A64Tweaker. Прирост производительности можно получить лишь путем понижения задержек: в первую очередь CAS Latency (CL), а затем RAS to CAS Delay (tRCD), RAS Precharge (tRP) и Active to Precharge (tRAS). Именно их в сокращенном виде CL4-5-4-12 указывают изготовители модулей памяти на стикерах продуктов. Уже после настройки основных таймингов можно переходить к понижению дополнительных.

    Компоновка модулей памяти

    Модули стандартов: a) DDR2; b) DDR; c) SD-RAM.

    1. Чипы (микросхемы) памяти. Комбинация «чипы + РСВ» определяет объем, количество банков, тип модулей (с коррекцией ошибок или без).
    2. SPD (Serial Presence Detect) - микросхема энергонезависимой памяти, в которую записаны базовые настройки любого модуля. Во время старта системы BIOS материнской платы считывает информацию, отображенную в SPD, и выставляет соответствующие тайминги и частоту работы ОЗУ.
    3. «Ключ» — специальная прорезь платы, по которой можно определить тип модуля. Механически препятствует неверной установке плашек в слоты, предназначенные для оперативной памяти.
    4. smd-компоненты модулей (резисторы, конденсаторы). Обеспечивают электрическую развязку сигнальных цепей и управление питанием чипов.
    5. На стикерах производители обязательно указывают стандарт памяти, штатную частоту работы и базовые тайминги.
    6. РСВ - печатная плата. На ней распаиваются остальные компоненты модуля. От качества РСВ зачастую зависит результат разгона: на разных платах одинаковые чипы могут вести себя по-разному.

    На результаты разгона оперативной памяти значительное влияние оказывает увеличение напряжения питания плашек. Безопасный для длительной эксплуатации предел зачастую превышает заявленные производителями значения на 10-20%, однако в каждом случае подбирается индивидуально с учетом специфики чипов. Для наиболее распространенной DDR2 рабочее напряжение зачастую равно 1,8 В. Его без особого риска можно поднять до 2-2,1 В при условии, что это влечет за собой улучшение результатов разгона. Впрочем, для оверклокерских модулей, использующих чипы Micron D9, производители заявляют штатное напряжение питания на уровне 2,3-2,4 В. Превышать эти значения рекомендуется только для кратковременных бенчинг-сессий, когда важен каждый дополнительный мегагерц частоты. Отметим, что при длительной эксплуатации памяти при напряжениях питания, отличающихся от безопасных для используемых чипов значений, возможна так называемая деградация модулей ОЗУ. Под этим термином понимают снижение разгонного потенциала модулей со временем (вплоть до неспособности работать в штатных режимах) и полного выхода плашек из строя. На деградационные процессы особо не влияет качество охлаждения модулей - даже холодные чипы могут быть им подвержены. Конечно, есть и примеры длительного успешного использования ОЗУ при высоких напряжениях, но помните: все операции при форсировании системы вы проводите на свой страх и риск. Не переусердствуйте.

    Прирост производительности современных ПК можно получить, используя преимущества двухканального режима (Dual Channel). Это достигается за счет увеличения ширины канала обмена данными и роста теоретической пропускной способности подсистемы памяти. Такой вариант не требует специальных знаний, навыков и тонкой настройки режимов работы ОЗУ. Для активации Dual Channel достаточно иметь два или четыре модуля одинакового объема (при этом необязательно использовать полностью идентичные плашки). Двухканальный режим включается автоматически после установки ОЗУ в соответствующие слоты материнской платы.

    Все описанные манипуляции приводят к увеличению быстродействия подсистемы памяти, однако заметить прирост невооруженным глазом зачастую сложно. При хорошей настройке и ощутимом повышении частоты работы модулей можно рассчитывать на прибавку производительности порядка 10-15%. Среднестатистические показатели более низкие. Стоит ли овчинка выделки и нужно ли тратить время на игры с настройками? Если хотите детально изучить повадки ПК - почему бы и нет?

    ЕРР и XMP - разгон ОЗУ для ленивых

    Далеко не все пользователи изучают особенности настройки ПК на максимальное быстродействие. Именно для новичков оверклокинга ведущие компании предполагают простые способы повышения производительности компьютера.

    В отношении ОЗУ все началось с технологии Enhanced Performance Profiles (EPP), представленной NVIDIA и Corsair. Материнские платы на базе nForce 680i SLI первыми предоставили максимальную функциональность в плане настройки подсистемы памяти. Суть ЕРР довольно проста: производители ОЗУ подбирают гарантированные нестандартные скоростные режимы функционирования собственных продуктов, а разработчики системных плат предоставляют возможность их активировать через BIOS. EPP - расширенный перечень настроек модулей, дополняющий базовый набор. Существует две версии ЕРР - сокращенная и полная (два и одиннадцать резервных пунктов соответственно).

    Параметр Возможные значения для ЕРР Поддерживается
    JEDEC SPD Сокращенный профиль ЕРР Полный профиль ЕРР
    CAS Latency 2, 3, 4, 5, 6 Да Да Да
    Minimum Cycle time at Supported CAS JEDEC + 1,875 нс (DDR2-1066) Да Да Да
    Minimum RAS to CAS Delay (tRCD) JEDEC* Да Да Да
    Minimum Row Precharge Time (tRP) JEDEC* Да Да Да
    Minimum Active to Precharge Time (tRAS) JEDEC* Да Да Да
    Write Recovery Time (tWR) JEDEC* Да Да Да
    Minimum Active to Active/Refresh Time (tRC) JEDEC* Да Да Да
    Voltage Level 1,8-2,5 В - Да Да
    Address Command Rate 1Т, 2Т - Да Да
    Address Drive Strenght 1.0х, 1.25х, 1.5х, 2.0х - - Да
    Chip Select Drive Strenght 1.0х, 1.25х, 1.5х, 2.0х - - Да
    Clock Drive Strenght 0.75х, 1.0х, 1.25х, 1.5х - - Да
    Data Drive Strenght 0.75х, 1.0х, 1.25х, 1.5х - - Да
    DQS Drive Strenght 0.75х, 1.0х, 1.25х, 1.5х - - Да
    Address/ Command Fine Delay 0, 1/64, 2/64, 3/64 MEMCLK - - Да
    Address/ Command Setup Time 1/2, 1 MEMCLK - - Да
    Chip Select Delay 0, 1/64, 2/64, 3/64 MEMCLK - - Да
    Chip Select Setup Time 1/2, 1 MEMCLK - - Да
    * Диапазон значений соответствует требованиям, определенным JEDEC для модулей DDR2
    Расширенные профили ЕРР позволяют автоматически управлять ощутимо большим количеством задержек модулей стандарта DDR2, чем базовый набор, сертифицированный JEDEC.

    Дальнейшее развитие данной темы - концепция Xtreme Memory Profiles (ХМР), представленная компанией Intel. По своей сути данное новшество не отличается от ЕРР: расширенный набор настроек для ОЗУ, гарантированные производителями скоростные режимы записаны в SPD планок и при необходимости активируются в BIOS платы. Поскольку Xtreme Memory Profiles и Enhanced Performance Profiles предоставлены разными разработчиками, модули сертифицируются под их собственные наборы системной логики (на чипсетах NVIDIA или Intel). XMP, как более поздний стандарт, относится только к DDR3.

    Безусловно, несложные в активации резервов ОЗУ технологии EPP и XMP пригодятся новичкам. Однако позволят ли производители модулей просто так выжать максимум из своих продуктов? Хотите еще больше? Тогда нам по пути - будем глубже вникать в суть повышения быстродействия подсистемы памяти.

    Итоги

    В небольшом материале сложно раскрыть все аспекты работы модулей, принципы функционирования динамической памяти вообще, показать, насколько повлияет изменение одной из настроек ОЗУ на общую производительность системы. Однако надеемся, что начало положено: тем, кто заинтересовался теоретическими вопросами, настоятельно рекомендуем изучить материалы JEDEC. Они доступны каждому желающему. На практике же опыт традиционно приходит со временем. Одна из главных целей материала - объяснение новичкам основ разгона подсистемы памяти.

    Тонкая настройка работы модулей - дело довольно хлопотное, и если вам не нужна максимальная производительность, если каждый балл в тестовом приложении не решает судьбу рекорда, можно ограничиться привязкой к частоте и основным таймингам. Существенное влияние на быстродействие оказывает параметр CAS Latency (CL). Выделим также RAS to CAS Delay (tRCD), RAS Precharge (tRP) и Cycle Time (или Active to Precharge) (tRAS) - это базовый набор, основные тайминги, всегда указываемые производителями. Обратите внимание и на опцию Command Rate (наиболее актуально для владельцев современных плат на чипсетах NVIDIA). Впрочем, не стоит забывать о балансе характеристик. Системы, использующие неодинаковые контроллеры памяти, по-разному могут реагировать на изменения параметров. Разгоняя ОЗУ, следует придерживаться общей схемы: максимальный разгон процессора при пониженной частоте модулей → предельный разгон памяти по частоте с наихудшими задержками (изменением делителей) → снижение таймингов при сохранении достигнутых частотных показателей.

    Просмотр содержимого SPD-модуля памяти с поддержкой Еnhanced Рerformance Рrofiles с помощью утилиты CPU-Z. Видно, что в ЕРР #1 прописан скоростной режим, позволяющий раскрыть потенциал ОЗУ. Текущие частота работы и задержки подсистемы памяти. Программа CPU-Z позволяет оперативно определить данные настройки и отслеживать их в режиме реального времени (полезно, если вы меняете задержки, находясь в ОС).

    Дальше - тестирование производительности (не ограничивайтесь лишь синтетическими приложениями!), затем новая процедура разгона модулей. Установите значения основных таймингов меньше на порядок (скажем, 4-4-4-12 вместо 5-5-5-15), с помощью делителей подберите максимальную частоту в таких условиях и протестируйте ПК заново. Таким образом возможно определить, что больше всего «по душе» вашему компьютеру - высокая частота работы или низкие задержки модулей. После чего переходите к тонкой настройке подсистемы памяти, поиску минимальных значений для субтаймингов, доступных для корректировки. Желаем удачи в этом нелегком деле!

    Другие идентичные названия опции: DRAM 1T/2T Command, SDRAM Command Rate.

    DRAM Command Rate - это так называемый командный тайминг, функция задержки между этапами работы контроллера DRAM (микросхемы, которая управляет памятью). составляют отдельную настраиваемую группу опций BIOS. В этой статье мы попробуем разобраться, какое значение данной функции является оптимальным и почему.

    Для наилучшего понимания смысла рассматриваемой опции необходимо проследить процесс чтения данных из памяти. Изначальный запрос на чтение информации, посылаемый операционной системой контроллеру памяти, не содержит в себе точных «координат», уникального физического адреса запрашиваемых данных. Система передает лишь условное обозначение, виртуальный адрес, с которым начинает работать контроллер памяти, преобразуя его в физический адрес. В то же самое время контроллер выполняет активацию банка памяти, содержащего необходимую системе информацию. Это происходит через присвоение сигнала этому банку с помощью команды Chip Select. Результатом конвертации или декодирования виртуального адреса является необходимый физический адрес данных; после его получения контроллер приступает к выполнению команд чтения.

    То есть, проще говоря, вместо немедленной инициализации операции чтения контроллер задерживается для проведения конвертации адресов. Интервал тайминга прямо пропорционален объему обрабатываемой памяти и количеству ее банков. Соответственно, при увеличении «объема работ» контроллеру для проведения данной операции потребуется больше времени.

    Тайминг BIOS DRAM Command Rate предоставляет возможность пользователю самостоятельно определить интервал вышеописанной задержки, выбрав между значениями 1Т или 2Т (такт).

    Стоит ли включать опцию?

    Казалось бы, выбор очевиден: чем меньше интервал задержки, тем быстрее обработка команд контроллера. Однако это не совсем так. Понятно, что при увеличении времени ожидания контроллер излишне задерживается и отправляет команды позже, чем нужно. В результате этого снижается быстродействие памяти, а также ухудшается производительность ОЗУ. Но при использовании слишком малого значения тайминга управляющая памятью микросхема просто не успевает выполнить декодирование и отправку адресов, вследствие чего информация может быть повреждена или утеряна.

    В некоторых моделях и версиях BIOS встречается также третий вариант - Auto (или By SPD). Присвоение функции такого значения приведет к тому, что интервал будет взят из информации, запрограммированной производителем в микросхеме SPD (Serial Presence Detect).

    Прежде чем экспериментировать с быстрым интервалом в 1Т, стоит изучить техническую документацию материнской платы на предмет такой возможности. Если нет уверенности в совершаемых действиях, то рекомендуем остановиться на значении Auto.

    Разгоняя компьютер, мы больше внимания уделяем таким компонентам как процессор и видеокарта, а память, как не менее важную составляющую, иногда обходим стороной. А ведь именно тонкая настройка подсистемы памяти может дополнительно увеличить скорость рендеринга сцены в трехмерных редакторах, уменьшить время на компрессию домашнего видеоархива или прибавить пару кадров за секунду в любимой игре. Но даже если вы не занимаетесь оверклокингом, дополнительная производительность никогда не помешает, тем более что при правильном подходе риск минимален.

    Уже прошли те времена, когда доступ к настройкам подсистемы памяти в BIOS Setup был закрыт от лишних глаз. Сейчас их столько, что даже подготовленный пользователь может растеряться при таком разнообразии, не говоря уже о простом "юзере". Мы постараемся максимально разъяснить действия, необходимые для повышения производительности системы посредством простейших настроек основных таймингов и, при необходимости, некоторых других параметров. В данном материале мы рассмотрим платформу Intel с памятью DDR2 на базе чипсета от той же компании, и основной целью будет показать не то, насколько поднимется быстродействие, а то, как именно его необходимо поднять. Что касается альтернативных решений, то для памяти стандарта DDR2 наши рекомендации практически полностью применимы, а для обычной DDR (меньшие частота и задержки, и большее напряжение) есть некоторые оговорки, но в целом принципы настройки те же.

    Как известно, чем меньше задержки, тем меньше латентность памяти и, соответственно, выше скорость работы. Но не стоит сразу же и необдуманно уменьшать параметры памяти в BIOS, так как это может привести к совершенно обратным результатам, и вам придется либо возвращать все настройки на место, либо воспользоваться Clear CMOS. Все необходимо проводить постепенно - изменяя каждый параметр, перезагружать компьютер и тестировать скорость и стабильность системы, и так каждый раз, пока не будут достигнуты стабильные и производительные показатели.

    На данный момент времени самым актуальным типом памяти является DDR2-800, но он появился недавно и пока только набирает обороты. Следующий тип (вернее, предыдущий), DDR2-667, является одним из самых распространенных, а DDR2-533 уже начинает сходить со сцены, хотя и присутствует на рынке в должном количестве. Память DDR2-400 нет смысла рассматривать, так как она практически уже исчезла из обихода. Модули памяти каждого типа имеют определенный набор таймингов, а для большей совместимости с имеющимся разнообразием оборудования они немного завышены. Так, в SPD модулей DDR2-533 производители обычно указывают временные задержки 4-4-4-12 (CL-RCD-RP-RAS), в DDR2-667 - 5-5-5-15 и в DDR2-800 - 5-5-5-18, при стандартном напряжении питания 1,8-1,85 В. Но ничто не мешает их снизить для увеличения производительности системы, а при условии поднятия напряжения всего до 2-2,1 В (что для памяти будет в пределах нормы, но охлаждение все же не помешает) вполне возможно установить еще более агрессивные задержки.

    В качестве тестовой платформы для наших экспериментов мы выбрали следующую конфигурацию:

    • Материнская плата: ASUS P5B-E (Intel P965, BIOS 1202)
    • Процессор: Intel Core 2 Extreme X6800 (2,93 ГГц, 4 Мб кэш, FSB1066, LGA775)
    • Система охлаждения: Thermaltake Big Typhoon
    • Видеокарта: ASUS EN7800GT Dual (2хGeForce 7800GT, но использовалось только "половина" видеокарты)
    • HDD: Samsung HD120IJ (120 Гб, 7200 об/мин, SATAII)
    • Привод: Samsung TS-H552 (DVD+/-RW)
    • Блок питания: Zalman ZM600-HP

    В качестве оперативной памяти использовалось два модуля DDR2-800 объемом 1 Гб производства Hynix (1GB 2Rx8 PC2-6400U-555-12), благодаря чему появилась возможность расширить количество тестов с различными режимами работы памяти и комбинациями таймингов.

    Приведем перечень необходимого ПО, позволяющего проверить стабильность системы и зафиксировать результаты настроек памяти. Для проверки стабильной работы памяти можно использовать такие тестовые программы как Testmem, Testmem+, S&M, Prime95 , в качестве утилиты настройки таймингов "на лету" в среде Windows применяется MemSet (для платформ Intel и AMD) и A64Info (только для AMD) . Выяснение оправданности экспериментов над памятью можно осуществить архиватором WinRAR 3.70b (имеется встроенный бенчмарк), программой SuperPI , рассчитывающая значение числа Пи, тестовым пакетом Everest (также есть встроенный бенчмарк), SiSoft Sandra и т.д.

    Основные же настройки осуществляются в BIOS Setup. Для этого необходимо во время старта системы нажать клавишу Del, F2 или другую, в зависимости от производителя платы. Далее ищем пункт меню, отвечающий за настройки памяти: тайминги и режим работы. В нашем случае искомые настройки находились в Advanced/Chipset Setting/North Bridge Configuration (тайминги) и Advanced/Configure System Frequency (режим работы или, проще говоря, частота памяти). В BIOS"е других плат настройки памяти могут находиться в "Advanced Chipset Features" (Biostar), "Advanced/Memory Configuration" (Intel), "Soft Menu + Advanced Chipset Features" (abit), "Advanced Chipset Features/DRAM Configuration" (EPoX), "OverClocking Features/DRAM Configuration" (Sapphire), "MB Intelligent Tweaker" (Gigabyte, для активации настроек необходимо в главном окне BIOS нажать Ctrl+F1 ) и т.д. Напряжение питания обычно изменяется в пункте меню, отвечающем за оверклокинг и обозначается как "Memory Voltage", "DDR2 OverVoltage Control", "DIMM Voltage", "DRAM Voltage", "VDIMM" и т.д. Также у различных плат от одного и того же производителя настройки могут отличаться как по названию и размещению, так и по количеству, так что в каждом отдельном случае придется обратиться к инструкции.

    Если нет желания поднимать рабочую частоту модулей (при условии возможностей и поддержки со стороны платы) выше ее номинальной, то можно ограничиться уменьшением задержек. Если да, то вам скорее придется прибегнуть к повышению напряжения питания, равно как и при снижении таймингов, в зависимости от самой памяти. Для изменения настроек достаточно необходимые пункты перевести из режима "Auto" в "Manual". Нас интересуют основные тайминги, которые обычно находятся вместе и называются следующим образом: CAS# Latency Time (CAS, CL, Tcl, tCL), RAS# to CAS# Delay (RCD, Trcd, tRCD), RAS# Precharge (Row Precharge Time, RP, Trp, tRP) и RAS# Activate to Precharge (RAS, Min.RAS# Active Time, Cycle Time, Tras, tRAS). Также есть еще один параметр - Command Rate (Memory Timing, 1T/2T Memory Timing, CMD-ADDR Timing Mode) принимающий значение 1T или 2T (в чипсете AMD RD600 появилось еще одно значение - 3Т) и присутствующий на платформе AMD или в чипсетах NVidia (в логике от Intel он заблокирован в значении 2T). При снижении этого параметра до единицы увеличивается быстродействие подсистемы памяти, но снижается максимально возможная ее частота. При попытке изменить основные тайминги на некоторых материнских платах могут ожидать "подводные камни" - отключив автоматическую настройку, мы тем самым сбрасываем значения подтаймингов (дополнительные тайминги, влияющие как на частоту, так и на быстродействие памяти, но не так значительно, как основные), как, например, на нашей тестовой плате. В этом случае придется воспользоваться программой MemSet (желательно последней версии) и просмотреть для каждого режима работы памяти значения подтаймингов (субтаймингов), чтобы установить аналогичные в BIOS"e.

    Если названия задержек не совпадут, то тут хорошо проявляет себя "метод научного тыка". Незначительно изменяя дополнительные настройки в BIOS Setup, проверяем программой, что, где и как изменилось.

    Теперь для памяти, функционирующей на частоте 533 МГц, можно попытаться вместо стандартных задержек 4-4-4-12 (или какого-либо другого варианта) установить 3-3-3-9 или даже 3-3-3-8. Если с такими настройками система не стартует, поднимаем напряжение на модулях памяти до 1,9-2,1 В. Выше не рекомендуется, даже при 2,1 В желательно использовать дополнительное охлаждение памяти (простейший вариант - направить на них поток воздуха от обычного кулера). Но сперва необходимо провести тесты при стандартных настройках, например в очень чувствительном к таймингам архиваторе WinRAR (Tools/Benchmark and hardware test). После изменения параметров проверяем снова и, если результат удовлетворяет, оставляем как есть. Если нет, как это произошло в нашем тестировании, то при помощи утилиты MemSet в среде Windows (эта операция может привести либо к зависанию системы, либо, что еще хуже, полной неработоспособности ее) или же средствами BIOS Setup поднимаем на единицу RAS# to CAS# Delay и снова тестируем. После можно попытаться уменьшить на единицу параметр RAS# Precharge, что немного увеличит быстродействие.

    Тоже самое проделываем для памяти DDR2-667: вместо значений 5-5-5-15 выставляем 3-3-3-9. При проведении тестов нам пришлось также увеличить RAS# to CAS# Delay, иначе быстродействие ничем не отличалось от стандартных настроек.

    Для системы, использующей DDR2-800, задержки можно уменьшить до 4-4-4-12 или даже 4-4-3-10, в зависимости от конкретных модулей. В любом случае подбор таймингов сугубо индивидуален, и дать конкретные рекомендации достаточно сложно, но приведенные примеры вполне могут помочь вам в тонкой настройке системы. И не забываем о напряжении питания.

    В итоге мы провели тестирование с восемью различными вариантами и комбинациями режимов работы памяти и ее задержками, а также включили в тесты результаты оверклокерской памяти, - Team Xtreem TXDD1024M1066HC4, работавшей на эффективной частоте 800 МГц при таймингах 3-3-3-8. Итак, для режима 533 МГц вышло три комбинации с таймингами 4-4-4-12, 3-4-3-8 и 3-4-2-8, для 667 МГц всего две - 5-5-5-15 и 3-4-3-9, а для режима 800 МГц, как и в первом случае, три - 5-5-5-18, 4-4-4-12 и 4-4-3-10. В качестве тестовых пакетов использовались: подтест памяти из синтетического пакета PCMark05, архиватор WinRAR 3.70b, программа расчета числа Пи - SuperPI и игра Doom 3 (разрешение 1024x768, качество графики High). Латентность памяти проверялась встроенным бенчмарком программы Everest. Все тесты проходили в среде Windows XP Professional Edition SP2. Представленные результаты на диаграммах расположены по режимам работы.

    Как видите по результатам, разница в некоторых тестах незначительная, а порой даже мизерная. Это обусловлено тем, что системная шина процессора Core 2 Duo, равная 1066 МГц, имеет теоретическую пропускную способность 8,5 Гб/с, что соответствует пропускной способности двухканальной памяти DDR2-533. При использовании более скоростной памяти ограничивающим фактором быстродействия системы становится шина FSB. Уменьшение задержек ведет к росту быстродействия, но не так заметно, как повышение частоты памяти. При использовании в качестве тестового стенда платформы AMD можно было бы наблюдать совсем другую картину, что мы по возможности и сделаем в следующий раз, а пока вернемся к нашим тестам.

    В синтетике рост производительности при уменьшении задержек для каждого из режимов составил 0,5% для 533 МГц, 2,3% для 667 МГц и 1% для 800 МГц. Заметен значительный рост производительности при переходе от памяти DDR2-533 к DDR2-667, а вот смена с 667 на DDR2-800 дает уже не такую прибавку скорости. Также память уровнем ниже и с низкими таймингами вплотную приближается к более высокочастотному варианту, но с номинальными настройками. И это справедливо практически для каждого теста. Для архиватора WinRAR, который достаточно чувствителен к изменению таймингов, показатель производительности немного вырос: 3,3% для DDR2-533 и 8,4% для DDR2-667/800. Расчет восьмимиллионного знака числа Пи отнесся к различным комбинациям в процентном соотношении лучше, чем PCMark05, хоть и незначительно. Игровое приложение не сильно жалует DDR2-677 с таймингами 5-5-5-15, и только снижение последних позволило обойти менее скоростную память (которой, как оказалось, все равно, какие тайминги стоят) на два кадра. Настройка памяти DDR2-800 дала прибавку еще в два кадра, а оверклокерский вариант, который имел неплохой разрыв в остальных тестах, не слишком вырвался вперед относительно менее дорогого аналога. Все же, кроме процессора и памяти, есть еще одно звено - видеоподсистема, которая вносит свои коррективы в производительность всей системы в целом. Результат латентности памяти удивил, хотя, если присмотреться к графику, становится ясно, отчего показатели именно такие, какие есть. Падая с ростом частоты и уменьшением таймингов от режима DDR2-533 4-4-4-12, латентность имеет "провал" на DDR2-667 3-4-3-9, а последний режим практически ничем кроме частоты от предыдущего не отличается. И благодаря столь низким задержкам DDR2-667 запросто обходит DDR2-800, которая имеет более высокие значения, но пропускная способность DDR2-800 позволяет в реальных приложениях все же вырваться вперед.

    И в заключение хотелось бы сказать, что несмотря на небольшой процент прироста быстродействия (~0,5-8,5), который получается от уменьшения временных задержек, эффект все же присутствует. И даже при переходе с DDR2-533 на DDR2-800 мы получаем прибавку в среднем 3-4%, а в WinRAR более 20. Так что подобный "тюнинг" имеет свои плюсы и позволяет даже без серьезного разгона немного поднять производительность системы.