Обсуждение Nvidia GeForce RTX 4090 активно велось на протяжении всего 2022 года. После долгого периода высоких цен и дефицита CEO Дженсен Хуанг представил важные детали на GTC 2022, которые, безусловно, вызвали бы у многих разочарование. Цена в 1599 долларов за флагманскую модель на архитектуре Ada Lovelace? На самом деле, это всего на 100 долларов больше, чем стартовая цена RTX 3090. Если карта сможет продемонстрировать обещанную Nvidia производительность в 2–4 раза выше, чем у RTX 3090 Ti, то, несомненно, найдутся покупатели, готовые заплатить за неё. RTX 4090 уверенно занимает лидирующую позицию в тестах графических процессоров, особенно в разрешениях 1440p и 4K. Для тех, кто ищет самую мощную видеокарту, не заботясь о цене, она стала одним из лучших вариантов.
Однако это не означает, что RTX 4090 является выгодным предложением, хотя это может быть воспринято по-разному. Если оценивать её по количеству FPS на каждый потраченный доллар, то она занимает последнее место среди 68 графических процессоров за последние десять лет. Но стоит учитывать, что наш стандартный рейтинг основан на производительности в 1080p ultra, а эта карта явно не создана для такого разрешения. На самом деле, её высокая скорость приводит к тому, что узкие места ЦП остаются проблемой даже при игре на 1440p ultra. Если рассматривать производительность в 4K и учитывать трассировку лучей, можно утверждать, что это одно из лучших предложений — понимаете, о чем мы говорим, когда речь идет о субъективности ценности?
Тем не менее, цена за возможность обладать RTX 4090 высока, поскольку базовая версия Founders Edition стоит 1599 долларов, а карты от партнеров могут стоить до 1999 долларов. Но для тех, кто стремится к лучшему или у кого достаточно средств, чтобы не считать 2000 долларов значительной суммой, это именно та карта, которую стоит рассмотреть прямо сейчас. Мы будем удивлены, если в этом поколении появится что-то более впечатляющее, за исключением возможной RTX 4090 Ti.
Текущие характеристики топовых графических процессоров
Видеокарта | RTX 4090 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6950 XT | Arc A770 16 ГБ |
---|---|---|---|---|---|---|
Архитектура | AD102 | GA102 | GA102 | GA102 | Navi 21 | ACM-G10 |
Технология процесса | TSMC 4N | Samsung 8N | Samsung 8N | Samsung 8N | TSMC N7 | TSMC N6 |
Транзисторы (млрд) | 76.3 | 28.3 | 28.3 | 28.3 | 26.8 | 21.7 |
Размер матрицы (мм²) | 608.4 | 628.4 | 628.4 | 628.4 | 519 | 406 |
SM / CU / Xe-Cores | 128 | 84 | 82 | 80 | 80 | 32 |
Шейдеры | 16384 | 10752 | 10496 | 10240 | 5120 | 4096 |
Тензорные ядра | 512 | 336 | 328 | 320 | N/D | 512 |
Ядра трассировки | 128 | 84 | 82 | 80 | 80 | 32 |
Частота разгона (МГц) | 2520 | 1860 | 1695 | 1665 | 2310 | 2100 |
Скорость VRAM (Гбит/с) | 21 | 21 | 19.5 | 19 | 18 | 17.5 |
Видеопамять (ГБ) | 24 | 24 | 24 | 12 | 16 | 16 |
Ширина шины VRAM | 384 | 384 | 384 | 384 | 256 | 256 |
L2 / Бесконечный кэш | 72 | 6 | 6 | 6 | 128 | 16 |
ROPs | 176 | 112 | 112 | 112 | 128 | 128 |
TMUs | 512 | 336 | 328 | 320 | 320 | 256 |
TFLOPS FP32 | 82.6 | 40 | 35.6 | 34.1 | 23.7 | 17.2 |
TFLOPS FP16 (FP8/INT8) | 661 (1321) | 160 (320) | 142 (285) | 136 (273) | 47.4 | 138 (275) |
Пропускная способность (ГБ/с) | 1008 | 1008 | 936 | 912 | 576 | 560 |
TDP (Вт) | 450 | 450 | 350 | 350 | 335 | 225 |
Дата запуска | октябрь 2022 г. | март 2022 г. | сентябрь 2020 | июнь 2021 г. | май 2022 г. | октябрь 2022 г. |
Стартовая цена | 1599 долларов США | 1999 долларов США | 1499 долларов США | 1199 долларов США | 1099 долларов США | 349 долларов |
Давайте рассмотрим, кто занимает ведущие позиции в мире высокопроизводительных видеокарт, включая модели от Nvidia, AMD и Intel. Arc A770 от Intel явно находится в другом классе, но все равно интересно посмотреть, как она выглядит на фоне конкурентов.
Для подробного изучения архитектуры Nvidia Ada Lovelace мы рекомендуем ознакомиться с нашим углубленным анализом, где рассматриваются новые технологии и улучшения в серии RTX 40. В таблице спецификаций представлена ключевая информация. Например, количество транзисторов в RTX 4090 почти утроилось по сравнению с Ampere; количество ядер увеличилось на 52% по сравнению с RTX 3090 Ti; тактовая частота графического процессора выросла на 35%. Что касается памяти GDDR6X, она осталась почти такой же, но кэш L2 был увеличен в 12 раз, что позволяет GPU реже запрашивать данные из основной памяти.
На бумаге это означает, что RTX 4090 предлагает более чем вдвое большую вычислительную мощность по сравнению с RTX 3090 Ti, и в некоторых рабочих нагрузках вы сможете увидеть такие впечатляющие приросты. Однако в этом поколении есть и другие улучшения, которые могут еще больше увеличить разрыв в производительности.
Трассировка лучей снова становится в центре внимания, с тремя новыми технологиями — Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) и Displaced Micro-Meshes (DMM) — которые могут обеспечить значительные улучшения. Однако для их реализации разработчики должны интегрировать эти технологии, что означает, что текущие игры и движки не смогут воспользоваться этими преимуществами.
Задачи в области глубокого обучения и искусственного интеллекта также должны ощутить значительные улучшения благодаря новым поколениям. Архитектура Ada включает FP8 Transformer Engine, заимствованный у Hopper H100, и поддержку числового формата FP8. Это позволит удвоить вычислительную мощность на ядро Tensor для алгоритмов, использующих FP8 вместо FP16, и достичь до четырехкратного увеличения производительности в обработке чисел по сравнению с RTX 3090 Ti.
Одним из алгоритмов, который может использовать новые ядра Tensor в сочетании с улучшенным оптическим ускорителем потока (OFA), является DLSS 3. На самом деле, DLSS 3 требует видеокарту из серии RTX 40, что означает, что более ранние модели RTX не смогут воспользоваться этими преимуществами. Что же делает DLSS 3? Он анализирует текущие и ранее отрисованные кадры, создавая дополнительные промежуточные кадры для заполнения пробелов. В некоторых случаях это может практически удвоить производительность по сравнению с DLSS 2. Мы подробнее рассмотрим DLSS 3 в дальнейшем обзоре.
С профессиональной точки зрения, особенно для тех, кто занимается глубоким обучением, стоимость RTX 4090 оправдана — время, как известно, деньги, и удвоение или учетверение пропускной способности значительно экономит время. Создатели контента найдут в этой карте множество преимуществ, и это будет быстрым и простым шагом для перехода с RTX 3090 или 3090 Ti на 4090. Также будет рассмотрена производительность ProViz.
Но как насчет геймеров? В отличие от RTX 3090 и 3090 Ti, Nvidia не подчеркивает, что RTX 4090 ориентирована исключительно на профессионалов. Да, эта карта отлично подойдет для таких пользователей, но она также принадлежит к семейству GeForce, и Nvidia открыто заявляет о ее игровой производительности. Возможно, причиной этого является влияние недавнего бума майнинга криптовалют, хотя в настоящее время майнинг на GPU стал невыгодным, так что, по крайней мере, геймерам не придется конкурировать с майнерами за видеокарты в этот раз.
Игровые тесты 4К
Начнем с ключевого аспекта — производительности на максимальных настройках в 4K. Если у вас монитор с разрешением 1080p, даже с высокой частотой обновления, RTX 4090, вероятно, окажется избыточным. Исключение составляют игры с интенсивной трассировкой лучей, о которых мы поговорим позже.
Давайте на мгновение остановимся и обратим внимание на диаграммы — их девять, так что не ограничивайтесь лишь общим средним значением! Если же взглянуть на среднее, то RTX 4090 демонстрирует впечатляющий рост производительности на 55% по сравнению с RTX 3090 Ti, которая была выпущена всего шесть месяцев назад. Если вы недавно приобрели 3090 Ti, это может вызвать у вас недовольство. Да, вы могли бы сэкономить 500 долларов, но если вы ищете GPU стоимостью 1000 долларов или более, такой уровень производительности оправдывает цену.
Если сравнивать с другими графическими картами, прирост по сравнению с RTX 3090 Founders Edition составляет 71%, а с RTX 3080 Ti — 77%. Даже в сравнении с RX 6950 XT от AMD в нашем игровом тесте, который не использует все возможности архитектуры Ada Lovelace, вы получаете увеличение производительности на 64%. Это значительное преимущество, которое может сделать производительность Nvidia недостижимой для будущих графических карт AMD на базе RDNA 3. Нам предстоит подождать еще месяц, чтобы узнать, каковы планы AMD, но сейчас Nvidia ставит высокую планку.
Стоит отметить, что средний прирост в 55% учитывает игры, где узкие места ЦП все еще влияют на производительность, как в случае с Flight Simulator. RTX 4090 практически не теряет эффективность при переходе от 1080p ultra к 1440p ultra и затем к 4K ultra. Это одна из причин, почему технология DLSS 3 от Nvidia так привлекательна — но об этом мы поговорим чуть позже.
В восьми разных тестах RTX 4090 демонстрирует преимущество над 3090 Ti, колеблясь от 11% в игре Flight Simulator до впечатляющих 112% в Total War: Warhammer 3. Эти два показателя являются крайними, в то время как остальные шесть игр показывают более умеренные результаты, варьирующиеся от 46% (Far Cry 6, Red Dead Redemption 2) до 70% (Forza Horizon 5).
Важно также отметить, что использование DLSS 2 в режиме качества положительно сказывается на производительности в четырех поддерживаемых играх. В Flight Simulator производительность снижается на 4%, что связано с ограничениями ЦП. Horizon Zero Dawn демонстрирует лишь 10% прирост, в то время как Watch Dogs Legion и Red Dead Redemption показывают улучшение на 13% и 14% соответственно. RTX 3090 Ti могла обеспечить прирост до 35% с режимом качества DLSS 2, что снова указывает на узкие места ЦП, даже при разрешении 4K.
Однако стоит понимать, что эта карта не предназначена исключительно для традиционного рендеринга растеризации. Хотя она легко обходит карты предыдущего поколения в таких играх, ее истинный потенциал раскрывается в задачах с интенсивной трассировкой лучей.
Если вас не заинтересовала стандартная игровая производительность, то результаты трассировки лучей точно привлекут ваше внимание. Мы наблюдаем впечатляющий рост на 78% по сравнению с RTX 3090 Ti в уже существующих играх с трассировкой лучей. Более требовательные проекты находятся на горизонте, и, вероятно, вам понадобится серия RTX 40 с DLSS 3 для достижения оптимальной производительности в таких играх.
Сравнивая с другими графическими процессорами, RTX 4090 превосходит флагманскую RX 6950 XT от AMD на 190%, что делает ее почти втрое быстрее. Она также демонстрирует более чем двукратное превосходство над RTX 3090 и 3080 Ti. При использовании DLSS в режиме качества производительность 4090 возрастает на 78%. В итоге RTX 4090, работающая в режиме наивысшего качества DLSS, достигает почти пятикратной производительности по сравнению с 6950 XT в требовательных играх с DXR.
Хотя отдельные графики производительности показывают диапазон результатов, он менее широкий, чем в наших стандартных тестах растеризации. Это объясняется тем, что большинство игр с трассировкой лучей полностью загружают графический процессор, особенно при 4K. В шести тестируемых играх RTX 4090 показывала преимущество от 67% в Control Ultimate Edition (самой старой игре из нашего набора DXR) до 106% в Fortnite при максимальных настройках RT.
Даже без DLSS RTX 4090 почти достигает 60 кадров в секунду и выше в режиме трассировки лучей на 4K Ultra. Она обеспечивает играбельную производительность при 40 кадрах в секунду и выше во всех играх. При включении DLSS 2 этот показатель увеличивается до 100 кадров в секунду в среднем, а все тесты DXR теперь уверенно превышают 60 кадров в секунду. Вскоре мы также рассмотрим, что может предложить DLSS 3 в некоторых предварительных версиях игр.
GeForce RTX 4090: игровая производительность 1440p
RTX 4090 превращает 1440p ultra в новый стандарт для 1080p ultra. Иными словами, узкие места системы, такие как процессор, становятся значительно более важными даже при разрешении 1440p. Несмотря на это, 4090 по-прежнему демонстрирует среднее преимущество в 28% по сравнению с 3090 Ti и 25% над RX 6950 XT, однако заметно, что эти результаты ограничены. Данные о производительности с DLSS также подтверждают это: в лучшем случае производительность достигает исходного уровня, а в худшем — частота кадров снижается на 5%.
В отдельных тестах видно, что Flight Simulator не показывает свою полную мощность — производительность на 4090 оказывается на 10% ниже, чем на 3090 Ti. Хотя узкие места процессора влияют на все графические процессоры одного производителя, новая архитектура Ada, вероятно, требует оптимизации в драйверах. В этом случае путь Ada не так совершенен, как у предыдущей архитектуры Ampere.
Это единственная игра, где 4090 уступает 3090 Ti, но в таких играх, как Far Cry 6 и Horizon Zero Dawn, преимущества снизились до однозначных процентов, а Watch Dogs Legion показывает средний прирост всего лишь на 23%.
С другой стороны, игры с трассировкой лучей не испытывают особых проблем при снижении разрешения до 1440p, особенно если не использовать DLSS. RTX 4090 все еще опережает 3090 Ti на 69%, что означает лишь 9% падение производительности по сравнению с 4K. Однако прирост производительности от режима DLSS 2 Quality значительно уменьшается, добавляя всего 43% к общей производительности — это на 35% меньше, чем при 4K.
Другие графические процессоры продолжают существенно уступать: 4090 обходит RX 6950 XT на 160%, 3090 на 90% и 3080 Ti на 95%. Напомним, что в прошлом году RTX 3080 Ti была запущена по цене 1199 долларов и моментально распродана. Теперь вы можете получить вдвое большую производительность всего за 33% доплаты, особенно в требовательных DXR-играх.
GeForce RTX 4090: производительность в играх 1080p
Стандартные результаты тестирования в разрешении 1080p ultra в основном показывают, что некоторые игры все еще демонстрируют ограниченное масштабирование производительности, тогда как другие явно упираются в узкие места процессора. RTX 4090 в среднем лишь на 16% опережает RTX 3090 Ti, и в паре игр (например, Far Cry 6 и Flight Simulator) старая модель оказывается быстрее.
AMD RX 6950 XT тоже немного отстает, уступая 4090 всего на 9%, что любопытно. Оба графических процессора обладают значительным объемом кэша, что раньше значительно помогало производительности AMD на разрешении 1080p, в то время как на 4K разница менее заметна. Архитектуры кэширования Nvidia и AMD различаются, и оба устройства сталкиваются с ограничениями производительности со стороны процессора. Если же снизить нагрузку до 1080p medium (данные не представлены), 6950 XT в итоге окажется с небольшим 1%-ным преимуществом.
Вывод: не стоит приобретать RTX 4090, если ваши планы ограничиваются играми в 1080p. Серьезно, лучше этого не делать. Даже если у вас монитор с частотой обновления 360 Гц, вы скорее всего будете использовать пониженные настройки качества для увеличения частоты кадров, и в этом случае 4090 не даст значительного прироста производительности по сравнению с картой предыдущего поколения.
Трассировка лучей снова демонстрирует более скромные приросты при разрешении 1080p, хотя RTX 4090 все еще на 59% быстрее, чем 3090 Ti в целом. Эти результаты касаются самых требовательных игр на данный момент, хотя некоторые из них, как Metro Exodus Enhanced Edition, не так уж и требовательны. RTX 4090 по-прежнему более чем в два раза превосходит RX 6950 XT по производительности, что подчеркивает отставание архитектуры AMD RDNA 2.
Будет любопытно наблюдать, что AMD предложит с архитектурой RDNA 3, чтобы уменьшить разрыв. Например, Intel Arc A770 практически сравним по производительности с DXR RX 6800 и опережает RX 6750 XT, имея всего 32 RTU против 60 у AMD (и 40 у 6750/6700). В то же время DLSS улучшает производительность всего на 21% при 1080p. Также важно учитывать, что при использовании DLSS в режиме производительности (с масштабированием 4x) графические процессоры Nvidia отрисовывают нативное разрешение 1080p, которое затем увеличивается до 4K. DLSS немного снижает производительность (сравнительно с Ampere, на Ada Lovelace этот эффект менее выражен), поэтому результаты нативного разрешения 1080p хорошо иллюстрируют, чего можно ожидать от режима производительности DLSS от Nvidia.
Заключение
Два года между значительными обновлениями архитектуры графических процессоров могут показаться продолжительным сроком, и последние годы были непростыми для геймеров, желающих обновить свои видеокарты. К счастью, мрачный период майнинга криптовалют на GPU, похоже, завершился (по крайней мере, на данный момент), и мы можем надеяться на улучшение поставок и доступности карт серии RTX 40 по сравнению с поколением Ampere.
RTX 4090 и архитектура Ada Lovelace действительно впечатляют. С точки зрения производительности и технологий Nvidia сделала шаги вперед, которых мы не наблюдали между предыдущими архитектурами GPU. В ходе наших тестов мы увидели улучшение производительности более чем на 50% при разрешении 4K ultra и увеличение на 78% в играх с интенсивной трассировкой лучей. Вдобавок, технологии DLSS и DLSS 3 Frame Generation предлагают еще более значительные приросты.
Мы наконец-то подошли к моменту, когда разработчики игр могут реализовать поистине впечатляющие эффекты трассировки лучей, по крайней мере, для пользователей высококлассного оборудования серии RTX 40. Хотя сейчас это все еще небольшая аудитория, со временем она, вероятно, расширится. В ближайшие месяцы мы надеемся увидеть несколько игр следующего поколения, которые смогут наглядно продемонстрировать возможности RTX 4090.
Тем не менее, не только игры выигрывают от этого прогресса. Профессиональные приложения также показывают значительные улучшения в производительности. Видеомонтаж теперь может выполняться более чем в два раза быстрее по сравнению с оборудованием предыдущего поколения серии RTX 30, и поддержка AV1 теперь полностью реализована. Обновленные приложения с поддержкой AV1, включая Discord и OBS, должны появиться в этом месяце.
Конечно, покупка видеокарты сопряжена с определенной ценой, и в этом случае стоимость действительно впечатляет. 1599 долларов (или даже больше) за RTX 4090, если она используется только для игр, — это сумма, которую многие не готовы заплатить. Также маловероятно, что Nvidia будет производить большие партии RTX 4090. Если взглянуть на данные из последнего обзора оборудования Steam, можно заметить, что общее количество установок моделей 3080 более чем в пять раз превышает количество 3090, а 3070 встречается почти вдвое чаще, чем 3080. Модели RTX 3060 значительно более распространены, а RTX 3050, как самая доступная карта, имеет чуть меньше установок, чем 3070, что связано с ее хорошим соотношением цены и производительности.
С учетом цен на RTX 3090 и RTX 3090 Ti становится ясно, что есть немало геймеров, готовых инвестировать более 1000 долларов в видеокарту, и именно на этот сегмент ориентирована Nvidia. По данным Steam, количество карт серии RTX 3090 у геймеров превышает количество любой одной модели из серии RX 6000, за исключением моделей RX 66xx — их доля составляет 0,74% от общего числа, в то время как у RTX 3090 — 0,49%. Но стоит ли покупать RTX 4090?
Это зависит от вашего бюджета и целей. У некоторых людей есть дорогостоящие увлечения — спортивные автомобили, посещение матчей, коллекционирование моделей, модная одежда или посещение элитных ресторанов — и потратить пару тысяч долларов за два года для них не станет проблемой. В то же время, многие живут на скромный бюджет и довольствуются игровыми ПК, стоимость которых составляет менее 500 долларов.
Если RTX 4090 выходит за рамки вашего бюджета, не беда. Многие из нас будут наблюдать с восхищением или завистью, когда кто-то проезжает мимо на дорогом спортивном автомобиле. Более доступные модели RTX 4080 появятся в продаже в следующем месяце, а AMD планирует выпустить свои графические процессоры серии RX 7000 и RDNA 3 до конца года. Надеемся, что в недалеком будущем мы увидим значительно более производительные видеокарты в высоком, среднем и бюджетном сегментах.
На данный момент же рынок по-прежнему принадлежит архитектуре Ada Lovelace. Хотя AMD может попытаться оспорить это в будущем, согласно последним слухам, с размером графического кристалла всего 308 мм², сложно представить, что AMD сможет предложить столь значительные улучшения, как это сделала Nvidia. Если вы не хотите ждать, чтобы узнать, что предложит AMD, RTX 4090 останется самым мощным GPU от Team Green на длительный срок, или, по крайней мере, до появления RTX 4090 Ti.
GeForce RTX 4090 Founders Edition и другие модели RTX 4090 официально поступят в продажу завтра, 12 октября, с стартовой ценой в 1599 долларов. В ближайшие недели мы планируем оценить множество карт от партнеров AIB, так что следите за обновлениями, поскольку мы добавим результаты их производительности в эту статью.