NVIDIA GeForce RTX 4090 İncelemesi

by Aybike Güzel
0 comment

NVIDIA, yakın tarihte orijinal bir grafik mimarisiyle birlikte GeForce RTX 4000 serisi ekran kartlarını tanıtmıştı. Ada Lovelace mimarili kartların hükümdarı GeForce RTX 4090, artık ofisimize konuk oluyor.

İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın ismini taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda kıymetli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.

“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde çok büyük frekans ve IPC artışları sağlıyor. Yeni jenerasyon GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu jenerasyon için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, lakin mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak formda ayarlanmış.

CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıyeten 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en güçlü kart olan 4090, RTX 3090 Ti ile birebir halde 21 Gbps süratte çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.

NVIDIA, donanımsal ve rasterizasyon açısından kuşaklar ortasında büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler bambaşka bir noktaya geliyor. Sadece RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik sürece sisteminden hariç olarak sırf yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel sürece (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tabir daha getiriyor. Bu nitekim çok değerli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında farklı bir halde konumlandırıyor.

İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil grubun referans dizaynını temsil ediyor. Yeni kuşak kartların genel görünümü RTX 3000 serisiyle birebir kalmış, fakat RTX 4090 hakikaten heybetli ve çok büyük. RTX 4000 serisi PCI-Express Gen 4 ilişki arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR ismi verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafından geliştirilen RTX 4090 modellerinde standart haline geliyor.

Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 4090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu ortada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta kimi modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel dizaynlar 40.000-50.000 lira civarında fiyatlarla satılıyor.

Graphics Card RTX 4090 RTX 3090 Ti RTX 3090 RTX 3080 Ti RX 6950 XT Arc A770 16GB
Mimari AD102 GA102 GA102 GA102 Navi 21 ACM-G10
Üretim Teknolojisi TSMC 4N Samsung 8N Samsung 8N Samsung 8N TSMC N7 TSMC N6
Transistör Sayısı 76.3 milyar 28.3 milyar 28.3 milyar 28.3 milyar 26.8 milyar 21.7 milyar
Kalıp Boyutu 608.4 mm^2 628.4 mm^2 628.4 mm^2 628.4 mm^2 519 mm^2 406 mm^2
SM / CU / Xe-Core 128 84 82 80 80 32
GPU Çekirdeği 16384 10752 10496 10240 5120 4096
Tensor Çekirdeği/
XMX Motoru
512 336 328 320 512
Işın İzleme Çekirdeği 128 84 82 80 80 32
Boost Frekansı 2520 MHz 1860 MHz 1695 MHz 1665 MHz 2310 MHz 2100 MHz
Bellek Hızı 21 Gbps 21 Gbps 19.5 Gbps 19 Gbps 18 Gbps 17.5 Gbps
Bellek Kapasitesi 24 GB 24 GB 24 GB 12 GB 16 GB 16 GB
Bellek Bant Genişliği 384-bit 384-bit 384-bit 384-bit 256-bit 256-bit
L2 / Infinity Önbellek 72 6 6 6 128 16
ROP 176 112 112 112 128 128
TMU 512 336 328 320 320 256
TFLOPS FP32 82.6 40 35.6 34.1 23.7 17.2
TFLOPS FP16 (FP8/INT8) 661 (1321) 160 (320) 142 (285) 136 (273) 47.4 138 (275)
Bant Genişliği 1008 GBps 1008 GBps 936 GBps 912 GBps 576 GBps 560 GBps
TDP 450W 450W 350W 350W 335W 225W
Liste Fiyatı 1,599$ 1,999$ 1,499$ 1,199$ 1,099$ 349$

Yukarıdaki teknik özellikler tablosu aslında birçok şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat suratları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla görebiliyoruz ve RTX 3090/3090 Ti’ye kıyasla değerli farklar var. Lakin GPU’nun içinde fark yaratan öteki değişiklikler de var.

Eğer ekran kartlarını profesyonel maksatla kullanacaksanız, bilhassa de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi sahiden parasının hakkını verecek bir eser serisi. Ayrıyeten içerik üreten bireyler için de Ada mimarili kartlar ülkü bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da sahiden kıymetli gelişmeler sunuyor.


NVIDIA Ada Lovelace mimarisi.

Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin tersine NVIDIA, RTX 4090’ın sırf profesyoneller için tasarlandığını söylemiyor Evet, RTX 4090 profesyoneller için kusursuz işler çıkaracak. Fakat bu kart birebir vakitte GeForce ailesinin bir kesimi ve şirket oyun performansı konusunda daima grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile nitekim çok güçlü. DLSS 3 devreye girdiğinde ise işler aslında değişik bir hal alıyor.

3. Kuşak Ray Tracing Çekirdekleri

Işın izleme bir defa daha büyük ehemmiyet kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, lakin geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.


NVIDIA Shader Execution Reordering performans karları.

OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha düzgün işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma mühleti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.


Opacity Micro-Maps (OMM)

Ada GPU içinde yer alan ışın izleme üniteleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla detay eklemelerini sağlıyor.

Shader Execution Reordering

Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı objeye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylece çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, evvelden verimsiz olan bu iş yüklerini dinamik olarak yine düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.

4. Jenerasyon Tensor Çekirdekleri

Derin öğrenme ve yapay zeka iş yüklerine gelince, yeniden bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü kuşak Tensor çekirdekleri, birinci olarak Hopper H100 bilgi merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.

Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama marifeti iki katına çıkıyor.

AV1 Kodek Desteği

Önceki kuşak Ampere ekran kartlarında AV1 kod çözme takviyesi sunulsa da AV1 kodlama dayanağı sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama takviyesi sunan sekizinci kuşak NVIDIA Encoder’a (NVENC) sahip olacak. Böylece yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıyeten 1080p’de yayın yapan kullanıcıların birebir bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.


RTX 4000 Serisi AV1 ekosistemi.

Ada GPU’lar ayrıyeten çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel görüntü düzenleme için 8K/60 yahut dört adet 4K/60 görüntü kodlamasına imkan sağlıyor. DaVinci Resolve, Adobe Premiere Pro için tanınan Voukoder eklentisi ve Çin’in en yeterli görüntü düzenleme uygulaması olan Jianying, AV1 takviyesinin yanı sıra çift kodlama dayanağıyla kullanıma sunulacak. NVIDIA ayrıyeten tanınan efekt uygulaması Notch’a AV1 dayanağı getirmek ve Topaz yazılımına çift kodlama takviyesi sunmak için çalışıyor.

DLSS 3, Gerçek Vakitli 3D Uygulamalarına da Katkı Sağlıyor

Grafik dünyasında 3D düzenleme yapmak şiddetli bir tecrübedir. 3D içerik üreticileri, çalışma yaptığı sıralarda daima önizleme yapmak zorunda kalırlar. Lakin DLSS 3’ün performans kazanımları sayesinde sanatkarlar, gerçek vakitli render uygulamalarında akıcı ve sıkıntısız halde içerik üretebilecekler.

DLSS 3 teknolojisi birinci etapta Unreal Engine, Unity ve Omniverse’e geliyor. 3D sanatkarları, daha evvel hiç görülmemiş gerçekçilik düzeyleriyle gerçek vakitli etkileşime imkan tanıyan malzemeler, aydınlatma, objeler, karakterler ve sahneler oluşturabilecekler. Sanatkarlar sahnelerinde değişiklikler yaparken imaj anında işlenecek ve süratli geri bildirim alabilecekler.

24 GB GDDR6X Bellek

Bildiğiniz üzere, birçok iş yükü için GPU bellek boyutu ve suratları çok değerli. GeForce RTX 4090, öteki iyileştirmelerin yanı sıra 21 Gbps suratında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda materyal ve doku kullanan, büyük bilgi kümeleriyle çalışan şahıslar, ağır GPU kullanımına muhtaçlık duyan iş akışlarını rahat yürütebilecek.

DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve birtakım durumlarda daha yüksek performans artışları getiriyor. Bu hakikaten oyun ve grafik dünyasında ihtilal yaratan bir teknoloji.

DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma süreç çizgisini dahil etmeden sırf yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, evvelki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.


NVIDIA DLSS 3 Teknolojisi.

DLSS 3, imaj kalitesi ve cevap verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka takviyeli grafiklerde ihtilal niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel datayı ele alıyor: mevcut ve evvelki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafından oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik üzere oyun motoru dataları.

Optical Flow Accelerator, iki ardışık oyun içi kareyi tahlil ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği istikameti ve suratı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma üzere piksel seviyesinde bilgileri yakalama yeteneğine sahip. Aşağıdaki motosiklet örneğinde, motosikletlinin hareket akışı gölgenin motosiklete nazaran ekranda kabaca birebir yerde kaldığını yanlışsız bir formda temsil etmekte.


Optik Akış Hızlandırıcı, yansıma üzere piksel seviyesindeki efektleri hakikat bir halde takip ederken, DLSS 3 ayrıyeten sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini yanlışsız bir biçimde izlediği (ancak gölgeleri değil) gösterilmiş. Sadece motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz üzere görsel anormalliklere neden olmakta.


DLSS Frame Generation yapay zeka ağı, her piksel için orta kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen bilgilerin nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini hem de optik akışı kullanarak (aşağıdaki fotoğrafta görüldüğü gibi) hem geometriyi hem de efektleri gerçek bir halde yine oluşturabiliyor.

Yapay zeka, DLSS 3 etkinleştirildiğinde birinci karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını tekrar yapılandırıyor. Biraz evvel belirttiğimiz üzere, görüntülenen toplam piksellerin sekizde yedisi yine yapılandırılıyor ve performansa büyük katkı sağlanıyor.

DLSS 3’ün Performans Katkısı

NVIDIA’nın argümanlarına bakılırsa makul oyun ve motorlarda klâsik işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni şoförler, oyun güncellemeleri ve gelişmiş DLSS 3 dayanağı ile çok daha uygununu görebiliriz.

Eskiden içerik üretimi büyük stüdyolar tarafından yapılırken, artık ferdi geliştiriciler güçlü sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz üzere Game Ready şoförünün yanı sıra Studio şoförüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil ekibin sunduğu kimi ayrıcalıklar:

  • 3D, görüntü ve yapay zeka dayanaklı işleri hızlandırmak için özel donanım optimizasyonları.
  • Güvenilirliği en üst seviyeye çıkarmak için uygulamalar üzerinde kapsamlı bir formda test edilmiş Studio şoförleri.
  • 110’dan fazla tanınan uygulamada RTX donanımı için uygulama optimizasyonları.
  • Ayrıca bu uygulamaların daha süratli çalışmasını sağlayan, Optix, DLSS ve Maxine üzere özel özellikler sunan yazılım geliştirme kitleri.
  • NVIDIA Omniverse, Broadcast, Canvas ve RTX Remix dahil olmak üzere Studio Suite uygulamaları.

RTX 4000 serisiyle birlikte sunulan yenilikler:

  • Canlı yayınlar yapıyorsanız, daha uygun canlı akış kalitesi için AV1 dayanaklı yeni sekizinci jenerasyon kodlayıcıdan yararlanabilir, ayrıyeten NVIDIA Broadcast yapay zeka efektleriyle mikrofon ses kalitenizi ve web kamera imgelerinizi güzelleştirebilirsiniz.
  • Video düzenleme işleriyle ilgileniyorsanız, RTX 4000 serisiyle sunulan çift kodlayıcı sayesinde 2 kata kadar daha yüksek yapay zeka performansı ve 2 kata kadar daha yüksek çıktı performansı elde edebilirsiniz.
  • 3D sanatkarlar, 3. jenerasyon RT çekirdekleri, gölgelendirici yürütme yine düzenlemesi, DLSS 3 ve NVIDIA Omniverse sayesinde 4K60’ta içerik oluşturabilir.
  • Mod yapımcısıysanız klasik oyunları yine düzenleyebilir, RTX Remix ile RTX’i faal edebilirsiniz.

AV1 ve Yapay Zeka Dayanaklı Yayıncılık

Canlı yayıncılar çoklukla bant genişliğiyle ilgili problemler (örneğin Twitch yahut Discord’un azamî 8 Mbps bit suratı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha ayrıntılı ve daha kusursuz görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıyeten HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.


H.264 ve AV1 kodlama verimliliği.

NVIDIA, AV1 için daldaki önde gelen şirketlerle birlikte çalıştığını söylüyor. Tanınan uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanacak bir güncellemeden sonra NVENC ile AV1 takviyesi sunmaya başlayacak. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.

Video Düzenleme

Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve üzere görüntü düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka takviyeli Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, görüntü kare boyutu dönüştürme, bulanıklaştırma, sertleştirme, manzara sürece efektleri ve RAW evrak dönüştürme üzere temel fonksiyonların tümü, gelişmiş GPU teknolojileri sayesinde her zamankinden daha kısa müddette tamamlanıyor.

RTX 4090 Performansı

RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli:


RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli.

RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine nazaran 2 kata kadar daha düzgün performans sağlıyor:


RTX 3000 serisine nazaran 2 kata kadar daha süratli kodlama.

ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI fonksiyonelliğini kullanıyor. Böylece manzara detaylarından ödün vermeden düşük çözünürlüklü imgelerden yüksek çözünürlüklü imaj çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı manzara boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha süratli.


ON1 Resize AI 2022 ile yapay zeka dayanaklı manzara kırpma.

Işın izleme takviyeli sürece, animatörlerin sinemalardaki görsel efektler ve oyunlardaki animasyonlu karakterler üzere fotogerçekçi dijital varlıklar tasarlamasına imkan tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor fakat yüksek güçlü sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında öteki bir noktaya taşıyor.

Yeni amiral gemisi, ışın izlemeli sürece konusunda en güçlü GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot üzere görüntü sürece uygulamalarında evvelki jenerasyon RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha süratli kare sürece performansı sunuyor. DLSS 3 ve gölgelendirici yürütme yine sıralama özelliğiyle birleştirildiğinde ise gerçek vakitli render uygulamalarında 4 kata kadar daha süratli render performansı elde etmek mümkün.


RTX 4090, ışın izlemeyle manzara sürece konusunda RTX 3090 Ti’den 4 kata kadar daha düzgün performans vaat ediyor.

8K Oyunculuğa Gerçek Adım Adım

AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun tecrübesine hazır. Ayrıyeten RTX 4090’da bulunan çift kodlayıcılar sayesinde GeForce Experience  üzerinden 8K görüntü oyun çekimi yapabiliyoruz.

NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün çok kıymetli olduğunu vurguluyor. İşte şirket tarafından paylaşılan bir test çizelgesi:


7680×4320 çözünürlük, en yüksek oyun ayarları, DLSS performans modu, oyuna bağlı olarak DLSS Frame Generation özelliği, Core i9-12900K CPU, 32 GB RAM, Windows 11 işletim sistemi.

You may also like

Leave a Comment