Acara NVIDIA GTC 2024, yang berlangsung hingga 21 Maret, menampilkan banyak pengumuman yang biasa diharapkan dari konferensi teknologi besar. Salah satu hal yang menonjol, dari keynote pendiri dan CEO Jensen Huang: arsitektur GPU Blackwell generasi berikutnyamemungkinkan organisasi untuk membangun dan menjalankan AI generatif secara real-time pada model bahasa besar dengan triliunan parameter.
“Masa depan bersifat generatif…itulah mengapa ini merupakan industri baru,” kata Huang kepada para hadirin. “Cara kami melakukan komputasi pada dasarnya berbeda. Kami menciptakan prosesor untuk era AI generatif.
Tapi ini bukan satu-satunya pengumuman ‘generasi berikutnya’ yang keluar dari pertemuan di San Jose.
NVIDIA mengumumkan cetak biru untuk membangun pusat data generasi berikutnya, menjanjikan ‘infrastruktur AI yang sangat efisien’ dan dukungan dari mitra mulai dari Schneider Electric, perusahaan infrastruktur pusat data Vertiv, hingga penyedia perangkat lunak simulasi Ansys.
Pusat data, yang dianggap beroperasi penuh, didemonstrasikan di lantai pameran GTC sebagai kembaran digital NVIDIA Omniverse, sebuah platform untuk membangun karya 3D, mulai dari alat, hingga aplikasi, dan layanan. Pengumuman lainnya adalah pengenalan API awanuntuk membantu pengembang dengan mudah mengintegrasikan teknologi inti Omniverse langsung ke dalam desain dan penerapan perangkat lunak otomasi yang ada untuk kembaran digital.
Superkomputer NVIDIA AI terbaru didasarkan pada sistem pendingin cair NVIDIA GB200 NVL72. Ia memiliki dua rak, keduanya berisi 18 CPU NVIDIA Grace dan 36 GPU NVIDIA Blackwell, dihubungkan oleh switch NVIDIA NVLink generasi keempat.
Cadence, partner lain yang dikutip dalam pengumuman tersebut, memainkan peran khusus berkat dia Platform kembar digital Cadence Reality, yang juga diumumkan kemarin sebagai ‘solusi kembar digital komprehensif pertama yang digerakkan oleh AI di industri untuk memfasilitasi desain dan modernisasi pusat data yang berkelanjutan.’ Hasilnya adalah peningkatan efisiensi energi pusat data yang diklaim sebesar 30%.
Platform ini digunakan dalam demonstrasi ini untuk beberapa tujuan. Para insinyur mengintegrasikan dan memvisualisasikan beberapa kumpulan data CAD (desain berbantuan komputer) dengan ‘peningkatan akurasi dan realisme’, serta menggunakan pemecah Reality Digital Twin dari Cadence untuk mensimulasikan aliran udara dan kinerja sistem pendingin cair baru. Perangkat lunak Ansys membantu menghadirkan data simulasi ke kembaran digital.
“Demo ini menunjukkan bagaimana digital twins dapat memungkinkan pengguna untuk sepenuhnya menguji, mengoptimalkan, dan memvalidasi desain pusat data sebelum memproduksi sistem fisik,” kata NVIDIA. “Dengan memvisualisasikan kinerja pusat data dalam digital twin, tim dapat lebih mengoptimalkan desain dan merencanakan skenario bagaimana-jika”.
Meskipun platform GPU Blackwell menjanjikan, platform ini memerlukan tempat untuk menjalankannya – dan penyedia cloud terbesar sangat terlibat dalam menawarkan NVIDIA Grace Blackwell. “Seluruh industri bersiap menghadapi Blackwell,” seperti yang dikatakan Huang.
NVIDIA Blackwell di AWS akan ‘membantu pelanggan di setiap industri membuka kemampuan kecerdasan buatan generatif baru dengan lebih cepat’, kata pernyataan dari kedua perusahaan. Kembali ke: Ciptakan 2010, AWS sudah memiliki instans GPU NVIDIA. Huang muncul bersama CEO AWS Adam Selipsky dalam cameo penting dari Anniversary: Invent tahun lalu.
Tumpukan tersebut mencakup Jaringan Adaptor Elastic Fabric AWS, UltraClusters Amazon EC2, serta infrastruktur virtualisasi AWS Nitro. Eksklusif untuk AWS adalah Project Ceiba, sebuah kolaborasi superkomputer AI yang juga akan menggunakan platform Blackwell, yang akan digunakan oleh tim R&D internal NVIDIA.
Microsoft dan NVIDIA, memperluas kolaborasi jangka panjang mereka, juga menghadirkan prosesor GB200 Grace Blackwell ke Azure. Perusahaan Redmond mengklaim yang pertama bagi Azure dalam berintegrasi dengan Omniverse Cloud API. Sebuah demonstrasi di GTC menunjukkan bagaimana, dengan menggunakan penampil 3D interaktif di Power BI, operator pembangkit listrik dapat melihat data pembangkit listrik secara real-time, yang di-overlay pada kembaran digital 3D dari fasilitas mereka.
Ilmu kesehatan dan kehidupan diumumkan sebagai industri utama bagi AWS dan Microsoft. NVIDIA bekerja sama dengan NVIDIA untuk ‘memperluas penemuan pengobatan dengan bantuan komputer dengan model AI baru’, sedangkan NVIDIA menjanjikan bahwa banyak sekali pemangku kepentingan layanan kesehatan ‘akan segera dapat berinovasi dengan cepat dalam penelitian klinis dan pemberian layanan dengan peningkatan efisiensi. .’
Google Cloud, sementara itu, memiliki Google Kubernetes Engine (GKE) sebagai keunggulannya. Perusahaan itu mengintegrasikan layanan mikro NVIDIA NIM ke GKE untuk membantu mempercepat penerapan AI generatif di perusahaan, serta memfasilitasi penerapan framework NVIDIA NeMo pada platformnya melalui GKE dan Google Cloud HPC Toolkit.
Namun, sesuai dengan tema ‘generasi berikutnya’, tidak hanya hyperscaler saja yang harus diterapkan. NexGen Cloud adalah penyedia cloud berdasarkan infrastruktur sebagai layanan berkelanjutan, dengan Hyperstack, didukung oleh 100% energi terbarukan, ditawarkan sebagai platform layanan GPU sesuai permintaan dan mandiri. GPU NVIDIA H100 adalah penawaran andalan, dan perusahaan ini menjadi berita utama pada bulan September menggembar-gemborkan supercloud AI Eropa senilai $1 miliar menjanjikan lebih dari 20.000 GPU Tensor Core H100 setelah selesai.
Awan NexGen menyatakan bahwa layanan komputasi yang didukung oleh platform NVIDIA Blackwell akan menjadi bagian dari supercloud AI. “Melalui solusi yang didukung Blackwell, kami akan dapat membekali pelanggan dengan penawaran GPU paling kuat di pasar, memberdayakan mereka untuk mendorong inovasi, sekaligus mencapai efisiensi yang belum pernah terjadi sebelumnya,” kata Chris Starkey, CEO NexGen Cloud.