NVIDIA dan OpenAI Meluncurkan Model Penalaran Terbuka Tercepat

robot
Pembuatan abstrak sedang berlangsung

NVIDIA dan OpenAI baru saja merilis dua model penalaran open-weight baru, gpt-oss-120b dan gpt-oss-20b. Model 120b dapat memproses 1,5 juta token per detik pada satu sistem NVIDIA GB200 NVL72. Ini dimungkinkan oleh kombinasi arsitektur Blackwell dari NVIDIA dan format presisi 4-bit baru yang disebut NVFP4. Format tersebut membantu mencapai keseimbangan antara akurasi dan efisiensi.

Apa yang Menggerakkan Model

Apa yang membantu model-model ini berjalan dengan efisien adalah kombinasi perangkat keras baru dan perangkat lunak cerdas. Mereka dilatih pada GPU H100 NVIDIA yang kuat dan dirancang untuk bekerja dengan lancar di berbagai perangkat. Anda dapat menggunakannya dari sistem cloud besar hingga PC desktop biasa dengan kartu NVIDIA RTX. Jika Anda sudah menggunakan CUDA, Anda mungkin bisa menjalankan model-model ini tanpa banyak usaha tambahan.

Kedua model juga dikemas sebagai apa yang disebut NVIDIA "Layanan Mikro Inference." Ini membuat model menjadi lebih cepat dan lebih mudah. Anda tidak perlu membangun semuanya dari awal. Dan jika Anda sudah menggunakan alat AI populer seperti Hugging Face atau Llama.cpp, model-model ini akan terhubung dengan mudah.

Perangkat keras Blackwell baru dari NVIDIA juga memainkan peran besar di sini. Ini mencakup fitur yang disebut NVFP4, yang membantu model berjalan lebih cepat dan lebih efisien dengan menggunakan angka presisi lebih rendah tanpa kehilangan akurasi. Itu mungkin terdengar teknis, tetapi hasilnya cukup sederhana. Ini akan menghasilkan AI yang lebih cepat yang menggunakan lebih sedikit daya dan memori. Bagi bisnis, itu bisa berarti biaya yang lebih rendah.

Ada juga hubungan jangka panjang antara NVIDIA dan OpenAI yang telah membantu mewujudkan ini. Hubungan ini kembali ke saat Jensen Huang secara langsung menyerahkan DGX-1 pertama. Apa yang terjadi sekarang dengan seri gpt-oss terasa seperti langkah logis berikutnya dalam kolaborasi itu. Namun, produksi tersebut akan membutuhkan kekuatan komputasi, penyempurnaan, dan kesiapan operasional yang jauh lebih besar. Perangkat keras, perangkat lunak, dan layanan semuanya bekerja sama, yang jarang terlihat pada tingkat ini.

Terbuka untuk Semua untuk Membangun

Salah satu hal terpenting tentang rilis ini adalah bahwa model-model tersebut terbuka. Ini berarti siapa pun dari startup & universitas juga dapat bekerja pada mereka. Mereka dapat membangunnya, menyesuaikannya, dan menggunakannya dalam sistem mereka. OpenAI sekarang memiliki lebih dari 4 juta pengembang seumur hidup yang membangun di platformnya. NVIDIA, di sisi lain, memiliki lebih dari 6,5 juta pengembang yang menggunakan alat perangkat lunaknya. Mereka telah bekerja sama selama hampir satu dekade, dan jangkauannya sangat besar. Ada ratusan juta GPU di seluruh dunia yang berjalan di platform NVIDIA CUDA. Ketika teknologi seperti ini dirilis ke dalam ekosistem yang sebesar dan berpengalaman itu, adopsi cenderung bergerak dengan cepat. Dan di situlah ini mulai terasa kurang seperti peluncuran dan lebih seperti titik balik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)