NVIDIA telah mengumumkan keluarga model terbuka NVIDIA Nemotron™ 3 beserta data dan library yang dirancang untuk mendukung pengembangan AI agentic yang transparan, efisien, dan terspesialisasi di berbagai industri.
Model Nemotron 3—tersedia dalam ukuran Nano, Super, dan Ultra—memperkenalkan arsitektur terobosan hybrid latent mixture-of-experts (MoE) yang membantu pengembang membangun dan menerapkan sistem multi-agen yang andal dalam skala besar.
Seiring organisasi beralih dari chatbot satu model ke sistem AI multi-agen yang kolaboratif, pengembang menghadapi tantangan yang semakin kompleks, termasuk overhead komunikasi, pergeseran konteks, dan biaya inferensi yang tinggi. Selain itu, transparansi menjadi kebutuhan penting agar model yang mengotomatiskan alur kerja kompleks dapat dipercaya. Nemotron 3 dirancang untuk menjawab tantangan tersebut dengan menghadirkan kinerja dan keterbukaan yang dibutuhkan untuk membangun AI agentic yang terspesialisasi.
“Inovasi terbuka adalah fondasi kemajuan AI,” ujar Jensen Huang, pendiri dan CEO NVIDIA. “Dengan Nemotron, kami mengubah AI canggih menjadi platform terbuka yang memberikan transparansi dan efisiensi bagi pengembang untuk membangun sistem agentic dalam skala besar.”
NVIDIA Nemotron juga mendukung inisiatif sovereign AI NVIDIA, dengan organisasi di berbagai wilayah—mulai dari Eropa hingga Korea Selatan—mengadopsi model yang terbuka, transparan, dan efisien untuk membangun sistem AI yang selaras dengan data, regulasi, dan nilai masing-masing.
Para pengguna awal, termasuk Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys, dan Zoom, telah mengintegrasikan model dari keluarga Nemotron untuk mendukung alur kerja AI di sektor manufaktur, keamanan siber, pengembangan perangkat lunak, media, komunikasi, dan industri lainnya.
“NVIDIA dan ServiceNow telah membentuk masa depan AI selama bertahun-tahun, dan yang terbaik masih akan datang,” kata Bill McDermott, Chairman dan CEO ServiceNow. “Hari ini, kami melangkah lebih jauh untuk memberdayakan para pemimpin lintas industri dalam mempercepat strategi AI agentic mereka. Otomasi alur kerja cerdas ServiceNow yang dipadukan dengan NVIDIA Nemotron 3 akan terus menetapkan standar baru dengan efisiensi, kecepatan, dan akurasi yang tak tertandingi.”
Seiring berkembangnya sistem AI multi-agen, pengembang semakin mengandalkan model proprietari untuk penalaran tingkat lanjut, sekaligus menggunakan model terbuka yang lebih efisien dan dapat disesuaikan untuk menekan biaya. Perutean tugas antara model frontier dan Nemotron dalam satu alur kerja memungkinkan agen memperoleh kecerdasan maksimal sekaligus mengoptimalkan tokenomics.
“Perplexity dibangun atas gagasan bahwa rasa ingin tahu manusia akan diperkuat oleh AI yang akurat dan terintegrasi dalam alat-alat unggulan seperti asisten AI,” ujar Aravind Srinivas, CEO Perplexity. “Dengan agent router kami, beban kerja dapat diarahkan ke model terbuka yang telah di-fine-tune seperti Nemotron 3 Ultra, atau memanfaatkan model proprietari terdepan saat tugas memerlukan kemampuan unik—sehingga asisten AI kami beroperasi dengan kecepatan, efisiensi, dan skala yang luar biasa.”
Model terbuka Nemotron 3 memungkinkan startup membangun dan mengiterasi agen AI dengan lebih cepat, mempercepat inovasi dari tahap prototipe hingga implementasi tingkat enterprise. Perusahaan portofolio dari General Catalyst, Mayfield, dan Sierra Ventures tengah mengeksplorasi Nemotron 3 untuk mengembangkan AI teammate yang mendukung kolaborasi manusia-AI.
“Stack model terbuka NVIDIA dan program NVIDIA Inception memberikan perusahaan tahap awal model, alat, dan infrastruktur yang hemat biaya untuk bereksperimen, berinovasi, dan berkembang dengan cepat,” kata Navin Chaddha, Managing Partner Mayfield. “Nemotron 3 memberi para pendiri awal yang kuat untuk membangun aplikasi AI agentic dan AI teammate, sekaligus mengakses basis terpasang NVIDIA yang sangat luas.”
Nemotron 3 Mendefinisikan Ulang AI Multi-Agen dengan Efisiensi dan Akurasi
Keluarga model MoE Nemotron 3 mencakup tiga ukuran:
Nemotron 3 Nano: model kecil dengan 30 miliar parameter, mengaktifkan hingga 3 miliar parameter sekaligus untuk tugas yang sangat terarah dan efisien.
Nemotron 3 Super: model penalaran berakurasi tinggi dengan sekitar 100 miliar parameter dan hingga 10 miliar parameter aktif per token, untuk aplikasi multi-agen.
Nemotron 3 Ultra: mesin penalaran besar dengan sekitar 500 miliar parameter dan hingga 50 miliar parameter aktif per token, untuk aplikasi AI yang kompleks.
Tersedia mulai hari ini, Nemotron 3 Nano merupakan model paling hemat biaya komputasi, dioptimalkan untuk tugas seperti debugging perangkat lunak, peringkasan konten, alur kerja asisten AI, dan pencarian informasi dengan biaya inferensi rendah. Model ini menggunakan arsitektur hybrid MoE unik untuk meningkatkan efisiensi dan skalabilitas.
Desain tersebut menghasilkan throughput token hingga 4x lebih tinggi dibandingkan Nemotron 2 Nano dan mengurangi generasi token penalaran hingga 60%, sehingga secara signifikan menurunkan biaya inferensi. Dengan jendela konteks 1 juta token, Nemotron 3 Nano mampu mengingat lebih banyak informasi, meningkatkan akurasi, dan menghubungkan informasi dalam tugas panjang dan bertahap.
Artificial Analysis, lembaga independen pemeringkat AI, menempatkan model ini sebagai yang paling terbuka dan efisien di kelas ukurannya, dengan akurasi terdepan.
Nemotron 3 Super unggul untuk aplikasi yang memerlukan banyak agen yang berkolaborasi menyelesaikan tugas kompleks dengan latensi rendah. Nemotron 3 Ultra berfungsi sebagai mesin penalaran tingkat lanjut untuk alur kerja AI yang membutuhkan riset mendalam dan perencanaan strategis.
Nemotron 3 Super dan Ultra menggunakan format pelatihan NVFP4 4-bit yang sangat efisien pada arsitektur NVIDIA Blackwell, sehingga secara signifikan mengurangi kebutuhan memori dan mempercepat pelatihan. Efisiensi ini memungkinkan pelatihan model besar pada infrastruktur yang ada tanpa mengorbankan akurasi dibandingkan format presisi lebih tinggi.
Dengan keluarga model Nemotron 3, pengembang dapat memilih model terbuka yang paling sesuai dengan beban kerja mereka—menskalakan dari puluhan hingga ratusan agen—sekaligus memperoleh penalaran jangka panjang yang lebih cepat dan akurat untuk alur kerja kompleks.
Alat dan Data Terbuka Baru untuk Kustomisasi Agen AI
NVIDIA juga merilis kumpulan dataset pelatihan dan library reinforcement learning mutakhir yang tersedia bagi siapa pun yang membangun agen AI terspesialisasi.
Sebanyak tiga triliun token dataset Nemotron untuk pra-pelatihan, pasca-pelatihan, dan reinforcement learning menyediakan contoh penalaran, pemrograman, serta alur kerja bertahap yang kaya untuk menciptakan agen yang sangat kapabel dan spesifik domain. Nemotron Agentic Safety Dataset menyediakan telemetri dunia nyata untuk membantu tim mengevaluasi dan memperkuat keselamatan sistem agen yang kompleks.
Untuk mempercepat pengembangan, NVIDIA merilis library open-source NeMo Gym dan NeMo RL, yang menyediakan lingkungan pelatihan dan fondasi pasca-pelatihan bagi model Nemotron, serta NeMo Evaluator untuk memvalidasi keselamatan dan kinerja model. Seluruh alat dan dataset kini tersedia di GitHub dan Hugging Face.
Nemotron 3 didukung oleh LM Studio, llama.cpp, SGLang, dan vLLM. Selain itu, Prime Intellect dan Unsloth mengintegrasikan lingkungan pelatihan siap pakai NeMo Gym langsung ke alur kerja mereka, memberikan akses lebih cepat dan mudah ke pelatihan reinforcement learning yang andal.
Mulai Menggunakan Model Terbuka NVIDIA
Nemotron 3 Nano tersedia hari ini di Hugging Face dan melalui penyedia layanan inferensi termasuk Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, dan Together AI.
Nemotron juga ditawarkan pada platform AI dan infrastruktur data enterprise, termasuk Couchbase, DataRobot, H2O.ai, JFrog, Lambda, dan UiPath. Untuk pelanggan cloud publik, Nemotron 3 Nano akan tersedia di AWS melalui Amazon Bedrock (serverless) serta segera didukung di Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, dan Yotta.
Nemotron 3 Nano juga tersedia sebagai microservice NVIDIA NIM™ untuk penerapan yang aman dan skalabel di mana saja pada infrastruktur yang dipercepat NVIDIA, memberikan privasi dan kontrol maksimal.
Nemotron 3 Super dan Ultra diperkirakan akan tersedia pada paruh pertama tahun 2026.
Share this post
