Jensen Huang astus Taipeis Computexil lavale nahktagis ja tutvustas Nemotron 3 Ultrat – NVIDIA suurimat avatud kiipi. AI mudel tänaseni ja hetkel kõige nutikam Ameerika Ühendriikides välja töötatud avatud kaaluga mudel. Vaatamata muljetavaldavatele spetsifikatsioonidele jääb see Hiina konkurentidest maha.
Ligikaudu 550 miljardi parameetriga, millest 55 miljardit on igal ajahetkel aktiivsed, kasutab see mudel disaini, mida tuntakse ekspertide seguna. Parameetrid on tehisintellekti mudeli ehituskivid ja suurem arv on tavaliselt seotud võimsama mudeliga.
Ekspertide segu mudeli toimimise mõistmiseks võrrelge seda spetsialiste täis haiglaga: patsiendi saabumisel ilmuvad kohale ainult asjaomased arstid, mitte kogu personal. See lähenemisviis hoiab mudeli tegevuskulud oluliselt madalamad, kui kvartalipõhine suur hulk parameetreid eeldaks, võimaldades NVIDIA-l väita viis korda kiiremat järelduste tegemist ja 30% madalamaid kulusid võrreldes sarnaste avatud kaaluga alternatiividega.
Sõltumatu arvustaja Artificial Analysis, kes tegi eelväljaande arvustuse koostamisel koostööd NVIDIAga, paigutas Nemotron 3 Ultra oma intelligentse indeksi (Intelligent Index) 48. kohale. See indeks hõlmab kümmet arutluskäigu, kodeerimise, üldteadmiste ja agendi jõudluse hindamist numbrilisel skaalal, kus kõrgemad skoorid näitavad targemat mudelit.
See teeb sellest selge edumaaga parima avatud kaaluga USA mudeli. Lähimad USA mudelid on Google'i Gemma 4 31B 39. kohal, Nemotron 3 Super 36. kohal ja gpt-oss-120b mudel firmalt ... OpenAI 33. kohal.
Hüpe eelkäijaga võrreldes on rabav. Nemotron 3 Super, mis toodi turule 2026. aasta märtsis 120 miljardi parameetriga, oli juba varem autonoomsete agentide jaoks kindel avatud mudel. Ultra tähendab 12 indeksipunkti kasvu, mida võrdlusaluste maastikul ei tohiks alahinnata.
NVIDIA on modelleerimistööstuses tegutsenud kauem, kui paljud arvavad. Esimene Nemotroni mudel toodi turule 2023. aasta novembris ja kolmas põlvkond kuulutati välja 2025. aasta detsembris.
Perekond koosneb kolmest variandist: Nano kergemate ülesannete jaoks, Super keskmise suurusega rakenduste jaoks ja Ultra keeruka arutlustöö jaoks. Kõik kolm jagavad sama hübriidarhitektuuri, mis ühendab Mamba-2 kihid, standardse Transformeri tähelepanu ja sega-ekspertide marsruutimise.
Mamba-2 on alternatiiv tavalisele tähelepanule, mis töötleb pikki järjestusi murdosa hinnaga – see on oluline, kui soovite mudelit, mis suudab korraga töödelda miljonit märki. Nemotron 3 Ultra toetab miljoni märgi kontekstiakent, mis tähendab, et agent saab teoreetiliselt vaadata tervet suurt koodibaasi või sadu uurimisdokumente samaaegselt.
Lisaks kasutab Ultra mudel tehnikat nimega mitme märgi ennustamine (MTP), mis võimaldab mudelil ennustada samaaegselt mitut tulevast märki, kiirendades genereerimist. Kõik kolm Nemotron 3 mudelit on läbinud järelkoolituse, kasutades tugevdusõpet erinevates interaktiivsetes keskkondades, õpetades neid mitmeastmeliste ülesannete planeerimist ja täitmist, mitte ainult küsimustele vastamist.
Ultra mudeli kaalud on avalikud ja treeningretseptid on avaldatud. Kas selle käitamiseks on vaja superarvutit? Põhimõtteliselt jah: 550 miljardi parameetriga mudel on midagi andmekeskustele. Kuid see on ligipääsetav NVIDIA API või pilveteenuse pakkujate kaudu ilma riistvara ise ostmata, samamoodi nagu kasutajad juba pääsevad GPT-le või Claude'ile brauseri kaudu ligi.
Nemotron 3 Ultra paistab silma kiiruse poolest. DeepInfra eelväljaande lõpp-punktis edastas mudel üle 300 väljundtokeni sekundis. Sama intelligentsusklassi Hiina mudelid – DeepSeek V4 Pro ja Kimi K2.6 – edastavad praegu oma kommerts-API-de kaudu kiirusega 50–100 tokenit sekundis. See kiiruse erinevus on reaalsete juurutuste puhul oluline, eriti autonoomsete agentide puhul, kes täidavad pikki mitmeastmelisi ülesandeid, kus iga sammu ootamine kiiresti summeerub.
Siiski ei lahenda kiirus pelgalt intelligentsuse võrrandit. Artificial Analysis esitatud andmed teevad tegeliku olukorra üsna selgeks. Vertikaalteljel – intelligentsus – on Nemotron 3 Ultra 48 punkti peal, mis on hea, kuid Hiina Moonshot AI Kimi K2.6 on 54 punkti peal. Kuuepunktiline erinevus indeksis kujutab endast olulist erinevust: Kimi K2.6 ilmus 2026. aasta aprillis ja on praegu kõigi tehisintellekti mudelite, nii suletud kui ka avatud, seas neljandal kohal, jäädes vaid kolm punkti maha Anthropicu, Google'i ja OpenAI lipulaevmudelitest – mis kõik on 57 punkti peal.
Olukord avatud kaaluga USA-s pole uus. Hiina laborid on avatud ökosüsteeme tugevate mudelitega üle ujutanud, samas kui Ameerika ettevõtted – OpenAI, Anthropic, Google – hoiavad oma parimaid süsteeme API-de taga. Nagu Decrypt märtsis teatas, tõusis Hiina avatud lähtekoodiga mudelite osakaal globaalses avatud mudelite kasutuses umbes 1,2%-lt 2024. aasta lõpuks umbes 30%-le 2025. aasta lõpuks. NVIDIA on Ameerika suurim nimi, mis püüab aktiivselt seda suundumust muuta, avalikult väljakuulutatud viieaastase plaaniga kulutada 26 miljardit dollarit avatud kaaluga tehisintellekti arendamisele.
Nemotron 3 Ultra on selle pühendumuse seni kõige nähtavam tulemus. NVIDIA on teatanud ka, et töötab juba järgmise põlvkonna Nemotron 4 kallal, mida arendab Nemotroni koalitsioon, mis koosneb kaheksast tehisintellekti laborist, sealhulgas Mistral AI ja Perplexity, mille NVIDIA koondas 2026. aasta märtsis, et ühiselt arendada avatud piirimudeleid DGX Cloudi infrastruktuuril. Nemotron 3 Ultra tuleb müügile 4. juunil.
Mis teeb Nemotron 3 Ultra teiste mudelitega võrreldes ainulaadseks?
Nemotron 3 Ultra eristub oma tohutu kiiruse (üle 300 žetooni sekundis) ja hübriidarhitektuuri poolest, mis muudab selle ulatuslike rakenduste jaoks kulutõhusaks.
Kuidas Nemotron 3 Ultra oma eelkäijaga võrreldes on?
Nemotron 3 Ultra on Nemotron 3 Superiga võrreldes tõusnud 12 indeksipunkti võrra, mis kujutab endast märkimisväärset edasiminekut nii jõudluse kui ka võimaluste osas.
Miks on avatud raskuste turul nii tihe konkurents?
Hiina laborid on välja töötanud võimsad mudelid, mis turgu üle ujutavad, samas kui Ameerika ettevõtted hoiavad oma keerukamaid süsteeme sageli suletud uste taga. See on toonud kaasa kasvava lõhe avatud lähtekoodiga tehisintellekti arendamises.
