NVIDIA a dezvăluit astăzi familia NVIDIA Alpamayo de modele AI deschise, instrumente de simulare și seturi de date concepute pentru a accelera următoarea eră a dezvoltării vehiculelor autonome (VA) sigure și bazate pe raționament.
Vehiculele autonome trebuie să funcționeze în siguranță într-o gamă enormă de condiții de conducere.
Scenariile rare și complexe, adesea numite „coadă lungă”, rămân unele dintre cele mai dificile provocări pentru sistemele autonome.
Arhitecturile VA tradiționale separă percepția și planificarea, ceea ce poate limita scalabilitatea atunci când apar situații noi sau neobișnuite.
Progresele recente în învățarea end-to-end au înregistrat salturi semnificative, dar depășirea acestor cazuri limită cu coadă lungă necesită modele care pot raționa în siguranță despre cauză și efect, în special atunci când situațiile se află în afara experienței de antrenament a unui model.
Familia Alpamayo introduce modele de acțiune vizuală-limbaj (VLA) bazate pe raționament, bazate pe lanț de gândire, care aduc gândirea asemănătoare omului în procesul decizional în domeniul VA.
Aceste sisteme pot analiza scenarii noi sau rare pas cu pas, îmbunătățind capacitatea de conducere și explicabilitatea – ceea ce este esențial pentru scalarea încrederii și siguranței în vehiculele inteligente – și sunt susținute de sistemul de siguranță NVIDIA Halos.
„Momentul ChatGPT pentru Inteligența Artificială fizică a sosit – când mașinile încep să înțeleagă, să raționeze și să acționeze în lumea reală”
„Robotaxi-urile sunt printre primele care beneficiază de asta. Alpamayo aduce raționamentul în vehiculele autonome, permițându-le să gândească prin scenarii rare, să conducă în siguranță în medii complexe și să își explice deciziile de conducere – este fundamentul unei autonomii sigure și scalabile.” – a declarat Jensen Huang, fondator și CEO al NVIDIA.
Un ecosistem complet, deschis, pentru o autonomie bazată pe raționament
Alpamayo integrează trei piloni fundamentali – modele deschise, cadre de simulare și seturi de date – într-un ecosistem coeziv, deschis, pe care orice dezvoltator auto sau echipă de cercetare poate construi.
În loc să ruleze direct în vehicul, modelele Alpamayo servesc drept modele didactice la scară largă pe care dezvoltatorii le pot regla fin și implementa în coloana vertebrală a stivelor lor AV complete.
La CES, NVIDIA lansează:
- Alpamayo 1: Primul model VLA de raționament bazat pe lanț de gândire din industrie, conceput pentru comunitatea de cercetare AV, acum pe Hugging Face. Cu o arhitectură de 10 miliarde de parametri, Alpamayo 1 folosește date video de intrare pentru a genera traiectorii alături de urme de raționament, arătând logica din spatele fiecărei decizii. Dezvoltatorii pot adapta Alpamayo 1 în modele de execuție mai mici pentru dezvoltarea vehiculelor sau îl pot utiliza ca bază pentru instrumente de dezvoltare AV, cum ar fi evaluatori bazați pe raționament și sisteme de autoetichetare. Alpamayo 1 oferă ponderi de model deschise și scripturi de inferență open-source. Viitoarele modele din familie vor avea un număr mai mare de parametri, capacități de raționament mai detaliate, o mai mare flexibilitate de intrare și ieșire și opțiuni pentru utilizare comercială.
- AlpaSim: Un cadru de simulare complet open-source, end-to-end, pentru dezvoltarea AV de înaltă fidelitate, disponibil pe GitHub. Acesta oferă modelare realistă a senzorilor, dinamică a traficului configurabilă și medii de testare scalabile în buclă închisă, permițând validarea rapidă și rafinarea politicilor.
- Seturi de date deschise pentru inteligența artificială fizică: NVIDIA oferă cel mai divers set de date deschise la scară largă pentru sistemele audio-video, care conține peste 1.700 de ore de date despre condus colectate în cea mai largă gamă geografică și de condiții, acoperind cazuri rare și complexe din lumea reală, esențiale pentru avansarea arhitecturilor de raționament. Aceste seturi de date sunt disponibile pe Hugging Face.
Împreună, aceste instrumente permit o buclă de dezvoltare auto-susținută pentru stivele audio-video bazate pe raționament.
O industrie audio-video extinsă suportă Alpamayo
Liderii în mobilitate și experții din industrie, inclusiv Lucid, JLR, Uber și Berkeley DeepDrive, își manifestă interesul față de Alpamayo pentru a dezvolta stive audio-video bazate pe raționament care vor permite autonomie de nivel 4.
„Trecerea către inteligența artificială fizică evidențiază nevoia tot mai mare de sisteme de inteligență artificială care pot raționa despre comportamentul din lumea reală, nu doar procesa date”
„Mediile avansate de simulare, seturile de date bogate și modelele de raționament sunt elemente importante ale evoluției.” – a declarat Kai Stepper, vicepreședinte ADAS și conducere autonomă la Lucid Motors
„Dezvoltarea deschisă și transparentă a inteligenței artificiale este esențială pentru promovarea responsabilă a mobilității autonome”
„Prin modele open-source precum Alpamayo, NVIDIA contribuie la accelerarea inovației în ecosistemul conducerii autonome, oferind dezvoltatorilor și cercetătorilor noi instrumente pentru a aborda în siguranță scenarii complexe din lumea reală.” – a declarat Thomas Müller, director executiv al departamentului de inginerie de produs la JLR.
„Gestionarea scenariilor de conducere imprevizibile și cu coadă lungă este una dintre provocările definitorii ale autonomiei”
„Alpamayo creează noi oportunități interesante pentru industrie pentru a accelera inteligența artificială fizică, a îmbunătăți transparența și a crește implementările sigure de nivel 4.” – a declarat Sarfraz Maredia, director global al departamentului de mobilitate și livrare autonomă la Uber.
„Alpamayo 1 permite vehiculelor să interpreteze medii complexe, să anticipeze situații noi și să ia decizii sigure, chiar și în scenarii nemaiîntâlnite anterior”
„Natura open-source a modelului accelerează inovația la nivelul întregii industrii, permițând partenerilor să adapteze și să rafineze tehnologia pentru nevoile lor unice.” – a declarat Owen Chen, analist principal senior la S&P Global.
„Lansarea portofoliului Alpamayo reprezintă un salt major înainte pentru comunitatea de cercetare”
„Decizia NVIDIA de a face acest lucru disponibil publicului larg este transformatoare, deoarece accesul și capacitățile sale ne vor permite să ne antrenăm la o scară fără precedent – oferindu-ne flexibilitatea și resursele necesare pentru a promova conducerea autonomă în mainstream.” – a declarat Wei Zhan, codirector al Berkeley DeepDrive.
Dincolo de Alpamayo, dezvoltatorii pot accesa bogata bibliotecă de instrumente și modele NVIDIA, inclusiv de pe platformele NVIDIA Cosmos™ și NVIDIA Omniverse™.
Dezvoltatorii pot regla fin versiunile de modele pe baza datelor proprietare ale flotei, le pot integra în arhitectura NVIDIA DRIVE Hyperion™ construită cu tehnologia de calcul accelerată NVIDIA DRIVE AGX Thor™ și pot valida performanța în simulare înainte de implementarea comercială.

Lasă un răspuns