news

NVIDIA Memenangkan Penghargaan NeurIPS untuk Penelitian AI Generatif, Agen AI Generalis

Dua makalah NVIDIA Research — satu mengeksplorasi model AI generatif berbasis difusi dan satu lagi tentang pelatihan agen AI generalis — telah dianugerahi Penghargaan NeurIPS 2022 atas kontribusinya di bidang AI dan pembelajaran mesin.

Ini adalah di antara lebih dari 60+ pembicaraan, poster, dan lokakarya dengan penulis NVIDIA yang dipresentasikan pada konferensi NeurIPs, yang berlangsung minggu ini di New Orleans dan minggu depan secara online.

Pembuatan data sintetis — untuk gambar, teks, atau video — adalah tema utama di beberapa makalah yang ditulis oleh NVIDIA. Topik lainnya termasuk pembelajaran penguatan, pengumpulan dan augmentasi data, model cuaca, dan pembelajaran federasi.

“AI adalah teknologi yang sangat penting, dan NVIDIA membuat kemajuan pesat di seluruh aspek — dari AI generatif hingga agen AI otonom,” kata Jan Kautz, wakil presiden riset pembelajaran dan persepsi di NVIDIA. “Dalam AI generatif, kami tidak hanya memajukan pemahaman teoretis kami tentang model yang mendasarinya, tetapi juga memberikan kontribusi praktis yang akan mengurangi upaya menciptakan dunia virtual dan simulasi yang realistis.”

Konsep Ulang Desain Model Generatif Berbasis Difusi

Model berbasis difusi telah muncul sebagai teknik terobosan untuk AI generatif. Peneliti NVIDIA memenangkan penghargaan Outstanding Main Track Paper untuk karya yang menganalisis desain model difusi, mengusulkan peningkatan yang dapat meningkatkan efisiensi dan kualitas model ini secara dramatis.

Makalah ini memecah komponen model difusi menjadi desain modular, membantu pengembang mengidentifikasi proses yang dapat disesuaikan untuk meningkatkan kinerja seluruh model. Para peneliti menunjukkan bahwa modifikasi mereka memungkinkan skor rekaman pada metrik yang menilai kualitas gambar yang dihasilkan AI.

Melatih Agen AI Generalis dalam Suite Simulasi Berbasis Minecraft

Sementara para peneliti telah lama melatih agen AI otonom di lingkungan video-game seperti Starcraft, Dota dan Pergi, agen ini biasanya spesialis hanya dalam beberapa tugas. Jadi peneliti NVIDIA beralih ke Minecraftgame paling populer di dunia, untuk mengembangkan kerangka kerja pelatihan yang dapat diskalakan untuk agen generalis — yang dapat berhasil menjalankan berbagai tugas terbuka.

Dijuluki MineDojo, framework ini memungkinkan agen AI untuk belajar MinecraftGameplay fleksibel menggunakan database online besar lebih dari 7.000 halaman wiki, jutaan utas Reddit, dan 300.000 jam gameplay yang direkam (ditunjukkan pada gambar di atas). Proyek ini memenangkan Outstanding Datasets and Benchmarks Paper Award dari komite NeurIPS.

Sebagai bukti konsep, para peneliti di balik MineDojo membuat model dasar berskala besar, yang disebut MineCLIP, yang belajar mengasosiasikan rekaman video YouTube Minecraft gameplay dengan transkrip video, di mana pemain biasanya menceritakan tindakan di layar. Menggunakan MineCLIP, tim dapat melatih agen pembelajaran penguatan yang mampu melakukan beberapa tugas Minecraft tanpa campur tangan manusia.

Membuat Bentuk 3D Kompleks untuk Mengisi Dunia Virtual

Juga di NeurIPS adalah GET3D, model AI generatif yang secara instan mensintesis bentuk 3D berdasarkan kategori gambar 2D yang dilatihnya, seperti bangunan, mobil, atau hewan. Objek yang dihasilkan AI memiliki tekstur fidelitas tinggi dan detail geometris yang kompleks — dan dibuat dalam format jaring segitiga yang digunakan dalam aplikasi perangkat lunak grafis populer. Ini memudahkan pengguna untuk mengimpor bentuk ke perender 3D dan mesin game untuk pengeditan lebih lanjut.

Dinamakan karena kemampuannya untuk Gmenghasilkan explicit Tdiekstur 3D meshes, GET3D dilatih pada NVIDIA A100 Tensor Core GPU menggunakan sekitar 1 juta gambar 2D dari bentuk 3D yang diambil dari berbagai sudut kamera. Model ini dapat menghasilkan sekitar 20 objek per detik saat menjalankan inferensi pada satu GPU NVIDIA.

Objek yang dihasilkan AI dapat digunakan untuk mengisi representasi 3D bangunan, ruang luar, atau seluruh kota — ruang digital yang dirancang untuk industri seperti game, robot, arsitektur, dan media sosial.

Meningkatkan Pipa Rendering Terbalik Dengan Kontrol Atas Material, Pencahayaan

Pada konferensi CVPR terbaru, yang diadakan di New Orleans pada bulan Juni, NVIDIA Research memperkenalkan 3D MoMa, sebuah metode rendering terbalik yang memungkinkan pengembang untuk membuat objek 3D yang terdiri dari tiga bagian berbeda: model mesh 3D, material yang dihamparkan pada model, dan pencahayaan. .

Sejak saat itu, tim telah mencapai kemajuan signifikan dalam mengurai material dan pencahayaan dari objek 3D — yang pada gilirannya meningkatkan kemampuan kreator untuk mengedit bentuk yang dihasilkan AI dengan menukar material atau menyesuaikan pencahayaan saat objek bergerak di sekitar pemandangan.

https://www.youtube.com/watch?v=JEDaclmYcbM

Karya tersebut, yang mengandalkan model shading yang lebih realistis yang memanfaatkan ray tracing yang dipercepat GPU NVIDIA RTX, dipresentasikan sebagai poster di NeurIPS.

Meningkatkan Akurasi Faktual Teks yang Dihasilkan Model Bahasa

Makalah lain yang diterima di NeurIPS meneliti tantangan utama dengan model bahasa yang telah dilatih sebelumnya: akurasi faktual dari teks yang dihasilkan AI.

Model bahasa yang dilatih untuk pembuatan teks terbuka sering menghasilkan teks yang berisi informasi nonfaktual, karena AI hanya membuat korelasi antara kata untuk memprediksi apa yang akan muncul selanjutnya dalam sebuah kalimat. Dalam makalah tersebut, peneliti NVIDIA mengusulkan teknik untuk mengatasi keterbatasan ini, yang diperlukan sebelum model tersebut dapat digunakan untuk aplikasi dunia nyata.

Para peneliti membuat tolok ukur otomatis pertama untuk mengukur akurasi faktual model bahasa untuk pembuatan teks terbuka, dan menemukan bahwa model bahasa yang lebih besar dengan miliaran parameter lebih faktual daripada yang lebih kecil. Tim mengusulkan teknik baru, pelatihan yang ditingkatkan faktualitas, bersama dengan algoritme pengambilan sampel baru yang bersama-sama membantu melatih model bahasa untuk menghasilkan teks yang akurat — dan menunjukkan pengurangan tingkat kesalahan faktual dari 33% menjadi sekitar 15%.

Ada lebih dari 300 peneliti NVIDIA di seluruh dunia, dengan tim yang berfokus pada topik termasuk AI, grafik komputer, visi komputer, mobil tanpa pengemudi, dan robotika. Pelajari lebih lanjut tentang NVIDIA Research dan lihat daftar lengkap makalah yang diterima NVIDIA di NeurIPS.

Buat layaknya itu kami https://teacuppigs.net/ sediakan web site ini pada para pecinta togel hongkong. Sebab kita tetap membagikan hasil https://sieviarynets.net/ hk tercepat dan juga terakurat alhasil para pemeran tidak butuh tunggu lama terhadap jam 23. 00 wib. Kemudian, bersama hasil pengeluaran hk yang kami bagikan pada para pemeran pastinya hasil itu kita ambil langsung berasal dari web site sah hongkongpools. Karena kita membawa koneksi berasal dari situs hongkongpools https://shopuniversitymall.com/ bersama tiap pemberitahuan hasil pengeluaran hk telah singgah hingga bagan knowledge hk yang diatas