Tes Pelatihan Hopper, Ampere Sapu MLPerf
news

Tes Pelatihan Hopper, Ampere Sapu MLPerf

Dua bulan setelah debut mereka menyapu tolok ukur inferensi MLPerf, GPU NVIDIA H100 Tensor Core mencetak rekor dunia di seluruh beban kerja AI perusahaan dalam pengujian pelatihan AI terbaru grup industri.

Bersama-sama, hasilnya menunjukkan H100 adalah pilihan terbaik bagi pengguna yang menuntut kinerja maksimal saat membuat dan menerapkan model AI tingkat lanjut.

MLPerf adalah standar industri untuk mengukur kinerja AI. Itu didukung oleh grup luas yang mencakup Amazon, Arm, Baidu, Google, Universitas Harvard, Intel, Meta, Microsoft, Universitas Stanford, dan Universitas Toronto.

Dalam benchmark MLPerf terkait yang juga dirilis hari ini, GPU NVIDIA A100 Tensor Core meningkatkan standar yang ditetapkan tahun lalu dalam komputasi performa tinggi (HPC).

GPU NVIDIA H100 hingga 6,7x lebih cepat dari GPU A100 saat pertama kali diajukan untuk Pelatihan MLPerf.

GPU H100 (alias Hopper) meningkatkan standar kinerja per akselerator dalam Pelatihan MLPerf. Mereka memberikan kinerja hingga 6,7x lebih tinggi dari GPU generasi sebelumnya saat pertama kali dikirimkan pada pelatihan MLPerf. Dengan perbandingan yang sama, GPU A100 saat ini mengemas kekuatan 2,5x lebih banyak, berkat kemajuan dalam perangkat lunak.

Sebagian karena Transformer Engine-nya, Hopper unggul dalam melatih model BERT yang populer untuk pemrosesan bahasa alami. Ini adalah salah satu model AI MLPerf terbesar dan paling haus kinerja.

MLPerf memberi pengguna kepercayaan diri untuk membuat keputusan pembelian yang tepat karena tolok ukurnya mencakup beban kerja AI paling populer saat ini — visi komputer, pemrosesan bahasa alami, sistem rekomendasi, pembelajaran penguatan, dan banyak lagi. Tes ini ditinjau oleh rekan sejawat, sehingga pengguna dapat mengandalkan hasil mereka.

GPU A100 Mencapai Puncak Baru di HPC

Dalam rangkaian terpisah dari tolok ukur MLPerf HPC, GPU A100 menyapu semua pengujian model AI pelatihan dalam menuntut beban kerja ilmiah yang dijalankan di superkomputer. Hasilnya menunjukkan kemampuan platform NVIDIA AI untuk menskalakan tantangan teknis terberat di dunia.

Misalnya, GPU A100 melatih model AI dalam uji CosmoFlow untuk astrofisika 9x lebih cepat daripada hasil terbaik dua tahun lalu di putaran pertama MLPerf HPC. Dalam beban kerja yang sama, A100 juga memberikan throughput per chip hingga 66x lebih banyak daripada penawaran alternatif.

Tolok ukur HPC melatih model untuk bekerja dalam astrofisika, prakiraan cuaca, dan dinamika molekuler. Mereka termasuk di antara banyak bidang teknis, seperti penemuan obat, adopsi AI untuk memajukan ilmu pengetahuan.

Dalam pengujian di seluruh dunia, GPU A100 memimpin dalam kecepatan dan hasil pelatihan.

Pusat superkomputer di Asia, Eropa, dan AS berpartisipasi dalam putaran terakhir tes HPC MLPerf. Dalam debutnya di benchmark DeepCAM, Dell Technologies menunjukkan hasil yang kuat menggunakan GPU NVIDIA A100.

Ekosistem yang Tak Tertandingi

Dalam benchmark pelatihan AI perusahaan, total 11 perusahaan, termasuk layanan cloud Microsoft Azure, membuat pengajuan menggunakan GPU NVIDIA A100, A30, dan A40. Pembuat sistem termasuk ASUS, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo dan Supermicro menggunakan total sembilan Sistem Bersertifikasi NVIDIA untuk pengajuan mereka.

Pada putaran terakhir, setidaknya tiga perusahaan bergabung dengan NVIDIA dalam mengirimkan hasil pada semua delapan beban kerja pelatihan MLPerf. Keserbagunaan itu penting karena aplikasi dunia nyata seringkali membutuhkan rangkaian model AI yang beragam.

Mitra NVIDIA berpartisipasi dalam MLPerf karena mereka tahu ini adalah alat yang berharga bagi pelanggan yang mengevaluasi platform dan vendor AI.

Dibawah tenda

Platform NVIDIA AI menyediakan tumpukan penuh mulai dari chip hingga sistem, perangkat lunak, dan layanan. Itu memungkinkan peningkatan kinerja berkelanjutan dari waktu ke waktu.

Misalnya, pengiriman dalam pengujian HPC terbaru menerapkan rangkaian pengoptimalan dan teknik perangkat lunak yang dijelaskan dalam artikel teknis. Bersama-sama mereka memangkas runtime pada satu benchmark sebanyak 5x, menjadi hanya 22 menit dari 101 menit.

Artikel kedua menjelaskan bagaimana NVIDIA mengoptimalkan platformnya untuk benchmark AI perusahaan. Misalnya, kami menggunakan NVIDIA DALI untuk memuat dan melakukan pra-proses data secara efisien untuk benchmark visi komputer.

Semua perangkat lunak yang digunakan dalam pengujian tersedia dari repositori MLPerf, jadi siapa pun bisa mendapatkan hasil kelas dunia ini. NVIDIA terus menggabungkan pengoptimalan ini ke dalam wadah yang tersedia di NGC, pusat perangkat lunak untuk aplikasi GPU.

Buat seperti itu kita https://gagdetfrontal.com/ sedia kan web ini pada para pecinta togel hongkong. Sebab kami selalu membagikan hasil http://cialisgoedkoopbestellen.top/ hk tercepat dan juga terakurat alhasil para pemeran tidak butuh menanti lama terhadap jam 23. 00 wib. Kemudian, bersama hasil pengeluaran hk yang kami bagikan pada para pemeran pastinya hasil itu kita ambil segera dari situs sah hongkongpools. Karena kita membawa koneksi berasal dari web site hongkongpools https://enriqueig.com/ bersama dengan tiap pemberitahuan hasil pengeluaran hk udah berkunjung hingga bagan knowledge hk yang diatas