Apa itu Model AI yang Dilatih Sebelumnya?
news

Apa itu Model AI yang Dilatih Sebelumnya?

Bayangkan mencoba mengajari balita apa itu unicorn. Tempat yang baik untuk memulai mungkin dengan menunjukkan gambar makhluk itu kepada anak-anak dan menjelaskan ciri-ciri uniknya.

Sekarang bayangkan mencoba mengajari mesin kecerdasan artifisial apa itu unicorn. Di mana seseorang akan memulai?

Model AI terlatih menawarkan solusi.

Model AI yang telah dilatih sebelumnya adalah model pembelajaran mendalam — ekspresi algoritme saraf mirip otak yang menemukan pola atau membuat prediksi berdasarkan data — yang dilatih pada kumpulan data besar untuk menyelesaikan tugas tertentu. Ini dapat digunakan apa adanya atau lebih lanjut disesuaikan agar sesuai dengan kebutuhan spesifik aplikasi.

Mengapa Model AI yang Dilatih Digunakan?

Alih-alih membuat model AI dari awal, developer dapat menggunakan model yang telah dilatih sebelumnya dan menyesuaikannya untuk memenuhi kebutuhan mereka.

Untuk membangun aplikasi AI, pengembang pertama-tama memerlukan model AI yang dapat menyelesaikan tugas tertentu, baik itu mengidentifikasi kuda mitos, mendeteksi bahaya keselamatan untuk kendaraan otonom, atau mendiagnosis kanker berdasarkan pencitraan medis. Model itu membutuhkan banyak data representatif untuk dipelajari.

Proses pembelajaran ini memerlukan melalui beberapa lapisan data yang masuk dan menekankan karakteristik yang relevan dengan tujuan di setiap lapisan.

Untuk membuat model yang dapat mengenali unicorn, misalnya, pertama-tama Anda dapat memberinya gambar unicorn, kuda, kucing, harimau, dan hewan lainnya. Ini adalah data yang masuk.

Kemudian, lapisan sifat data representatif dibangun, dimulai dengan yang sederhana — seperti garis dan warna — dan berlanjut ke fitur struktural yang kompleks. Karakteristik ini diberi berbagai tingkat relevansi dengan menghitung probabilitas.

Berbeda dengan kucing atau harimau, misalnya, semakin mirip kuda suatu makhluk, semakin besar kemungkinannya adalah unicorn. Nilai probabilistik seperti itu disimpan di setiap lapisan jaringan saraf dalam model AI, dan saat lapisan ditambahkan, pemahamannya tentang representasi meningkat.

Untuk membuat model seperti itu dari awal, pengembang memerlukan kumpulan data yang sangat besar, seringkali dengan miliaran baris data. Ini bisa jadi mahal dan sulit diperoleh, tetapi mengorbankan data dapat menyebabkan kinerja model yang buruk.

Representasi probabilistik yang telah dihitung sebelumnya — dikenal sebagai bobot — menghemat waktu, uang, dan tenaga. Model pra-pelatihan sudah dibuat dan dilatih dengan bobot ini.

Menggunakan model pra-pelatihan berkualitas tinggi dengan sejumlah besar bobot representatif yang akurat menghasilkan peluang keberhasilan yang lebih tinggi untuk penerapan AI. Bobot dapat dimodifikasi, dan lebih banyak data dapat ditambahkan ke model untuk menyesuaikan atau menyempurnakannya lebih lanjut.

Pengembang yang membangun model pra-pelatihan dapat membuat aplikasi AI lebih cepat, tanpa harus khawatir tentang penanganan tumpukan data masukan atau probabilitas komputasi untuk lapisan padat.

Dengan kata lain, menggunakan model AI yang telah dilatih sebelumnya seperti mendapatkan gaun atau kemeja lalu menyesuaikannya dengan kebutuhan Anda, daripada memulai dengan kain, benang, dan jarum.

Model AI pra-pelatihan sering digunakan untuk pembelajaran transfer dan dapat didasarkan pada beberapa tipe arsitektur model. Salah satu jenis arsitektur yang populer adalah model transformator, jaringan saraf yang mempelajari konteks dan makna dengan melacak hubungan dalam data berurutan.

Menurut Alfredo Ramos, wakil presiden senior platform di perusahaan AI Clarifai — mitra utama dalam program NVIDIA Inception untuk startup — model yang telah dilatih sebelumnya dapat memangkas waktu pengembangan aplikasi AI hingga satu tahun dan menghasilkan penghematan biaya ratusan ribu dolar .

Bagaimana Model Terlatih Memajukan AI?

Karena model pra-pelatihan menyederhanakan dan mempercepat pengembangan AI, banyak pengembang dan perusahaan menggunakannya untuk mempercepat berbagai kasus penggunaan AI.

Area teratas di mana model terlatih memajukan AI meliputi:

  • Pemrosesan bahasa alami. Model terlatih digunakan untuk terjemahan, chatbots, dan aplikasi pemrosesan bahasa alami lainnya. Model bahasa besar, seringkali didasarkan pada arsitektur model transformator, merupakan perpanjangan dari model pra-pelatihan. Salah satu contoh LLM terlatih adalah NVIDIA NeMo Megatron, salah satu model AI terbesar di dunia.
  • Pidato AI. Model terlatih dapat membantu aplikasi speech AI plug and play dalam berbagai bahasa. Kasus penggunaan meliputi otomatisasi pusat panggilan, asisten AI, dan teknologi pengenalan suara.
  • Visi komputer. Seperti pada contoh unicorn di atas, model terlatih dapat membantu AI mengenali makhluk dengan cepat — atau objek, tempat, dan orang. Dengan cara ini, model yang telah dilatih mempercepat visi komputer, memberikan aplikasi kemampuan visi seperti manusia di seluruh olahraga, kota pintar, dan lainnya.
  • Kesehatan. Untuk aplikasi perawatan kesehatan, model AI terlatih seperti MegaMolBART — bagian dari layanan dan kerangka kerja NVIDIA BioNeMo — dapat memahami bahasa kimia dan mempelajari hubungan antara atom dalam molekul dunia nyata, memberi komunitas ilmiah alat yang ampuh untuk penemuan obat yang lebih cepat.
  • Keamanan cyber. Model yang telah dilatih sebelumnya memberikan titik awal untuk mengimplementasikan solusi keamanan siber berbasis AI dan memperluas kemampuan analis keamanan manusia untuk mendeteksi ancaman lebih cepat. Contohnya termasuk sidik jari digital manusia dan mesin, dan deteksi anomali, informasi sensitif, dan phishing.
  • Alur kerja seni dan kreatif. Mendukung gelombang seni AI baru-baru ini, model terlatih dapat membantu mempercepat alur kerja kreatif melalui alat seperti GauGAN dan NVIDIA Canvas.

Model AI yang telah dilatih sebelumnya dapat diterapkan di seluruh industri di luar ini, karena penyesuaian dan penyempurnaannya dapat menghasilkan kemungkinan penggunaan yang tak terbatas.

Tempat Menemukan Model AI yang Telah Dilatih

Perusahaan seperti Google, Meta, Microsoft, dan NVIDIA menciptakan arsitektur dan kerangka kerja model mutakhir untuk membangun model AI.

Ini kadang-kadang dirilis pada hub model atau sebagai open source, memungkinkan pengembang menyempurnakan model AI yang telah dilatih sebelumnya, meningkatkan akurasinya, dan memperluas repositori model.

NVIDIA NGC — hub untuk perangkat lunak AI yang dioptimalkan GPU, model, dan contoh Notebook Jupyter — mencakup model yang telah dilatih sebelumnya serta tolok ukur AI dan resep pelatihan yang dioptimalkan untuk digunakan dengan platform NVIDIA AI.

NVIDIA AI Enterprise, rangkaian AI dan perangkat lunak analitik data cloud-native yang terkelola sepenuhnya, aman, mencakup model yang telah dilatih sebelumnya tanpa enkripsi. Hal ini memungkinkan pengembang dan perusahaan yang ingin mengintegrasikan model pra-pelatihan NVIDIA ke dalam aplikasi AI kustom mereka untuk melihat bobot dan bias model, meningkatkan kemampuan menjelaskan, dan melakukan debug dengan mudah.

Ribuan model sumber terbuka juga tersedia di hub seperti GitHub, Hugging Face, dan lainnya.

Model terlatih harus dilatih menggunakan data etis yang transparan dan dapat dijelaskan, sesuai dengan privasi, serta diperoleh dengan persetujuan dan tanpa bias.

Model AI yang Dilatih NVIDIA

Untuk membantu lebih banyak pengembang memindahkan AI dari prototipe ke produksi, NVIDIA menawarkan beberapa model pra-pelatihan yang dapat digunakan di luar kotak, termasuk:

  • NVIDIA SegFormer, model transformator untuk segmentasi semantik yang sederhana, efisien, dan kuat — tersedia di GitHub.
  • Model visi komputer NVIDIA yang dibuat khusus, dilatih pada jutaan gambar untuk kota pintar, manajemen parkir, dan aplikasi lainnya.
  • NVIDIA NeMo Megatron, model bahasa terbesar di dunia yang dapat disesuaikan, sebagai bagian dari NVIDIA NeMo, kerangka kerja sumber terbuka untuk membangun aplikasi berkinerja tinggi dan fleksibel untuk AI percakapan, AI ucapan, dan biologi.
  • NVIDIA StyleGAN, arsitektur generator berbasis gaya untuk jaringan adversarial generatif, atau GAN. Ini menggunakan pembelajaran transfer untuk menghasilkan lukisan tak terbatas dalam berbagai gaya.

Selain itu, NVIDIA Riva, kit pengembangan perangkat lunak yang dipercepat GPU untuk membangun dan menerapkan aplikasi AI ucapan, menyertakan model yang telah dilatih sebelumnya dalam sepuluh bahasa.

Dan MONAI, kerangka kerja AI sumber terbuka untuk penelitian perawatan kesehatan yang dikembangkan oleh NVIDIA dan King’s College London, menyertakan model pra-pelatihan untuk pencitraan medis.

Belajar lebih tentang Model AI prapelatihan NVIDIA.

Buat layaknya itu kami sediakan web ini terhadap para pengagum togel hongkong. Sebab kita senantiasa membagikan hasil https://sieviarynets.net/ hk tercepat serta terakurat alhasil para pemeran tidak butuh tunggu lama pada jam 23. 00 wib. Kemudian, dengan hasil pengeluaran hk yang kita bagikan pada para pemeran tentunya hasil itu kami ambil segera dari website sah hongkongpools. Karena kita mempunyai koneksi berasal dari web hongkongpools https://natassembly.org/ bersama tiap pemberitahuan hasil pengeluaran hk udah singgah sampai bagan information hk yang diatas