Kemajuan dalam seluruh pengurutan genom telah memicu revolusi dalam biologi digital.
Program genomik di seluruh dunia mendapatkan momentum karena biaya throughput tinggi, sequencing generasi berikutnya telah menurun.
Apakah digunakan untuk mengurutkan pasien perawatan kritis dengan penyakit langka atau dalam penelitian genetika skala populasi, pengurutan seluruh genom menjadi langkah mendasar dalam alur kerja klinis dan penemuan obat.
Tapi pengurutan genom hanyalah langkah pertama. Menganalisis data pengurutan genom membutuhkan komputasi yang dipercepat, ilmu data, dan AI untuk membaca dan memahami genom. Dengan berakhirnya hukum Moore, pengamatan bahwa ada dua kali lipat jumlah transistor dalam sirkuit terpadu setiap dua tahun, pendekatan komputasi baru diperlukan untuk menurunkan biaya analisis data, meningkatkan throughput dan akurasi pembacaan, dan akhirnya membuka kunci potensi penuh dari genom manusia.
Ledakan di Bioinformatika Data
Mengurutkan seluruh genom individu menghasilkan sekitar 100 gigabyte data mentah. Itu lebih dari dua kali lipat setelah genom diurutkan menggunakan algoritme dan aplikasi yang kompleks seperti pembelajaran mendalam dan pemrosesan bahasa alami.
Karena biaya pengurutan genom manusia terus menurun, volume data pengurutan meningkat secara eksponensial.
Diperkirakan 40 exabyte akan dibutuhkan untuk menyimpan semua data genom manusia pada tahun 2025. Sebagai referensi, itu 8x lebih banyak penyimpanan daripada yang dibutuhkan untuk menyimpan setiap kata yang diucapkan dalam sejarah.
Banyak pipa analisis genom berjuang untuk mengikuti tingkat ekspansif dari data mentah yang dihasilkan.
Dipercepat Analisis Pengurutan Genom Alur kerja
Analisis pengurutan rumit dan intensif secara komputasi, dengan banyak langkah yang diperlukan untuk mengidentifikasi varian genetik dalam genom manusia.
Pembelajaran mendalam menjadi penting untuk pemanggilan basis tepat di dalam instrumen genom menggunakan model berbasis RNN- dan jaringan saraf convolutional (CNN). Jaringan saraf menginterpretasikan data gambar dan sinyal yang dihasilkan oleh instrumen dan menyimpulkan 3 miliar pasang nukleotida genom manusia. Ini meningkatkan akurasi pembacaan dan memastikan bahwa panggilan dasar terjadi lebih dekat dengan waktu nyata, lebih lanjut mempercepat seluruh alur kerja genomik, dari sampel ke format panggilan varian hingga laporan akhir.
Untuk analisis genomik sekunder, teknologi penyelarasan menggunakan genom referensi untuk membantu menyatukan kembali genom setelah pengurutan fragmen DNA.
BWA-MEM, algoritme terkemuka untuk penyelarasan, membantu peneliti dengan cepat memetakan pembacaan urutan DNA ke genom referensi. STAR adalah algoritme penyelarasan standar emas lainnya yang digunakan untuk data RNA-seq yang memberikan penyelarasan ultra cepat yang akurat untuk lebih memahami ekspresi gen.
Algoritme pemrograman dinamis Smith-Waterman juga banyak digunakan untuk penyelarasan, sebuah langkah yang dipercepat 35x pada GPU NVIDIA H100 Tensor Core, yang menyertakan akselerator pemrograman dinamis.
Mengungkap Varian Genetik
Salah satu tahapan paling kritis dari proyek pengurutan adalah pemanggilan varian, di mana peneliti mengidentifikasi perbedaan antara sampel pasien dan genom referensi. Ini membantu dokter menentukan penyakit genetik apa yang mungkin dimiliki pasien yang sakit kritis, atau membantu peneliti melihat populasi untuk menemukan target obat baru. Varian ini dapat berupa perubahan nukleotida tunggal, penyisipan dan penghapusan kecil, atau penataan ulang yang kompleks.
Penelepon yang dioptimalkan dan dipercepat GPU seperti GATK Broad Institute — perangkat analisis genom untuk pemanggilan varian germline — meningkatkan kecepatan analisis. Untuk membantu peneliti menghapus positif palsu dalam hasil GATK, NVIDIA berkolaborasi dengan Broad Institute untuk memperkenalkan NVScoreVariants, alat pembelajaran mendalam untuk memfilter varian menggunakan CNN.
Pemanggil varian berbasis pembelajaran mendalam seperti DeepVariant Google meningkatkan akurasi panggilan, tanpa memerlukan langkah pemfilteran terpisah. DeepVariant menggunakan arsitektur CNN untuk memanggil varian. Itu dapat dilatih ulang untuk menyempurnakan akurasi yang ditingkatkan dengan output setiap platform genomik.
Perangkat lunak analisis sekunder dalam rangkaian alat NVIDIA Clara Parabricks telah mempercepat penelepon varian ini hingga 80x. Misalnya, runtime germline HaplotypeCaller berkurang dari 16 jam di lingkungan berbasis CPU menjadi kurang dari lima menit dengan Clara Parabricks yang dipercepat GPU.
Mempercepat Gelombang Genomik Berikutnya
NVIDIA membantu mengaktifkan gelombang genomik berikutnya dengan mendukung platform pengurutan bacaan pendek dan panjang dengan panggilan berbasis AI yang dipercepat dan panggilan varian. Para pemimpin industri dan perusahaan rintisan bekerja sama dengan NVIDIA untuk mendorong batas pengurutan seluruh genom.
Misalnya, perusahaan biotek PacBio baru-baru ini mengumumkan sistem Revio, sistem pengurutan lama yang baru yang menampilkan GPU NVIDIA Tensor Core. Diaktifkan oleh peningkatan 20x dalam daya komputasi relatif terhadap sistem sebelumnya, Revio dirancang untuk mengurutkan genom manusia dengan pembacaan panjang akurasi tinggi dalam skala di bawah $1.000.
Oxford Nanopore Technologies menawarkan satu-satunya teknologi tunggal yang dapat mengurutkan fragmen DNA atau RNA dengan panjang berapa pun secara real time. Fitur-fitur ini memungkinkan penemuan variasi genetik yang lebih cepat. Seattle Children’s Hospital baru-baru ini menggunakan instrumen pengurutan nanopori berkemampuan tinggi PromethION untuk memahami kelainan genetik dalam beberapa jam pertama kehidupan bayi baru lahir.
Ultima Genomics menawarkan pengurutan seluruh genom throughput tinggi hanya dengan $100 per sampel, dan Singular Genomics G4 adalah sistem benchtop yang paling kuat.
Belajarlah lagi
Di NVIDIA GTC, konferensi AI gratis yang berlangsung online pada 20-23 Maret, pembicara dari PacBio, Oxford Nanopore, Genomic England, KAUST, Stanford, Argonne National Labs, dan institusi terkemuka lainnya akan berbagi kemajuan AI terbaru dalam pengurutan genomik, analisis, dan genomik model bahasa besar untuk memahami ekspresi gen.
Konferensi ini menghadirkan keynote dari pendiri dan CEO NVIDIA Jensen Huang pada hari Selasa, 21 Maret, pukul 8 pagi PT.
NVIDIA Clara Parabricks gratis untuk pelajar dan peneliti. Mulailah hari ini atau coba lab langsung gratis untuk merasakan toolkit beraksi.
Buat layaknya itu kita http://pctechforum.com/ sedia kan web site ini terhadap para pecinta togel hongkong. Sebab kami tetap membagikan hasil https://liriklagu.biz/ hk tercepat dan juga terakurat alhasil para pemeran tidak butuh menunggu lama pada jam 23. 00 wib. Kemudian, bersama hasil pengeluaran hk yang kita bagikan pada para pemeran sudah pasti hasil itu kita ambil langsung dari web site sah hongkongpools. Karena kita membawa koneksi dari web site hongkongpools https://pengertianmenurutparaahli.com/ dengan tiap pemberitahuan hasil pengeluaran hk udah singgah sampai bagan knowledge hk yang diatas