Amazon Web Services Sediakan Layanan untuk Menghemat Biaya Pelatihan AI Generatif

Selasa, 4 Juli 2023 17:58 WIB

Chief Technologist Amazon Web Services (AWS) Olivier Klein menjelaskan tentang AI generatif. Tempo/Nabiila Azzahra A.

TEMPO.CO, Jakarta - Amazon Web Services (AWS) membeberkan cara mengurangi biaya pelatihan model AI generatif dengan layanan baru yang mereka miliki, yaitu Amazon Bedrock, Amazon EC2 Trn1n dan Amazon EC2 Inf2 serta Amazon CodeWhisperer.

AWS merupakan anak perusahaan Amazon yang menyediakan platform komputasi awan dan API sesuai permintaan untuk individu, perusahaan dan pemerintah dengan basis terukur dan pembayaran sesuai pemakaian. Kepala Teknolog AWS Olivier Klein memperkenalkan tiga layanan AI generatif ini dalam acara media briefing pada Senin, 3 Juli 2023 di Jakarta.

Olivier menjelaskan layanan Amazon Bedrock dapat memberikan cara mudah untuk menskalakan aplikasi AI generatif dengan foundational models (FM) atau model dasar yang telah dilatih sebelumnya. Dengan layanan ini, AWS memberikan model yang dapat digunakan pelanggan dalam cloud pribadi masing-masing dan melatihnya secara aman dengan data mereka. Ini menjadi cara mudah untuk membuat berbagai aplikasi AI generatif berbeda.

“Bedrock menjadi platform yang memungkinkan kita untuk mempunyai berbagai macam model dasar,” kata Olivier. “Pelanggan sekarang dapat menggunakannya dengan cepat tanpa pelatihan apa pun, hanya perlu menyempurnakannya sesuai dengan perusahaan masing-masing."

Selain Bedrock, Olivier memaparkan bagaimana AWS dapat membantu pelanggan mengurangi biaya melatih dan menjalankan model machine learning atau pembelajaran mesin, yaitu dengan Amazon EC2 Trn1n dan Amazon EC2 Inf2. “Karena model ini sangat besar, kami ingin melihat bagaimana bisa melakukannya dengan biaya yang efektif dan hemat energi,” kata dia.

Advertising
Advertising

Amazon EC2 Trn1n dan Amazon EC2 Inf2 atau lebih spesifik AWS Trainium dan AWS Inferentia, disebut sebagai chipset khusus yang diproduksi oleh AWS. Chipset khusus ini ditawarkan oleh AWS kepada pelanggan sebagai tambahan dari chipset lain yang beredar di pasaran.

Mereka dirancang khusus untuk menurunkan biaya menjalankan model AI, khususnya model AI generatif, dalam hal membuat prediksi. AWS Inferentia memiliki biaya per inferensi terendah di cloud untuk menjalankan model deep learning (DL), hingga 70 persen lebih rendah daripada instans Amazon EC2 lain yang sebanding.

Adapun iterasi kedua Inferentia yaitu AWS Inferentia2 dapat memberikan performa tinggi dengan biaya per inferensi terendah untuk large language models (LLM) dan model difusi mencapai 40 persen performa harga lebih baik dibandingkan instans Amazon EC2 lain. Sedangkan, Amazon Trainium menawarkan pelatihan LLM dan model difusi yang paling hemat biaya dan berkinerja tinggi, menghemat hingga 50 persen untuk biaya pelatihan.

“Jadi, dengan kami terus melakukan ini, pelanggan dapat menurunkan biaya pelatihan dan proses inference, juga mengurangi konsumsi energi yang dibutuhkan untuk pelatihan dan menjalankan model AI,” ujar Olivier.

Masih dalam upaya membuat penggunaan AI generatif lebih efektif, AWS juga memiliki CodeWhisperer, yaitu pendamping dalam proses coding. Pelanggan dapat menggunakan bahasa pemrograman Nitro yang kemudian akan diterjemahkan oleh CodeWhisperer ke dalam berbagai variasi.

Keunggulan dari CodeWhisperer adalah dapat menghasilkan saran kode secara real time, memindai kode untuk kerentanan yang sulit ditemukan dan menandai kode yang menyerupai data pelatihan open-source untuk kemudian disaring secara otomatis. Dalam sebuah tantangan yang dilakukan oleh Amazon selama masa pratinjau, hasil menunjukkan bahwa peserta yang menggunakan CodeWhisperer 27 persen lebih mungkin menyelesaikan tugas dengan sukses.

Selain tingkat kesuksesan, peserta melakukan tugas rata-rata 57 persen lebih cepat daripada mereka yang tidak menggunakan CodeWhisperer. “Menurut saya, ini cara yang baik untuk menjadi lebih efektif,” kata Olivier.

Pilihan Editor: Apa Dampak AI Generatif seperti ChatGPT terhadap Lingkungan?

Berita terkait

Bos Microsoft Ungkap Rencana Investasi AI dan Cloud Senilai Rp 27,6 Triliun di Indonesia, Ini Rinciannya

11 hari lalu

Bos Microsoft Ungkap Rencana Investasi AI dan Cloud Senilai Rp 27,6 Triliun di Indonesia, Ini Rinciannya

CEO Microsoft, Satya Nadella, membeberkan rencana investasi perusahaannya di Indonesia. Tak hanya untuk pengembangan infrastruktur AI dan cloud.

Baca Selengkapnya

Next Stop Paris, Film Romantis Hasil Kecanggihan AI

24 hari lalu

Next Stop Paris, Film Romantis Hasil Kecanggihan AI

Produsen TV asal Cina, TCL, mengembangkan film romantis berbasis AI generatif.

Baca Selengkapnya

Microsoft Gelontorkan Dana Jumbo ke Sejumlah Negara, Demi Bisnis AI Generatif Hingga Cloud

29 hari lalu

Microsoft Gelontorkan Dana Jumbo ke Sejumlah Negara, Demi Bisnis AI Generatif Hingga Cloud

Microsoft mengasup investasi jumbo ke sejumlah negara untuk pengembangan teknologi mutakhir, seperti AI generatif dan cloud.

Baca Selengkapnya

Aturan untuk Pengembangan AI di Jepang Makin Dipertimbangkan

49 hari lalu

Aturan untuk Pengembangan AI di Jepang Makin Dipertimbangkan

Pemerintah Jepang mempertimbangkan penerapan peraturan yang mengikat secara hukum bagi pengembang sistem kecerdasan buatan atau AI berskala besar

Baca Selengkapnya

Pakar Antimonopoli Sebut Rencana Google AI di iPhone Akan Bermasalah

52 hari lalu

Pakar Antimonopoli Sebut Rencana Google AI di iPhone Akan Bermasalah

Google sudah berada di bawah pengawasan karena membayar miliaran dolar kepada Apple untuk menjadi penyedia pencarian default.

Baca Selengkapnya

Banjir Peminat, Kelas Pelatihan AI Coursera Diikuti 1,6 Juta Peserta dari Indonesia

53 hari lalu

Banjir Peminat, Kelas Pelatihan AI Coursera Diikuti 1,6 Juta Peserta dari Indonesia

Jumlah peserta kelas daring Cousera meningkat di Indonesia, maupun secara global. Menawarkan pelatihan AI dengan bahasa yang mudah dipahami.

Baca Selengkapnya

Deretan Polemik Sirekap, Pengakuan KPU Kerja Sama dengan Alibaba Cloud hingga Kejanggalan Server

55 hari lalu

Deretan Polemik Sirekap, Pengakuan KPU Kerja Sama dengan Alibaba Cloud hingga Kejanggalan Server

KPU mengakui pengadaan dan kontrak komputasi awan atau cloud untuk Sirekap yang digunakan selama Pemilu 2024

Baca Selengkapnya

NVIDIA Digugat 3 Penulis, Dituding AI Perusahaan Teknologi Ini Melanggar Hak Cipta

59 hari lalu

NVIDIA Digugat 3 Penulis, Dituding AI Perusahaan Teknologi Ini Melanggar Hak Cipta

NVIDIA -perusahaan teknologi Amerika- menghadapi gugatan hukum dugaan pelanggaran hak cipta

Baca Selengkapnya

App Mall, Toko Aplikasi yang Disiapkan Google untuk Chromebook

4 Maret 2024

App Mall, Toko Aplikasi yang Disiapkan Google untuk Chromebook

Google siapkan App Mall untuk perangkat Chromebook. Upaya mengatasi navigasi aplikasi lintas browser yang sering membingungkan pengguna.

Baca Selengkapnya

Saingi ChatGPT, Baidu Integrasikan AI ke Ponsel Lenovo

11 Februari 2024

Saingi ChatGPT, Baidu Integrasikan AI ke Ponsel Lenovo

Selain bermitra dengan Lenovo, Baidu sudah lebih dulu menjalin kerja sama serupa dengan Samsung dan Honor.

Baca Selengkapnya