Alibaba Cloud Buka Sumber Kode Model LLM Berparameter 7 Miliar

Reporter

Editor

Erwin Prima

Selasa, 8 Agustus 2023 16:18 WIB

Logo Alibaba Cloud (Alibaba Cloud)

TEMPO.CO, Jakarta - Alibaba Cloud mengumumkan kontribusi terbarunya terhadap komunitas sumber terbuka (open-source) dengan membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar, yaitu Qwen-7B dan Qwen-7B-Chat, melalui komunitas model kecerdasan buatan ModelScope, dan platform kolaboratif kecerdasan buatan Hugging Face.

Sebelumnya, Alibaba Cloud memperkenalkan LLM miliknya, Tongyi Qianwen, pada bulan April di awal tahun ini. Model canggih ini mampu menghasilkan konten mirip manusia dalam bahasa Mandarin dan Inggris, dengan berbagai ukuran model, termasuk model dengan parameter tujuh miliar atau lebih.

Dalam upaya demokratisasi teknologi AI, kode model, bobot model, dan dokumentasi akan dapat diakses secara bebas oleh kalangan akademisi, peneliti, dan lembaga komersial di seluruh dunia. Untuk penggunaan komersial, model-model tersebut akan dapat digunakan secara gratis oleh perusahaan-perusahaan dengan jumlah pengguna aktif bulanan kurang dari 100 juta. Program-program dengan jumlah pengguna lebih banyak dapat meminta lisensi dari Alibaba Cloud.

"Dengan menyediakan sumber terbuka untuk model bahasa besar eksklusif kami, kami ingin mempromosikan teknologi inklusif dan memungkinkan lebih banyak developer dan UMKM untuk mendapatkan manfaat dari AI generatif," kata Jingren Zhou, CTO Alibaba Cloud Intelligence, dalam keterangannya, Selasa, 8 Agustus 2023.

"Sebagai pendukung dengan komitmen jangka panjang terhadap inisiatif sumber terbuka, kami berharap pendekatan terbuka ini juga dapat membawa kebijaksanaan kolektif untuk lebih membantu berkembangnya komunitas sumber terbuka," tambahnya.

Model Qwen-7B telah dilatih sebelumnya pada lebih dari 2 triliun token, termasuk materi berbahasa Mandarin, Inggris, dan multibahasa lainnya, kode, serta matematika, mencakup bidang umum dan profesional. Panjang konteksnya mencapai 8K.

Selama pelatihan, model Qwen-7B-Chat diselaraskan dengan instruksi manusia. Baik model Qwen-7B maupun Qwen-7B-Chat dapat diimplementasikan pada infrastruktur cloud dan lokal. Hal ini memungkinkan pengguna untuk melakukan penyesuaian ulang terhadap model dan membangun model generatif berkualitas tinggi mereka sendiri secara efektif dan dengan biaya yang efisien.

Model pra-pelatihan Qwen-7B, berhasil mencetak skor tertinggi dalam uji benchmark Massive Multi-task Language Understanding (MMLU), dengan mencetak skor 56,7, mengungguli model open-source yang sudah ada dengan skala yang serupa atau bahkan beberapa model yang lebih besar.

Advertising
Advertising

Uji benchmark ini mengevaluasi akurasi dari model teks multitugas dalam 57 tugas yang beragam, mencakup bidang-bidang seperti matematika dasar, ilmu komputer, dan hukum. Selain itu, Qwen-7B meraih skor tertinggi di antara model-model lainnya dengan parameter yang setara dalam leaderboard C-Eval, suatu rangkaian evaluasi komprehensif untuk model-model dasar dalam bahasa Mandarin. Ini mencakup 52 subjek dalam empat spesialisasi utama, termasuk humaniora, ilmu sosial, STEM, dan lainnya. Selain itu, Qwen-7B mencapai kinerja tinggi pada uji benchmark matematika dan pembuatan kode, seperti GSM8K dan HumanEval.

Pada bulan Juli, Alibaba Cloud juga memperkenalkan penghasil gambar AI-nya, Tongyi Wanxiang, yang dirancang untuk mendukung developer dan UKM dalam mengembangkan gambar kreatif mereka.

Alibaba Cloud juga mengungkapkan ModelScopeGPT, kerangka serbaguna yang dirancang untuk membantu pengguna dalam melakukan tugas-tugas AI yang kompleks dan khusus di berbagai bidang bahasa, visi, dan ucapan dengan memanfaatkan berbagai model AI di ModelScope. Diluncurkan oleh Alibaba Cloud tahun lalu, ModelScope adalah komunitas model AI sumber terbuka yang saat ini memiliki lebih dari 1.000 model AI yang disumbangkan oleh 20 institut AI terkemuka.

Selalu update info terkini. Simak breaking news dan berita pilihan dari Tempo.co di kanal Telegram “Tempo.co Update”. Klik https://t.me/tempodotcoupdate untuk bergabung. Anda perlu meng-install aplikasi Telegram terlebih dahulu.

Berita terkait

Kementerian PUPR Manfatkan AI untuk Bangun Infrastruktur Jalan di IKN

12 jam lalu

Kementerian PUPR Manfatkan AI untuk Bangun Infrastruktur Jalan di IKN

Menurut Kementerian PUPR pemanfaatan AI digunakan untuk membangun dan mempermudah proses konstruksi infrastruktur jalan di IKN

Baca Selengkapnya

OpenAI Meluncurkan GPT4o, Mengenal Model AI Baru Ini

1 hari lalu

OpenAI Meluncurkan GPT4o, Mengenal Model AI Baru Ini

OpenAI mengumumkan peluncuran model kecerdasan buatan generatif baru bernama GPT-4o

Baca Selengkapnya

Dampak Teknologi AI, Bisa Tahan dan Serang Pengguna Teknologi dalam Waktu Bersamaan

1 hari lalu

Dampak Teknologi AI, Bisa Tahan dan Serang Pengguna Teknologi dalam Waktu Bersamaan

Teknologi AI yang berkembang bisa membawa dampak negatif dan positif.

Baca Selengkapnya

OpenAI Luncurkan GPT-4o, Model AI yang Lebih Pintar Merespons Perintah Suara

2 hari lalu

OpenAI Luncurkan GPT-4o, Model AI yang Lebih Pintar Merespons Perintah Suara

Model ChatGPT terbaru, GPT-4o lebih handarl merespons perintah dari pengguna., terutama yang berupa input suara.

Baca Selengkapnya

Bersaing Membuat Film Pendek dengan AI, Mengenal Cinema Synthetica

2 hari lalu

Bersaing Membuat Film Pendek dengan AI, Mengenal Cinema Synthetica

Kompetisi Cinema Synthetica menantang para sineas muda untuk membuat film pendek menggunakan kecerdasan buatan atau AI

Baca Selengkapnya

Dibanderol Hingga Rp 75 Juta, Begini Spesifikasi Laptop Gaming Terbaru Asus

2 hari lalu

Dibanderol Hingga Rp 75 Juta, Begini Spesifikasi Laptop Gaming Terbaru Asus

Laptop AsusROG Strix Scar 18 (G834JYR) yang rilis pada awal 2024 diklaim memiliki performa lengkap. Masuk segmen laptop premium seharga Rp 75 juta.

Baca Selengkapnya

Temuan Peneliti MIT Mengklaim AI Telah Mempelajari Cara Menipu Manusia

3 hari lalu

Temuan Peneliti MIT Mengklaim AI Telah Mempelajari Cara Menipu Manusia

Kemampuan sistem AI ini dapat melakukan hal-hal seperti membodohi pemain game online atau melewati captcha.

Baca Selengkapnya

Survei Microsoft dan LinkedIn: Perusahaan Lebih Tertarik pada Karyawan dengan Keterampilan AI

3 hari lalu

Survei Microsoft dan LinkedIn: Perusahaan Lebih Tertarik pada Karyawan dengan Keterampilan AI

Penelitian Microsoft dan LinkedIn membuktikan korporasi kini lebih menginginkan pekerja dengan kemampuan AI. Budaya AI terus berkembang di kantoran.

Baca Selengkapnya

Serba-serbi Wonderland yang akan Tayang 5 Juni 2024

5 hari lalu

Serba-serbi Wonderland yang akan Tayang 5 Juni 2024

Setelah pertama kali diumumkan pada 2020, jadwal tayang film Wonderland garapan sutradara Kim Tae Yon akhirnya rilis

Baca Selengkapnya

Seberapa Bergantung China Terhadap Teknologi Kecerdasan Buatan Amerika Serikat?

6 hari lalu

Seberapa Bergantung China Terhadap Teknologi Kecerdasan Buatan Amerika Serikat?

Langkah Departemen Perdagangan AS ditujukan untuk mengekspor model kecerdasan buatan atau AI berpemilik ataukah sumber tertutup?

Baca Selengkapnya