Alibaba Cloud Buka Sumber Kode Model LLM Berparameter 7 Miliar

Reporter

Editor

Erwin Prima

Selasa, 8 Agustus 2023 16:18 WIB

Logo Alibaba Cloud (Alibaba Cloud)

TEMPO.CO, Jakarta - Alibaba Cloud mengumumkan kontribusi terbarunya terhadap komunitas sumber terbuka (open-source) dengan membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar, yaitu Qwen-7B dan Qwen-7B-Chat, melalui komunitas model kecerdasan buatan ModelScope, dan platform kolaboratif kecerdasan buatan Hugging Face.

Sebelumnya, Alibaba Cloud memperkenalkan LLM miliknya, Tongyi Qianwen, pada bulan April di awal tahun ini. Model canggih ini mampu menghasilkan konten mirip manusia dalam bahasa Mandarin dan Inggris, dengan berbagai ukuran model, termasuk model dengan parameter tujuh miliar atau lebih.

Dalam upaya demokratisasi teknologi AI, kode model, bobot model, dan dokumentasi akan dapat diakses secara bebas oleh kalangan akademisi, peneliti, dan lembaga komersial di seluruh dunia. Untuk penggunaan komersial, model-model tersebut akan dapat digunakan secara gratis oleh perusahaan-perusahaan dengan jumlah pengguna aktif bulanan kurang dari 100 juta. Program-program dengan jumlah pengguna lebih banyak dapat meminta lisensi dari Alibaba Cloud.

"Dengan menyediakan sumber terbuka untuk model bahasa besar eksklusif kami, kami ingin mempromosikan teknologi inklusif dan memungkinkan lebih banyak developer dan UMKM untuk mendapatkan manfaat dari AI generatif," kata Jingren Zhou, CTO Alibaba Cloud Intelligence, dalam keterangannya, Selasa, 8 Agustus 2023.

"Sebagai pendukung dengan komitmen jangka panjang terhadap inisiatif sumber terbuka, kami berharap pendekatan terbuka ini juga dapat membawa kebijaksanaan kolektif untuk lebih membantu berkembangnya komunitas sumber terbuka," tambahnya.

Model Qwen-7B telah dilatih sebelumnya pada lebih dari 2 triliun token, termasuk materi berbahasa Mandarin, Inggris, dan multibahasa lainnya, kode, serta matematika, mencakup bidang umum dan profesional. Panjang konteksnya mencapai 8K.

Selama pelatihan, model Qwen-7B-Chat diselaraskan dengan instruksi manusia. Baik model Qwen-7B maupun Qwen-7B-Chat dapat diimplementasikan pada infrastruktur cloud dan lokal. Hal ini memungkinkan pengguna untuk melakukan penyesuaian ulang terhadap model dan membangun model generatif berkualitas tinggi mereka sendiri secara efektif dan dengan biaya yang efisien.

Model pra-pelatihan Qwen-7B, berhasil mencetak skor tertinggi dalam uji benchmark Massive Multi-task Language Understanding (MMLU), dengan mencetak skor 56,7, mengungguli model open-source yang sudah ada dengan skala yang serupa atau bahkan beberapa model yang lebih besar.

Advertising

Uji benchmark ini mengevaluasi akurasi dari model teks multitugas dalam 57 tugas yang beragam, mencakup bidang-bidang seperti matematika dasar, ilmu komputer, dan hukum. Selain itu, Qwen-7B meraih skor tertinggi di antara model-model lainnya dengan parameter yang setara dalam leaderboard C-Eval, suatu rangkaian evaluasi komprehensif untuk model-model dasar dalam bahasa Mandarin. Ini mencakup 52 subjek dalam empat spesialisasi utama, termasuk humaniora, ilmu sosial, STEM, dan lainnya. Selain itu, Qwen-7B mencapai kinerja tinggi pada uji benchmark matematika dan pembuatan kode, seperti GSM8K dan HumanEval.

Pada bulan Juli, Alibaba Cloud juga memperkenalkan penghasil gambar AI-nya, Tongyi Wanxiang, yang dirancang untuk mendukung developer dan UKM dalam mengembangkan gambar kreatif mereka.

Alibaba Cloud juga mengungkapkan ModelScopeGPT, kerangka serbaguna yang dirancang untuk membantu pengguna dalam melakukan tugas-tugas AI yang kompleks dan khusus di berbagai bidang bahasa, visi, dan ucapan dengan memanfaatkan berbagai model AI di ModelScope. Diluncurkan oleh Alibaba Cloud tahun lalu, ModelScope adalah komunitas model AI sumber terbuka yang saat ini memiliki lebih dari 1.000 model AI yang disumbangkan oleh 20 institut AI terkemuka.

Selalu update info terkini. Simak breaking news dan berita pilihan dari Tempo.co di kanal Telegram “Tempo.co Update”. Klik https://t.me/tempodotcoupdate untuk bergabung. Anda perlu meng-install aplikasi Telegram terlebih dahulu.