TUTUP
SCROLL UNTUK MELANJUTKAN MEMBACA
Gabung di IDN Times

5 Fakta Menarik Llama 3, Model AI Open Source Terbaru dari Meta

Diklaim ungguli GPT-3.5 dan Claude Sonnet

logo perusahaan Meta (unsplash.com/Dima Solomin)

Meta, perusahaan induk Facebook, baru saja meluncurkan generasi terbaru model AI open source mereka yang diberi nama Llama 3. Model ini merupakan penerus dari Llama 2 yang dirilis tahun 2023 lalu dengan berbagai peningkatan kemampuan. Saat ini, Llama 3 tersedia dalam dua varian, yaitu Llama 3 8B dan Llama 3 70B.

Menariknya, Meta mengklaim bahwa Llama 3 merupakan model AI terbaik di kelasnya yang mampu mengungguli model populer seperti GPT-3.5 dari OpenAI serta Claude dari Anthropic. Sifatnya yang open source juga membuat komunitas AI antusias dengan perilisan ini.

1. Unggul dalam berbagai uji kemampuan standar

Dalam dunia AI, kemampuan sebuah model biasanya diukur melalui berbagai uji kemampuan baku yang disebut benchmark. Meta dengan bangga menyatakan bahwa Llama 3 8B, varian dengan 8 miliar parameter, berhasil mengungguli beberapa model lain yang setara, seperti Mistral 7B dan Gemma 7B. Keunggulan Llama 3 8B terlihat di setidaknya 9 benchmark, termasuk MMLU untuk menilai pengetahuan umum, ARC untuk mengukur kemampuan pemecahan masalah, dan DROP untuk menguji pemahaman bacaan.

Lebih mengesankan lagi, Llama 3 70B, varian dengan 70 miliar parameter diklaim mampu bersaing dengan model-model AI terbaik saat ini. Beberapa model tersebut seperti Gemini 1.5 Pro dari Google dan Claude 3 Sonnet dari Anthropic. Bahkan, pada beberapa benchmark seperti MMLU, HumanEval (mengukur kemampuan pemrograman), dan GSM-8K (menguji keterampilan matematika), Llama 3 70B dilaporkan unggul dari kedua model tersebut. Hal menarik lainnya adalah Meta juga mengembangkan serangkaian uji kemampuan mereka sendiri untuk membandingkan performa Llama 3 70B dengan model-model lainnya. Dalam uji ini, Llama 3 70B dilaporkan unggul dalam berbagai tugas, mulai dari pemrograman, penulisan kreatif, hingga meringkas teks.  

Baca Juga: OpenAI Perkenalkan Voice Engine, AI Kloning Suara Super Realistis

2. Kualitas dan kuantitas data latih yang ditingkatkan

perbandingan benchmark Llama 3 dengan model AI lain. (ai.meta.com)

Seperti halnya manusia yang belajar dari pengalaman, kemampuan suatu AI juga sangat dipengaruhi oleh kualitas dan kuantitas data yang digunakan saat proses pelatihan. Dalam pengembangan Llama 3, Meta menggunakan dataset yang jauh lebih besar dibandingkan versi sebelumnya; peningkatan hingga 7 kali lipat. Total data yang digunakan untuk melatih Llama 3 setara dengan 750 miliar kata, suatu jumlah yang luar biasa besar.

Tak hanya dari segi kuantitas, data latih Llama 3 juga lebih beragam. Misalnya, porsi data yang mengandung kode komputer meningkat hingga 4 kali lipat dibandingkan Llama 2. Selain itu, terdapat pula data dalam 30 bahasa selain bahasa Inggris yang mencakup 5 persen dari total data latih. Untuk memastikan Llama 3 belajar dari contoh-contoh terbaik, Meta juga mengembangkan sistem khusus yang dapat menyaring dan memilih data berkualitas tinggi secara otomatis.

3. Arsitektur model dan metode pelatihan yang disempurnakan

hasil tes benchmark Llama 3 400B. (ai.meta.com)

Dalam mengembangkan Llama 3, Meta tidak hanya berfokus pada peningkatan kuantitas data, tetapi juga kualitas arsitektur model dan metode pelatihan. Salah satu inovasi yang diterapkan adalah sistem encoding kata yang lebih efisien untuk mengubah teks menjadi representasi numerik yang dapat diproses oleh AI. Teknik attention, yang berperan dalam menentukan bagian mana dari data yang perlu mendapat perhatian lebih, juga dioptimasi untuk meningkatkan performa Llama 3.

Proses fine-tuning, yaitu pengaturan akhir model AI agar dapat mengikuti instruksi dengan lebih baik, juga mendapatkan sentuhan inovasi. Sejumlah metode mutakhir dipadukan untuk menghasilkan model yang lebih terampil dan fleksibel. Tak hanya dari sisi algoritma, Meta juga mengembangkan hardware dan software yang mendukung proses pelatihan Llama 3. Hasilnya, waktu yang dibutuhkan untuk melatih Llama 3 menjadi 3 kali lebih singkat dibandingkan pendahulunya.

4. Peningkatan sistem keamanan

Seiring dengan meningkatnya kemampuan Llama 3, Meta juga semakin menekankan pentingnya aspek keamanan dan tanggung jawab dalam mengembangkan AI. Untuk mendeteksi konten berbahaya yang mungkin dihasilkan oleh Llama 3, Meta menghadirkan dua perangkat canggih yaitu Llama Guard 2 dan CyberSecEval 2. Kedua perangkat ini juga dapat mengenali potensi celah keamanan siber dalam sistem AI.

Meta tidak hanya fokus pada konten berbahaya, tetapi juga pada kode yang mungkin berdampak negatif. Code Shield adalah perangkat terbaru dari Meta yang berfungsi sebagai filter pintar untuk mengenali dan mencegah kode berbahaya yang dapat dihasilkan oleh Llama 3. Sebagai pelengkap, Meta juga merilis panduan komprehensif bertajuk Responsible Use Guide yang memuat praktik-praktik terbaik dalam menerapkan AI secara etis dan bertanggung jawab.

Verified Writer

Leo Manik

...

IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.

Rekomendasi Artikel

Berita Terkini Lainnya