Meta Luncurkan Llama 3.1, Model AI Open Source Tercanggih di Dunia
Meta merilis varian Llama 3.1 dengan 405 miliar parameter
Follow IDN Times untuk mendapatkan informasi terkini. Klik untuk follow WhatsApp Channel & Google News
Meta kembali menggemparkan dunia kecerdasan buatan (AI) dengan meluncurkan Llama 3.1, serangkaian model AI open source yang diklaim tercanggih hingga saat ini. Keluarga Llama 3.1 hadir dalam tiga varian, yakni 8B, 70B, dan yang terbesar, 405B. Dengan kemampuan yang diklaim menyaingi bahkan melampaui model-model AI terkemuka seperti GPT-4o dari OpenAI dan Claude 3.5 Sonnet dari Anthropic, Llama 3.1 menandai era baru dalam perkembangan AI open source.
Langkah berani Meta ini berpotensi mengubah lanskap AI global secara signifikan. Llama 3.1 menjanjikan akses yang lebih luas terhadap teknologi AI canggih bagi para pengembang dan peneliti di seluruh dunia. Mau tahu informasi lebih lanjut dari Meta luncurkan Llama 3.1? Berikut penjelasan terkait kemampuan, fitur dan manfaat dari Llama 3.1 besutan Meta ini!
1. Llama 3.1 405B jadi raksasa AI open source
Llama 3.1 405B menjadi sorotan utama dalam peluncuran ini sebagai model AI open source terbesar yang pernah ada. Melansir dari blog resmi Meta, dengan 405 miliar parameter, model ini dilatih menggunakan lebih dari 16.000 GPU Nvidia H100. Ini merupakan sebuah investasi yang luar biasa dalam sumber daya komputasi. Dataset pelatihannya mencapai 15 triliun token, setara dengan sekitar 750 miliar kata dan mencakup data hingga tahun 2024.
Kemampuan Llama 3.1 405B sungguh mengesankan dengan jendela konteks 128.000 token, setara dengan buku setebal 50 halaman. Ini memungkinkan model untuk memahami dan mengolah teks yang sangat panjang, membuka peluang baru dalam analisis dokumen dan percakapan kompleks. Model ini mendukung delapan bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai, menjadikannya alat yang sangat berguna untuk komunikasi lintas budaya dan analisis teks multibahasa.
Dalam hal performa, Meta mengklaim bahwa Llama 3.1 405B mengungguli GPT-4 dalam beberapa benchmark dan menunjukkan "hasil campuran" dibandingkan dengan GPT-4o dan Claude 3.5 Sonnet. Secara spesifik, model ini lebih unggul dalam eksekusi kode dan pembuatan plot dibandingkan GPT-4o, meskipun kemampuan multibahasanya secara keseluruhan lebih lemah. Dibandingkan dengan Claude 3.5 Sonnet, Llama 3.1 405B masih tertinggal dalam pemrograman dan penalaran umum.
Llama 3.1 405B juga dilengkapi dengan kemampuan menggunakan alat pihak ketiga. Model ini dapat memanfaatkan Brave Search untuk menjawab pertanyaan tentang peristiwa terkini, API Wolfram Alpha untuk query terkait matematika dan sains, serta interpreter Python untuk memvalidasi kode. Kemampuan ini membuat Llama 3.1 405B menjadi alat yang sangat serbaguna untuk berbagai aplikasi AI.
Meskipun sangat kuat, Llama 3.1 405B memiliki kebutuhan sumber daya yang besar. Meta merekomendasikan penggunaan setidaknya satu node server untuk menjalankan model ini, yang mungkin menjadi pertimbangan bagi pengembang atau perusahaan yang ingin menggunakannya secara langsung. Namun, Meta mengklaim bahwa biaya operasional Llama 3.1 405B hanya sekitar setengah dari GPT-4o milik OpenAI, menjadikannya pilihan yang lebih ekonomis untuk aplikasi skala besar.
Baca Juga: OpenAI Perkenalkan SearchGPT, Siap Bersaing dengan Google
IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.