Google dan Meta memperbarui model AI mereka di tengah munculnya “AlphaChip”

Minggu ini merupakan minggu yang sangat sibuk dalam berita AI berkat OpenAI, termasuk postingan blog kontroversial dari CEO Sam Altman, peluncuran Mode Suara Tingkat Lanjut secara luas, rumor pusat data 5GW, perombakan staf besar, dan rencana restrukturisasi yang dramatis.

Namun dunia AI lainnya tidak melakukan hal yang sama, mereka melakukan hal mereka sendiri dan menghasilkan model serta penelitian AI baru setiap saat. Berikut ringkasan beberapa berita AI penting lainnya dari minggu lalu.

Pembaruan Google Gemini

Pada hari Selasa, Google mengumumkan pembaruan pada jajaran model Gemini, termasuk peluncuran dua model siap produksi baru yang mengulangi rilis sebelumnya: Gemini-1.5-Pro-002 dan Gemini-1.5-Flash-002. Perusahaan melaporkan peningkatan kualitas secara keseluruhan, dengan peningkatan penting dalam matematika, penanganan konteks panjang, dan tugas visi. Google mengklaim peningkatan kinerja sebesar 7 persen pada benchmark MMLU-Pro dan peningkatan sebesar 20 persen dalam tugas-tugas yang berhubungan dengan matematika. Namun seperti yang Anda ketahui, jika Anda sudah lama membaca Ars Technica, biasanya tolok ukur AI tidak berguna seperti yang kita inginkan.

Seiring dengan peningkatan model, Google memperkenalkan pengurangan harga yang signifikan untuk Gemini 1.5 Pro, memotong biaya token masukan sebesar 64 persen dan biaya token keluaran sebesar 52 persen untuk permintaan di bawah 128.000 token. Seperti yang dicatat oleh peneliti AI Simon Willison di blognya, “Sebagai perbandingan, GPT-4o saat ini berharga $5/[million tokens] input dan output $15/m dan Claude 3.5 Sonnet adalah $3/m input dan $15/m output. Gemini 1.5 Pro merupakan model paling murah di antara model-model terdepan dan sekarang bahkan lebih murah lagi.”

Google juga meningkatkan batas kecepatan, dengan Gemini 1.5 Flash kini mendukung 2.000 permintaan per menit dan Gemini 1.5 Pro menangani 1.000 permintaan per menit. Google melaporkan bahwa model terbaru menawarkan kecepatan output dua kali lipat dan latensi tiga kali lebih rendah dibandingkan versi sebelumnya. Perubahan ini mungkin mempermudah dan menghemat biaya bagi pengembang untuk membangun aplikasi dengan Gemini dibandingkan sebelumnya.

Meta meluncurkan Llama 3.2

Pada hari Rabu, Meta mengumumkan peluncuran Llama 3.2, pembaruan signifikan pada jajaran model AI bobot terbuka yang telah kami bahas secara ekstensif di masa lalu. Rilis baru ini mencakup model bahasa besar (LLM) berkemampuan vision dalam ukuran parameter 11 miliar dan 90B, serta model parameter 1B dan 3B hanya teks ringan yang dirancang untuk perangkat edge dan seluler. Meta mengklaim model visi bersaing dengan model sumber tertutup terkemuka dalam tugas pengenalan gambar dan pemahaman visual, sementara model yang lebih kecil dilaporkan mengungguli pesaing berukuran serupa dalam berbagai tugas berbasis teks.

Willison melakukan beberapa eksperimen dengan beberapa model 3.2 yang lebih kecil dan melaporkan hasil yang mengesankan untuk ukuran model tersebut. Peneliti AI Ethan Mollick memamerkan menjalankan Llama 3.2 di iPhone-nya menggunakan aplikasi bernama PocketPal.

Meta juga memperkenalkan distribusi resmi pertama “Llama Stack”, yang dibuat untuk menyederhanakan pengembangan dan penerapan di berbagai lingkungan. Seperti rilis sebelumnya, Meta membuat model tersedia untuk diunduh gratis, dengan batasan lisensi. Model-model baru ini mendukung jendela konteks panjang hingga 128.000 token.

AlphaChip AI Google mempercepat desain chip

Pada hari Kamis, Google DeepMind mengumumkan kemajuan signifikan dalam desain chip elektronik berbasis AI, AlphaChip. Ini dimulai sebagai proyek penelitian pada tahun 2020 dan sekarang menjadi metode pembelajaran penguatan untuk merancang tata letak chip. Google dilaporkan telah menggunakan AlphaChip untuk membuat “tata letak chip manusia super” dalam tiga generasi terakhir Tensor Processing Unit (TPU), yang merupakan chip mirip dengan GPU yang dirancang untuk mempercepat operasi AI. Google mengklaim AlphaChip dapat menghasilkan tata letak chip berkualitas tinggi dalam hitungan jam, dibandingkan dengan upaya manusia yang berminggu-minggu atau berbulan-bulan. (Kabarnya, Nvidia juga telah menggunakan AI untuk membantu merancang chipnya.)

Khususnya, Google juga merilis pos pemeriksaan AlphaChip yang telah dilatih sebelumnya di GitHub, yang membagikan bobot model kepada publik. Perusahaan tersebut melaporkan bahwa dampak AlphaChip telah melampaui Google, dengan perusahaan desain chip seperti MediaTek mengadopsi dan mengembangkan teknologi untuk chip mereka. Menurut Google, AlphaChip telah memicu penelitian baru di bidang AI untuk desain chip, yang berpotensi mengoptimalkan setiap tahap siklus desain chip mulai dari arsitektur komputer hingga manufaktur.

Bukan itu saja yang terjadi, namun ada beberapa hal penting yang terjadi. Dengan industri AI yang tidak menunjukkan tanda-tanda melambat saat ini, kita lihat saja bagaimana perkembangannya minggu depan.

Google dan Meta memperbarui model AI mereka di tengah munculnya “AlphaChip”

Pembaruan Google Gemini

Meta meluncurkan Llama 3.2

AlphaChip AI Google mempercepat desain chip

Leave a Reply Cancel reply

Related Post

Is AI judging the future of gymnastics or just a surveillance tool?Is AI judging the future of gymnastics or just a surveillance tool?

NATO menguji teknologi pesawat nirawak otonom dalam kompetisi bergaya DARPANATO menguji teknologi pesawat nirawak otonom dalam kompetisi bergaya DARPA

Manajemen SaaS dan Penemuan AplikasiManajemen SaaS dan Penemuan Aplikasi