Aug 25, 2025

MUHAMMAD GHIFARY

Tahun ini saya berkesempatan menghadiri acara Google I/O Connect (https://ioconnectchina.googlecnapps.cn/intl/en_cn/) yang diadakan di Shanghai, China pada tanggal 13 - 14 Agustus 2025. Acara ini merupakan perpanjangan dari Google I/O (konferensi tahunan yang diadakan Google) yang memperkenalkan dan berbagi pengetahuan mengenai teknologi terkini yang dikembangkan Google.

Ada 4 tema besar yang dibahas pada Google I/O Connect kali ini:

Terlihat bahwa tema AI mendominasi Google I/O Connect tahun ini – tema-tema non-AI pun banyak yang berkenaan dengan AI. Sebagai Google Developer Experts (GDE) pada kategori AI, saya jadi agak bingung topik apa saja yang mesti mendapatkan perhatian lebih, karena semuanya menarik 🙂

Terdapat 3 tipe sesi yang diselenggarakan: presentasi keynote ,workshop, dan tech demo, yang dibawakan oleh para ahli dari Google dan juga para pelaku teknologi lain yang bekerjasama dengan Google. Selama 2 hari penuh mengikuti Google I/O Connect, ada 5 hal yang menarik bagi saya untuk dipelajari lebih lanjut:

1. Yang terbaru pada Gemmaverse

Gemma merupakan sekumpulan model lightweight AI open-source yang dikembangkan dengan teknologi yang sama dengan Gemini namun dengan ukuran dan kapasitas yang lebih sederhana. Versi terbaru dari Gemma saat ini yaitu Gemma 3 yang terdiri dari beberapa jenis model: 1B, 4B, 12B, dan 27B, dengan peningkatan performa yang signifikan dibandingkan Gemma 2.

gemmaverse.png

Terdapat pula beberapa varian dari Gemma yang di post-trained / fine-tuned pada domain tertentu yang menghasilkan special-purpose models:

CodeGemma Model untuk membantu pekerjaan koding / pemrograman.
PaliGemma Vision Language Model (VLM) untuk pengolahan dan analisis citra.
RecurrentGemma Model bahasa berdasarkan arsitektur recurrent network Griffin.
ShieldGemma Model yang berfungsi sebagai guardrail / moderasi konten untuk mengevaluasi keamanan atau kepatutan dari suatu konten/
DataGemma Model sebagai alat bantu riset yang dilengkapi konteks berbagai data statistik dari repositori Data Commons.
MedGemma Model multimodal berbasis Gemma 3 yang dilatih dengan teks dan citra medis untuk mengakselerasi pengembangan aplikasi AI di bidang kesehatan.

Kontribusi dari komunitas terhadap Gemma juga semakin berkembang. Telah banyak aplikasi berbasis Gemma yang dikembangkan untuk berbagai use cases, baik di sektor publik maupun privat. Berbagai varian dari Gemma yang dikembangkan komunitas juga semakin banyak, seperti yang dapat ditemui di Hugging Face.

2. Small Language Models dengan Google AI Edge (keynote)

Saat ini cara yang paling mudah untuk memanfaatkan model AI adalah melalui API Cloud. Namun ada kalanya kita membutuhkan solusi AI on-device dengan ukuran model lebih kecil (small foundation models) untuk menjaga privasi data dan kebutuhan mode offline / tanpa koneksi internet.

Sesi ini menjelaskan tentang Google AI Edge, sekumpulan tech stacks yang dapat dimanfaatkan untuk merealisasikan deployment AI on-device. Framework utama yang digunakan adalah MediaPipe dan LiteRT (sebelumnya bernama TFLite). MediaPipe menyediakan low-code API untuk memudahkan pengaturan inferensi berbagai model AI off-the-shelves. LiteRT merupakan lingkungan runtime berkinerja tinggi untuk menjalankan inferensi model AI pada device tujuan secara efisien.

slm.png