Scroll ke bawah untuk membaca berita

Logo
Digital

Google Luncurkan Model AI Gemini untuk Mengalahkan GPT-4

Gemini adalah lompatan besar dalam model AI yang pada akhirnya akan mempengaruhi hampir semua produk Google.

7 Desember 2023 | 21.02 WIB

Logo Google. REUTERS
Perbesar
Logo Google. REUTERS

Baca berita dengan sedikit iklan, klik disini

Logo

TEMPO.CO, Jakarta - Gemini adalah model bahasa besar terbaru Google, yang pertama kali diperkenalkan oleh CEO Sundar Pichai pada konferensi pengembang I/O pada bulan Juni dan sekarang diluncurkan ke publik. “Ini adalah awal dari era baru AI di Google, era Gemini,” kata Pichai sebagaiman dikutip The Verge, 6 Desember 2023.

Baca berita dengan sedikit iklan, klik disini

Logo

Dari penjelasan Pichai dan CEO Google DeepMind Demis Hassabis, Gemini adalah lompatan besar dalam model AI yang pada akhirnya akan mempengaruhi hampir semua produk Google. “Salah satu hal hebat mengenai momen ini,” kata Pichai, “adalah Anda dapat mengerjakan satu teknologi dasar dan menjadikannya lebih baik dan teknologi tersebut langsung diterapkan ke seluruh produk kami.”

Baca berita dengan sedikit iklan, klik di sini

Gemini lebih dari satu model AI. Ada versi yang lebih ringan bernama Gemini Nano yang dimaksudkan untuk dijalankan secara offline di perangkat Android. Ada versi yang lebih canggih bernama Gemini Pro yang akan segera mendukung banyak layanan AI Google dan menjadi tulang punggung Bard mulai hari ini.

Dan ada model yang lebih mumpuni bernama Gemini Ultra yang merupakan LLM terkuat yang pernah dibuat Google dan tampaknya sebagian besar dirancang untuk pusat data dan aplikasi perusahaan.

Google saat ini meluncurkan model tersebut dalam beberapa cara. Bard kini ditenagai oleh Gemini Pro, dan pengguna Pixel 8 Pro akan mendapatkan beberapa fitur baru berkat Gemini Nano. Gemini Ultra akan hadir tahun depan. Pengembang dan pelanggan perusahaan akan dapat mengakses Gemini Pro melalui Google Generative AI Studio atau Vertex AI di Google Cloud mulai tanggal 13 Desember.

Gemini hanya tersedia dalam bahasa Inggris untuk saat ini, dan bahasa lain akan segera hadir. Namun Pichai mengatakan model tersebut pada akhirnya akan diintegrasikan ke dalam mesin pencari Google, produk iklannya, browser Chrome, dan banyak lagi, di seluruh dunia. Ini adalah masa depan Google, dan ini bukanlah momen yang terlalu cepat.

OpenAI meluncurkan ChatGPT setahun yang lalu, dan perusahaan serta produknya segera menjadi hal terbesar dalam AI. Kini, Google -- perusahaan yang menciptakan sebagian besar teknologi dasar di balik booming AI saat ini -- akhirnya siap untuk melawan.

“Kami telah melakukan analisis yang sangat menyeluruh terhadap sistem secara berdampingan, dan benchmarkingnya,” kata Hassabis. Google menjalankan 32 tolok ukur mapan yang membandingkan kedua model tersebut, mulai dari pengujian keseluruhan yang luas seperti tolok ukur Pemahaman Bahasa Multi-tugas hingga pengujian yang membandingkan kemampuan dua model dalam menghasilkan kode Python.

“Saya pikir kami jauh unggul dalam 30 dari 32 tolok ukur tersebut," kata Hassabis, dengan sedikit senyuman di wajahnya. “Beberapa di antaranya sangat sempit. Beberapa di antaranya berukuran lebih besar.”

Dalam tolok ukur tersebut (yang sebagian besar sangat mendekati), keunggulan Gemini yang paling jelas berasal dari kemampuannya memahami dan berinteraksi dengan video dan audio. Hal ini memang disengaja. Multimodalitas telah menjadi bagian dari rencana Gemini sejak awal.

Google belum melatih model terpisah untuk gambar dan suara, seperti cara OpenAI membuat DALL-E dan Whisper. Ia membangun satu model multisensori sejak awal. “Kami selalu tertarik pada sistem yang sangat umum,” kata Hassabis. Dia sangat tertarik pada cara memadukan semua cara tersebut, mengumpulkan data sebanyak mungkin dari sejumlah masukan dan indra, lalu memberikan tanggapan dengan variasi yang sama banyaknya.

Saat ini, model Gemini yang paling dasar adalah teks masuk dan teks keluar, namun model yang lebih canggih seperti Gemini Ultra dapat bekerja dengan gambar, video, dan audio. "Hal ini akan menjadi lebih umum dari itu,” kata Hassabis. “Masih ada hal-hal seperti aksi dan sentuhan – lebih mirip hal-hal yang bersifat robotik.”

Seiring berjalannya waktu, katanya, Gemini akan lebih peka, menjadi lebih sadar, dan menjadi lebih akurat serta membumi dalam prosesnya. “Model-model ini lebih memahami dunia di sekitar mereka.” Model-model ini tentu saja masih berhalusinasi dan masih memiliki bias serta masalah lainnya. Namun semakin banyak yang mereka ketahui, kata Hassabis, semakin baik pula manfaatnya.

Selalu update info terkini. Simak breaking news dan berita pilihan dari Tempo.co di kanal Telegram “Tempo.co Update”. Klik https://t.me/tempodotcoupdate untuk bergabung. Anda perlu meng-install aplikasi Telegram terlebih dahulu.

Erwin Prima

Erwin Prima

close

Baca berita dengan sedikit iklan, klik disini

Logo
Logo Tempo
Unduh aplikasi Tempo
download tempo from appstoredownload tempo from playstore
Ikuti Media Sosial Kami
© 2024 Tempo - Hak Cipta Dilindungi Hukum
Beranda Harian Mingguan Tempo Plus