27 Mei 2026

Menembus Batas Kreativitas dengan Gemini Omni dan Seni Menguasai Perintah AI

Tahun lalu, lewat Nano Banana, kecerdasan Gemini mulai dibawa ke ranah pembuatan dan penyuntingan gambar. Sejak saat itu, jutaan orang terbantu untuk merestorasi foto-foto lama, merancang sesuatu dari sketsa kasar, hingga memvisualisasikan ide dengan cara yang sebelumnya tidak pernah terbayangkan. Sejak awal, kami memang membangun Gemini dengan pondasi multimoda asli (natively multimodal). Kini, saatnya mengambil langkah besar berikutnya.

Kami memperkenalkan Gemini Omni, sebuah ruang di mana kemampuan penalaran Gemini berpadu langsung dengan kekuatan kreasi. Omni merupakan model baru kami yang sanggup menciptakan apa saja dari input apa saja—dan langkah awal ini kami mulai dari video. Lewat Omni, Anda bisa mengombinasikan gambar, audio, video, dan teks sebagai input untuk menghasilkan video berkualitas tinggi yang berpijak pada basis pengetahuan dunia nyata milik Gemini. Menariknya lagi, Anda bisa mengedit video tersebut dengan mudah, cukup lewat obrolan biasa.

Saat ini, kami mulai meluncurkan model pertama dari lini Omni, yaitu Gemini Omni Flash, ke aplikasi Gemini, Google Flow, dan YouTube Shorts. Ke depannya, kami juga akan mendukung modalitas output lain seperti gambar dan audio. Ada beberapa hal yang membuat Omni begitu spesial.

Salah satunya adalah kemampuan menyunting video lewat percakapan. Gemini Omni menawarkan cara yang jauh lebih mudah untuk mengedit video dengan bahasa sehari-hari. Setiap instruksi yang Anda berikan akan saling menyambung dengan perintah sebelumnya. Karakter Anda akan tetap konsisten, hukum fisika di dalamnya tetap terjaga, dan adegan tersebut tetap “ingat” apa yang terjadi sebelumnya. Anda bisa mengubah hal spesifik atau merombak total dunia di sekitar Anda. Video Anda kini menjadi titik awal untuk menciptakan sesuatu yang bahkan tidak akan pernah bisa Anda rekam sendiri.

Omni tidak sekadar membangun adegan yang tampak riil, tetapi juga mampu menalar apa yang seharusnya terjadi selanjutnya. Model ini memadukan pemahaman fisika yang intuitif dengan pengetahuan Gemini tentang sejarah, sains, serta konteks budaya, menjembatani celah antara visual fotorealistis dan penceritaan yang bermakna.

Visual yang dihasilkan pun memiliki akurasi fisika yang lebih baik. Omni memiliki pemahaman intuitif yang telah ditingkatkan terhadap gaya-gaya seperti gravitasi, energi kinetik, hingga dinamika fluida, sehingga Anda bisa menciptakan adegan yang jauh lebih realistis. Selain itu, Anda bisa membuat video dari kombinasi input apa pun. Omni mampu mengubah referensi apa saja—baik itu gambar, teks, video, atau audio—menjadi satu output yang utuh dan padu. Meski di awal baru referensi suara yang didukung untuk input audio, jenis input audio lainnya akan segera kami hadirkan.

Kehadiran teknologi secanggih Gemini Omni, ChatGPT, atau Claude memang membuat alat-alat kecerdasan buatan ini terasa seperti mesin penjual otomatis (vending machine) di tempat kerja modern. Kita tinggal mengetik sesuatu, menekan tombol enter, dan beberapa detik kemudian jawaban yang rapi langsung keluar.

Namun, masalahnya adalah banyak pengguna yang masih memperlakukan chatbot AI ini layaknya mesin pencari biasa, hanya saja dengan tata bahasa yang lebih baik. Imbasnya, hasil yang didapat sering kali berupa rangkuman yang mengambang, saran generik, atau jawaban yang terdengar sangat meyakinkan padahal sebenarnya melenceng dari inti masalah.

Perbedaan antara hasil AI yang biasa-biasa saja dengan hasil yang benar-benar solutif biasanya bermuara pada satu hal: cara kita memberikan perintah atau prompting. Perubahan kecil dalam merumuskan instruksi bisa mendongkrak akurasi, kedalaman, struktur, serta keandalan jawaban di berbagai platform secara drastis. Karena dunia bisnis saat ini semakin bergantung pada AI generatif untuk kebutuhan riset, penulisan, pembuatan kode pemrograman, hingga analisis, kemampuan menyusun prompt telah berevolusi dari yang dulunya sekadar keahlian unik menjadi sebuah literasi wajib di dunia kerja. Berikut adalah beberapa teknik praktis yang terbukti konsisten menghasilkan respons AI yang jauh lebih baik.

Berikan Peran yang Jelas pada AI

Salah satu cara paling mudah untuk meningkatkan kualitas jawaban AI adalah dengan menetapkan peran spesifik kepada model tersebut sebelum mengajukan pertanyaan.

Alih-alih hanya menulis: “Jelaskan tentang zero trust security.”

Cobalah beralih ke format seperti ini: “Bertindaklah sebagai seorang analis keamanan siber yang sedang menjelaskan konsep zero trust security kepada pemilik usaha kecil yang memiliki keterbatasan pengalaman teknis.”

Pemberian peran (role prompting) membantu model AI untuk menyering nada bicara, pilihan kosakata, serta tingkat kedalaman detail. Langkah ini juga efektif mengurangi jawaban-jawaban yang terlalu umum karena AI mendapatkan konteks yang lebih terang mengenai siapa audiensnya dan apa tujuan instruksi tersebut.

Spesifik Mengenai Format Output

Model AI secara bawaan sering kali memberikan jawaban dalam bentuk paragraf panjang lebar, kecuali jika pengguna menentukan strukturnya secara spesifik. Jika target Anda adalah sebuah tabel, daftar periksa (checklist), draf email, kerangka salindia, atau rangkuman poin-poin, katakan saja secara langsung.

Sebagai contoh: “Rangkum artikel ini menjadi lima poin utama untuk audiens sekelas CIO.”

Atau: “Buat tabel perbandingan yang menunjukkan harga, kelebihan, kekurangan, dan skenario penggunaan yang ideal.”

Instruksi format output yang jelas seperti ini akan memangkas waktu Anda untuk merapikan kembali teks yang dihasilkan, sehingga respons tersebut bisa langsung digunakan. Hal ini menjadi sangat berharga di lingkungan kerja di mana tim menggunakan AI untuk memproduksi berbagai dokumen operasional secara cepat.