Google Rilis AI yang Bisa Edit Foto dengan Prompt Teks

- Gemini 2.5 Flash Image adalah AI dari Google DeepMind yang memungkinkan pengguna mengedit gambar melalui perintah teks, bukan proses kaku.
- Model ini memiliki kemampuan menjaga konsistensi karakter dan gaya artistik, serta fusi multi-gambar cerdas, meskipun masih perlu disempurnakan.
- Pengguna dapat mencoba model ini melalui aplikasi Gemini, Adobe Firefly, atau platform industri kreatif lainnya, serta akses teknis untuk pengembang dan perusahaan.
Di tengah riuhnya perkembangan kecerdasan buatan (AI), muncul sebuah nama unik yang sempat menjadi buah bibir di kalangan penggiat teknologi: "nano-banana". Nama alias ini ternyata milik jagoan baru Google, Gemini 2.5 Flash Image, sebuah model AI yang dirilis dalam versi preview pada 26 Agustus 2025. Kehadirannya bukan sekadar menambah daftar panjang AI pembuat gambar yang sudah ada.
Google rilis AI yang bisa edit foto dengan prompt teks yang mengubah cara kita berinteraksi pada gambar. Lupakan proses kaku dan berulang-ulang dalam mengedit foto. Gemini 2.5 Flash Image menawarkan sebuah alur kerja yang mirip kolaborasi kreatif antara manusia dan mesin. Yuk, kenali lebih dekat Gemini 2.5 Flash Image dari Google ini!
1. Mengedit gambar semudah mengobrol
Gemini 2.5 Flash Image adalah model AI dari Google DeepMind yang dirancang untuk memahami, membuat, dan memanipulasi gambar secara native. Sederhananya, kemampuan visual bukanlah fitur tempelan, melainkan bagian dari arsitekturnya. Hal ini memungkinkannya untuk tidak hanya melihat gambar sebagai kumpulan piksel, tetapi juga memahami konteks di dalamnya, bahkan dari sketsa tangan sekalipun, dilansir website DeepMind.
Inovasi paling menarik yang dibawanya adalah konsep "editing konversasional". Pengguna bisa menyempurnakan gambar melalui serangkaian perintah sederhana, layaknya sedang memberi arahan pada seorang desainer. Proses ini mengubah alur kerja yang kaku menjadi sebuah dialog kreatif yang lebih intuitif dan dinamis.
Misalnya, setelah mengunggah foto seekor kucing di taman, kamu bisa memulai percakapan seperti ini:
Prompt 1: "Ubah kucing ini menjadi astronot."
Prompt 2: "Sekarang, tempatkan dia di luar angkasa dengan latar belakang planet-planet."
Prompt 3: "Tambahkan helm di kepalanya dan buat seolah dia sedang melayang."
Sebagai bagian dari komitmen terhadap AI yang bertanggung jawab, Google juga menyematkan watermark tak kasat mata bernama SynthID. Teknologi ini berfungsi sebagai penanda bahwa sebuah gambar merupakan hasil kreasi AI. Tujuannya adalah untuk meningkatkan transparansi di era konten digital yang semakin canggih.
2. Kemampuan dan kekurangannya

Gemini 2.5 Flash memiliki kemampuan yang sangat baik dalam menjaga konsistensi karakter. Model ini dapat mempertahankan identitas visual sebuah subjek, baik itu manusia, hewan peliharaan, atau produk, di berbagai adegan dan gaya. Fitur ini bisa sangat membantu para profesional di bidang pemasaran dan periklanan yang sering kali harus membuat satu set gambar kampanye yang seragam.
Konsistensi ini tidak hanya berlaku pada subjek, tetapi juga pada gaya artistik. Pengguna bisa memastikan nuansa visual yang koheren di seluruh gambar yang dibuat, menjaga identitas sebuah merek atau proyek kreatif tetap utuh. Ini adalah solusi untuk salah satu tantangan terbesar dalam dunia AI generatif.
Fitur unggulan lainnya adalah "fusi multi-gambar" yang cerdas. Model ini mampu menggabungkan hingga tiga gambar referensi menjadi satu visual baru yang mulus dan logis. Proses ini secara pintar memadukan elemen seperti pencahayaan, tekstur, dan skala dari setiap gambar untuk menciptakan hasil akhir yang natural.
Meskipun terdengar superior, model ini masih dalam tahap preview dan memiliki beberapa area yang perlu disempurnakan. Sejumlah pengguna melaporkan bahwa 2.5 Flash terkadang kesulitan untuk me-render detail-detail kecil secara akurat. Terutama pada bagian wajah dan teks yang sering kali hasilnya tampak kurang tajam atau bahkan salah eja.
3. Begini cara mengakses dan mencobanya

Bagi kamu yang penasaran, cara termudah untuk menjajal kemampuan Gemini 2.5 Flash Image adalah melalui aplikasi atau website Gemini. Google telah mengintegrasikan model ini untuk membuat dan mengedit gambar langsung di sana. Pengguna bisa langsung bereksperimen dengan berbagai perintah untuk melihat sendiri keajaibannya.
Google juga memperluas ketersediaan model ini melalui kerja sama dengan Adobe. Teknologi ini kini terintegrasi langsung ke dalam Adobe Firefly dan Adobe Express. Selain Adobe, sejumlah platform industri kreatif juga telah mengadopsi teknologi ini. Platform desain seperti Leonardo.Ai dan Figma, serta agensi periklanan global WPP, juga termasuk di antara mitra awal Google.
Untuk kalangan pengembang dan perusahaan, Google menyediakan akses yang lebih teknis. Para pengembang bisa mengaksesnya melalui Gemini API dan Google AI Studio untuk bereksperimen dan membangun aplikasi baru. Sementara itu, perusahaan besar dapat memanfaatkannya melalui platform Google Cloud Vertex AI untuk skalabilitas dan keamanan tingkat lanjut.
4. Contoh penggunaan di berbagai industri kreatif

Google rilis AI yang bisa edit foto dengan prompt teks tak hanya untuk kegiatan kreatif, melainkan bisa dijadikan alat andalan untuk membuat aset marketing yang beragam tapi tetap konsisten. Misalnya dengan prompt: "Buat gambar botol parfum X di atas meja marmer dengan latar belakang pantai saat matahari terbenam." Sektor e-commerce juga bisa memanfaatkan kemampuan 2.5 Flash ini. Penjual dapat membuat mockup produk yang menarik tanpa perlu sesi pemotretan yang mahal dan memakan waktu. Contoh prompt-nya: "Ambil gambar sepatu lari ini dan tempatkan di kaki seorang pelari yang sedang beraksi di jalanan kota Tokyo."
Model ini juga tentu sangat membantu untuk keperluan sehari-hari atau non-komersial. Kamu bisa memintanya memperbaiki hasil selfie, memperindah potret pemandangan, menyunting pasfoto atau mungkin hanya untuk membuat meme seru-seruan. Namun, perlu diingat, alat seperti ini juga dapat digunakan untuk hal-hal yang kurang etis. Oleh karena itu, pastikan untuk selalu menggunakannya dengan bertanggung jawab ya!