Baca artikel IDN Times lainnya di IDN App
For
You

Gemini 2.0 Flash Bisa Edit Gambar Seperti Photoshop, Begini Caranya! 

ilustrasi Gemini. (unsplash.com/Solen Feyissa)
ilustrasi Gemini. (unsplash.com/Solen Feyissa)
Intinya sih...
  • Gemini 2.0 Flash memungkinkan pembuatan dan pengeditan gambar langsung tanpa bantuan model AI tambahan.
  • Kualitas gambar yang dihasilkan sangat realistis dan berkualitas tinggi, serta mampu menghasilkan ilustrasi cerita dengan konsistensi karakter dan latar.
  • Gemini 2.0 Flash juga dapat digunakan untuk mengedit gambar yang sudah ada, seperti mewarnai foto hitam putih atau melakukan perubahan objek dan latar.

Google baru saja merilis kemampuan native image generation di Gemini 2.0 Flash. Fitur ini memungkinkan Gemini menghasilkan dan mengedit gambar secara langsung tanpa bantuan model AI tambahan. Peningkatan ini membuat Gemini mampu memanipulasi gambar layaknya Photoshop. Google telah menjadi perusahaan AS pertama yang merilis fitur ini.

Kabar gembira bagi pengguna, fitur baru Gemini 2.0 Flash ini tersedia gratis melalui platform Google AI Studio. Google berhasil menyalip pesaingnya, OpenAI yang masih belum merilis fitur serupa setelah diperkenalkan dalam GPT-4o sejak Mei 2024. Mari kita pelajari lebih lanjut cara memanfaatkan pembuatan gambar dari Gemini 2.0 Flash ini.

1. Apa yang membuat teknologi native image generation spesial?

Gemini 2.0 Flash menghadirkan cara baru mengolah gambar melalui native image generation. Google mengintegrasikan pembuatan gambar langsung ke dalam model AI-nya, berbeda dari sistem sebelumnya yang membutuhkan dua model terpisah. OpenAI, misalnya, masih mengandalkan kombinasi GPT-4o dan Dall-E 3 untuk menghasilkan gambar.

Integrasi langsung ini menghasilkan akurasi lebih tinggi dalam memahami perintah pengguna. Model ini mampu memproses perintah teks rumit, mempertahankan konsistensi elemen visual, dan menghasilkan gambar berkualitas tinggi. Keunggulan lain Gemini 2.0 Flash terletak pada kemampuan text rendering yang superior dibanding model AI lainnya.

Gemini 2.0 Flash bisa membuat ilustrasi cerita sambil menjaga konsistensi karakter dan latar. Model ini juga unggul dalam memahami konteks dunia nyata, menghasilkan gambar yang lebih realistis dan masuk akal sesuai pengetahuan umum. Google AI Studio menyediakan akses gratis ke Gemini 2.0 Flash melalui versi eksperimental bernama "gemini-2.0-flash-exp". Pengguna bisa memanfaatkan model ini baik melalui antarmuka web maupun API. 

2. Cara membuat gambar dengan Gemini 2.0 Flash

contoh cara membuat gambar dengan Gemini 2.0 Flash di Google AI Studio (dok. pribadi/Leo Manik)
contoh cara membuat gambar dengan Gemini 2.0 Flash di Google AI Studio (dok. pribadi/Leo Manik)

Berikut langkah-langkah menggunakan Gemini 2.0 Flash untuk menghasilkan gambar:

  • Akses Google AI Studio di aistudio.google.com
  • Pilih model Gemini 2.0 Flash (Image Generation) Experimental
  • Atur pengaturan output ke "Images and text"

Kualitas prompt menjadi kunci untuk menghasilkan gambar sesuai keinginan. Prompt sebaiknya menjelaskan detail visual yang diinginkan secara spesifik. Masukkan informasi seperti subjek, latar, gaya visual, sudut pandang, dan elemen penting lainnya dalam prompt.

Penulis melakukan uji coba membuat gambar seorang pengajar di ruang kuliah. Prompt yang digunakan:

"Buat gambar seorang pengajar menulis di papan tulis kapur di aula kelas kuliah. Tambahkan tulisan 'Basic Machine Learning' di papan tulis. Pengajar menggunakan kaos hitam berlogo Google. Ambil gambar dari belakang dengan gaya fotorealistis"

Hasilnya sangat memuaskan, teks "Basic Machine Learning" dan logo Google terlihat jelas. Kualitas gambar juga cukup realistis seakan foto dipotret mentah tanpa filter tambahan. Pengguna juga bisa meminta Gemini untuk membuat ulang gambar jika hasilnya kurang memuaskan. 

3. Cara edit gambar dengan Gemini 2.0 Flash

cara mengedit gambar dengan Gemini 2.0 Flash di Google AI Studio. (dok. pribadi/Leo Manik)
cara mengedit gambar dengan Gemini 2.0 Flash di Google AI Studio. (dok. pribadi/Leo Manik)

Kemampuan Gemini 2.0 Flash tidak terbatas pada pembuatan gambar baru. Model ini juga bisa mengedit gambar yang sudah ada melalui perintah dalam bahasa natural. Pengguna cukup mengunggah gambar ke Google AI Studio dan memberikan instruksi pengeditan yang diinginkan.

Misalnya, Gemini bisa digunakan untuk mewarnai foto hitam putih. Penulis mencoba merekonstruksi warna foto lama mantan Presiden AS John F Kennedy bersama PM Inggris Harold McMillan. Hasil pewarnaan terlihat natural dan masuk akal, meski masih ada beberapa detail kecil yang masih memerlukan penyempurnaan.

Fitur editing Gemini bisa dimanfaatkan dalam banyak cara. Pengguna bisa meminta Gemini untuk menghapus objek tertentu, mengganti objek, mengganti latar atau bahkan mengganti pose. Namun, penulis sendiri menyadari beberapa kekurangan dari fitur Gemini ini. Misalnya, resolusi yang dihasilkan terbilang rendah, sehingga detail-detail kecil kerap rusak. Beberapa pengguna lain juga mengaku kesulitan mengatur rasio gambar sesuai keinginan. 

Terlepas dari plus dan minusnya, perlu diingat bahwa fitur native image Gemini 2.0 Flash ini masih tahap uji coba. Kedepannya, Google mungkin akan memperbaiki kualitasnya berdasarkan masukan dari pengguna. Nah, apakah kamu tertarik membuat dan mengedit gambar dengan Gemini 2.0 Flash?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Leo Manik
EditorLeo Manik
Follow Us