Baca artikel IDN Times lainnya di IDN App
For
You

OpenAI Luncurkan GPT-4.1 yang Unggul dalam Kemampuan Coding

ilustrasi logo ChatGPT. (unsplash.com/Solen Feyissa)
ilustrasi logo ChatGPT. (unsplash.com/Solen Feyissa)

Perusahaan-perusahaan kecerdasan buatan (AI) tampaknya semakin gencar belomba menciptakan model terbaik untuk coding. Kini, giliran OpenAI yang baru saja memperkenalkan keluarga model terbaru mereka, GPT-4.1, yang hadir dalam tiga varian. Model ini diklaim unggul dalam bidang coding dan tugas dengan instruksi kompleks.

GPT 4.1 hadir dengan jendela konteks hingga 1 juta token, setara dengan 750 ribu kata. Peningkatan ini memungkinkan model memproses teks delapan kali lebih banyak dibanding versi sebelumnya. Apa saja kehebatan lain GPT-4.1 dari OpenAI ini? Yuk simak ulasan lengkapnya!

1. GPT-4.1 hadir dalam tiga varian

OpenAI merilis tiga varian model dalam keluarga GPT-4.1, masing-masing dengan keunggulan tersendiri. Melansir VentureBeat, model utama GPT-4.1 didesain untuk tugas bisnis kompleks. GPT-4.1 mini cocok untuk kasus yang membutuhkan keseimbangan antara kecerdasan dan kecepatan. Sementara GPT-4.1 nano hadir sebagai model tercepat dan termurah, ideal untuk tugas sederhana seperti klasifikasi.

Seluruh model ini memiliki batas pengetahuan terbaru hingga Juni 2024. Namun, perlu diingat model ini masih hanya tersedia di platform API. Harga GPT-4.1 ditetapkan sebesar 2 dolar AS (sekitar Rp33 ribu) per satu juta token input dan 8 dolar AS (sekitar Rp134 ribu) per satu juta token output. Tarif ini 26 persen lebih murah dibanding GPT-4o, menjadikannya lebih terjangkau bagi developer.

GPT-4.1 mini menawarkan performa cukup mumpuni dengan latensi hampir setengah dan biaya 83 persen lebih rendah dibanding GPT-4o. Harganya 0,4 dolar AS (sekitar Rp6.700) per satu juta token input dan 1,6 dolar AS (sekitar Rp26 ribu) per satu juta token output. Sementara GPT-4.1 nano dibanderol 0,1 dolar AS (sekitar Rp1.600) per satu juta token input dan 0,4 dolar AS (sekitar Rp6.700) per satu juta token output, dilansir TechCrunch

OpenAI juga mengumumkan penghentian GPT-4.5 Preview dari API pada 14 Juli 2025. Langkah ini diambil karena GPT-4.1 sudah menawarkan performa setara atau lebih baik dengan biaya dan latensi yang jauh lebih rendah.

2. Peningkatan signifikan dalam kemampuan coding

Keunggulan utama GPT-4.1 terletak pada kemampuan coding-nya. Model ini meraih skor 54,6 persen pada benchmark SWE-bench Verified, meningkat 21,4 persen dari GPT-4o. Skor ini menunjukkan peningkatan kemampuan model dalam mengeksplorasi repositori kode, menyelesaikan tugas, dan menghasilkan kode yang berfungsi serta lulus pengujian.

Dalam pengujian pemrograman frontend, GPT-4.1 menunjukkan hasil mengesankan. Tim penilai lebih menyukai situs web yang dibuat GPT-4.1 dibanding GPT-4o hingga 80 persen. Model baru ini juga mampu menghasilkan 32.768 token sekaligus, dua kali lipat dibanding GPT-4o yang hanya 16.384 token.

Windsurf, penyedia alat coding AI populer, melaporkan GPT-4.1 meraih skor 60 persen lebih tinggi dibanding GPT-4o dalam benchmark internal mereka. Pengguna mereka mencatat model baru ini 30 persen lebih efisien dalam pemanggilan tool dan 50 persen lebih kecil kemungkinannya mengulang editan tidak perlu.

Qodo, perusahaan lain yang melakukan pengujian, menemukan GPT-4.1 menghasilkan saran lebih baik dalam 55 persen kasus saat meninjau pull request GitHub. Model ini unggul dalam presisi dan kelengkapan analisis kode.

3. Jendela konteks hingga satu juta token

Fitur unggulan lain GPT-4.1 adalah jendela konteksnya yang mencapai satu juta token, delapan kali lebih besar dari model sebelumnya. Kemampuan ini memungkinkan pemrosesan basis kode atau dokumen besar sekaligus, setara dengan menganalisis delapan salinan seluruh basis kode React dalam sekali jalan.

Thomson Reuters yang juga menguji GPT-4.1 melaporkan peningkatan akurasi peninjauan dokumen sebesar 17 persen saat menggunakannya dengan asisten AI mereka CoCounsel. Model ini mampu mempertahankan konteks dari berbagai sumber dan mengidentifikasi hubungan antar dokumen dengan tepat.

Perusahaan finansial Carlyle menggunakan GPT-4.1 untuk mengekstrak data keuangan dari berbagai dokumen kompleks. Menurut evaluasi internal mereka, model ini berkerja 50 persen lebih baik dalam mengambil data dari dokumen besar dibanding model lain yang tersedia.

Peluncuran GPT-4.1 terjadi saat persaingan AI semakin ketat terutama di bidang coding.  Google baru saja meluncurkan Gemini 2.5 Pro yang dinilai bersaing ketat dengan Claude 3.7 Sonnet dari Anthropic. Selama ini Sonnet masih menjadi favorit para programmer. Namun, tidak bisa dipungkiri kalau ChatGPT dan OpenAI masih jauh lebih populer secara umum dari pesaing-pesaingnya. 

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Debby Utomo
EditorDebby Utomo
Follow Us