Claude Code vs. Cursor vs. Codex vs. Antigravity: Enam Bulan Perkembangannya

Enam bulan lalu, tool coding agentic masih diperdebatkan bentuknya. Memasuki awal Juni 2026, perdebatan itu pada dasarnya sudah selesai.

Empat produk yang paling menentukan kategori ini sepanjang tahun tampak makin sepakat tentang seperti apa bentuk ideal tool tersebut.

Titik awalnya ada di November. Google merilis Antigravity dalam public preview pada 18 November 2025, bertepatan dengan hadirnya Gemini 3, dan peluncuran itu mendorong antarmuka coding yang berpusat pada agent ke arus utama. Claude Code dari Anthropic, Codex dari OpenAI, dan Cursor dari Anysphere sebenarnya sudah lebih dulu hadir di lapangan.

Melihat keempatnya berkembang dalam enam bulan yang sama memberi gambaran yang lebih jelas daripada hanya menilai satu peluncuran. Bagian paling menarik justru terjadi setelah pengumuman resmi. Ibarat smartphone yang akhirnya menetap pada bentuk layar datar, setelah semua pihak menerima bentuk dasarnya, persaingan bergeser ke platform yang mengelilinginya.

Posisi masing-masing tool AI coding pada 2026

Claude Code tetap dekat dengan asalnya: hidup di terminal dan mengandalkan reasoning dengan context panjang, compaction, serta alur kerja yang penuh approval. Pola ini membuatnya kuat untuk pekerjaan pada codebase besar, ketika agent harus memahami banyak konteks sebelum menyentuh satu baris kode. Developer yang ingin meninjau setiap perubahan sebelum diterapkan cenderung memilih pendekatan ini. Gesekan dalam workflow itu memang disengaja, karena pada codebase serius, momen paling berisiko adalah tepat sebelum sebuah command dijalankan atau file diubah, dan Claude Code menempatkan manusia persis di titik itu.

Cursor mengambil arah berbeda dengan tetap model-agnostic. Tool ini berjalan di dalam lingkungan VS Code yang familier dan memungkinkan pengguna memilih frontier model mana pun yang sudah mereka bayar, sehingga tim tidak terikat pada jadwal rilis satu vendor. Keunggulan yang lebih dalam adalah Cursor tidak memaksa migrasi workflow. Developer bisa menambahkan kemampuan agent tanpa meninggalkan file, tab, diff, dan shortcut yang sudah mereka kuasai, sementara Composer agent kini menangani pekerjaan multi-file langsung dari editor.

Codex memilih jalur distribusi. Karena Codex dibundel ke dalam paket ChatGPT untuk sebagian besar pengguna dan tidak berdiri sebagai produk dengan harga terpisah, adopsinya tumbuh lebih cepat daripada produk lain di kategori ini, walau penggunaan bisnis dan beban kerja yang lebih berat kini diatur melalui limit serta kredit khusus Codex. OpenAI melaporkan lebih dari 3 juta developer mingguan pada pertengahan April 2026 dan lebih dari 4 juta pada akhir Mei. Sumber pendapatan utamanya datang dari implementasi enterprise melalui ChatGPT Business dan Enterprise.

Antigravity menempuh perubahan paling jauh dari titik awalnya. Produk ini pertama kali hadir sebagai IDE native-AI berbasis fork dari VS Code, lalu diluncurkan ulang di Google I/O pada 19 Mei 2026 sebagai Antigravity 2.0, sebuah platform dengan lima permukaan: aplikasi desktop mandiri, CLI, SDK, Managed Agents API di dalam Gemini API, dan lapisan enterprise untuk pelanggan Google Cloud.

Anggap saja seperti smartphone yang akhirnya menetap pada bentuk layar datar: begitu semua orang menerima bentuknya, persaingan pindah ke platform di sekelilingnya.

Pembangunan ulang itu tidak berjalan mulus. Google menghapus IDE asli sebagai default dan membuat banyak setup rusak dalam semalam, setelah sebelumnya menuai kemarahan pada Maret 2026 saat beralih ke model credit pack dan memperketat kuota. Jika dibaca bersama langkah Google lainnya, taruhan besarnya terlihat jelas: membangun jalur dari coding agent lokal ke runtime managed agent di Google Cloud, dengan harness yang sama berjalan di desktop client, CLI, Gemini API, dan platform enterprise.

Di mana posisi GitHub Copilot?

Satu nama memang sengaja tidak masuk ke empat besar tadi: GitHub Copilot. Copilot membentuk keseluruhan kategori ini, dan coding agent miliknya sekarang sudah mampu merencanakan pekerjaan, mengedit branch, lalu membuka pull request lengkap dengan kontrol enterprise. Fokus artikel ini ada pada produk yang paling mendorong percakapan agent-first sepanjang tahun, tetapi Copilot tetap layak diawasi karena GitHub menguasai tempat isu, pull request, review, dan Actions berlangsung. Itu adalah keuntungan kandang ketika hasil kerja agent akhirnya harus masuk ke alur merge.

Cetak biru yang akhirnya mereka sepakati

Jika keempat produk itu disejajarkan hari ini, kemiripannya sulit diabaikan. Mereka bergerak menuju pola yang sama: antarmuka terminal atau command line, perencanaan eksplisit sebelum eksekusi, approval gate, akses ke tool eksternal lewat Model Context Protocol, dan bentuk tertentu dari delegated work atau parallel agent work. Empat lab dengan budaya yang sangat berbeda tiba di cetak biru yang hampir sama hanya dalam enam bulan, dan biasanya itu menandakan desain tersebut bukan sekadar pilihan, melainkan sebuah penemuan.

Empat lab dengan budaya yang sangat berbeda tiba pada cetak biru yang hampir sama hanya dalam enam bulan, yang biasanya berarti desain itu lebih merupakan hasil penemuan daripada pilihan semata.

Jika diminta memperbaiki integration test yang gagal di tiga file, alurnya kini serupa: agent membaca repository, mengusulkan rencana, menunggu approval, mengedit kode, menjalankan test, lalu melaporkan hasilnya sambil menampilkan diff. Keseragaman ini diam-diam mengubah definisi tool tersebut. Coding agent sekarang membaca issue, mengedit branch, menjalankan test, memanggil tool, dan membuka pull request, sehingga perilakunya lebih mirip rekan junior yang memiliki akses commit daripada sekadar autocomplete.

Konektor yang paling sering dibicarakan adalah MCP, tetapi standar yang lebih senyap di dalam repository mungkin justru lebih penting. Konvensi AGENTS.md mengubah repository itu sendiri menjadi panduan onboarding untuk agent, berisi cara menjalankan test, gaya penulisan yang harus diikuti, dan area yang tidak boleh disentuh. Codex, Cursor, Copilot, dan Windsurf membacanya secara native.

OpenAI memulainya; Google, Cursor, dan Sourcegraph kemudian ikut bergabung; dan sejak Desember 2025, konvensi ini berada di bawah Agentic AI Foundation di Linux Foundation bersama MCP. Konvergensi ini memang belum total, karena Claude Code masih membaca CLAUDE.md miliknya sendiri. Meski begitu, arahnya jelas menuju satu file instruksi lintas tool yang membuat perilaku agent lebih portabel.

Konvergensi ini juga diam-diam menurunkan peran model sebagai faktor pembeda utama. Sepanjang sebagian besar 2025, penawaran tiap vendor berpusat pada model mana yang menulis kode paling baik. Namun pada SWE-bench Verified per pertengahan Mei 2026, skor teratas sudah berada dalam rentang yang cukup sempit, dan Cursor bahkan bisa menjalankan model mana pun.

Ketika mesin tidak lagi menjadi pembeda besar, perbedaan bergeser ke segala sesuatu di sekelilingnya: harness, workflow, model approval, dan kanal distribusi. Itu mungkin perubahan paling penting dalam enam bulan terakhir, dan itulah sebabnya pilihan tim sekarang lebih ditentukan oleh kecocokan penggunaan daripada leaderboard model mana yang menang minggu lalu.

Benchmark masih mengukur apakah sebuah agent bisa menyelesaikan tugas yang terisolasi. Namun di repository nyata, bagian tersulit adalah mendaratkan perubahan yang bisa lolos kebiasaan lokal, CI, dan review manusia. Karena itu, tim mulai merutekan pekerjaan berdasarkan jenis tugas, bukan bersumpah setia pada satu tool saja.

Lock-in juga tumbuh di lapisan itu. Tim yang sudah menata kebiasaan review, skill, hook, dan pola subagent di sekitar satu tool tidak akan berpindah dengan ringan. Migrasi CLI Antigravity yang menyakitkan menunjukkan seberapa besar gesekan yang muncul ketika workflow telanjur terbentuk.

Pertanyaan soal biaya memisahkan mereka

Pricing adalah titik ketika keempat tool berhenti berima. Hal pertama yang perlu dipahami adalah agent menagih biaya lebih seperti compute job daripada sekadar seat, karena ia harus membaca repository besar, menyalakan sandbox, menjalankan test, dan mengulangi percobaan sampai perubahan benar-benar bisa di-merge. Angka yang layak dibandingkan bukan harga bulanan di depan, melainkan biaya per perubahan yang benar-benar diterima. Sesuatu yang terlihat murah di awal tidak selalu murah saat dipakai sepanjang hari oleh satu tim.

Agent menagih biaya lebih seperti compute job. Angka yang paling relevan untuk dibandingkan adalah biaya per perubahan yang benar-benar diterima, bukan sekadar harga bulanan.

Codex menjadi outlier karena tidak memiliki harga terpisah dan menumpang pada paket ChatGPT, yang membantu pertumbuhannya sangat cepat, walau pekerjaan berat tetap dimeter melalui kredit khusus Codex. Cursor Pro dan tier awal Claude Code sama-sama berada di kisaran US$20 pada Juni 2026, dengan biaya penggunaan tambahan di atasnya, sementara paket Max Anthropic jauh lebih tinggi untuk power user. Antigravity masih berada pada pola akses ala preview, tetapi perubahan kuota dan paket Google, termasuk tier AI Ultra US$100 per bulan yang diumumkan di sekitar Google I/O, sudah menunjukkan betapa cepat akses gratis menjadi tidak stabil ketika beban kerja agent makin mahal.

Tool	Pusat gravitasi	Kondisi saat tool ini biasanya unggul
Claude Code	Native terminal, approval-first	Reasoning mendalam dan pekerjaan pada codebase besar untuk tim yang ingin membaca setiap diff
Cursor	IDE model-agnostic	Tim yang hidup di editor dan ingin bebas memilih model tanpa lock-in vendor
Codex	Dibundel ke dalam ChatGPT	Jangkauan cepat dan rollout enterprise karena tidak punya harga terpisah
Antigravity	Platform multi-surface	Organisasi berbasis Google Cloud dan Android yang ingin managed agents, dengan risiko preview yang masih melekat

Perbandingan singkat posisi dan keunggulan relatif empat tool AI coding utama pada 2026.

Tabel itu sebaiknya tidak dibaca sebagai putusan final. Banyak tim menjalankan dua tool sekaligus: satu di terminal untuk refactor serius dan satu di editor untuk edit harian. Jebakannya adalah keempatnya tampak hampir sama saat demo. Perbedaan yang benar-benar terasa baru muncul belakangan, terutama pada lokasi eksekusi kode, batasan akses agent, dan total biaya setelah seminggu kerja nyata. Lapisan itulah yang lebih penting diperiksa sebelum berkomitmen daripada angka SWE-bench di slide peluncuran.

Penantang berikutnya sudah datang

Gagasan bahwa Grok Build masih sekadar sesuatu yang patut ditunggu dalam beberapa pekan ke depan perlu sedikit dikoreksi, karena xAI sebenarnya sudah bergerak. Produk itu masuk early beta pada pertengahan Mei 2026 untuk tier SuperGrok tertinggi, lalu xAI memublikasikan pengumuman Grok Build pada 25 Mei dan membuka akses bagi seluruh pelanggan SuperGrok serta X Premium Plus.

Tool ini berupa CLI native terminal yang ditenagai model grok-build-0.1A, yang menurut xAI memang dilatih khusus untuk agentic coding, dengan skor yang dilaporkan berada di sekitar 70,8 persen pada SWE-bench, diverifikasi dalam beberapa ulasan pihak ketiga awal.

Dua pilihan desainnya menonjol. Grok Build dapat menjalankan hingga delapan subagent secara paralel, masing-masing diisolasi di Git worktree tersendiri. Ini adalah taruhan arsitektur paling berani di kategori tersebut. xAI juga menyebutnya local-first, artinya source code dan credential tetap berada di mesin lokal selama sesi, bukan dikirim ke server xAI. Klaim seperti ini jelas menarik bagi tim yang bekerja di lingkungan teregulasi, walau dokumentasi kepatuhannya masih belum setebal pesan pemasarannya.

Enam bulan konvergensi telah menetapkan bentuk dasar tool agentic coding dan mengubah fase berikutnya menjadi persaingan pada harness, harga, dan kebiasaan yang dibangun tim di sekitar satu produk.

Eksekusi lokal bukan berarti inferensi lokal. Karena itu, yang benar-benar penting adalah konteks repository mana yang masih dikirim ke model. Bagian yang masih hilang adalah Arena Mode, fitur yang akan menghasilkan beberapa kandidat output sekaligus lalu membiarkan pengguna memilih yang terbaik. Jejak kodenya sudah terlihat, tetapi pada fase beta fitur itu belum aktif.

Peluncurannya sudah terjadi, jadi pengujian sesungguhnya dalam beberapa pekan ke depan adalah soal retensi: apakah Grok Build bisa membuat developer tetap bertahan di terminal lebih dari minggu pertama, apakah Arena Mode benar-benar dirilis dan membantu mengecilkan jarak benchmark dalam praktik, serta apakah pricing yang agresif mampu menarik pengguna berbayar dari pemain lama.

Enam bulan konvergensi telah memantapkan bentuk tool agentic coding dan mengubah fase berikutnya menjadi persaingan tentang harness, harga, dan kebiasaan tim. Kini sudah ada agent terminal kelima yang masuk ke arena itu, didukung basis pelanggan besar dari X Premium Plus dan pemilik yang bersedia terus membiayainya. Itu cukup menjadi alasan untuk melihat bagaimana para pemain lama akan merespons.