Awal bulan ini, jutaan pengguna OpenClaw bangun dengan kabar bahwa alat agen AI yang sempat viral dan menguasai industri teknologi kini dibatasi keras oleh Anthropic.
Anthropic, seperti laboratorium AI besar lainnya, berada di bawah tekanan besar untuk mengurangi beban pada sistemnya dan mulai menghasilkan laba. Karena itu, jika pengguna ingin Claude AI menjalankan agen-agen populer mereka, mereka harus mulai membayar mahal.
“Langganan kami tidak dirancang untuk pola penggunaan alat pihak ketiga ini,” tulis Boris Cherny, kepala Claude Code, di X. “Kami ingin mengelola pertumbuhan dengan sengaja agar bisa terus melayani pelanggan secara berkelanjutan dalam jangka panjang. Perubahan ini adalah langkah ke arah itu.”
Pengumuman itu menandai perubahan zaman. Investor telah menuangkan ratusan miliar dolar ke perusahaan seperti OpenAI dan Anthropic untuk membantu mereka membangun skala dan infrastruktur komputasi. Sekarang, mereka menuntut imbal hasil. Setelah bertahun-tahun memberi akses murah atau bahkan gratis ke sistem AI canggih, tagihannya mulai datang, dan pengguna di hilir mulai merasakan tekanannya.
Dalam beberapa tahun terakhir, sebagian besar laboratorium AI teratas memperkenalkan tier langganan baru untuk menarik pengguna berat. OpenAI dan Anthropic juga mengubah skema harga enterprise mereka. OpenAI memperkenalkan iklan di dalam platform. Anthropic, tentu saja, membatasi alat pihak ketiga.
Dalam banyak hal, ini adalah cerita lama yang berulang, terutama sebagai gema jelas dari ledakan teknologi pada dekade 2010-an. Para investor ventura membantu startup mensubsidi pertumbuhan cepat di banyak bidang: aplikasi ride-hailing, e-commerce, hingga layanan pesan-antar makanan dan belanja. Setelah perusahaan mengukuhkan posisinya, mereka menaikkan harga, menambah sumber pendapatan baru, lalu memberi keuntungan kepada investor. Atau tidak, dan mereka jatuh.
Namun perusahaan AI telah menghabiskan uang investor jauh lebih cepat daripada sektor lain mana pun dalam sejarah terbaru. Mereka membangun pusat data di seluruh dunia, menggelontorkan miliaran dolar dengan janji model yang lebih baik, biaya yang lebih rendah, dan AI untuk semua orang. Bahkan untuk menghentikan kerugian saja sudah sulit, apalagi menghasilkan laba sebesar yang diharapkan investor.
“Ketika Anda menanamkan triliunan dolar ke pusat data, Anda tentu mengharapkan imbal hasil,” kata Will Sommer, senior director analyst di Gartner yang fokus pada peramalan ekonomi dan pemodelan kuantitatif.
“Apakah era AI yang pada dasarnya gratis atau nyaris gratis ini mulai berakhir?” kata Mark Riedl, profesor di Georgia Tech School of Interactive Computing. “Terlalu cepat untuk dipastikan, tetapi ada beberapa tanda.”
Sommer mempelajari tren pasar ekonomi jangka panjang terkait generative AI, termasuk menghitung seberapa besar uang yang dipertaruhkan. Menurutnya, antara 2024 dan 2029, Gartner memperkirakan investasi modal untuk pusat data AI akan mencapai sekitar 6,3 triliun dolar — jumlah yang sangat besar.
Untuk menghindari penurunan nilai aset, penyedia model AI besar idealnya menghasilkan return on invested capital (ROIC) sekitar 25 persen. Itu kurang lebih setara dengan imbal hasil yang biasa diraih Amazon, Microsoft, dan Google atas investasi modal mereka secara keseluruhan. Jika imbal hasil turun di bawah 12 persen, modal institusional biasanya kehilangan minat. Di bawah 7 persen, aset masuk ke wilayah penurunan nilai, yang menurut Sommer akan menjadi bencana besar bagi para investor teknologi.
Untuk mencapai batas minimal 7 persen itu, Gartner memperkirakan perusahaan AI besar perlu meraup hampir 7 triliun dolar pendapatan yang digerakkan AI hingga 2029, mendekati 2 triliun dolar per tahun di akhir periode. Untuk mencapai “historic returns”, para penyedia harus mengantongi hampir 8,2 triliun dolar pada periode yang sama.
OpenAI telah membuat komitmen belanja sebesar 600 miliar dolar hingga 2030, kata perusahaan itu pada Februari. Sommer menyebut angka itu sudah merupakan penurunan besar dari rencana sebelumnya sebesar 1,4 triliun dolar. Berdasarkan proyeksi pendapatan OpenAI dan kemungkinan pertumbuhan tahunan majemuknya, Sommer memperkirakan bahwa bahkan dalam skenario terbaik, laboratorium itu hanya akan mencapai sebagian kecil dari total belanja yang dibutuhkan untuk meraih ROIC 7 persen.
Dari token ke tagihan
Bagaimana penyedia model seperti OpenAI menghasilkan uang sebesar itu? Dengan menjual akses ke yang disebut token. Token pada dasarnya adalah unit data input yang bisa dipahami dan diproses model AI — bisa berupa teks, gambar, audio, atau bentuk lain. Satu token umumnya setara kira-kira empat karakter bahasa Inggris. Kata “bathroom”, misalnya, kemungkinan diproses sebagai dua token. Satu paragraf bahasa Inggris biasanya sekitar 100 token, dan esai 1.500 kata bisa mencapai sekitar 2.050 token, menurut estimasi OpenAI.
Untuk memenuhi ekspektasi pendapatan investor, penyedia harus memproses jumlah token yang “membuat kepala pening”.
Menurut berbagai ukuran, angka perusahaan sebenarnya sudah sangat besar. Google, misalnya, mengumumkan pada Oktober bahwa mereka memproses 1,3 quadrillion token. Jika semua perkiraan penyedia dijumlahkan, Sommer mengatakan hasilnya berada di kisaran 100 hingga 200 quadrillion token per tahun. Namun untuk mencapai belanja tahunan 2 triliun dolar yang dihitung Gartner, para penyedia perlu menghasilkan sekitar 10 sextillion token per tahun. Sebagai gambaran, quadrillion memiliki 15 nol, sedangkan sextillion memiliki 21 nol. Dengan margin laba 10 persen per token, konsumsi token antara sekarang dan 2030 harus tumbuh 50.000–100.000 kali.
Saat ini, perusahaan masih mengejar pusat data tambahan dan kekurangan kapasitas komputasi, sehingga belum mampu memproses token sebanyak itu. Bahkan jika mereka bisa, mereka tetap menghadapi masalah lain: kemungkinan besar mereka merugi. Sommer memperkirakan bahwa jika yang dihitung hanya biaya langsung infrastruktur dan listrik, setiap perusahaan memang masih punya margin yang wajar pada tiap token. Tetapi margin itu kemungkinan jauh lebih tipis, atau bahkan tidak ada, pada model-model baru yang lebih rakus token. Dan margin itu habis oleh biaya operasional tidak langsung, seperti membangun komputasi tambahan dan ongkos “gila” untuk terus melatih model besar berikutnya.
“Begitu Anda menambahkan semua infrastruktur yang harus dibangun untuk generasi model berikutnya, dan melihat bagaimana model ini akan diskalakan, semuanya menjadi semakin tidak berkelanjutan,” kata Sommer.
Sommer memperkirakan banyak perusahaan “tidak akan mampu mempertahankan burn rate mereka”, dan pasar akan mengalami konsolidasi yang nyaris tak terhindarkan. Dalam pandangannya, di tiap pasar regional hanya akan bertahan paling banyak dua penyedia large language model. Sementara itu, era ketika hampir setiap layanan punya tier gratis yang cukup longgar kemungkinan tidak akan bertahan lama.
“Bagi [laboratorium] yang punya banyak pengguna gratis, saya rasa pertanyaannya bukan lagi apakah akan memonetisasi tier gratis, tetapi kapan, dan seberapa keras mereka melakukannya,” kata Jay Madheswaran, salah satu pendiri startup AI hukum Eve, yang menjadi klien OpenAI dan Anthropic, kepada The Verge.
Bahkan jika matematika itu bisa diselesaikan, membangun loyalitas pelanggan juga tidak mudah. Laboratorium AI besar terus saling menyalip dalam peluncuran model, rilis fitur, perubahan strategi, pengumuman perekrutan, dan banyak lagi. Sulit untuk tetap unggul cukup lama dan menguasai satu segmen pasar. Para engineer dan developer juga terkenal sering berganti model yang mereka pakai dari hari ke hari, dan itu sangat mudah dilakukan.
Karena itu, laboratorium semakin menekankan pentingnya mengikat pengguna ke platform dan alat mereka. Anthropic, yang terutama membangun untuk klien enterprise, semakin fokus pada coding. OpenAI juga baru-baru ini berjanji akan meniru fokus Anthropic pada coding dan enterprise, di tengah laporan bahwa keduanya sedang berlomba menuju IPO pada akhir 2026.
“Ini adalah perlombaan senjata di mana Anda tidak bisa berhenti sama sekali karena biaya pindahnya nyaris nol,” kata Soham Mazumdar, salah satu pendiri dan CEO Wisdom AI. Ia menambahkan, “Sebagai orang biasa, saya rasa saya justru akan menjadi pemenang dalam jangka panjang.”
Biaya inferensi makin berat
Pada masa awal AI, sebagian besar biaya komputasi dipakai untuk melatih model awal, sedangkan inference — atau menjalankan tugas — lebih murah. Namun seiring model berkembang dan fitur bertambah, inference menjadi jauh lebih boros sumber daya. AI agent, yakni alat yang idealnya mampu menyelesaikan tugas kompleks bertahap atas nama pengguna tanpa harus terus diarahkan, kini memakai jauh lebih banyak token dibanding chatbot dasar beberapa tahun lalu.
Model reasoning yang semakin banyak dipakai oleh AI agent juga terkenal mahal di sisi inference, kata Riedl. Agent seperti platform open-source OpenClaw umumnya lebih efisien dan efektif daripada yang tanpa reasoning, tetapi mereka juga menghabiskan jauh lebih banyak token untuk kerja di balik layar yang mungkin tidak terlihat oleh pengguna akhir. Itu bisa berupa “berpikir” melalui banyak jalur potensial, menjalankan sub-agent untuk sebagian tugas, atau memeriksa akurasi langkah-langkah proses.
“Anda memasukkan prompt satu kalimat… lalu sistem akan berbicara pada dirinya sendiri selama ribuan token, ribuan kata, bahkan mungkin puluhan ribu ketika masuk ke coding,” kata Riedl. “Jika ada ribuan atau jutaan orang yang memakainya setiap hari, biaya inference dari sekadar pengguna yang terus menghasilkan token akan jauh melebihi sisi pelatihan.”
Jika penyedia model benar-benar untung dari semua token itu dan punya kapasitas untuk menanganinya dengan mudah, hal itu tidak akan menjadi masalah. Namun kondisi saat ini justru menekan.
“Siapa pun yang membangun agent dalam beberapa tahun terakhir memang sudah melihat ini akan datang,” kata Aaron Levie, CEO Box. Ia menambahkan, “Kasus penggunaannya meledak, dan kapasitas kami habis.”
Laboratorium AI teratas juga baru-baru ini mengubah kebijakan mereka soal penggunaan API dan alat pihak ketiga — seperti Anthropic yang pada dasarnya melarang penggunaan OpenClaw kecuali pelanggan membayar ekstra — karena tekanan tambahan tersebut. “Alat-alat ini pada dasarnya hanya duduk sebagai prosesor latar di laptop dan desktop semua orang, terus-menerus bangun sendiri, menghasilkan token, melakukan sesuatu, lalu tidur lagi,” kata Riedl.
Dan apa pun yang dilakukan oleh AI agent berbasis reasoning, kemungkinan akan selalu ada token terbuang — misalnya saat model masuk ke jalur yang tidak berguna lalu mundur, memeriksa sesuatu tanpa mengubah apa pun, atau bahkan berhenti untuk menulis puisi. Di era ketika laboratorium kemungkinan merugi pada sebagian token dan perusahaan kekurangan kapasitas komputasi, industri ini berupaya mengurangi token yang terbuang dan membangun model yang lebih terarah.
Meski model yang memakai token lebih sedikit mungkin baik bagi pelanggan berbayar dan laboratorium AI, ironi-nya itu justru berlawanan dengan misi untuk meningkatkan konsumsi token secara masif. Seperti kata Sommer, model harga bisa berubah besar ke depan, tetapi saat ini ada “ruang sempit di treadmill” antara tujuan jangka pendek dan jangka panjang.
Arah industri ke depan
Jika semua ini dijumlahkan, perusahaan AI besar sedang berada di titik transisi: mereka menarik banyak pengguna lewat akses gratis, lalu harus mempertahankan pengguna itu sambil menaikkan harga cukup tinggi. “Di satu sisi, mereka ingin lebih banyak token dihasilkan, tetapi mereka harus menyerap biaya itu sendiri — sejauh modal ventura masih mengalir — atau membebankannya kembali ke pelanggan,” kata Riedl. “Mungkin ekonomi industri ini sekarang sedikit terbalik.”
Saat ini, OpenAI dan Anthropic sering mempertimbangkan kelebihan model langganan flat-rate lama dan model berbasis pemakaian. Paket enterprise keduanya kini berbasis token, karena penggunaan sangat tidak merata: satu orang mungkin hanya memakai sekali atau dua kali seminggu selama beberapa menit, sementara orang lain menjalankan lima agent di latar belakang sepanjang waktu.
Untuk chatbot konsumen, sebagian monetisasi kini datang melalui iklan. OpenAI baru saja memperkenalkan iklan di ChatGPT, yang muncul sebagai sidebar terpisah, dan menurut laporan sedang mengembangkan alat untuk melacak seberapa baik iklan itu bekerja. Anthropic bahkan mengecam langkah itu dalam iklan Super Bowl 2026 mereka.
Bagi perusahaan yang membangun alat di atas model seperti GPT-5 atau Claude Opus, harga token naik dan biaya tambahan itu sebagian besar diteruskan ke pelanggan. Beberapa perusahaan teknologi yang diwawancarai The Verge mengatakan mereka, atau pelanggan mereka, sedang mengubah strategi untuk menahan kenaikan harga. Sebagian mempertimbangkan pindah penuh atau sebagian ke model open-source, dan sebagian menghabiskan banyak waktu serta sumber daya untuk menilai seberapa baik model mahal bekerja pada tugas tertentu dibanding alternatif yang lebih murah.
David DeSanto, CEO perusahaan perangkat lunak Anaconda, baru-baru ini selesai melakukan perjalanan lima minggu keliling dunia untuk berbicara dengan pelanggan. Menurutnya, banyak yang mulai beralih ke self-host AI models — menjalankan model mereka sendiri di Amazon Bedrock atau Google Vertex AI agar punya kontrol lebih besar atas supply chain — atau memakai model open-source dan open-weight untuk banyak kebutuhan, karena banyak model seperti itu sudah jauh meningkat di benchmark belakangan ini. Sebagian perusahaan juga khawatir soal keamanan mengirim IP ke laboratorium frontier komersial, sehingga mereka hanya memakai ChatGPT atau Claude untuk aplikasi yang benar-benar mission-critical.
“Semua orang yang saya temui punya versi masalah yang sama — penggunaan token mereka naik, jadi biaya usage-based billing juga naik, atau tier yang mereka pakai tidak lagi punya batas yang sama, lalu mereka harus naik ke tier yang lebih mahal agar bisa mempertahankan jumlah penggunaan bulanan yang sama dalam paket flat-rate mereka,” kata DeSanto.
Eve, perusahaan yang menjual perangkat lunak untuk pengacara penggugat, terus menyeimbangkan kualitas dan biaya token, kata Madheswaran — terutama karena penggunaan token Eve telah naik 100x secara year-over-year sampai saat ini. Karena itu, mereka terus berganti antara model open-source dan model dari Anthropic serta OpenAI.
Namun bahkan penurunan kualitas output sebesar 1 persen bisa berdampak cukup besar pada pelanggan Eve, kata Madheswaran. Karena itu Eve menghabiskan banyak sumber daya internal untuk melacak kualitas model. Biasanya perusahaan itu menggunakan model reasoning baru yang lebih mahal sekitar 25–30 persen dari waktu, lalu membagi sisa pemakaian antara varian open-source miliknya sendiri dan model-model kecil yang lebih murah dari laboratorium besar. Menurutnya, beberapa model murah ternyata sama akuratnya dengan model mahal, tergantung pertanyaannya.
“Yang sebenarnya dilakukan open source adalah menekan perusahaan-perusahaan ini agar membuat model murah mereka menjadi lebih murah lagi, karena margin laba mereka di sana jauh, jauh lebih baik,” kata Madheswaran.
Wisdom AI, yang menyediakan analitik berbasis AI, sejauh ini belum perlu meneruskan kenaikan biaya ke pelanggan. Timnya menguji bagaimana berbagai model bekerja pada berbagai jenis tugas, lalu menganggarkannya sesuai kebutuhan. Mazumdar mengatakan mereka belakangan menguji Cerebras, yang populer untuk model open-weight, “sebagai antisipasi terhadap betapa mahalnya keadaan” di laboratorium papan atas seperti OpenAI dan Anthropic.
“[Perusahaan AI besar] selama ini membagikannya secara gratis,” kata Mazumdar. “Yang mereka coba lakukan adalah, begitu mereka mencium ada perusahaan yang siap membayar, mereka langsung menaikkan harga dengan drastis.”
Namun ia menambahkan, selalu ada biaya, terutama di sisi coding.
“Kenataannya begini: kalau Anda melakukan coding dalam bentuk apa pun, model open-source memang belum bisa mendekat, dan itulah kenyataan yang tidak menyenangkan dari posisi kita sekarang,” katanya.
Levie dari Box percaya perubahan ini akan berlangsung selama 24 bulan ke depan. Menurutnya, era AI yang disubsidi modal ventura memang mungkin diperlukan untuk pertumbuhan — bagaimanapun, jika dua perusahaan dengan produk yang kurang lebih sama berebut pelanggan yang sama dan salah satunya menawarkan produk lebih murah karena disubsidi, maka yang terakhir jelas akan menang, setidaknya dalam jangka pendek. Namun sekarang waktunya membangun efisiensi yang lebih baik ke dalam sistem, dan tidak semua pemain akan selamat.
“Ukuran pasarnya sangat besar sehingga saya pikir semuanya pada akhirnya akan berjalan,” kata Levie. “Di level perusahaan individual, Anda harus memutuskan: apakah Anda bisa mengikuti flywheel ini, atau Anda akan terhimpit karena tak mampu menggalang modal atau tak mampu membuat model lebih efisien untuk tugas Anda?”
Madheswaran dari Eve yakin industri ini segera bergeser dari fokus pada model yang disebut “terbaik” ke model yang paling cocok untuk kebutuhan bisnis yang spesifik dan personal. “Itu dugaan saya, dan jelas saya mempertaruhkan seluruh perusahaan kami pada itu.”
Sommer dari Gartner menyamakan seluruh situasi ini dengan apa yang ia sebut “stegosaurus paradox”. Saat para ilmuwan pertama kali menemukan fosil stegosaurus, katanya, mereka tidak paham bagaimana tubuh sebesar itu bisa ditopang kepala yang kecil dengan mulut yang mungil. Teori yang mereka bangun adalah bahwa stegosaurus harus makan terus-menerus, dan makan makanan yang sangat bergizi.
“Kami melihat AI seperti hal yang sama,” kata Sommer. Agar stegosaurus itu — yaitu laboratorium AI — tetap hidup, penyedia harus menemukan lebih banyak makanan untuknya, yakni ekonomi global secara keseluruhan, bukan hanya pasar teknologi, dan makanannya juga harus sangat bergizi, artinya penyedia harus bisa meraup margin dan berhenti mensubsidi. Jika paradoks stegosaurus itu tidak terselesaikan, dan mulutnya terlalu kecil untuk tubuhnya, itu akan memicu penurunan nilai aset, turunnya valuasi, mengeringnya pendanaan, dan penyesuaian besar terhadap ekspektasi AI di seluruh dunia. Karena itu, Sommer menilai model bisnis yang berkelanjutan “akan menuntut genAI tertanam di mana-mana, mulai dari billboard sampai kiosk kasir”, dengan penyedia mengambil bagian dari semua transaksi itu.
“Era gratis itu sebenarnya hanyalah land grab — strategi yang biasa dipakai startup,” kata Madheswaran. “Itu bukan model bisnis. Anda tidak bisa melakukan itu terlalu lama.”