Kalau kamu memakai AI lewat API atau langganan berbatas, token adalah mata uangnya. Setiap kata yang masuk dan keluar dihitung, dan pemakaian yang boros membuat tagihan membengkak atau jatah cepat habis. Kabar baiknya, banyak token terbuang sia-sia karena kebiasaan yang mudah diperbaiki. Berikut 9 trik praktis menghemat token tanpa mengorbankan kualitas jawaban.
Dulu, Pahami Apa Itu Token
Token bukan kata, tapi potongan kata. Satu kata bahasa Indonesia bisa jadi 2–3 token. Yang dihitung adalah input (prompt + konteks yang kamu kirim) ditambah output (jawaban AI). Mengontrol keduanya adalah kunci hemat.
1. Tulis Prompt Ringkas, Bukan Bertele-tele
Basa-basi seperti "Tolong ya, kalau kamu berkenan, bisakah kamu membantu saya..." membuang token tanpa menambah kualitas. Langsung ke inti. AI modern tidak butuh sopan-santun panjang untuk paham maksudmu.
2. Batasi Panjang Output
Output biasanya lebih mahal daripada input. Kalau kamu cuma butuh ringkasan, minta secara eksplisit:
Jawab dalam maksimal 3 poin, masing-masing satu kalimat.
Tanpa batasan, AI cenderung menjawab panjang dan menghabiskan token yang tidak kamu butuhkan.
3. Jangan Kirim Konteks yang Tidak Perlu
Menempel seluruh dokumen padahal hanya butuh satu bagian itu pemborosan besar. Kirim hanya potongan yang relevan. Kalau dokumen panjang, rangkum dulu atau pakai pendekatan retrieval (RAG) yang hanya mengambil bagian penting.
4. Pakai Model yang Sesuai Tugas
Tidak semua tugas butuh model termahal. Untuk tugas sederhana — klasifikasi, ekstraksi, ringkasan singkat — model kecil yang murah sudah cukup. Sisakan model besar untuk tugas yang benar-benar butuh penalaran kompleks.
5. Hindari Mengulang Konteks di Setiap Pesan
Dalam percakapan panjang, riwayat ikut dikirim berulang dan menumpuk token. Kalau topik sudah berganti, mulai sesi baru. Jangan paksakan satu percakapan panjang untuk hal-hal yang tidak berhubungan.
6. Susun Instruksi Sekali, Pakai Berulang
Untuk tugas berulang, simpan template prompt yang sudah ringkas dan teruji. Kamu tidak perlu menulis ulang instruksi panjang tiap kali — cukup ganti bagian variabelnya.
7. Minta Format Terstruktur
Meminta jawaban dalam format ringkas (daftar, tabel, JSON) sering lebih hemat daripada paragraf panjang yang berputar-putar. Bonus: hasilnya lebih mudah dipakai ulang di kode.
8. Manfaatkan Caching kalau Tersedia
Beberapa penyedia API menawarkan prompt caching — konteks yang sama tidak dihitung penuh saat dikirim ulang. Kalau kamu sering memakai instruksi sistem yang sama, fitur ini bisa memangkas biaya signifikan.
9. Uji dengan Sampel Kecil Dulu
Sebelum menjalankan tugas ke ribuan data, uji prompt-mu pada beberapa contoh. Ini mencegah kamu menghabiskan banyak token hanya untuk menyadari prompt-nya keliru dan harus diulang.
Kesimpulan
Hemat token bukan soal pelit, tapi soal efisiensi: hasil yang sama dengan biaya lebih kecil. Tulis ringkas, batasi output, kirim hanya konteks relevan, dan pilih model yang tepat. Kebiasaan kecil ini, kalau dikalikan ratusan pemakaian per hari, menghemat banyak. Mulai terapkan dan perhatikan tagihanmu turun.