Saat mulai belajar AI, banyak orang justru merasa bingung bukan karena coding atau matematika, melainkan karena banyaknya istilah AI yang harus dipahami. Kata seperti model, training, inference, token, embedding, hallucination, hingga RAG sering muncul seolah sudah umum dipahami.
Padahal, tanpa memahami istilah AI adalah fondasi penting, proses belajar bisa terasa jauh lebih lambat dan membingungkan. Banyak pemula akhirnya kesulitan membedakan mana konsep inti dan mana sekadar jargon teknis. Agar tidak tersesat di istilah yang kompleks, baca artikel ini sampai selesai karena kami merangkum 50+ istilah AI secara ringkas, jelas, dan mudah dipahami.
Ringkasan Cepat
- Machine Learning Glossary dari Google mendefinisikan banyak istilah ML/AI, termasuk istilah yang terkait LLM.
- IBM menjelaskan large language models (LLM) sebagai kategori model deep learning yang dilatih pada data sangat besar dan umumnya berbasis arsitektur transformer, mampu memahami dan menghasilkan bahasa alami.
- NIST menekankan pendekatan berbasis risiko untuk memaksimalkan manfaat AI sambil meminimalkan dampak negatif, termasuk pengukuran, evaluasi, standar, dan tata kelola.
- Untuk prompt engineering, praktik terbaik sebaiknya dimulai dari kriteria sukses yang jelas dan evaluasi yang bisa diuji, lalu teknik prompting diterapkan sesuai kebutuhan.
AI (Artificial Intelligence) adalah bidang yang berfokus pada pembuatan sistem yang dapat melakukan tugas yang biasanya membutuhkan kecerdasan manusia, seperti memahami bahasa, mengenali pola, mengambil keputusan, dan menghasilkan konten.
Also Read
Cara pakai glossary ini
Supaya tidak terasa membingungkan di awal, Anda tidak perlu membaca semuanya sekaligus. Gunakan glossary ini sesuai kebutuhan Anda saja.
Beberapa cara yang bisa membantu:
- Jika Anda pemula: mulai dari bagian istilah inti, lalu lanjut ke bagian LLM
- Jika Anda sudah terbiasa praktik: langsung cari istilah yang paling sering muncul di pekerjaan Anda
- Jika Anda sering bingung istilah yang mirip: cek bagian “sering tertukar” untuk membedakan konsepnya dengan lebih jelas
Dengan cara ini, glossary bisa dipakai sebagai referensi cepat, bukan bahan bacaan yang harus dihafalkan dari awal sampai akhir.
Tabel singkat: istilah yang paling sering tertukar
| Istilah | Sering dikira sama dengan | Bedanya apa? |
|---|---|---|
| AI | Machine Learning | ML adalah bagian dari AI |
| Training | Inference | training = belajar, inference = memakai |
| Model | Algorithm | model = hasil training, algorithm = cara melatih |
| Token | Kata | token bisa subword/karakter |
| Embedding | Vector biasa | embedding merepresentasikan makna/relasi |
| Accuracy | Precision/Recall | accuracy bisa menipu di data imbalance |
| Hallucination | Error biasa | hallucination = output meyakinkan tapi salah |
50+ istilah AI untuk pemula
A. Istilah Inti (Pondasi Utama)
Ini adalah istilah inti dalam dunia AI dan machine learning yang sering muncul, jadi penting untuk dipahami sejak awal:
- Generalization: Kemampuan AI untuk bekerja dengan baik pada data yang belum pernah ia lihat sebelumnya.
- Artificial Intelligence (AI): Sistem komputer yang meniru kecerdasan manusia.
- Machine Learning (ML): Metode agar komputer belajar sendiri dari data tanpa harus diprogram manual.
- Deep Learning: Bagian dari ML yang menggunakan jaringan saraf berlapis seperti struktur otak manusia
- Model: Hasil akhir dari proses pelatihan data yang sudah siap digunakan untuk prediksi
- Training: Proses melatih algoritma menggunakan data agar menjadi model yang “pintar”
- Inference: Proses saat model digunakan untuk menghasilkan jawaban, misalnya ketika Anda bertanya ke ChatGPT
- Dataset: Kumpulan data yang digunakan untuk melatih atau menguji AI.
- Feature: Atribut atau variabel input seperti umur, harga, atau warna yang digunakan model untuk belajar
- Label: Jawaban benar yang digunakan dalam proses belajar.
- Supervised Learning: Metode belajar dengan data yang sudah memiliki jawaban benar
- Unsupervised Learning: Mencari pola tersembunyi tanpa ada kunci jawaban.
- Self-supervised Learning: Model belajar dengan menebak bagian data yang sengaja disembunyikan (dasar dari LLM).
- Reinforcement Learning (RL): Belajar lewat sistem reward (hadiah) dan penalti/hukuman.
- Overfitting: Kondisi ketika model terlalu menghafal data latihan sehingga buruk saat menghadapi data baru.
- Underfitting: Londisi ketika model terlalu sederhana sehingga gagal menangkap pola penting.
- Generalization: kemampuan model untuk tetap akurat pada data baru di dunia nyata.
B. Evaluasi model
Bagian ini penting supaya Anda tidak salah menilai performa sebuah model AI dan tidak hanya terpaku pada “terasa bagus” atau “terlihat pintar”.
Beberapa metrik yang umum digunakan:
- Accuracy: Seberapa sering jawaban AI secara keseluruhan benar.
- Precision: Seberapa tepat prediksi AI saat menyatakan sesuatu sebagai positif, agar tidak terlalu banyak tebakan yang salah.
- Recall: Seberapa banyak kasus positif yang berhasil ditemukan AI, supaya tidak ada yang terlewat.
- F1 Score: Keseimbangan antara Precision dan Recall.
- Confusion Matrix: Tabel evaluasi yang menampilkan kombinasi hasil seperti TP, TN, FP, dan FN untuk melihat performa lebih detail
- A/B Testing: Metode membandingkan dua versi model atau prompt untuk melihat mana yang memberikan hasil lebih baik atau lebih disukai pengguna
C. Istilah data dan proses
Bagian ini sering digunakan saat Anda mulai menyiapkan data sebelum masuk ke proses pelatihan model.
- Data preprocessing: Proses membersihkan dan mengubah data agar siap digunakan oleh model
- Normalization/Standardization: Teknik untuk menyamakan skala data agar setiap fitur berada pada rentang yang seimbang
- Train/Validation/Test Split: Pembagian data menjadi tiga bagian, yaitu data untuk pelatihan, validasi, dan pengujian model
D. Istilah LLM dan Generative AI
Bagian ini berisi istilah yang paling sering Anda temui saat bekerja dengan sistem AI saat ini, terutama LLM dan aplikasi berbasis AI agent.
- Large Language Model (LLM): model deep learning yang dilatih pada data sangat besar untuk memahami dan menghasilkan bahasa alami.
- Transformer: arsitektur neural network yang unggul untuk urutan kata dan pola teks.
- Token: Unit kecil teks yang diproses model, bisa berupa kata, subword, atau karakter.
- Tokenization: Proses memecah teks menjadi token.
- Context window: Jumlah token yang bisa “diingat” model dalam satu input.
- Prompt: Instruksi/teks input untuk mengarahkan output model.
- Prompt engineering: Merancang prompt untuk memenuhi kriteria sukses, idealnya diuji lewat evaluasi.
- Temperature: Parameter yang memengaruhi variasi/keberanian output.
- Top-p: Sampling untuk membatasi probabilitas token yang dipilih.
- Hallucination: Output yang terdengar meyakinkan tetapi faktanya salah.
- Grounding: Menambatkan jawaban ke sumber data yang bisa diverifikasi.
- Embedding: Representasi vektor yang menangkap makna/relasi antar teks.
- Vector database: Penyimpanan embedding untuk pencarian kemiripan.
- RAG (Retrieval-Augmented Generation): Mengambil konteks dari dokumen, lalu model menjawab berdasarkan konteks.
- Fine-tuning: Melatih ulang model pada data spesifik untuk tugas tertentu.
- Instruction tuning: Fine-tuning agar model lebih patuh instruksi.
- RLHF: Penyelarasan model memakai feedback manusia.
- Agentic AI / AI agent: Sistem yang dapat merencanakan dan menjalankan langkah-langkah (tool use) untuk menyelesaikan tugas.
E. Risiko, tata kelola, dan trust
Bagian ini sering dianggap “tambahan”, padahal justru krusial saat AI mulai dipakai di sistem nyata:
- Bias: Kecenderungan output yang tidak adil akibat data atau proses pelatihan yang tidak seimbang
- Fairness: Upaya memastikan hasil tidak merugikan kelompok tertentu.
- Privacy: Perlindungan data pribadi, termasuk saat training/inference.
- Security: Melindungi sistem dari serangan dan penyalahgunaan.
- Risk management: Pendekatan mengukur dan mengelola risiko AI, seperti yang ditekankan NIST.
- Evaluation/benchmarking: Menguji model dengan metode yang konsisten.
F. Bonus (sering muncul di diskusi):
Selain istilah utama, ada juga beberapa konsep yang sering dibahas saat masuk ke aspek performa dan operasional AI:
- Latency: Waktu yang dibutuhkan model untuk memberikan respons setelah menerima request
- Throughput: jumlah request yang bisa diproses per waktu.
- Cost per inference: biaya per request.
Checklist belajar AI untuk pemula
Agar tidak terasa “tersesat” di awal, lebih baik fokus ke konsep dasar yang benar benar sering dipakai dalam praktik.
Berikut hal hal yang sebaiknya dipahami terlebih dahulu:
- Pahami perbedaan training vs inference
- Kenali perbedaan accuracy, precision, dan recall
- Mengerti konsep token, context window, dan embedding
- Biasakan melakukan grounding, yaitu mengecek sumber atau dasar informasi
- Tentukan kriteria sukses sejak awal, lalu lakukan evaluasi kecil sebelum terlalu jauh masuk ke prompt engineering
Eksperimen AI sering butuh server sendiri
Eksperimen AI seperti RAG, vector search, hingga pengembangan AI Agent membutuhkan server dengan kendali penuh agar integrasi data dan API berjalan mulus.
Untuk mendukung kebutuhan deploy dan testing aplikasi AI Anda, VPS murah dari Rumahweb adalah solusi infrastruktur yang andal. Dengan performa stabil dan fleksibilitas tinggi, Anda bisa mengelola lingkungan pengembangan AI secara profesional tanpa kendala latency yang mengganggu.
FAQ
AI payung besar. ML bagian dari AI yang belajar dari data. Deep learning adalah ML berbasis neural network berlapis.
IBM menjelaskan LLM sebagai kategori model deep learning yang dilatih pada data sangat besar untuk memahami dan menghasilkan bahasa alami, biasanya berbasis transformer.
Karena pada dataset tidak seimbang, model bisa “tampak akurat” tanpa benar-benar berguna.
Hallucination adalah jawaban model yang terdengar yakin tetapi tidak benar secara fakta.
Prompt engineering adalah mengoptimalkan prompt berdasarkan kriteria sukses yang bisa diuji, tetapi tidak semua masalah harus diselesaikan dengan prompt.
Kesimpulan
Belajar AI akan terasa jauh lebih mudah jika Anda memiliki pemahaman dasar istilah yang jelas sejak awal. Dengan fondasi yang tepat, Anda tidak akan mudah tersesat saat membaca artikel atau diskusi teknis yang penuh jargon.
Secara sederhana, alurnya bisa dimulai dari:
- Pondasi: training, inference, model, dan data
- Evaluasi: accuracy, precision, dan recall
- Istilah LLM: token, embedding, RAG, hingga hallucination
Dengan memahami tiga lapisan ini, Anda akan lebih mudah mengikuti perkembangan dunia AI tanpa merasa kewalahan oleh istilah teknis yang muncul di sana sini.







