Apa itu LLM (Large Language Model)?

LLM adalah kategori model deep learning yang dilatih pada data sangat besar sehingga mampu memahami dan menghasilkan bahasa alami, umumnya berbasis arsitektur transformer.

Istilah AI untuk Pemula: 50+ Kata yang Wajib Dipahami

Q: Apa bedanya AI, machine learning, dan deep learning?

AI adalah payung besar. Machine learning adalah bagian dari AI yang belajar dari data. Deep learning adalah machine learning yang menggunakan neural network berlapis.

Q: Kenapa accuracy bisa menipu?

Accuracy bisa menipu pada dataset yang tidak seimbang karena model dapat terlihat akurat hanya dengan memprediksi kelas mayoritas, tanpa benar-benar berguna untuk mendeteksi kelas minoritas.

by

Adellia Luluk Anggraini

April 30, 2026

rumahweb.com

Saat mulai belajar AI, banyak orang justru merasa bingung bukan karena coding atau matematika, melainkan karena banyaknya istilah AI yang harus dipahami. Kata seperti model, training, inference, token, embedding, hallucination, hingga RAG sering muncul seolah sudah umum dipahami.

Padahal, tanpa memahami istilah AI adalah fondasi penting, proses belajar bisa terasa jauh lebih lambat dan membingungkan. Banyak pemula akhirnya kesulitan membedakan mana konsep inti dan mana sekadar jargon teknis. Agar tidak tersesat di istilah yang kompleks, baca artikel ini sampai selesai karena kami merangkum 50+ istilah AI secara ringkas, jelas, dan mudah dipahami.

Ringkasan Cepat

Machine Learning Glossary dari Google mendefinisikan banyak istilah ML/AI, termasuk istilah yang terkait LLM.
IBM menjelaskan large language models (LLM) sebagai kategori model deep learning yang dilatih pada data sangat besar dan umumnya berbasis arsitektur transformer, mampu memahami dan menghasilkan bahasa alami.
NIST menekankan pendekatan berbasis risiko untuk memaksimalkan manfaat AI sambil meminimalkan dampak negatif, termasuk pengukuran, evaluasi, standar, dan tata kelola.
Untuk prompt engineering, praktik terbaik sebaiknya dimulai dari kriteria sukses yang jelas dan evaluasi yang bisa diuji, lalu teknik prompting diterapkan sesuai kebutuhan.

AI (Artificial Intelligence) adalah bidang yang berfokus pada pembuatan sistem yang dapat melakukan tugas yang biasanya membutuhkan kecerdasan manusia, seperti memahami bahasa, mengenali pola, mengambil keputusan, dan menghasilkan konten.

Cara pakai glossary ini

Supaya tidak terasa membingungkan di awal, Anda tidak perlu membaca semuanya sekaligus. Gunakan glossary ini sesuai kebutuhan Anda saja.

Beberapa cara yang bisa membantu:

Jika Anda pemula: mulai dari bagian istilah inti, lalu lanjut ke bagian LLM
Jika Anda sudah terbiasa praktik: langsung cari istilah yang paling sering muncul di pekerjaan Anda
Jika Anda sering bingung istilah yang mirip: cek bagian “sering tertukar” untuk membedakan konsepnya dengan lebih jelas

Dengan cara ini, glossary bisa dipakai sebagai referensi cepat, bukan bahan bacaan yang harus dihafalkan dari awal sampai akhir.

Tabel singkat: istilah yang paling sering tertukar

Istilah	Sering dikira sama dengan	Bedanya apa?
AI	Machine Learning	ML adalah bagian dari AI
Training	Inference	training = belajar, inference = memakai
Model	Algorithm	model = hasil training, algorithm = cara melatih
Token	Kata	token bisa subword/karakter
Embedding	Vector biasa	embedding merepresentasikan makna/relasi
Accuracy	Precision/Recall	accuracy bisa menipu di data imbalance
Hallucination	Error biasa	hallucination = output meyakinkan tapi salah

50+ istilah AI untuk pemula

A. Istilah Inti (Pondasi Utama)

Ini adalah istilah inti dalam dunia AI dan machine learning yang sering muncul, jadi penting untuk dipahami sejak awal:

Generalization: Kemampuan AI untuk bekerja dengan baik pada data yang belum pernah ia lihat sebelumnya.
Artificial Intelligence (AI): Sistem komputer yang meniru kecerdasan manusia.
Machine Learning (ML): Metode agar komputer belajar sendiri dari data tanpa harus diprogram manual.
Deep Learning: Bagian dari ML yang menggunakan jaringan saraf berlapis seperti struktur otak manusia
Model: Hasil akhir dari proses pelatihan data yang sudah siap digunakan untuk prediksi
Training: Proses melatih algoritma menggunakan data agar menjadi model yang “pintar”
Inference: Proses saat model digunakan untuk menghasilkan jawaban, misalnya ketika Anda bertanya ke ChatGPT
Dataset: Kumpulan data yang digunakan untuk melatih atau menguji AI.
Feature: Atribut atau variabel input seperti umur, harga, atau warna yang digunakan model untuk belajar
Label: Jawaban benar yang digunakan dalam proses belajar.
Supervised Learning: Metode belajar dengan data yang sudah memiliki jawaban benar
Unsupervised Learning: Mencari pola tersembunyi tanpa ada kunci jawaban.
Self-supervised Learning: Model belajar dengan menebak bagian data yang sengaja disembunyikan (dasar dari LLM).
Reinforcement Learning (RL): Belajar lewat sistem reward (hadiah) dan penalti/hukuman.
Overfitting: Kondisi ketika model terlalu menghafal data latihan sehingga buruk saat menghadapi data baru.
Underfitting: Londisi ketika model terlalu sederhana sehingga gagal menangkap pola penting.
Generalization: kemampuan model untuk tetap akurat pada data baru di dunia nyata.

B. Evaluasi model

Bagian ini penting supaya Anda tidak salah menilai performa sebuah model AI dan tidak hanya terpaku pada “terasa bagus” atau “terlihat pintar”.

Beberapa metrik yang umum digunakan:

Accuracy: Seberapa sering jawaban AI secara keseluruhan benar.
Precision: Seberapa tepat prediksi AI saat menyatakan sesuatu sebagai positif, agar tidak terlalu banyak tebakan yang salah.
Recall: Seberapa banyak kasus positif yang berhasil ditemukan AI, supaya tidak ada yang terlewat.
F1 Score: Keseimbangan antara Precision dan Recall.
Confusion Matrix: Tabel evaluasi yang menampilkan kombinasi hasil seperti TP, TN, FP, dan FN untuk melihat performa lebih detail
A/B Testing: Metode membandingkan dua versi model atau prompt untuk melihat mana yang memberikan hasil lebih baik atau lebih disukai pengguna

C. Istilah data dan proses

Bagian ini sering digunakan saat Anda mulai menyiapkan data sebelum masuk ke proses pelatihan model.

Data preprocessing: Proses membersihkan dan mengubah data agar siap digunakan oleh model
Normalization/Standardization: Teknik untuk menyamakan skala data agar setiap fitur berada pada rentang yang seimbang
Train/Validation/Test Split: Pembagian data menjadi tiga bagian, yaitu data untuk pelatihan, validasi, dan pengujian model

D. Istilah LLM dan Generative AI

Bagian ini berisi istilah yang paling sering Anda temui saat bekerja dengan sistem AI saat ini, terutama LLM dan aplikasi berbasis AI agent.

Large Language Model (LLM): model deep learning yang dilatih pada data sangat besar untuk memahami dan menghasilkan bahasa alami.
Transformer: arsitektur neural network yang unggul untuk urutan kata dan pola teks.
Token: Unit kecil teks yang diproses model, bisa berupa kata, subword, atau karakter.
Tokenization: Proses memecah teks menjadi token.
Context window: Jumlah token yang bisa “diingat” model dalam satu input.
Prompt: Instruksi/teks input untuk mengarahkan output model.
Prompt engineering: Merancang prompt untuk memenuhi kriteria sukses, idealnya diuji lewat evaluasi.
Temperature: Parameter yang memengaruhi variasi/keberanian output.
Top-p: Sampling untuk membatasi probabilitas token yang dipilih.
Hallucination: Output yang terdengar meyakinkan tetapi faktanya salah.
Grounding: Menambatkan jawaban ke sumber data yang bisa diverifikasi.
Embedding: Representasi vektor yang menangkap makna/relasi antar teks.
Vector database: Penyimpanan embedding untuk pencarian kemiripan.
RAG (Retrieval-Augmented Generation): Mengambil konteks dari dokumen, lalu model menjawab berdasarkan konteks.
Fine-tuning: Melatih ulang model pada data spesifik untuk tugas tertentu.
Instruction tuning: Fine-tuning agar model lebih patuh instruksi.
RLHF: Penyelarasan model memakai feedback manusia.
Agentic AI / AI agent: Sistem yang dapat merencanakan dan menjalankan langkah-langkah (tool use) untuk menyelesaikan tugas.

E. Risiko, tata kelola, dan trust

Bagian ini sering dianggap “tambahan”, padahal justru krusial saat AI mulai dipakai di sistem nyata:

Bias: Kecenderungan output yang tidak adil akibat data atau proses pelatihan yang tidak seimbang
Fairness: Upaya memastikan hasil tidak merugikan kelompok tertentu.
Privacy: Perlindungan data pribadi, termasuk saat training/inference.
Security: Melindungi sistem dari serangan dan penyalahgunaan.
Risk management: Pendekatan mengukur dan mengelola risiko AI, seperti yang ditekankan NIST.
Evaluation/benchmarking: Menguji model dengan metode yang konsisten.

F. Bonus (sering muncul di diskusi):

Selain istilah utama, ada juga beberapa konsep yang sering dibahas saat masuk ke aspek performa dan operasional AI:

Latency: Waktu yang dibutuhkan model untuk memberikan respons setelah menerima request
Throughput: jumlah request yang bisa diproses per waktu.
Cost per inference: biaya per request.

Checklist belajar AI untuk pemula

Agar tidak terasa “tersesat” di awal, lebih baik fokus ke konsep dasar yang benar benar sering dipakai dalam praktik.

Berikut hal hal yang sebaiknya dipahami terlebih dahulu:

Pahami perbedaan training vs inference
Kenali perbedaan accuracy, precision, dan recall
Mengerti konsep token, context window, dan embedding
Biasakan melakukan grounding, yaitu mengecek sumber atau dasar informasi
Tentukan kriteria sukses sejak awal, lalu lakukan evaluasi kecil sebelum terlalu jauh masuk ke prompt engineering

Eksperimen AI sering butuh server sendiri

Eksperimen AI seperti RAG, vector search, hingga pengembangan AI Agent membutuhkan server dengan kendali penuh agar integrasi data dan API berjalan mulus.

Untuk mendukung kebutuhan deploy dan testing aplikasi AI Anda, VPS murah dari Rumahweb adalah solusi infrastruktur yang andal. Dengan performa stabil dan fleksibilitas tinggi, Anda bisa mengelola lingkungan pengembangan AI secara profesional tanpa kendala latency yang mengganggu.

FAQ

1. Apa bedanya AI, ML, dan deep learning ?

AI payung besar. ML bagian dari AI yang belajar dari data. Deep learning adalah ML berbasis neural network berlapis.

2. LLM itu apa ?

IBM menjelaskan LLM sebagai kategori model deep learning yang dilatih pada data sangat besar untuk memahami dan menghasilkan bahasa alami, biasanya berbasis transformer.

3, Kenapa accuracy bisa menipu ?

Karena pada dataset tidak seimbang, model bisa “tampak akurat” tanpa benar-benar berguna.

4. Apa itu hallucination ?

Hallucination adalah jawaban model yang terdengar yakin tetapi tidak benar secara fakta.

5. Apa itu prompt engineering dan kapan perlu ?

Prompt engineering adalah mengoptimalkan prompt berdasarkan kriteria sukses yang bisa diuji, tetapi tidak semua masalah harus diselesaikan dengan prompt.

Kesimpulan

Belajar AI akan terasa jauh lebih mudah jika Anda memiliki pemahaman dasar istilah yang jelas sejak awal. Dengan fondasi yang tepat, Anda tidak akan mudah tersesat saat membaca artikel atau diskusi teknis yang penuh jargon.

Secara sederhana, alurnya bisa dimulai dari:

Pondasi: training, inference, model, dan data
Evaluasi: accuracy, precision, dan recall
Istilah LLM: token, embedding, RAG, hingga hallucination

Dengan memahami tiga lapisan ini, Anda akan lebih mudah mengikuti perkembangan dunia AI tanpa merasa kewalahan oleh istilah teknis yang muncul di sana sini.

Referensi

Facebook X LinkedIn

AI, Artificial Intelligence, Istilah AI

Cara Menggunakan Grok AI: Panduan Lengkap untuk Pemula

Adellia Luluk Anggraini

June 12, 2026

Semakin banyak orang memanfaatkan AI untuk membantu pekerjaan sehari-hari, mulai dari mencari informasi, membuat konten, hingga menganalisis data. Namun, cara ...

banner blog - Contoh Prompt Gemini untuk Front End Developer

Contoh Prompt Gemini AI untuk Front End Developer

Adellia Luluk Anggraini

June 10, 2026

Membuat tampilan website kini tidak selalu harus dimulai dari baris kode kosong. Dengan bantuan AI seperti Gemini, front-end developer dapat ...

Cara AI Membantu Pengusaha Menghemat 15 Jam Kerja per Minggu

Wina Dwi S

June 10, 2026

Bagi jutaan bisnis, AI kini bukan sekadar alat bantu, melainkan sudah berperan layaknya karyawan sendiri. Laporan State of AI dari ...

Cara Menulis Prompt Gemini yang Efektif untuk Google Workspace

Adellia Luluk Anggraini

June 10, 2026

Banyak orang menggunakan AI seperti menggunakan mesin pencari, yaitu dengan mengetik satu kalimat singkat lalu berharap mendapatkan hasil yang langsung ...

banner blog - Cara Membuat PPT Dengan Gamma AI

Cara Membuat PPT Dengan Gamma AI, Lebih Cepat dan Rapi

Adellia Luluk Anggraini

June 9, 2026

Pernah menghabiskan waktu berjam-jam hanya untuk menyusun presentasi, tetapi hasilnya masih terasa biasa saja? Kini, membuat PPT atau presentasi dengan ...

banner blog - Cara Menulis Artikel dengan AI

Cara Menulis Artikel dengan AI dari Brief sampai Publish

Adellia Luluk Anggraini

May 22, 2026

Menulis artikel dengan AI bisa mempercepat banyak tahap produksi konten, mulai dari mencari ide, menyusun outline, hingga membuat draft awal. ...

Istilah AI untuk Pemula: 50+ Kata yang Wajib Dipahami

by

Ringkasan Cepat

Cara pakai glossary ini

Tabel singkat: istilah yang paling sering tertukar

50+ istilah AI untuk pemula

A. Istilah Inti (Pondasi Utama)

B. Evaluasi model

C. Istilah data dan proses

D. Istilah LLM dan Generative AI

E. Risiko, tata kelola, dan trust

F. Bonus (sering muncul di diskusi):

Checklist belajar AI untuk pemula

Eksperimen AI sering butuh server sendiri

FAQ

Kesimpulan

Referensi

Related Post

Cara Menggunakan Grok AI: Panduan Lengkap untuk Pemula

Contoh Prompt Gemini AI untuk Front End Developer

Cara AI Membantu Pengusaha Menghemat 15 Jam Kerja per Minggu

Cara Menulis Prompt Gemini yang Efektif untuk Google Workspace

Cara Membuat PPT Dengan Gamma AI, Lebih Cepat dan Rapi

Cara Menulis Artikel dengan AI dari Brief sampai Publish

Hubungi Kami

Layanan

Tutorial

Informasi

News