Apa Itu Natural Language Generation? Cara Kerja dan Contohnya

Rita Puspita Sari
•
1 hari yang lalu

Dalam beberapa tahun terakhir, kecerdasan buatan semakin sering hadir dalam aktivitas sehari-hari. Kita berkomunikasi dengan chatbot, menerima ringkasan otomatis dari data, hingga mendapatkan saran kata saat mengetik di smartphone. Di balik semua kemampuan tersebut, ada satu teknologi penting yang bekerja secara diam-diam: Natural Language Generation (NLG).

NLG adalah fondasi utama yang memungkinkan mesin menghasilkan bahasa manusia secara otomatis — mulai dari teks ringkas, paragraf penjelasan, hingga jawaban panjang seperti yang dihasilkan model AI generatif saat ini. Teknologi ini mengubah data menjadi kalimat yang mudah dimengerti, sehingga informasi dapat diakses dengan cara yang lebih natural dan efisien.

Artikel ini membahas apa itu NLG, bagaimana cara kerjanya, jenis-jenisnya, serta perbedaannya dengan teknologi lain seperti NLP dan NLU.

Apa Itu NLG?

Natural Language Generation (NLG) adalah proses menggunakan kecerdasan buatan untuk menghasilkan bahasa alami (natural language) dari data, baik data terstruktur (seperti tabel dan angka) maupun data tidak terstruktur (seperti dokumen, file audio, atau teks panjang).

Dengan NLG, komputer dapat berinteraksi dengan manusia menggunakan kalimat yang jelas dan mudah dipahami, seolah-olah ditulis oleh manusia sungguhan.

NLG biasanya digunakan bersama dengan Natural Language Understanding (NLU) sebagai bagian dari bidang yang lebih besar, yaitu Natural Language Processing (NLP).

Jika NLP adalah payung utama yang mencakup pemahaman dan pemrosesan bahasa manusia, maka NLG adalah bagian yang bertugas menghasilkan konten baru.

Saat ini, NLG hadir dalam berbagai produk sehari-hari, seperti:

Business intelligence (BI) untuk membuat laporan otomatis,
Chatbot layanan pelanggan,
Asisten suara seperti Siri atau Google Assistant,
Model AI generatif seperti ChatGPT.

Setiap kali Anda melihat AI memberikan jawaban dalam bentuk kalimat — itulah hasil dari proses NLG.

Jenis–Jenis NLG

Secara umum, NLG modern dibagi menjadi dua kategori utama: ekstraktif dan abstraktif. Keduanya memiliki fungsi berbeda menurut kebutuhan pengguna dan tingkat kompleksitas analisis.

NLG Ekstraktif
Pada metode ekstraktif, sistem mengambil kata atau frasa langsung dari teks sumber tanpa menambah kreativitas atau parafrase. Model hanya memilih bagian yang paling relevan berdasarkan analisis, lalu menyusunnya menjadi keluaran.Metode ini umum dipakai dalam:
- Dokumen legal,
- Ringkasan teknis,
- Laporan yang membutuhkan presisi tinggi.
Karena tidak membuat konten baru, NLG ekstraktif jauh lebih sederhana dibandingkan jenis abstraktif. Namun, kekurangannya adalah keluaran bisa terasa kaku dan kurang mengalir seperti tulisan manusia.
NLG Abstraktif
Jika ekstraktif hanya menyalin, maka abstraktif menghasilkan konten baru berdasarkan pemahaman sistem terhadap dokumen sumber.

Model NLG abstraktif:
- Mengolah data,
- Memahami isi,
- Menyusun kalimat dengan kata-kata baru,
- Menghadirkan parafrase.
Proses ini membutuhkan model yang jauh lebih canggih, seperti transformer atau large language model (LLM).

Jenis NLG ini cocok untuk aplikasi yang memerlukan kreativitas atau penjelasan panjang, misalnya:
- Ringkasan berita,
- Penjelasan berbasis data,
- Jawaban panjang chatbot,
- Pembuatan konten.
Model generatif modern seperti ChatGPT menggunakan pendekatan abstraktif untuk menciptakan jawaban yang lebih natural dan kontekstual.

Bagaimana NLG Bekerja?

Menurut ilmuwan komputer Ehud Reiter, proses NLG mencakup beberapa tahap penting yang terjadi berurutan. Tahapan ini membantu sistem mengenali data, menyusun rencana, hingga akhirnya menghasilkan kalimat.

Berikut penjelasannya:

Analisis Sinyal / Data
Tahap pertama adalah memahami data apa yang masuk. Sistem:
- Mengidentifikasi konteks,
- Menganalisis pola,
- Menentukan informasi penting.
Data bisa berasal dari:
- Prompt pengguna,
- Basis data,
- Dokumen PDF atau teks panjang,
- Rekaman suara yang sudah ditranskripsi.
Proses seperti entity recognition digunakan untuk mengenali objek atau topik utama dalam data tersebut.
Interpretasi Data
Pada tahap ini, model NLP mengekstraksi wawasan atau insight dari data yang dianalisis.Jika data sudah diproses sebelumnya atau sudah memiliki struktur tertentu, tahap ini bisa dilewati. Namun dalam banyak kasus, sistem perlu:
- Menandai bagian bahasa (part-of-speech),
- Menganalisis struktur kalimat (sintaks),
- Memahami arti kata dan konteks (semantik).
Di sinilah peran NLU menjadi penting.
Perencanaan Dokumen
Setelah memahami data, sistem memutuskan:
- Informasi mana yang penting,
- Informasi mana yang perlu disampaikan,
- Urutan penyampaian yang paling efektif.
Tahap ini mirip seperti menyusun kerangka artikel sebelum menulis.
Microplanning
Tahap ini menentukan bagaimana kalimat akan disusun. Sistem memikirkan:
- Pemilihan kata,
- Gaya bahasa,
- Struktur paragraf,
- Panjang kalimat.
Tujuannya agar pesan tersampaikan secara jelas dan konsisten.
Surface Realization
Ini adalah tahap akhir di mana sistem menerjemahkan rencana yang sudah dibuat ke dalam bentuk bahasa alami. Pada tahap ini, algoritma menghasilkan kalimat lengkap yang siap dibaca manusia.
Mesin kini telah menghasilkan teks baru — inilah inti dari Natural Language Generation.

Perbedaan NLG, NLP, dan NLU

Istilah NLG, NLP, dan NLU sering terdengar mirip sehingga kerap dianggap sama. Padahal, ketiganya memiliki fungsi berbeda meski saling berkaitan dalam ekosistem kecerdasan buatan yang memahami dan memproduksi bahasa manusia. Berikut penjelasan paling sederhana agar mudah dibedakan.

NLG (Natural Language Generation)
NLG adalah teknologi yang membuat mesin mampu menulis atau menghasilkan teks layaknya manusia. Sistem ini mengubah data mentah menjadi kalimat yang enak dibaca.

Contoh penggunaan:
- Chatbot yang menulis jawaban otomatis.
- Aplikasi yang membuat laporan bisnis berdasarkan data penjualan.
- Sistem yang menyusun ringkasan otomatis dari data kompleks.
Dengan kata lain, NLG adalah proses “mesin berbicara atau menulis”.
NLU (Natural Language Understanding)
Jika NLG berfokus pada kemampuan mesin menghasilkan bahasa, NLU berfokus pada membuat mesin mengerti apa yang dikatakan manusia. Ini termasuk memahami:
- Emosi (senang, marah, kecewa)
- Sentimen (positif, negatif, netral)
- Niat (ingin membeli, bertanya, mengeluh)
- Konteks (makna tergantung situasi)
- Arti tersirat atau makna mendalam dalam kalimat
Contoh penggunaan:
Saat pengguna mengetik, “Lapar nih”, sistem dapat menangkap maksud bahwa pengguna menginginkan rekomendasi makanan—bukan sekadar memberi definisi kata “lapar”.

Jadi, NLU adalah proses “mesin memahami manusia”.
NLP (Natural Language Processing)
NLP adalah bidang yang lebih luas dan mencakup berbagai teknik untuk membuat komputer mampu memproses bahasa manusia. Di dalamnya terdapat dua proses besar:
- NLU: Mengubah bahasa menjadi data yang bisa dipahami mesin.
- NLG: Mengubah data kembali menjadi bahasa yang natural.
- NLP mencakup banyak tahapan teknis, mulai dari tokenisasi, ekstraksi informasi, klasifikasi teks, sampai penerjemahan.

Kemajuan dalam deep learning dan large language models (LLM) seperti GPT membuat kemampuan NLG, NLU, dan NLP berkembang sangat cepat. Hasilnya, kini banyak aplikasi AI generatif yang mampu:

menulis otomatis,
menjawab percakapan dengan konteks,
memahami maksud pengguna lebih akurat,
menerjemahkan lebih natural,
dan menghasilkan konten kreatif seperti artikel, skrip, hingga kode.

Teknologi-teknologi inilah yang menjadi dasar chatbot cerdas, asisten virtual, dan sistem otomatis modern.

Perkembangan Model dan Metodologi NLG

Sistem NLG modern sebagian besar menggunakan model AI berbasis deep learning, terutama transformer, untuk menghasilkan kalimat yang koheren dan kontekstual. Namun, sebelum teknologi ini muncul, NLG dikembangkan melalui berbagai pendekatan lain yang lebih sederhana. Berikut penjelasan setiap model yang pernah dan masih digunakan hingga saat ini.

Model Template
Template merupakan metode NLG paling sederhana dan menjadi titik awal teknologi ini berkembang. Sistem berbasis template bekerja dengan pola kalimat yang sudah ditentukan sebelumnya. Beberapa bagian teks dibiarkan kosong sebagai variabel, lalu diisi berdasarkan input pengguna atau data terstruktur lainnya.

Contohnya:

“Pada [bulan] [tahun], toko kami di [lokasi] menjual [jumlah] unit [produk].”

Metode ini sangat efektif untuk pembuatan laporan dengan struktur yang selalu sama, seperti laporan penjualan, laporan operasional, atau notifikasi sederhana.

Kelebihan:
- Struktur output sangat konsisten.
- Mudah dipahami dan diimplementasikan.
- Tidak membutuhkan banyak data pelatihan.
Kekurangan:
- Tidak fleksibel.
- Tidak dapat menghasilkan variasi bahasa.
- Tidak cocok untuk teks yang memerlukan gaya bahasa kreatif.
Template bahkan tidak bisa digunakan untuk membuat sesuatu yang membutuhkan kreativitas, seperti resep masakan atau artikel opini. Struktur yang kaku membuatnya cepat ditinggalkan ketika kebutuhan pasar menuntut hasil yang lebih natural.
Sistem Berbasis Aturan (Rule-Based Systems)
Sebelum machine learning berkembang pesat, pendekatan berbasis aturan menjadi salah satu metode paling populer. Sistem ini bekerja berdasarkan logika yang ditentukan manual oleh pengembang atau pakar di bidang tertentu.

Biasanya, pengembang mewawancarai pakar untuk memahami bagaimana mereka menyusun suatu teks. Setelah itu, dibuatlah aturan “if–then” yang mengatur bagaimana teks dihasilkan.

Misalnya, pada laporan cuaca:
- Jika suhu di bawah 32°F atau 0°C
  maka deskripsikan sebagai “di bawah titik beku”.
Metode ini lebih fleksibel dibanding template karena dapat menyesuaikan output berdasarkan kondisi tertentu. Namun seiring bertambahnya aturan, sistem menjadi sangat rumit dan sulit dipelihara.

Kelemahan terbesar dari rule-based system adalah ketergantungan pada aturan manual. Ketika domain informasi berkembang, aturan harus ditambah satu per satu, membuat sistem rentan terhadap inkonsistensi.
Algoritma Machine Learning Statistik
Perkembangan machine learning membawa perubahan besar bagi NLG. Model statistik seperti Hidden Markov Model (HMM) atau rantai Markov memungkinkan sistem untuk mempelajari pola dari dataset besar tanpa harus diberi aturan secara manual.

Dalam konteks NLG, model ini memprediksi kemungkinan kata berikutnya berdasarkan pola kata sebelumnya. Semakin besar data yang diberikan, semakin baik pola yang dapat dipelajari.

Kelebihan:
- Lebih fleksibel daripada rule-based.
- Mampu menghasilkan variasi teks.
- Dapat belajar dari data tanpa campur tangan manusia.
Namun, model statistik membutuhkan dataset besar untuk dapat menghasilkan keluaran yang masuk akal. Selain itu, model ini terbatas pada pola lokal dan tidak bisa memahami konteks jangka panjang dalam kalimat.
Model Deep Learning
Kemajuan berikutnya adalah munculnya model deep learning, seperti Recurrent Neural Networks (RNN). RNN dirancang untuk mengolah data berulang atau sekuensial, misalnya kalimat atau paragraf. Model ini memiliki kemampuan untuk mengingat informasi dari langkah sebelumnya, sehingga konteks dalam kalimat bisa dipertahankan.

RNN banyak digunakan di:
- sistem terjemahan mesin,
- chatbot awal,
- prediksi teks,
- aplikasi pembuatan deskripsi otomatis.
Meski lebih canggih dari model statistik, RNN masih menghadapi kendala dalam mengolah hubungan jangka panjang antar kata. Model cenderung “lupa” konteks ketika kalimat terlalu panjang, sehingga hasilnya tidak selalu konsisten.
Transformer: Generasi Tercanggih NLG
Lompatan terbesar terjadi ketika arsitektur transformer diperkenalkan. Berbasis mekanisme self-attention, model ini mampu memahami hubungan antar kata dalam jarak jauh, membuat hasil teks jauh lebih natural, koheren, dan relevan secara konteks.

Model transformer kini menjadi fondasi berbagai teknologi populer seperti:
- GPT (termasuk ChatGPT),
- BERT,
- LLaMA,
- Claude.
Keunggulan transformer terletak pada kemampuannya memahami konteks global dalam kalimat dan menghasilkan tulisan yang sangat mirip dengan tulisan manusia.

Asisten digital modern, alat penulisan otomatis, hingga model generatif di aplikasi kreatif semuanya memanfaatkan teknologi ini.

Penerapan NLG dalam Kehidupan Sehari-hari

Teknologi NLG kini hadir dalam berbagai layanan digital. Setiap kali Anda membaca ringkasan otomatis, meminta chatbot menjawab pertanyaan, atau menggunakan asisten suara, NLG bekerja di balik layar.

Berikut beberapa use case utamanya:

Asisten Suara (Voice Assistants)
Siri, Alexa, Google Assistant, dan berbagai asisten suara lainnya menggunakan NLG untuk menyampaikan jawaban kepada pengguna. Setelah mengenali suara dan memahami maksud pengguna melalui NLP dan NLU, sistem akan menyusun kalimat respons yang terdengar alami.
Asisten Virtual dan Chatbot
Banyak perusahaan kini memakai chatbot untuk layanan pelanggan. Mulai dari menjawab pertanyaan dasar, memandu pengguna, hingga memberikan rekomendasi produk. NLG memungkinkan chatbot untuk membalas dengan gaya bahasa yang natural dan konsisten.

Ketika pertanyaan menjadi terlalu kompleks, sistem dapat meneruskan ke agen manusia.
Terjemahan Mesin (Machine Translation)
Aplikasi seperti Google Translate dan DeepL bekerja menggunakan dua komponen: pemahaman bahasa (NLU) dan pembangkitan bahasa (NLG). Setelah memahami teks sumber, sistem menghasilkan teks baru dalam bahasa target.

Terjemahan modern jauh lebih akurat berkat model transformer.
Ringkasan Data dan Pembuatan Laporan
Di bidang bisnis, NLG digunakan untuk mengubah data mentah menjadi laporan informatif. Misalnya:
- laporan penjualan,
- ringkasan performa mingguan,
- analisis tren pasar.
Dengan NLG, tugas yang biasa menghabiskan waktu berjam-jam kini bisa selesai dalam hitungan detik.
Pembuatan Konten Otomatis
Banyak perusahaan memanfaatkan NLG untuk membuat:
- deskripsi produk,
- email pemasaran,
- posting media sosial,
- materi promosi pendek.
Model generatif dapat menulis puluhan versi konten dalam waktu singkat dengan gaya bahasa berbeda sesuai target audiens.
Analisis Sentimen
Perusahaan sering mengumpulkan ribuan komentar dari media sosial, ulasan pelanggan, atau forum online. Melalui NLG, sistem dapat merangkum pola opini pengguna dan menghasilkan laporan tentang bagaimana publik merespons produk atau layanan tertentu.

Kesimpulan

Natural Language Generation adalah teknologi kunci yang memungkinkan komputer menghasilkan teks layaknya manusia. Dengan dua pendekatan utama NLG dapat digunakan untuk berbagai kebutuhan, mulai dari ringkasan teknis, laporan otomatis, hingga konten kreatif.

Proses NLG melibatkan serangkaian tahapan penting: memahami data, menafsirkan konteks, merencanakan dokumen, hingga menyusun dan merealisasikan bahasa. Teknologi ini bekerja berdampingan dengan NLP dan NLU, membentuk fondasi bagi semua aplikasi AI yang berkomunikasi melalui bahasa alami.

Seiring meningkatnya penggunaan AI generatif di berbagai industri, kemampuan NLG akan semakin krusial—baik untuk bisnis, layanan pelanggan, pendidikan, maupun komunikasi digital secara keseluruhan. Jika mesin bisa memahami bahasa dan sekaligus menghasilkan bahasa, maka jarak antara manusia dan teknologi akan semakin menyempit.