Baca berita dengan sedikit iklan, klik disini
TEMPO.CO, Jakarta - Badan Riset dan Inovasi Nasional (BRIN) mengembangkan model bahasa kecerdasan buatan atau AI yang membantu komputer untuk memahami, menafsirkan, dan menghasilkan teks bahasa. Cabang AI bernama Natural Language Processing (NLP) itu dikembangkan oleh para peneliti dari Pusat Riset Sains Data dan Informasi (PRSDI) BRIN.
Baca berita dengan sedikit iklan, klik disini
Peneliti dari Kelompok Riset Natural Language PRSDI BRIN, Iftitahu Ni'mah, mengatakan NLP terdiri dari berbagai metode analisis dan pengolahan bahasa alami. “Mulai dari pengolahan teks dan dokumen, pemrosesan bahasa alami pada chatbot dan asisten virtual, peringkasan otomatis, dan sebagainya," kata Iftitahu melalui keterangan tertulis, Jumat, 17 Mei 2024.
Baca berita dengan sedikit iklan, klik di sini
Baca berita dengan sedikit iklan, klik disini
Selama ini, analisis teks hanya memakai algoritma pembelajaran mesin (machine learning), pembelajaran mendalam (deep learning), serta pemodelan bahasa statistik. Adapun NLP, menurut dia, bisa mengelola data teks dan merespons informasi dengan cepat.
Kemampuannya dibuat semirip mungkin dengan manusia, terutama saat menghadapi data dan informasi di media sosial. Beberapa model populer dalam NLP adalah Transformer, Bidirectional Encoder Representations from Transformers (BERT), dan Generative Pre-trained Transformer (GPT).
Penelitian NLP pada sumber daya rendah, atau low resource NLP, umumnya terfokus pada penambahan data dan evaluasi. Proses ini jarang mempertimbangkan dampak negatif, seperti ketimpangan jumlah representasi kelas. Belum ada solusi dari segi desain algoritma untuk ketimpangan tersebut.
Dalam penelitian NLP, peneliti BRIN memakai dua studi kasus. Yang pertama adalah deteksi out-of-domain pada sistem dialog berbasis penugasan. Studi kedua menyangkut deteksi berita palsu berdasarkan sistem pelaporan hoax online di Indonesia.
Associate Professor Data Science Program Monash University Indonesia (UI), Derry Wijaya, mengatakan model bahasa besar (large language models/LLM) merupakan bagian dari AI generatif. Pemodalan bahasa membantu AI untuk memperbaiki ejaan, menghasilkan rangkuman yang bagus, menjawab pertanyaan dengan baik, serta merespons secara lebih natural.
“Language models ini meliputi pelatihan komputer yang lebih kuat,” kata dia.