Judul : Peringkasan
Multi-Dokumen Berbasis Clustering pada Sistem Temu Kembali Berita Online
Menggunakan Metode K-Means
Penulis : Amalia Kusuma Akaresti, Mochammad Ali Fauzi, Fitra
Abdurrachman Bachtiar Program Studi Teknik Informatika, Fakultas Ilmu
Komputer, Universitas Brawijaya
Publikasi : Jurnal Pengembangan Teknologi Informasi dan Ilmu
Komputer, Vol. 3, No. 1, Januari 2019, hlm. 325-331
Link Jurnal : http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/4116/1653
Reviewer : M.Izzul Fahmi
Tujuan Penelitian :
Pada penelitian ini dilakukan
peringkasan multi-dokumen berbasis clustering pada sistem temu kembali berita
online menggunakan metode K-Means. Penelitian ini bertujuan mengurangi
terjadinya redunansi informasi yang dapat menyebabkan pengguna internet menghabiskan
bayak waktu apabila membaca berbagai macam berita dari situs berita online yang
berbeda namun memiliki inti informasi yang sama.
Metode yang digunakan adalah
metode K-Means yaitu merupakan sistem yang dikembangkan untuk
mepermudah pengguna internet dalam menerima berita secara ringkas tanpa harus
membuang waktunya dengan membaca banyak berita dengan topik yang sama dan
menghasilkan peringkasan yang efektif dengan efisien. Sistem pada penelitian
ini terdapat dua tahap pemrosesan, yaitu pencarian dan peringkasan.
Hasil dan Pembahasan :
Pada penelitianu ini dilakukan
dua macam penelitian. Pengujian yang pertama pada penelitian ini dilakukan oleh
pakar. Sedangkan pengujian yang kedua dilakukan oleh pengguna umum.
Hasil pengujian oleh pakar :
Pakar yang digunakan dalam penelitian ini orang yang berkecimpung di dunia
jurnalistik, dan setelah mengkaji antara hasil sistem dan hasil pakar dapat
disimpulkan bahwa hasil clustering peringkasan oleh pakar untuk hasil
ringkasan yang dihasilkan, pakar memperhatikan susuan antar kalimat -
kalimatnya dan memperhatikan kesesuaian topik antar query yang dimasukan dengan
informasi yang tersedia pada data. Sedangkan sistem dalam hasil peringkasannya
hanya bergantung pada nilai Euclidean Distance, atau kesesuaian nilai jarak
kedekatan antar centroidnya. Sehingga ini menjadi benyebab mengapa hasil
pengujian pada peringkasan memiliki hasil yang sangat rendah.
Hasil pengujian oleh pengguna
umum :
Terdapat dua jenis penilaian kepuasan, yaitu kemudahan dalam pencarian
informasi dan kepusan terhadap penggunaan sistem dalam penelitian ini. Dari
hasil yang didapatkan pada pengujian kemudahan dan kepuasan oleh pengguna umum,
dapat disimpulkan bahwa sistem pencarian yang dibuat sudah sesuai dengan tujuan
penelitian untuk memudahkan pengguna internet dalam mencari informasi.
Judul : Strategi
Pemilihan Kalimat pada Peringkasan Multi Dokumen
Penulis : Satrio Verdianto, Agus Zainal Arifin, dan Diana
Purwitasari Jurusan Teknik Informatika, Fakultas Teknologi Informasi,
Institut Teknologi Sepuluh Nopember (ITS)
Publikasi : Nusantara Journal of Computers and its
Applications, Volume 2 – No.7, Desember 2016
Link Jurnal : https://njca.co.id/main/index.php/njca/article/view/14
Reviewer : M.Izzul Fahmi
Tujuan Penelitian :
Penelitian ini bertujuan untuk
memudahkan pengguna ketika mengakses berita secara online dengan cara melakukan
peringkasan berita. Ringkasan berita dapat diartikan sebagai sebuah teks yang
dihasilkan dari satu atau lebih kalimat yang mampu menyampaikan informasi
penting dari sebuah berita. Dimana panjang dari sebuah ringkasan tidak lebih
dari setengah panjang dokumen asli.
Metode Pengujian :
Uji coba dilakukan dengan
mengukur performa hasil ringkasan dengan menggunakan kombinasi empat fitur
berita yaitu posisi kalimat (p), word frequency (w), TF-IDF (t), dan judul
berita (j). Nantinya kombinasi 4 fitur akan dibandingkan dengan kombinasi 3
fitur dan kombinasi 2 fitur. Untuk mengukur performansi hasil ringkasan
digunakan metode evaluasi ROUGE-N yaitu ROUGE-1 dan evaluasi berdasarkan waktu
eksekusi.
Dataset :
Pengujian pada sistem peringkasan
dalam penelitian ini dilakukan dengan membandingkan hasil ringkasan sistem
dengan hasil ringkasan manusia dengan menggunakan ROUGE-N. Pengujian dilakukan
terhadap 15 kelompok dokumen berita berformat .xml yang dikelompokkan
berdasarkan topik dimana masing-masing kelompok memiliki jumlah dokumen berita.
Hasil dan Pembahasan :
Berdasarkan uji coba, didapatkan kesimpulan bahwa diantara empat kombinasi
fitur yakni fitur posisi kalimat, word frequency, TF-IDF, dan judul berita,
kombinasi yang paling optimal berdasarkan nilai ROUGE-1 dan waktu eksekusi
adalah kombinasi fitur posisi kalimat dan word frequency dengan nilai ROUGE-1
sebesar 0.679 dan lama waktu eksekusi 28.458 detik.
Perbandingan antara kedua
jurnal
Pada jurnal penelitian yang
pertama menghasilkan peringkasan multi-dokumen berbasis clustering dengan
metode k-mens yang bertujuan mengurangi terjadinya redundansi
informasi yang dapat menyebabkan pengguna internet menghabiskan bayak waktu
apabila membaca berbagai macam berita dari situs berita online yang berbeda
namun memiliki inti informasi yang sama.
Pada saat pengujian dilakukan dua kali yaitu dilakukan oleh pakar dan pengguna
umum. Pada pengujian oleh pakar yaitu pakar memperhatikan susuan antar kalimat
- kalimatnya dan memperhatikan kesesuaian topik antar query yang dimasukan
dengan informasi yang tersedia pada data. Sedangkan, pengujian oleh pengguna
umum Terdapat dua jenis penilaian kepuasan, yaitu kemudahan dalam pencarian
informasi dan kepusan terhadap penggunaan sistem dalam penelitian ini. Dan
dihasilkan bahwa sistem pencarian yang dibuat sudah sesuai dengan tujuan
penelitian untuk memudahkan pengguna internet dalam mencari informasi.
Sedangkan pada jurnal yang kedua sama – sama menghasilkan peringkasan
multi-dokumen. Namun kali ini menggunakan strategi pemilihan kalimat. Pada
penelitian tersebut bertujuan untuk memudahkan pengguna ketika mengakses berita
secara online dengan cara melakukan peringkasan berita.
Penelitian ini melakukan pengujian pada sistem peringkasan dalam penelitian ini
dilakukan dengan membandingkan hasil ringkasan sistem dengan hasil ringkasan
manusia dengan menggunakan ROUGE-N. Sehingga diperoleh hasil bahwa
kalimat-kalimat berita yang dapat dijadikan sebagai ringkasan secara umum
mengandung kata-kata yang sering muncul pada berita tersebut.