Sabtu, 09 Januari 2021

Tugas STKI 11

 



Judul : Peringkasan Multi-Dokumen Berbasis Clustering pada Sistem Temu Kembali Berita Online Menggunakan Metode K-Means

Penulis : Amalia Kusuma Akaresti, Mochammad Ali Fauzi, Fitra Abdurrachman Bachtiar Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya

Publikasi : Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Vol. 3, No. 1, Januari 2019, hlm. 325-331

Link Jurnal : http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/4116/1653

Reviewer : M.Izzul Fahmi

 

Tujuan Penelitian :

Pada penelitian ini dilakukan peringkasan multi-dokumen berbasis clustering pada sistem temu kembali berita online menggunakan metode K-Means. Penelitian ini bertujuan mengurangi terjadinya redunansi informasi yang dapat menyebabkan pengguna internet menghabiskan bayak waktu apabila membaca berbagai macam berita dari situs berita online yang berbeda namun memiliki inti informasi yang sama.

Metode Pengujian :

Metode yang digunakan adalah metode K-Means yaitu merupakan sistem yang dikembangkan untuk mepermudah pengguna internet dalam menerima berita secara ringkas tanpa harus membuang waktunya dengan membaca banyak berita dengan topik yang sama dan menghasilkan peringkasan yang efektif dengan efisien. Sistem pada penelitian ini terdapat dua tahap pemrosesan, yaitu pencarian dan peringkasan.

Hasil dan Pembahasan :

Pada penelitianu ini dilakukan dua macam penelitian. Pengujian yang pertama pada penelitian ini dilakukan oleh pakar. Sedangkan pengujian yang kedua dilakukan oleh pengguna umum.

Hasil pengujian oleh pakar :
Pakar yang digunakan dalam penelitian ini orang yang berkecimpung di dunia jurnalistik, dan setelah mengkaji antara hasil sistem dan hasil pakar dapat disimpulkan bahwa hasil clustering  peringkasan oleh pakar untuk hasil ringkasan yang dihasilkan, pakar memperhatikan susuan antar kalimat - kalimatnya dan memperhatikan kesesuaian topik antar query yang dimasukan dengan informasi yang tersedia pada data. Sedangkan sistem dalam hasil peringkasannya hanya bergantung pada nilai Euclidean Distance, atau kesesuaian nilai jarak kedekatan antar centroidnya. Sehingga ini menjadi benyebab mengapa hasil pengujian pada peringkasan memiliki hasil yang sangat rendah.

Hasil pengujian oleh pengguna umum :
Terdapat dua jenis penilaian kepuasan, yaitu kemudahan dalam pencarian informasi dan kepusan terhadap penggunaan sistem dalam penelitian ini. Dari hasil yang didapatkan pada pengujian kemudahan dan kepuasan oleh pengguna umum, dapat disimpulkan bahwa sistem pencarian yang dibuat sudah sesuai dengan tujuan penelitian untuk memudahkan pengguna internet dalam mencari informasi.

 

 


Judul : Strategi Pemilihan Kalimat pada Peringkasan Multi Dokumen

Penulis : Satrio Verdianto, Agus Zainal Arifin, dan Diana Purwitasari Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS)

Publikasi : Nusantara Journal of Computers and its Applications, Volume 2 – No.7, Desember 2016

Link Jurnal : https://njca.co.id/main/index.php/njca/article/view/14

Reviewer : M.Izzul Fahmi

 

Tujuan Penelitian :

Penelitian ini bertujuan untuk memudahkan pengguna ketika mengakses berita secara online dengan cara melakukan peringkasan berita. Ringkasan berita dapat diartikan sebagai sebuah teks yang dihasilkan dari satu atau lebih kalimat yang mampu menyampaikan informasi penting dari sebuah berita. Dimana panjang dari sebuah ringkasan tidak lebih dari setengah panjang dokumen asli.

Metode Pengujian :

Uji coba dilakukan dengan mengukur performa hasil ringkasan dengan menggunakan kombinasi empat fitur berita yaitu posisi kalimat (p), word frequency (w), TF-IDF (t), dan judul berita (j). Nantinya kombinasi 4 fitur akan dibandingkan dengan kombinasi 3 fitur dan kombinasi 2 fitur. Untuk mengukur performansi hasil ringkasan digunakan metode evaluasi ROUGE-N yaitu ROUGE-1 dan evaluasi berdasarkan waktu eksekusi.

Dataset :

Pengujian pada sistem peringkasan dalam penelitian ini dilakukan dengan membandingkan hasil ringkasan sistem dengan hasil ringkasan manusia dengan menggunakan ROUGE-N. Pengujian dilakukan terhadap 15 kelompok dokumen berita berformat .xml yang dikelompokkan berdasarkan topik dimana masing-masing kelompok memiliki jumlah dokumen berita.

Hasil dan Pembahasan :

Berdasarkan uji coba, didapatkan kesimpulan bahwa diantara empat kombinasi fitur yakni fitur posisi kalimat, word frequency, TF-IDF, dan judul berita, kombinasi yang paling optimal berdasarkan nilai ROUGE-1 dan waktu eksekusi adalah kombinasi fitur posisi kalimat dan word frequency dengan nilai ROUGE-1 sebesar 0.679 dan lama waktu eksekusi 28.458 detik.

 Sebagian besar berita cenderung menyampaikan ide pokoknya pada awal-awal kalimat sedangkan kalimat - kalimat selanjutnya merupakan penjelas atau bahkan informasi-informasi lain di luar pokok bahasan. Sehingga dengan menggunakan fitur posisi kalimat, kita dapat mengambil intisari dari berita tersebut. Kalimat-kalimat berita yang dapat dijadikan sebagai ringkasan secara umum mengandung kata-kata yang sering muncul pada kumpulan dokumen.

 

Perbandingan antara kedua jurnal

Pada jurnal penelitian yang pertama menghasilkan peringkasan multi-dokumen berbasis clustering dengan metode k-mens yang bertujuan mengurangi terjadinya redundansi informasi yang dapat menyebabkan pengguna internet menghabiskan bayak waktu apabila membaca berbagai macam berita dari situs berita online yang berbeda namun memiliki inti informasi yang sama.

Pada saat pengujian dilakukan dua kali yaitu dilakukan oleh pakar dan pengguna umum. Pada pengujian oleh pakar yaitu pakar memperhatikan susuan antar kalimat - kalimatnya dan memperhatikan kesesuaian topik antar query yang dimasukan dengan informasi yang tersedia pada data. Sedangkan, pengujian oleh pengguna umum Terdapat dua jenis penilaian kepuasan, yaitu kemudahan dalam pencarian informasi dan kepusan terhadap penggunaan sistem dalam penelitian ini. Dan dihasilkan bahwa sistem pencarian yang dibuat sudah sesuai dengan tujuan penelitian untuk memudahkan pengguna internet dalam mencari informasi.

Sedangkan pada jurnal yang kedua sama – sama menghasilkan peringkasan multi-dokumen. Namun kali ini menggunakan strategi pemilihan kalimat. Pada penelitian tersebut bertujuan untuk memudahkan pengguna ketika mengakses berita secara online dengan cara melakukan peringkasan berita.

Penelitian ini melakukan pengujian pada sistem peringkasan dalam penelitian ini dilakukan dengan membandingkan hasil ringkasan sistem dengan hasil ringkasan manusia dengan menggunakan ROUGE-N. Sehingga diperoleh hasil bahwa kalimat-kalimat berita yang dapat dijadikan sebagai ringkasan secara umum mengandung kata-kata yang sering muncul pada berita tersebut.