Skip to main content

Posts

Showing posts from July, 2012

Manfaat Tokenizing

Manfaat Tokenizing yaitu mempermudah dalam melakukan proses text mining, karena pada dasarnya Tokenizing merupakan tahap pertama yang harus dilalui sebelum melakukan tahapan selanjutnya pada text mining.

Tokenizing, Tokenisasi

Sistem temu kembali adalah suatu sistem komputerisasi penemuan kembali dokumen yang telah dicari secara otomatis, biasanya dalam bentuk teks. Dalam dunia komputer ini, sistem temu kembali sangat dibutuhkan, terutama dalam pencarian dokumen baik pada online atau dunia maya maupun pada dunia offline.

Pengertian Automatic Clustering

Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi mempunyai persamaan berdasarkan matrik tertentu. Sebuah cluster adalah sekumpulan objek yang digabung bersama karena persamaan atau kedekatannya.

Pengertian Text Mining

Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya di dapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen.

Data Mining

Tahukah anda apa Data Mining ? Berikut ini definisi Data Mining.  Data mining adalah Penggalian data (bahasa Inggris: data mining) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru.

Sistem Temu Kembali

Ketika kita memasukkan query pada sebuah mesin pencari, baik itu mesin pencari di google.com, bing.com, yahoo.com dan lain sebagainya, kita mendapatkan hasil yang beragam atau tidak sama.  Suatu saat anda coba, dengan menuliskan keyword yang sama pada 3 search engine yang berbeda, maka hasil pencarianpun tidak sama bahkan jauh berbeda. Apa penyebabnya ?