Pengertian Data Mining   Leave a comment

Data mining merupakan suatu penggalian data  dari suatu kumpulan data untuk menemukan keterkaitan, yang dapat di mengerti.

“Data  mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah suatu proses yang menggunakan teknik statistika, matematika, kecerdasan tiruan dan machine-learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. “ (Turban,dkk.2005)

“Menurut Gartner Group data mining merupakan proses dari pola-pola rancang bangun matematika dari sekumpulan besar data.Pola ini dapat berupa model aturan, afinitas, korelasi, tren, atau model prediksi.”

“Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.”(Larose,2005)

Data  mining  juga  disebut  sebagai  serangkaian  proses  untuk menggali  nilai  tambah  berupa  pengetahuan  yang  selama  ini  tidak  diketahui  secara manual  dari  suatu  kumpulan  data.”  (Pramudiono,  2007). 

Berdasarkan  beberapa  pengertian,  dapat  ditarik  kesimpulan  bahwa data mining  merupakan  suatu  teknik untuk menggali  suatu informasi  tersembunyi  pada  suatu data  (database)  yang  sangat  besar  sehingga  ditemukan    suatu    pola    yang    menarik    yang    sebelumnya    tidak    diketahui.

A.   Teknik Data Mining

Perkembangan bidang data mining yang semakin pesat, menimbulkan banyak tantangan baru, aplikasi-aplikasi dari metode dan teknik, statistik serta sistem basis data yang ada tidak dapat secara langsung menyelesaikan masalah-masalah yang ada dalam data mining. Menurut Jiawey Han, ada beberapa teknik yang dapat digunakan dalam data mining, yaitu :

  1. Klasifikasi / Classification

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.

  1. Klasterisasi / Clustering

Prinsip dari klasterisasi adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas atau klaster.

  1. Association rule

Association rule adalah teknik mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Association rules mining mencari dan menemukan hubungan antar item yang ada pada suatu dataset.

  1. Sequential Pattern

Sequential pattern mining adalah pola yang menggambarkan urutan waktu terjadinya peristiwa. Pola tersebut akan didapatkan apabila data yang disimpan dalam jumlah cukup besar dan setiap objeknya melakukan beberapa aksi yang berulang kali.

Sumber: Decision Support Systems and Inteligent System (Efraim Turban – Jay E. Aronson – Ting Peng Liang)

Posted November 26, 2012 by abdijeinlaknat brotherbad in Artikel

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s