Jumat, 23 Oktober 2020

Data Mining

 


Pengertian

Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data dredging (Larose, 2005)

Fungsi

Data mining memiliki fungsi yang penting yaitu membantu mendapatkan informasi yang berguna bagi pengguna. Beberapa fungsi dari data mining adalah:

1. Proses Prediksi / Prediction Process 

Yang merupakan proses untuk menemukan pola dari data yang sudah ada menjadi data perdiksi yang baru yang belum diketahui.

2. Proses Deskripsi / Description Process

Tujuan proses ini adalah untuk memahami lebih jauh tentang data yang diamati. Jadi dengan melakukan proses, diharap mampu mengetahui perilaku dari data tersebut yang nantinya bisa digunakan untuk mengetahui karakteristik dari data yang dimaksud.

3. Fungsi Klasifikasi / Classification Process

Data diproses sehingga akan ditemukan fungsi atau model tertentu yang menggambar suatu konsep dari suatu data. Model atau fungsi tersebut nantinya akan memisahkan tiap data menjadi kelompok-kelompok tertentu.

4. Fungsi Asosiasi (association).

Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data. 


Tahapan Data Mining 

Tahapan data mining dimulai dari awal hingga menghasilkan suatu output di akhir meliputi:




  1. Data Cleansing (pembersihan) merupakan proses pembersihan data dimana data yang tidak lengkap, eror dan tidak konsisten akan dibuang
  2. Data Integration (integrasi), yaitu data yang berulang akan dikombinasikan.
  3. Selection (seleksi), adalah proses pemilihan data yang relevan terhadap analisis untuk diterima dari koleksi data yang sudah ada.
  4. Data Transformation (perubahan), data yang sudah dipilih ke dalam bentuk mining procedure melalui cara dan agresi data.
  5. Data Mining, merupakan proses yang paling penting dimana akan dilakukan berbagai teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
  6. Pattern Evolution (perubahan pola), proses dimana pola-pola menarik yang sebelumnya sudah ditemukan dengan identifikasi berdasarkan measure yang telah diberikan.
  7. Knowledge Presentation (visualisasi), merupakan tahapan terakhir dalam data mining, proses yang digunakan adalah teknik visualisasi yang bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari penambangan data.

Tidak ada komentar:

Posting Komentar