Pengertian
Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data dredging (Larose, 2005)
Fungsi
Data mining memiliki fungsi yang penting yaitu membantu mendapatkan informasi yang berguna bagi pengguna. Beberapa fungsi dari data mining adalah:
1. Proses Prediksi / Prediction Process
Yang merupakan proses untuk menemukan pola dari data yang sudah ada menjadi data perdiksi yang baru yang belum diketahui.
2. Proses Deskripsi / Description Process
Tujuan proses ini adalah untuk memahami lebih jauh tentang data yang diamati. Jadi dengan melakukan proses, diharap mampu mengetahui perilaku dari data tersebut yang nantinya bisa digunakan untuk mengetahui karakteristik dari data yang dimaksud.
3. Fungsi Klasifikasi / Classification Process
Data diproses sehingga akan ditemukan fungsi atau model tertentu yang menggambar suatu konsep dari suatu data. Model atau fungsi tersebut nantinya akan memisahkan tiap data menjadi kelompok-kelompok tertentu.
4. Fungsi Asosiasi (association).
Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data.
Tahapan Data Mining
Tahapan data mining dimulai dari awal hingga menghasilkan suatu output di akhir meliputi:
- Data Cleansing (pembersihan) merupakan proses pembersihan data dimana data yang tidak lengkap, eror dan tidak konsisten akan dibuang
- Data Integration (integrasi), yaitu data yang berulang akan dikombinasikan.
- Selection (seleksi), adalah proses pemilihan data yang relevan terhadap analisis untuk diterima dari koleksi data yang sudah ada.
- Data Transformation (perubahan), data yang sudah dipilih ke dalam bentuk mining procedure melalui cara dan agresi data.
- Data Mining, merupakan proses yang paling penting dimana akan dilakukan berbagai teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
- Pattern Evolution (perubahan pola), proses dimana pola-pola menarik yang sebelumnya sudah ditemukan dengan identifikasi berdasarkan measure yang telah diberikan.
- Knowledge Presentation (visualisasi), merupakan tahapan terakhir dalam data mining, proses yang digunakan adalah teknik visualisasi yang bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari penambangan data.
Tidak ada komentar:
Posting Komentar