DATA MINNING
Data Mining
Data mining didefinisikan sebagai
satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara
menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data
yang sangat besar.
Selain itu juga ada beberapa
definisi dari data mining yang dikenal di buku-buku teks data mining.
Diantaranya adalah :
- Data mining adalah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang
selama ini tidak diketahui secara manual.
- Data mining adalah analisa otomatis dari data yang
berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau
kecenderungan yang penting yang biasanya tidak disadari keberadaannya
Menarik untuk diingat bahwa kata
mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari
sejumlah besar material dasar. Dari definisi-definisi itu, dapat dilihat ada
beberapa faktor yang mendefinisikan data mining :
- data mining adalah proses otomatis terhadap data
yang dikumpulkan di masa lalu
- objek dari data mining adalah data yang berjumlah
besar atau kompleks
- tujuan dari data mining adalah menemukan
hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang
bermanfaat
Sejarah Data mining bukanlah
suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan
data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik
dari bidang-bidang ilmu yang sudah mapan terlebih dulu. Gambar 1 menunjukkan
bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti
kecerdasan buatan (artificial intelligent), machine learning, statistic,
database dan juga information retrieval.
Data Mining merupakan teknologi
baru yang sangat berguna untuk membantu perusahaan-perusahaan menemukan
informasi yang sangat penting dari gudang data mereka.
Kakas data mining
meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk
mendukung pengambilan keputusan penting. Analisis yang diotomatisasi yang
dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung
keputusan tradisional yang sudah banyak digunakan.
Data Mining dapat menjawab
pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak
waktu untuk menjawabnya. Data Mining mengeksplorasi basis data untuk menemukan
pola-pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja
terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka.
Tugas Data Mining
Tugas Utama Data Mining Telah
disebutkan di ruang lingkup data mining bahwa pada kebanyakan aplikasinya, gol
utama dari data mining adalah untuk membuat prediksi dan deskripsi. Prediksi
menggunakan beberapa variabel atau field-field basis data untuk memprediksi
nilai-nilai variabel masa mendatang yang diperlukan, yang belum diketahui saat
ini.
Prediksi dan deskripsi pada data
mining dilakukan dengan tugas-tugas utama yang akan dijelaskan di bawah ini.
Pada setiap tugas akan diberikan pointer ke masalah bisnis yang dapat
diselesaikan (yang telah dibahas pada butir 3). Gambar-gambar yang ada
dimisalkan menunjukkan hubungan antara penghasilan pengecer dan kekurangan
pembayaran yang ditanggung oleh distributor (pemasok barang).
a) Klasifikasi
adalah fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah unsure
(item) data ke dalam salah satu dari beberapa kelas yang sudah didefinisikan.
Gambar menunjukkan pembagian sederhana pada data peminjaman menjadi dua ruang
kelas (punya dan tidak punya peminjaman). Pada gambar tersebut x
merepresentasikan peminjaman yang bermasalah dan o peminjaman yang pengembaliannya
lancar. (Sebagai solusi 3.e, 3.d dan 3.g).
b) Regresi adalah
fungsi pembelajaran yang memetakan sebuah unsur data ke sebuah variabel
prediksi bernilai nyata. Aplikasi dari regresisi ini misalnya adalah pada
prediksi volume biomasa di hutan dengan didasari pada pengukuran gelombang
mikro penginderaan jarak jauh (remotely-sensed), prediksi kebutuhan kustomer
terhadap sebuah produk baru sebagai fungsi dari pembiayaan advertensi, dll.
c)
Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan
dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster
untuk mendeskripsikan data yang ditelaah. Kategori-kategori ini dapat bersifat
eksklusif dan ekshaustif mutual, atau mengandung representasu yang lebih kaya
seperti kategori yang hirarkis atau saling menumpu (overlapping).
Di sini, cluster – cluster dapat
saling menumpu, sehingga titik-titik data dapat menjadi anggota lebih dari satu
cluster. (Label x dan o pada gambar sebelumnya diubah menjadi + untuk
mengindikasikan bahwa keanggotaan kelas diasumsikan belum diketahui).
d) Peringkasan
melibatkan metodologi untuk menemukan deskripsi yang ringkas dari sebuah
himpunan data. Satu contoh yang sederhana adalah mentabulasikan mean dan
deviasi standar untuk semua field-field tabel.
e) Pemodelan
Kebergantungan adalah penemuan sebuah model yang mendeskripsikan kebergantungan
yang signifikan antara variabelvariabel. Model kebergantungan ini ada di 2
tingkat: tingkat structural yang menspesifikasikan variabelvariabel yang secara
local bergantung satu sama lain, dan tingkat kuantitatif yang menspesifikasikan
tingkat kebergantungan dengan menggunakan skala numerik.
f)
Pendeteksian Perubahan dan Deviasi berfokus pada penemuan perubahan
yang paling signifikan di dalam data dari nilai-nilai yang telah diukur
sebelumnya.
Cara Kerja Data Mining
Teknik yang digunakan untuk
melaksanakan tugas ini disebut pemodelan. Pemodelan di sini dimaksudkan sebagai
kegiatan untuk membangun sebuah model pada situasi yang telah diketahui
“jawabannya” dan kemudian menerapkannya pada situasi lain yang akan dicari jawabannya
Kelebihan
Ø
mengelola data dalam jumlah besar
Ø
otomatis search
kekurangan
Ø
database
Ø
tentang analisa.
Kesimpulan
Data
mining,telah membantu para pelaku bisnis untuk mempertahankan dan mengembangkan
bisnis mereka. Akan tetapi, agar teknologi data mining ini dapat dimanfaatkan
terus dengan baik, teknologi ini harus terus dapat “bekerja” berdampingan
dengan bidang lain di dunia teknologi informasi yang berkembang dengan sangat
cepat dan pesat.
REFERENSI
https://niesha30.wordpress.com
Komentar
Posting Komentar