Data Perlombongan vs OLAP
Kedua -dua Data Perlombongan dan OLAP adalah dua teknologi Perisikan Perniagaan Bersama (BI). Kecerdasan Perniagaan merujuk kepada kaedah berasaskan komputer untuk mengenal pasti dan mengekstrak maklumat berguna dari data perniagaan. Perlombongan Data adalah bidang sains komputer yang, berkaitan dengan mengekstrak corak menarik dari set besar data. Ia menggabungkan banyak kaedah dari kecerdasan buatan, statistik dan pengurusan pangkalan data. OLAP (Pemprosesan Analisis Dalam Talian) Seperti yang dicadangkan nama adalah penyusunan cara untuk menanyakan pangkalan data pelbagai dimensi.
Perlombongan Data juga dikenali sebagai Penemuan Pengetahuan dalam Data (KDD). Seperti yang disebutkan di atas, ia adalah bidang sains komputer, yang berkaitan dengan pengekstrakan maklumat yang tidak diketahui dan menarik dari data mentah yang sebelum ini tidak diketahui. Oleh kerana pertumbuhan data eksponen, terutamanya dalam bidang seperti perniagaan, perlombongan data telah menjadi alat yang sangat penting untuk menukar kekayaan data yang besar ke dalam kecerdasan perniagaan, kerana pengekstrakan corak manual telah menjadi mustahil dalam beberapa dekad yang lalu. Sebagai contoh, ia kini digunakan untuk pelbagai aplikasi seperti analisis rangkaian sosial, pengesanan penipuan dan pemasaran. Perlombongan data biasanya berkaitan dengan empat tugas berikut: kluster, klasifikasi, regresi, dan persatuan. Clustering mengenal pasti kumpulan serupa dari data yang tidak berstruktur. Klasifikasi adalah peraturan pembelajaran yang boleh digunakan untuk data baru dan biasanya termasuk langkah -langkah berikut: pra -proses data, merancang pemodelan, pemilihan/pemilihan dan penilaian/pengesahan/pengesahan. Regresi mencari fungsi dengan ralat minimum untuk model data. Dan persatuan mencari hubungan antara pembolehubah. Perlombongan data biasanya digunakan untuk menjawab soalan seperti apakah produk utama yang mungkin membantu mendapatkan keuntungan yang tinggi tahun depan di Wal-Mart.
OLAP adalah kelas sistem, yang memberikan jawapan kepada pertanyaan pelbagai dimensi. Biasanya OLAP digunakan untuk pemasaran, belanjawan, ramalan dan aplikasi yang serupa. Ia tidak mengatakan bahawa pangkalan data yang digunakan untuk OLAP dikonfigurasikan untuk pertanyaan kompleks dan ad-hoc dengan prestasi cepat dalam fikiran. Biasanya matriks digunakan untuk memaparkan output OLAP. Barisan dan lajur dibentuk oleh dimensi pertanyaan. Mereka sering menggunakan kaedah pengagregatan pada pelbagai jadual untuk mendapatkan ringkasan. Sebagai contoh, ia boleh digunakan untuk mengetahui tentang jualan tahun ini di Wal-Mart berbanding tahun lepas? Apakah ramalan jualan pada suku berikutnya? Apa yang boleh dikatakan mengenai trend dengan melihat perubahan peratusan?
Walaupun jelas bahawa perlombongan data dan OLAP adalah serupa kerana mereka beroperasi pada data untuk mendapatkan kecerdasan, perbezaan utama datang dari cara mereka beroperasi pada data. Alat OLAP menyediakan analisis data multidimensi dan mereka memberikan ringkasan data tetapi secara kontras, perlombongan data memberi tumpuan kepada nisbah, corak dan pengaruh dalam set data. Itu adalah perjanjian OLAP dengan pengagregatan, yang beralih kepada operasi data melalui "penambahan" tetapi perlombongan data sepadan dengan "pembahagian". Perbezaan penting lain ialah sementara data model perlombongan data dan peraturan yang boleh ditarik balik, OLAP akan menjalankan teknik perbandingan dan kontras sepanjang dimensi perniagaan dalam masa nyata.