Apakah Data Warehousing?
Gudang data adalah penyimpanan elektronik sejumlah besar maklumat oleh perniagaan atau organisasi. Gudang data adalah komponen utama dari kecerdasan perniagaan yang menggunakan teknik analitik pada data perniagaan.
Konsep pergudangan data diperkenalkan pada tahun 1988 oleh penyelidik IBM, Barry Devlin dan Paul Murphy. Keperluan untuk data gudang berevolusi sebagai sistem komputer menjadi lebih kompleks dan menangani jumlah data yang meningkat. Buku utama mengenai pergudangan data ialah "Membangun Gudang Data" WH Inmon, yang pertama kali diterbitkan pada tahun 1990 dan telah dicetak semula beberapa kali sejak itu.
Bagaimana Data Warehousing berfungsi
Gudang data digunakan untuk memberikan gambaran yang lebih mendalam tentang prestasi sebuah syarikat dengan membandingkan data yang disatukan dari pelbagai sumber heterogen. Gudang data direka untuk menjalankan pertanyaan dan analisis data sejarah yang diperolehi daripada sumber transaksi.
Sebaik sahaja data telah dimasukkan ke dalam gudang, ia tidak berubah dan tidak boleh diubah kerana gudang data menjalankan analitik pada peristiwa yang telah terjadi dengan memberi tumpuan kepada perubahan data dari semasa ke semasa. Data warehoused mesti disimpan dengan cara yang selamat, boleh dipercayai, mudah diperolehi dan mudah diurus.
Terdapat langkah-langkah tertentu yang diambil untuk membuat gudang data. Langkah pertama adalah pengekstrakan data, yang melibatkan mengumpulkan sejumlah besar data dari pelbagai sumber. Selepas data dikumpulkan, ia akan melalui pembersihan data, proses menyisihkan data untuk kesilapan dan membetulkan atau mengecualikan sebarang kesilapan yang ditemui.
Data yang dibersihkan kemudian diubah dari format pangkalan data kepada format gudang. Sebaik sahaja ia disimpan di dalam gudang, data akan disusun, menyatukan, meringkaskan, dan sebagainya supaya ia lebih diselaraskan dan mudah digunakan. Dari masa ke masa, lebih banyak data ditambah ke gudang kerana banyak sumber data dikemas kini.
Takeaways Utama
- Gudang data adalah penyimpanan elektronik maklumat yang banyak oleh perniagaan atau organisasi. Gudang data direka untuk menjalankan pertanyaan dan analisis mengenai data sejarah yang diperolehi dari sumber transaksi untuk kecerdasan perniagaan dan keperluan penggalian data. Gudang data digunakan untuk memberikan lebih besar wawasan tentang prestasi sebuah syarikat dengan membandingkan data yang disatukan dari pelbagai sumber heterogen.
Pertimbangan Khas: Data Perlombongan
Perniagaan mungkin menyimpan data untuk digunakan dalam penerokaan dan perlombongan data, mencari corak maklumat yang akan membantu mereka memperbaiki proses perniagaan mereka. Sistem pergudangan data yang baik juga boleh mempermudah jabatan yang berbeza dalam syarikat untuk mengakses data masing-masing.
Contohnya, gudang data mungkin membenarkan syarikat dengan mudah menilai data pasukan jualan dan membantu membuat keputusan mengenai cara untuk meningkatkan jualan atau menyelaraskan jabatan. Perniagaan mungkin memilih untuk memberi tumpuan kepada tabiat perbelanjaan pelanggan untuk memposisikan produknya dengan lebih baik dan meningkatkan jualan.
Dengan data pergudangan, syarikat itu boleh mengumpulkan data sejarah perbelanjaan pelanggannya sejak lalu-mengatakan, 20 tahun-dan menjalankan analitik pada data ini. Maklumat yang dihasilkan dapat memberi gambaran tentang keinginan konsumennya; masa hari, bulan, atau tahun dengan jualan yang lebih tinggi; atau pelanggan perbelanjaan tertinggi untuk tahun ini.
Penyimpanan dan pengurusan data yang berkesan juga membuat proses, seperti memulakan tempahan perjalanan dan menggunakan mesin juruwang automatik.
Proses perlombongan data terputus lima langkah:
- Organisasi mengumpul data dan memuatkannya ke gudang data mereka. Mereka kemudian menyimpan dan mengurus data, sama ada pada pelayan dalaman atau awan. Penganalisis perniagaan, pasukan pengurusan dan profesional teknologi maklumat mengakses data dan menentukan bagaimana mereka mahu mengaturnya. Perisian aplikasi kemudian menyusun data berdasarkan hasil pengguna Pengguna akhir akhirnya membentangkan data dalam format mudah untuk berkongsi, seperti grafik atau jadual.
Data Warehousing vs Database
Gudang data tidak semestinya mempunyai konsep yang sama seperti pangkalan data standard. Pangkalan data adalah sistem transaksi yang ditetapkan untuk memantau dan mengemas kini data masa nyata untuk hanya mempunyai data paling terkini yang tersedia. Gudang data diprogramkan untuk mengagregat data berstruktur sepanjang tempoh masa. Sebagai contoh, pangkalan data mungkin hanya mempunyai alamat paling terkini pelanggan, sementara gudang data mungkin mempunyai semua alamat yang pelanggan telah tinggal selama 10 tahun yang lalu.
