ARSITEKTUR DATA WAREHOUSE

Nama                   : Ni Made Candra Puspita Dewi
NIM                     : 1805551079
Dosen Pengampu : I Putu Agus Eka Pratama, S.T., M.T.
Mata Kuliah         : Data Warehouse
Program Studi      : Teknologi Informasi, Fakultas Teknik, Universitas Udayana


A. Bill Inmon VS Ralph Kimball

            Pengertian Data Warehouse menurut Bill Inmon dan Ralph Kimball memiliki beberapa poin perbedaan yang nantinya perbedaan tersebut akan saling melengkapi antara satu dengan yang lainnya, diantaranya sebagai berikut.

1. Bill Inmon

Bill Inmon menyatakan bahwa Data Warehouse memiliki enam buah sifat utama diantaranya adalah berorientasi subjek (Subject Oriented), terintegrasi (Integrated), berorientasi kepada proses (Process Oriented), Time Variant, dapat diakses dengan mudah (Accesible), dan bersifat Non Volatile. Enam buah sifat utama tersebut yang mendasari adanya Teknologi Big Data saat ini.

2. Ralph Kimball

Ralph Kimball menyatakan bahwa Data Warehouse mengumpulkan data dari sumber - sumber transaksional (OLTP) untuk kebutuhan query dan analisa data (OLAP) yang memperhatikan histori dari data tersebut. Contoh dari On Line Transactional Processing (OLTP) yaitu apabila pada suatu database terjadi update data maka setiap entry data pada tabel di dalam database tersebut akan terjadi penumpukan data. Sedangkan pada On Line Analytical Processing (OLAP) jika entry data yang telah terdaftar pada sebuah Data Warehouse terjadi update data maka akan disimpan dalam entry baru dengan kata lain tidak terjadi penumpukan data.


B. Arsitektur Data Warehouse

Arsitektur data dari Data Warehouse diperkenalkan oleh Oracle. Menurut Oracle, Arsitektur Data Warehouse terdiri dari 3 jenis yaitu Basic Arschitecture, Staging Area Arschitecture, dan Staging Area + Data Mart Architecture. Penjelasan lebih lengkapnya dapat dilihat sebagai berikut.

1. Basic Arschitecture



Basic Arschitecture merupakan arsitektur Data Warehouse dasar atau yang paling sederhana. Basic Arschitecture memiliki 3 bagian utama yaitu Data source (sumber data), Warehouse (tempat data digudangkan), dan User (pengguna). Penjelasan mengenai 3 bagian utama pada Basic Arschitecture dapat dilihat sebagai berikut.

a. Data source yaitu sumber data meliputi data digital yang didapatkan dari sistem informasi, aplikasi, transaksi digital, komunikasi antar komputer atau pengguna, hingga dokumen fisik yang didigitalkan melalui proses scan atau dipotret melalui kamera, dimana sumber data tersebut memiliki size dan formatnya masing-masing.

b. Warehouse yaitu tempat data digital yang didapatkan akan digudangkan. Data digital yang didapatkan biasanya memuat metadata, summary data, dan raw data. Pada bagian ini data tersebut mengalami perubahan dari data transaksional (OLTP) menjadi analitikal (OLAP).

c. User yaitu pengguna yang dibagi menjadi 3 bagian yaitu Analyst, Mining, dan Reporting. Analyst bertugas untuk menganalisa data, Mining bertugas untuk memperoleh knowledge dari data sesuai pola, dan Reporting bertugas untuk menyampaikan laporan berdasarkan hasil analisa dan mining.


            2. Staging Area Arschitecture


Konsep dasar dari Staging Area Arschitecture adalah penambahan Staging Area untuk menampung data - data dari sumber data transaksional sebelum diteruskan ke warehouse. Pada Staging Area data tersebut akan dirapikan, dibersihkan, dan disesuaikan dengan kebutuhan yang dikenal dengan istilah data cleansing/cleaning dan proses ETL/ELT. Implementasinya dapat dilakukan secara pragmatically (pemrograman) maupun dengan penambahan modul pada sistem Data Warehouse.


3. Staging Area + Data Mart Architecture



Konsep dasar dari Staging Area + Data Mart Architecture adalah penambahan Data Mart untuk dikombinasikan dengan Staging Area. Data Mart merupakan bagian kecil dari Data Warehouse yang memiliki tujuan khusus seperti analisis marketing oleh bagian marketing. Arsitektur ini diperkenalkan oleh Oracle dan merupakan arsitektur yang paling banyak digunakan karena arsitektur ini memiliki kemampuan untuk memilah data sesuai kebutuhan dan juga mampu untuk kostumisasi sesuai kebutuhan.


C. Sumber Data pada Data Warehouse

Sumber data pada Data Warehouse dibedakan menjadi 2 jenis yaitu, Sumber Internal dan Sumber Eksternal. Penjelasan lebih lengkapnya dapat dilihat sebagai berikut.

1. Sumber Internal adalah sumber data yang berasal dari data transaksional bisa data digital dan bisa juga data fisik yang didigitalkan yang murni dari internal organisasi atau instansi bersangkutan. Contohnya seperti data mahasiswa, data dosen, dan pegawai pada suatu universitas.

2. Sumber Eksternal adalah sumber data yang berasal dari komputer atau server yang terhubung melalui jaringan internet atau cloud. Data tersebut diambil dan disimpan pada jaringan lokal suatu instansi atau perusahaan. Contohnya seperti riwayat pembayaran UKT dan surat – surat edaran pada suatu universitas.


Referensi :
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017.

Komentar

Postingan populer dari blog ini

Data Warehouse dan Cloud Computing (Cloud Warehousing)

Data Warehouse dan Integrasi Data