DATA MULTI DIMENSI PADA DATA WAREHOUSE

Nama                   : Ni Made Candra Puspita Dewi
NIM                     : 1805551079
Dosen Pengampu : I Putu Agus Eka Pratama, S.T., M.T.
Mata Kuliah         : Data Warehouse
Program Studi      : Teknologi Informasi, Fakultas Teknik, Universitas Udayana


Terdapat perbedaan mendasar antara data yang tersimpan pada database biasa dengan data yang tersimpan pada Data Warehouse. Hal ini disebabkan karena data- data pada Data Warehouse selain bertujuan untuk historis, juga digunakan untuk menganalisa data. Solusi dari masalah ini adalah bagaimana melihat data dari berbagai dimensi yang berbeda- beda.

A. Data Mart
Data Mart merupakan sub bagian dari Data Warehouse keseluruhan sebagai sebuah struktur data, yang di dalamnya memuat data, guna memudahkan pengguna akhir di dalam mengakses data dari Data Warehouse sesuai kebutuhan ataupun untuk analisa data. Data Mart juga dapat didefinisikan sebagai unit (bagian) dari Data Warehouse secara keseluruhan yang berada pada layer akses (Access Layer) berorientasikan kepada spesifik proses bisnis dan kebutuhan dari unit organisasi tempat dimana Data Warehouse tersebut diimplementasikan. Sehingga apabila Data Warehouse memuat semua data sesuai kebutuhan dari keseluruhan organisasi bersangkutan, maka Data Mart hanya memuat data spesifik sesuai kebutuhan per unit atau departemen saja. Data Warehouse memiliki enam model pengembangan diantaranya sebagai berikut.

1.      Top-Down Tanpa User Feedback



Aliran data pada model Top-Down tanpa User Feedback sangat sederhana karena tidak melibatkan User Feedback. Aliran data berawal dari sumber- sumber data (Data Sources) kemudian diteruskan ke Data Warehouse lalu diteruskan (dipecah) ke dalam beberapa buah Data Mart. Model ini difokuskan pada kemampuan untuk dapat menjadikan pengguna  memperoleh data sesuai kebutuhan melalui Data Mart (yang dialirkan dari Data Warehouse), tanpa melakukan pengubahan apapun pada Data Warehouse itu sendiri. Penambahan data pada Data Mart, hanya dapat dilakukan melalui Data Warehouse, dengan mengikuti aliran Extraction, Transformation, Transportation (ETT).


2.      Bottom-Up Tanpa User Feedback



Model Bottom-Up tanpa User Feedback merupakan kebalikan dari Top Down. Sesuai dengan namanya, pengembangan dimulai dari bawah, di mana dua buah Data Mart atau lebih dibentuk dari data - data yang berasal dari berbagai sumber data (Data Sources). Pada tahap satu, menerapkan ETT (Extraction, Transformation, Transportation) pada sumber data ke masing - masing Data Mart. Kemudian setiap Data Mart mengintegrasikan data - data dari berbagai sumber tersebut. Pada Tahap dua, data dialirkan dari masing - masing Data Mart ke Data Warehouse, dengan kembali menggunakan proses ETT (Extraction, Transformation, Transportation) pada data dari setiap Data Mart kembali diintegrasikan di dalam Data Warehouse kemudian dilakukan juga penghilangan Redudancy pada data- data dari sejumlah Data Mart tersebut.


3.      Parallel Tanpa User Feedback 



Model Parallel tanpa User Feedback merupakan modifikasi dari model Top Down, namun Data Mart tidak sepenuhnya bergantung kepada Data Warehouse (dalam hal sumber data yang diperoleh). Mekanisme kerja dimulai dengan dibangunnya Data Warehouse dari berbagai sumber data. Di dalam Data Warehouse terdapat Data Model yang menjadi acuan bagi model data untuk Data Mart. Data Mart telah dibentuk dan dipengaruhi oleh Data Model. Kemudian Data Mart yang terbentuk, ikut berperan di dalam membangun Data Warehouse melalui integrasi di level data.


4.      Top-Down Beserta User Feedback


 

Pada Model Top-Down beserta User Feedback sejumlah data dari berbagi sumber data membentuk Data Warehouse. Data Warehouse menjadi pusat dari penggudangan data- data yang berasal dari berbagai sumber data tersebut. Pada model ini terjadi proses integrasi di level data yang bertujuan memudahkan data- data disatukan ke dalam sebuah gudang data ini. Dari Data Warehouse, dibentuk sejumlah Data Mart sesuai dengan kebutuhan pengguna. User Feedback pada Data Mart, menjadi tolak ukur di dalam pengembangan berkelanjutan pada Data Mart dan Data Warehouse itu sendiri. Pada Model Top Down beserta User FeedbackUser Feedback mempengaruhi Data Mart dan secara otomatis akan mempengaruhi Data Warehouse itu sendiri. Terdapat aliran bolak- balik dari User Feedback (pengguna) ke Data Mart dan dari Data Mart ke Data Warehouse.


5.      Bottom-Up Beserta User Feedback



Aliran data yang bekerja pada Bottom-Up beserta User Feedback dimulai dari dibentuknya dua Data Mart atau lebih, menggunakan data - data dari berbagai sumber data. Kemudian digunakan ETT (Extraction, Transformation, Transportation) untuk membantu pengumpulan data, ekstraksi data, transformasi ke format data yang disepakati bersama di dalam Data Mart, serta integrasi di level data itu sendiri. Lalu dibentuk Data Warehouse dari Data Mart yang terbentuk kemudian kembali menggunakan ETT untuk mengintegrasikan data- data dari berbagai Data Mart tersebut ke dalam kesatuan Data Warehouse. User Feedback diarahkan melalui tatap muka Data Warehouse, yang berefek terhadap Data Mart dan Data Mart yang membentuk Data Warehouse.


6.      Parallel Beserta User Feedback 



Mekanisme kerja pada model Parallel beserta User Feedback dimulai dari penentuan aturan untuk model data dari Data Warehouse ke Data Mart yang terbentuk. Data dari berbagai sumber data masuk ke Data Mart dan ke Data Warehouse. Kemudian Data dari sumber data yang menuju ke Data Mart saja yang akan melalui proses ETT (Extraction, Transformation, Transportation). Data yang menuju ke Data Warehouse, terlebih dahulu menuju ke Data Model dari Data Warehouse, untuk menyeragaman format. Pada Data Warehouse tidak terjadi ETT, sebab Data Warehouse menjadi pusat untuk model data enterprise, yang menjadi acuan bagi Data Mart lainnya. Lalu Data Warehouse mengagregasikan data, memuat fungsi koordinasi dan integratif untuk pengembangan ke depannya, termasuk juga manajemen data dan informasi kepada pengguna. User Feedback dialirkan melalui tatap muka ke Data Mart.


B. Data Relasional VS Data Multi Dimensi

Data Relasional dan Data Multi Dimensi memiliki perbedaan pada sudut pandang (dimensi), dimana perbedaan ini memiliki penilaian tersendiri terhadap data tersebut. Perbedaan Data Relasional dengan Data Multi Dimensi dapat dilihat sebagai berikut. 

1.  Data Relasional atau Relational Data Modelling (RDM) dipandang sebagai bentuk hubungan antar data (melalui tabel) yang berelasi dalam struktur hirarki dan berada pada 2 dimensi (baris dan kolom). Ada 3 jenis relasi yang dikenal pada Data Relasional yaitu sebagai berikut.

a.   One to one, yaitu setiap baris data pada tabel pertama dihubungkan hanya ke satu baris data pada tabel ke dua.

b.  One to many, yaitu setiap baris data dari tabel pertama dapat dihubungkan ke satu baris atau lebih data pada tabel ke dua.

c. Many to many, yaitu satu baris atau lebih data pada tabel pertama bisa dihubungkan ke satu atau lebih baris data pada tabel ke dua. Artinya ada banyak baris di tabel satu dan tabel dua yang saling berhubungan satu sama lain.

       Dalam pengembangan perangkat lunak (database), digunakan desain pengembangan berupa Entity Relationship Management (ERD) dan merupakan data transaksional, dimana didalamnya terdapat manipulasi data serta tidak terjadinya penyimpanan data historis (2 dimensi).


2.  Data Multi Dimensi atau Multi Dimensional Data (MDD) yaitu model data fisik (Physical Data Model) yang strukturnya dapat dilihat dari berbagai sudut pandang (dimensi), dengan tiga buah bagian yaitu Record (baris), Field (kolom), dan Layer dengan objek - objek data multidimensi di dalamnya, yang atributnya dibedakan menjadi atribut dimensi dan atribut pengukuran. Data Multi Dimensi, jika direpresentasikan ke dalam bentuk koordinat, maka dapat ditunjukkan ke dalam tiga buah sumbu X, Y, dan Z.



Masing-masing dimensi dari data tersebut akan membentuk Tabel Kelulusan, Tabel Sidang, dan Tabel Wisuda. Ketiga tabel ini dapat digunakan untuk melihat data mahasiswa pada Tabel Mahasiswa seperti contoh dibawah ini.



Data Multi Dimensi tidak dapat lepas dari kebutuhan untuk mempermudah analisa data. Oleh karena ini Data Multi Dimensi menggunakan dua konsep yakni OLTP dan OLAP. OLTP merupakan data - data transaksional, hanya untuk kebutuhan data dan informasi semata, serta data hanya dilihat terstruktur dalam 2 dimensi (baris, kolom). Sedangkan OLAP berasal dari data - data transaksi (OLTP) dengan mengutamakan historis data, maka dari itu data perlu dilihat dalam 3 atau lebih dimensi yang bertujuan untuk kemudahan analisa data. Selain itu, tujuan dari pembentukan Data Multi Dimensi ini adalah untuk mempermudah pemotongan data sesuai kebutuhan atau slicing data yang diasumsikan untuk mengambil data yang relevan untuk kebutuhan analisa oleh pengguna.


Referensi :
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017.

Komentar

Postingan populer dari blog ini

ARSITEKTUR DATA WAREHOUSE

Data Warehouse dan Cloud Computing (Cloud Warehousing)

Data Warehouse dan Integrasi Data