Data Multidimensi


 Pada dasarnya, data multidimensi ini menjadi salah satu pembeda antara mempelajari database biasa dengan teknologi database berupa data warehouse. Sumber data pada data warehouse berasal dari minimal dua buah sumber data yang memiliki beragam format. Database konvensional, hanya mengenal dua dimensi yaitu baris dan kolom (sumbu x dan sumbu y), sedangkan data multi dimensi memiliki lebih dari 2 dimensi yang berbeda (tidak hanya sebatas baris dan kolom biasa). Ada banyak sudut pandang terhadap data tersebut. Data pada data warehouse sifatnya historis dan bukan hanya transaksional. Data historis ini akan digunakan untuk kebutuhan analisa data, sehingga data ini harus dilihat dari berbagai dimensi yang berbeda-beda.


Data Multidimensi

Data multidimensi adalah data yang memiliki lebih dari satu dimensi, yang dapat dikonfigurasi dan dianalisis dengan berbagai perspektif. Ini memungkinkan pengguna untuk menganalisis data dari berbagai sudut pandang dan memperoleh informasi yang lebih komprehensif. Data multidimensi dapat dibangun menggunakan arsitektur Online Analytical Processing (OLAP), yang mengintegrasikan data dari berbagai sumber dan memungkinkan pengguna untuk melakukan analisis data yang kompleks.

Data multidimensi dapat berisi informasi dari berbagai dimensi, seperti tipe produk, lokasi, waktu, dan lainnya. Data ini dapat digunakan untuk menyediakan informasi yang lebih komprehensif dan mempermudah proses analisis data.

Penggunaan data multidimensi dapat membantu pengguna menganalisis data dari berbagai sudut pandang, seperti melihat data secara keseluruhan atau menganalisis data secara lebih detail. Ini memungkinkan pengguna untuk memecahkan masalah dan membuat keputusan bisnis dengan efektif.

Tahapan Utama untuk Membangun Data Multi Dimensi
1. Tahap 1 — Mengumpulkan data dari klien
Pada tahap pertama, data multi dimensi mengumpulkan data yang benar dari klien. Sebagian besar ahli software memberikan kesederhanaan kepada klien tentang berbagai data yang dapat diperoleh dengan teknologi yang dipilih. Pengumpulan data dilakukan dengan lengkap dan rinci.

2. Tahap 2 — Mengelompokkan segmen-segmen yang berbeda dari sistem
Pada tahap kedua, data multi dimensi mulai mengenali dan mengklasifikasikan semua data ke bagian masing-masing tempat mereka berada. Selain itu, juga akan dipastikan bahwa bebas dari masalah untuk diterapkan langkah demi langkah.

3. Tahap 3 — Memperhatikan proporsi yang berbeda
Pada tahap ketiga ini merupakan dasar yang menjadi dasar dari desain sistem. Pada tahap ini, faktor utama dikenali menurut sudut pandang pengguna. Faktor-faktor ini juga dikenal sebagai “Dimensi”. Hal ini lah yang menjadi inti dari data multi dimensi itu.

4. Tahap 4 — Mempersiapkan faktor waktu aktual dan kualitasnya masing-masing
Pada tahap keempat, faktor yang telah dikenali pada langkah sebelumnya akan digunakan lebih lanjut demi mengidentifikasi kualitas yang terkait. Kualitas dikenal juga sebagai “atribut” dalam database.

5. Tahap 5 — Menemukan aktualitas dan kualitas
Pada tahap kelima, data multi dimensi memisahkan dan membedakan aktualitas dari faktor-faktor yang dikumpulkannya. Hal ini berperan penting dalam pengaturan data multi dimensi.

6. Tahap 6 — Membangun skema
Pada tahap keenam, skema dibangun sehubungan dengan informasi yang dikumpulkan dari langkah-langkah sebelumnya. Skema dibangun untuk menempatkan data.

Adapun contoh dari data multidimensi, yaitu:
1. Spreadsheet


contoh spreadsheet


2. Cube


contoh cube



Data Relasional atau Relational Data Modelling (RDM)

Data Relasional atau bisa juga disebut Relational Data Modelling (RDM) dipandang sebagai bentuk hubungan antar data melalui tabel yang berelasi dalam struktur hierarkis dan berada pada dua dimensi, yaitu baris dan kolom.



Contoh Relasi One to Many pada RDM


RDM memiliki tiga relasi yang dikenal, yaitu :
1. One to One
2. One to Many
3. Many to Many

Pada pengembangan perangkat lunak, diterapkan desain pengembangan berupa Entity Relationship Management (ERD) untuk database. RDM sudah dipastikan berupa data transaksional, karnea manipulasi data dilakukan tanpa menyimpan data historis (hanya dua dimensi). Hal ini yang menjadi pembeda utama dengan konsep data warehouse.


Data Mart

Data Mart adalah unit atau bagian dari data warehouse secara keseluruhan yang berada pada layer akses (access layer) berorientasikan ke proses bisnis yang spesifik dan kebutuhan dari unit organisasi tempat data warehouse tersebut diimplementasikan. Data Mart memuat data untuk memudahkan pengguna akhir dalam mengakses data dari data warehouse sesuai kebutuhan maupun untuk analisa data. Analoginya yaitu data mart adalah himpunan bagian dari sebuah himpunan semesta bernama data warehouse, sehingga apabila data warehouse memuat semua data sesuai kebutuhan dari keseluruhan organisasi bersangkutan, maka data mart hanya spesifik memuat data sesuai kebutuhan per unit atau departemen saja.


Pemodelan Data Multidimensi

Pemodelan data multidimensi adalah proses mengubah data yang terstruktur dalam bentuk tabular menjadi bentuk yang lebih mudah untuk ditinjau dan dianalisis. Dalam pemodelan data multidimensi, data dikelompokkan menjadi beberapa dimensi, yang dapat terdiri dari beberapa atribut. Dimensi ini dapat berasal dari berbagai sumber data, seperti database operasional (OLTP) atau data mart.

Terdapat dua tipe utama pemodelan data multidimensi:
1. Star Schema
Star Schema merupakan pemodelan pertama di dalam data multidimensi pada Data Warehouse yang melibatkan adanya dua buah jenis tabel (Fxt Table dan tabel multidimensi).
Kedua buah jenis tabel tersebut (Fact Table dan tabel dimensi), berelasi membentuk diagram
berupa ERD (Entity Relationship Diagram) yang menyerupai bintang (Star).



contoh pemodelan star schema

Kelebihan star schema:
- Kemudahan Pemahaman
- Kinerja Query
- Prediksi Query
- Logika Informasi
- Dukungan OLAP
- Kemudahan Pengembangan
- Adaptasi Masa Depan
- Gambaran Situasi Bisnis
- Navigasi yang Mudah

Kelemahaan star schema:
- pemborosan ruang (Space) 
- ukuran penyimpanan yang relatif besar
- sulitnya untuk melakukan perbaikan dan perawatan (Maintenance)
- rentannya kemungkinan terjadinya duplikasi data (Redudancy).


2. Snowflakes Schema
Snowflakes Schema merupakan salah satu pemodelan (skema) pada data multidimensi untuk Data Warehouse sebagal bentuk perluasan dari Star Schema, yang memiliki ciri khas di mana tidak semua tabel dimensi terhubung ke Fact Table, melainkan cukup hanya tabel dimensi utama saja, di mana semua tabel dimensi ini ternormalisasi.



contoh pemodelan snowflakes schema

Kelebihan snowflakes schema:
- kapasitas penyimpanan yang lebih sedikit
- kemudahan di dalam proses perawatan dan perbaikan (Maintenance)
- Snowflakes Schema sangat cocok digunakan untuk proses Query pada ETL

Kelemahan snowflakes schema:
- perfortgansi Query pada Snowflakes Schema terbilang lambat. 
- masalah kompleksitas pada Snowflakes Schema
- kompleksitas pada Snowflakes Schema menyebabkan pengguna akhir sulit untuk memperoleh Info dan kejelasan dari pemodelan ini.

Komentar

Postingan populer dari blog ini

Teknik Prediction