Data Warehouse   Leave a comment

Pengertian Data Warehouse

Data Warehouse adalah kumpulan macam-macam data dalam mendukung proses pembuatan keputusan.Konsep dasarnya adalah suatu informasi yang dikumpulkan dalam suatu gudang penyimpanan dan merepresentasikan solusi untuk pengaksesan data didalam sistem non relasional. Sehingga data warehouse dapat disebut sebagai database yang berorientasi pada subyek, terintegrasi, mempunyai Time Variant dan non-valitile .

Terdapat empat karakteristik untuk data warehouse :

  • Subject Oriented (Berorientasi Objek) didesain untuk menganalisa data berdasarkan subject-subject  tertentu dalam organisasi dan diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak  diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales).Contohnya suatu aplikasi untuk operasi perusahaan (Operational System) yang berorientasi pada proses (mengotomasi fungsi-fungsi dari proses bersangkutan function Oriented). Misalnya di bank,aplikasi kredit mengotomasi fungsi-fungsi: verifikasi lamaran dan credit checking, pemeriksaan Kolateral, Approval, pendanaan, tagihan, dan seterusnya
  • Integrated(Terintegrasi) yaitu  menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah/dipisahkan karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
    •  Time Variant (Rentang Waktu) adalah data untuk menyimpan sejarah (Historical Data). Waktu merupakan tipe atau bagian data yang sangat penting didalam data Warehouse. Didalam data Warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi dirubah atau dibatalkan, kapan efektifnya,kapan masuk ke komputer, kapan masuk ke data warehouse; juga hampir selalu disimpan versi,misalnya terjadi perubahan definisi kode pos, maka yang lama dan yang baru ada semua didalam data Warehouse kita. Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah.

“Intinya ,seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :antara lain:

  • Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
  • Menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
  • Dengan cara snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
  • Non-Volatile adalah data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu  ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Sekali masuk kedalam data Warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (Delete) Terlihat, bahwa keempat karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu data Warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan. Dan,implementasi keempat karakteristik ini membutuhkan struktur data dari data Warehouse yangberbeda dengan database sistem operasional.

Keuntungan Menggunakan Data Warehouse ini yaitu:

1.    Hasil yang diperoleh dari Investasi lebih tinggi

2.     Kompetitif

3.     Meningkatkan produktivitas perusahaan

4.     Data dapat terorganisir dengan baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.

5.    Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.

6.    Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal/sumbernya, sehingga memudahkan dalam menciptakan laporan.

7.     Tidak memperlambat kerja operasional transaksi.

Tapi selain keuntungan ada juga kekurangannya antara lain:

  1. datawarehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
  2. semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse.
  3. datawarehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.

 

PERANCANGAN DENGAN SKEMA BINTANG

Satu hal penting  yang  menjadi  perhatian  dalam perancangan data warehouse adalah pengumpulan data. Pengumpulan kebutuhan data bagi sistem harus berbeda  dengan data warehouse. Data warehouse yang dirancang dalam pengembangan system sebaiknya dapat menunjang permintaan user dan selalu terfokus pada penyediaan informasi  bagi user.

Skema bintang merupakan perancangan yang memiliki struktur sederhana dengan tabel-tabel yang relatif dan penggabungan yang telah diketahui  Inmon (2005, p357). Skema bintang merupakan suatu rancangan database di data warehouse yang menggambarkan hubungan yang jelas antara struktur tabel  fakta dan tabel dimensi. Skema ini dapat dibaca dengan mudah oleh analisis maupun pemakai yang tidak biasa dengan struktur database.

 

Keuntungan Menggunakan Skema Bintang

Menurut Inmon (2005, p126) menggunakan skema bintang memberikan beberapa keuntungan yang tidak terdapat pada struktur relasional  yang biasa. Skema bintang merupakan standar rancangan data warehouse:

  • Membentuk rancangan database yang memberikan waktu respon yang cepat.
  • Menghasilkan rancangan yang dapat dimodifikasi dengan mudah atauditambahkan sesuai dengan perkembangan dan pertumbuhan data warehouse.
  • Paralel dalam rancangan database, bagaimana user biasa memandang  dan menggunakan data.
  • Mempermudah pemahaman dan navigasi metadata baik untuk perancang maupun pemakai.
  • Memperluas pilihan software akses data ( front end data access tools ), sebagai beberapa produk yang memerlukan rancangan skema bintang.

Tabel Fakta dan Tabel Dimensi

  • Tabel Fakta (fact table) Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.
    • Dimension Table Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta  dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).


Posted Januari 13, 2012 by abdijeinlaknat brotherbad in Artikel

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s