データウェアハウスとは?
データウェアハウス(DWH)とは?製品メリットやデータベースとの違いなどわかりやすく解説
データウェアハウスとは?
なぜデータウェアハウスが重要なのか?
データウェアハウスのメリット
データウェアハウスの仕組み
データウェアハウスの構造
データウェアハウスの種類
データウェアハウスの活用事例
データウェアハウスとデータ経営
データウェアハウス
Domoの製品デモ動画をご覧ください。データウェアハウスに必要な機能の答えがきっと見つかります。
データウェアハウス(DWH)とは?製品メリットやデータベースとの違いなどわかりやすく解説
データウェアハウス(DWH)とは、さまざまなソースから収集したデータを一箇所に集め、比較・分析できるようにしたものです。データは、マーケティング、販売、財務部門が使用する内部アプリケーション、顧客向けウェブサイトやアプリケーション、パートナーやベンダーが使用する外部システムから取得することができます。
データウェアハウスでは、分析と意思決定のサポートが重要な役割を果たします。データウェアハウスは、膨大なデータの履歴を蓄積することで、データ分析やデータマイニング、人工知能(AI)や機械学習(ML)などの先進的な技術をサポートすることができます。大量のデータを一箇所に集めることで、組織は標準的な小規模データベースでは対応できないような、詳細な分析を行うことができるのです。
データウェアハウスは、1980年代に初めて概念化され、組織がデータを単に業務の動力としてだけでなく、ビジネスインテリジェンスを高め、チームの意思決定を支援するために利用されるようになりました。従来は、メインフレームコンピュータなどを使って、物理的にオンプレミスでホストされていました。現在では、多くのデータウェアハウスがクラウド上でホストされています。
データウェアハウスとは?
データウェアハウスとは何かをよりよく理解するために、データウェアハウスが何でないかを見てみるとよいでしょう。
データウェアハウスはデータベースではありません
データウェアハウスとデータベースはどちらもデータの集合体ですが、その規模や用途は異なります。データベースは高速なクエリーとトランザクション処理用に設計されていますが、データウェアハウスは分析用に設計されています。データベースは、特定のトピックや特定の用途に特化したデータの集合体である。データウェアハウスは、組織内のあらゆるアプリケーションやシステムからのデータを格納することができます。データウェアハウスは、データベースの集合体であると考えることができます。
データウェアハウスはデータレイクではない
データウェアハウスは生データを収集すると、分析用にデータを最適化するために設計された定義済みのスキーマを使用してデータを構造化します。また、データをファイルやフォルダーに整理し、レポート作成に利用できるようにします。データレイクはそうではありません。要するに、データレイクはあらかじめ定義されたスキーマを持たないデータウェアハウスなのです。データレイクには、生データ、構造化データ、非構造化データなど、あらゆる種類のデータが、元々あったどのような形式であれ、保存されます。
データウェアハウスはデータマートではない
データマートとデータウェアハウスの違いは、その範囲にある。データマートは通常、用途が限定されているのに対し、データウェアハウスは規模が大きく、より多様なデータを扱うことができます。データマートはデータウェアハウスのサブセットである場合もあります。
なぜデータウェアハウスが重要なのか?
データウェアハウスは、より質の高い分析と、より優れたビジネスインテリジェンスにつながります。データを1カ所に集めて整理することで、企業は大量のさまざまなデータを分析し、ビジネスプロセスとエクスペリエンスを改善するための貴重な洞察を得ることができます。また、データウェアハウスは継続的に履歴を記録し、企業はいつでもアクセスすることができます。データウェアハウスのようなデータの中心的な場所がなければ、データの統合は非常に困難です。
データウェアハウスのメリット
より高品質なデータ
データウェアハウスは、より完全なデータの全体像を提供します。さまざまなソースからのデータを一元化し、クレンジング、重複の排除、データセットの標準化を行うことで、単一の真実のソースを作成し、収集したデータの品質と有用性を向上させることができます。
より迅速な洞察
データを手作業で様々な場所から取得しなければならない場合、レポート作成に時間がかかることがあります。また、データのサイロ化により、データの取りこぼしが発生し、意思決定者は完全なデータセットなしで業務を行うことになります。データウェアハウスは、レポートの作成とデータ分析をより迅速かつシンプルにします。
ビジネスインテリジェンスの向上
データウェアハウスを利用することで、大規模なビジネスインテリジェンスの運用を支援します。ML、AI、データマイニングはすべて、大量のデータへのアクセスに依存しています。これらのツールを使用することで、リーダーは組織のより完全なビューに基づいて、よりスマートな意思決定を行うことができます。内部プロセスの合理化、財務管理、在庫の拡大でさえ、より優れたビジネスインテリジェンスが必要であり、それは一元化されたデータからもたらされます。
データウェアハウスの仕組み
データウェアハウスの正確なアーキテクチャは、組織固有のニーズによって異なりますが、各ウェアハウスは同じ一般的な構造を持っています。データウェアハウスは、3層のケーキのようなものだと考えてください。
レイヤー1
最初の層はデータウェアハウスサーバーで、さまざまなソースからデータを収集し、クレンジングし、変換する。このサーバーは、ETL(Extract, Transform, and Load)ツールを使用して、データを標準的な形式にまとめます。
レイヤー2
このケーキの真ん中には、OLAP(Online Analytical Processing)サーバーが置かれている。このサーバーは、高速なクエリーを実現する役割を担っている。
レイヤー3
最後のレイヤーは、個人がレポートを作成し、データ分析を行うことを可能にするフロントエンドのユーザーインターフェイスです。
データウェアハウスの構造
データウェアハウスは一般的に同じ構造を使用していますが、組織が取ることのできるアーキテクチャにはさまざまなアプローチがあります。それらのアプローチには、以下のようなものがあります。
シンプルなデータウェアハウス
これは最も基本的なアーキテクチャです。データは倉庫に入ってきて、中央のレポジトリに保存されます。エンドユーザーはそのデータにアクセスし、レポートや分析を行います。
ステージング・エリアを持つシンプルなデータウェアハウス
データを倉庫に格納する前に、データをクリーニングし、変換する必要があります。このプロセスは倉庫内で行うこともできますが、データフローにステージングエリアを追加することを選択する組織もあります。そこでは、データが倉庫に入る前に準備されます。
ハブ&スポーク型データウェアハウス
データウェアハウスのリポジトリとエンドユーザーの間にデータマートを追加する方法です。これにより、企業はデータウェアハウスを特定のビジネスライン向けにカスタマイズすることができます。
データウェアハウスの種類
組織では、一般的に3種類のデータウェアハウスを使用しています。
オンプレミス型/ライセンス型データウェアハウスソフトウェア
データウェアハウスのライセンスを購入し、現在のオンプレミスインフラストラクチャを利用して展開することができます。このオプションは、ハードウェアとソフトウェアを内部で管理するため、他のタイプのデータウェアハウスよりも高価で、拡張が困難な場合がありますが、データのセキュリティとプライバシーを高度に制御することができます。
データウェアハウスアプライアンス
既存のネットワークに接続する、ハードウェアとソフトウェアがあらかじめ統合されたバンドル製品を購入することができます。このバンドルは、データウェアハウスアプライアンスと呼ばれます。データウェアハウスアプライアンスは、「プラグアンドプレイ」の利便性を提供し、組織はすべての要素をそのまま使用することができます。
クラウドデータウェアハウス
クラウドベースのデータウェアハウスは、クラウド上で動作するマネージドサービスとして構築されています。物理的なデータウェアハウスのインフラについて心配する必要はなく、ソリューションのメンテナンスはすべてサービスプロバイダーが行います。
データウェアハウスの活用事例
あらゆる産業でデータが生成され、収集されています。データウェアハウスを利用することで、組織はより大きな洞察を得ることができ、その知識を利用して成長し、より成功することができます。ここでは、データウェアハウスを利用した分析の向上が、さまざまな業界を支えていることを紹介します。
小売・消費財・サービス
- マーケティングキャンペーンが顧客行動に与える影響の把握
- トレンドや購買のピークを予測する
- 新機能の必要性の認識
- サプライチェーンや製造プロセスの改善
- データドリブン
金融
市場動向の予測
M&Aの可能性の分析
カード会員の利用パターンの把握
回収部門の管理
債務不履行の潜在的リスクの特定と評価
教育
助成金提案や年次報告書のための情報収集
学生の統計的な追跡
受講スケジュール管理
行政
社会事業の効果判定
犯罪を含む司法制度のパターンの追跡
納税記録監査
行政サービスのための人口統計パターン
医療
病院が患者に対してどのような治療やサービスを提供しているかの分析
診療科や病院の敷地内におけるサービスのコスト比較
研究のための患者統計の収集
スタッフの継続教育や資格取得の追跡
医療を改善し、運営コストを削減するためのベストプラクティスの発見
データウェアハウスとデータ経営
データウェアハウスだけでは、時に硬直的で、ビジネスインパクトをもたらすアプリケーションを展開することが困難な場合があります。しかし、データウェアハウスを適切に活用すれば、企業のBIエンジンに不可欠なコンポーネントとして機能させることができます。
データウェアハウスの未来は、クラウドにあります。多くの企業が業務のクラウド化を進めており、データウェアハウスもそれに追随することになるでしょう。クラウドデータウェアハウス(CDW)は、どこからでもアクセスでき、コラボレーションが容易で、データを保存するための柔軟でスケーラブルなソリューションを提供します。さらに、クラウドベースのシステムの導入は、コスト効率が高く、迅速です。
適切なマルチクラウドフレームワークを使用すれば、データウェアハウスはより柔軟になり、IT部門はデータを移動する必要なく、インデックス作成、可視化のためのクエリー、データ変換などの特定のタスクにワークロードを自由に割り当てることができるようになります。
クラウド移行や企業のデジタル変革の取り組みが複雑化しているため、クロスクラウドデータウェアハウスはより一般的になりつつあります。CDWの投資を最大化するためには、データのライフサイクルを最小化する必要があります。これには、適切なデータガバナンスプロセスを導入した上で、ビジネスユーザーが特定のウェアハウス環境にアクセスできるようにすることが含まれます。
すでにオンプレミスのデータウェアハウスを持っていたり、データウェアハウスアプライアンスを使用していて、クラウドへの完全移行をためらっている組織も、クラウドベースのサービスから恩恵を受けることができます。Domo のようなツールは、既存のデータウェアハウスやデータレイクと統合し、そのデータをビジネス分析に利用できるようにします。
RELATED RESOURCES
Guide
DomoのBIとデータ分析機能の概要
Report