データウェアハウジングとは
データウェアハウジングとは、企業または組織が大量の情報を電子的に保存することです。 データウェアハウジングは、ビジネスデータに分析手法を採用するビジネスインテリジェンスの重要なコンポーネントです。
データウェアハウジングの概念は、1988年にIBMの研究者であるBarry DevlinとPaul Murphyによって導入されました。 データをウェアハウスに格納する必要性は、コンピューターシステムがより複雑になり、データ量が増加するにつれて進化しました。 データウェアハウジングに関する重要な本は、WH Inmonの「Building the Data Warehouse」です。これは1990年に最初に発行され、その後何度か再版されています。
データウェアハウジングの仕組み
データウェアハウジングは、複数の異種ソースから統合されたデータを比較することにより、企業のパフォーマンスに関する洞察を提供するために使用されます。 データウェアハウスは、トランザクションソースから派生した履歴データに対してクエリと分析を実行するように設計されています。
データがウェアハウスに組み込まれると、データウェアハウスはデータの変化に時間をかけて集中することで既に発生したイベントの分析を実行するため、データは変更されず、変更できません。 ウェアハウスに保管されたデータは、安全で信頼性が高く、取得および管理が容易な方法で保存する必要があります。
データウェアハウスを作成するために実行される特定の手順があります。 最初のステップはデータ抽出で、複数のソースポイントから大量のデータを収集します。 データがコンパイルされた後、データクリーニング、エラーのデータを確認し、見つかったエラーを修正または除外するプロセスが実行されます。
クリーンアップされたデータは、データベース形式からウェアハウス形式に変換されます。 ウェアハウスに保存されると、データはソート、統合、要約などを経て、より調整され、使いやすくなります。 時間の経過とともに、複数のデータソースが更新されるにつれて、より多くのデータがウェアハウスに追加されます。
重要なポイント
- データウェアハウジングは、ビジネスまたは組織による大量の情報の電子ストレージであり、データウェアハウスは、ビジネスインテリジェンスおよびデータマイニングの目的で、トランザクションソースから派生した履歴データに対してクエリおよび分析を実行するように設計されています。複数の異種ソースから統合されたデータを比較することにより、企業のパフォーマンスに関する洞察。
特別な考慮事項:データマイニング
企業は、ビジネスプロセスの改善に役立つ情報のパターンを探して、探査およびデータマイニングで使用するためにデータを保管する場合があります。 優れたデータウェアハウジングシステムは、社内のさまざまな部門が互いのデータに簡単にアクセスできるようにすることもできます。
たとえば、データウェアハウスを使用すると、会社は販売チームのデータを簡単に評価し、販売を改善する方法や部門を合理化する方法を決定するのに役立ちます。 事業は、顧客の消費習慣に焦点を合わせて、製品の位置付けを改善し、売り上げを増やすことを選択する場合があります。
データウェアハウジングを使用すると、会社は過去(たとえば20年)の顧客の支出の履歴データを収集し、このデータに対して分析を実行できます。 結果として得られる情報は、消費者の好みに対する洞察を提供する可能性があります。 売り上げの多い時刻、月、または年。 またはその年の最も支出の多い顧客。
効果的なデータの保存と管理も、旅行の予約の開始や現金自動預け払い機の使用などのプロセスを可能にします。
データマイニングプロセスは5つのステップに分けられます。
- 組織はデータを収集してデータウェアハウスにロードし、社内サーバーまたはクラウドにデータを保存および管理します。ビジネスアナリスト、管理チーム、および情報技術の専門家がデータにアクセスし、データの整理方法を決定します。その後、アプリケーションソフトウェアはユーザーの結果に基づいてデータを並べ替えます。エンドユーザーは最終的に、グラフや表などの共有しやすい形式でデータを提示します。
データウェアハウジングとデータベース
データウェアハウスは、必ずしも標準データベースと同じ概念ではありません。 データベースは、リアルタイムデータを監視および更新して最新のデータのみを利用できるように設定されたトランザクションシステムです。 データウェアハウスは、一定期間にわたって構造化データを集約するようにプログラムされています。 たとえば、データベースには顧客の最新の住所のみがあり、データウェアハウスには顧客が過去10年間住んでいたすべての住所がある場合があります。