平成27年秋期試験問題 午前Ⅱ 問21

データウェアハウスを構築するために,業務システムごとに異なっているデータ属性やコード体系を統一する処理はどれか。

  • ダイス
  • データクレンジング
  • ドリルダウン
  • ロールアップ
正解 問題へ
分野:テクノロジ系
中分類:データベース
小分類:データベース応用
解説
データウェアハウスを構築する際に使用される元データは、仕様の異なる様々なシステムに蓄積されていたもので、形式がバラバラなデータ群なので、このままではデータマイニングなどの解析で使用することができません。

この生データを解析で使用できるようにするために行われるのが、データクレンジング(=洗浄)です。データクレンジングの工程で、データ形式の統一、欠損値の補完、重複データの削除、単位の統一、異常値の処理などの処理をされた信頼できるデータによってデータウェアハウスは構築されます。
  • ダイスとはサイコロのことで、多次元データベースの中から縦軸と横軸を指定して2次元の表にする操作はダイシングと呼ばれます。3次元であるサイコロを振って見えている面が変わるように、縦横の項目を変えて多次元データのまったく違う面を表にする機能のことです。
  • 正しい。データクレンジングは、データウェアハウスに保存されるデータを統一する処理です。
  • ドリルダウンは、集計単位を国全体から都道府県レベルに映すように、多次元データベースにおいて階層的にデータを掘り下げる操作を指します。逆に集計レベルを高くする操作をドリルアップといいます。
  • ロールアップは、集計期間を1カ月→1年に変えるように、多次元データベースにおいてより高次元の集計データを作成する操作を指します。ドリルダウンの反対なので、ドリルアップとも呼ばれます。
選択肢以外にも多次元データベースをある断面で切り取って2次元の表にする操作である「スライス」があります。

多次元データベースとは、エンドユーザーが直接にデータベースを検索加工して問題発見をしたり問題解決をする分析を主とする利用目的のために適しているとされるデータベース。例えば月別・商品別の売上データを横に月,縦に商品をとれば2次元の表になります。月別・商品別に支店別を加えた売上データは3次元の表になります。さらに月別・商品別・支店別で売上,原価,利益のような会計区分を加えれば4次元になるというように表の次元は増大する。このような表の形式にしたものを多次元データベースといいます。

参考リンク: 多次元データベース
 http://www.kogures.com/hitoshi/webtext/db-mddb/index.html

Pagetop