Databricksダッシュボードの機能検証
- Databricks
- Bigdata
- ビッグデータ
- AI
- 生成AI
- DX
- Data Lake
- データレイク
- レイクハウス
- DWH
- 機械学習
- 可視化
- ダッシュボード
BIツールに関するニューソンの取り組み

NTTデータ ニューソンは、これまで多くのビッグデータ領域の案件に携わり、ビジネスの課題解決に貢献してきました。
その中でも「Tableau」については、日本法人設立直後よりパートナー契約を締結し、Tableau プロフェッショナルサービスをご提供することで、様々なお客様への導入から開発、その後の活用に至るまで、多くの実績を積み重ねています。
・コラム「DATA Saberが活躍する現場」
・スペシャルインタビュー「DATA Saberって何者なの!?」
・事例「BIシステム導入支援によるシステム安定化・利用部門の拡大(Tableau)」
当社は長年にわたり蓄積した Tableau に関するノウハウを体系的に整理、維持・改良しており、オリジナルの Tableau トレーニングカリキュラムを保持しています。
このコラムでは、当社の Tableau の知見をもとに、Databricks のダッシュボード機能を Tableau と比較します。
BI ツールというと Tableau をイメージする方が多いかもしれませんが、Databricks の BI 機能も決して劣るものではありません。Databricks の導入を前提としているものの、Databricks を実際にあまり操作したことがない方や他の BI ツールとの選定に迷われている方も是非ご覧ください。
Databricksのダッシュボード

Databricks は、クラウド上でデータの収集・蓄積からデータの可視化、 AI 活用までを実施できる統合プラットフォームです。
これまでデータ分析環境の構築にあたっては、データウェアハウスやデータレイク等のデータ基盤整備、BI ツールによる分析画面の作成、さらには AI 利用のためのデータ加工といった構成要素を複数の製品を利用して構築・連携しなければならず、分析システムのスムーズな運用に向けては、データ品質・鮮度の保証、データガバナンスの確保、複数製品利用環境におけるトラブル時のリカバリの難しさなどの課題がありました。このような課題に対応するために Databricks では一連のデータエンジニアリングの流れを統合的に管理する機能を保持しています。
Databricks のダッシュボード機能は、リアルタイムデータの可視化と分析に優れており、データの可視化に役立つダッシュボードやグラフを作成できます。Databricks 上で直接データを探索し、ビジネスの洞察を迅速に得ることが可能です。
ダッシュボード機能検証の概要
当社のノウハウをもとに現場で典型的に利用される Tableau のレポートやダッシュボードを Databricks 上でも再現できるか確認します。
レポートで表現するデータは、疑似的な小売店の POS データです。
このデータを基に、地域、商品、時間、顧客といった各軸に対して、売上などを分析するレポートを作成しています。
対象となるレポートは、以下の機能や種類が含まれます。
・ソートやフィルタ、グループ、階層などの機能を盛り込んだレポート
・棒グラフ、円グラフ、2軸グラフ、ブレンドなどグラフ種類を網羅するレポート
ダッシュボード機能検証結果
この章では両製品のダッシュボード機能に関して検証を行います。なお、全てをご紹介することは難しいため幾つか抜粋して記載します。
■ ピボットテーブルと操作可能なフィルタ
以下のTableauで表現したダッシュボードをDatabricksで再現します。スクリーンショットへ記載した箇所が検証の要所となります。

Databricksで再現すると以下のようになります。Databricksでもピボット集計や操作可能なフィルタ機能を使用する事ができ、インタラクティブなダッシュボードを提供する事が可能です。

■ 2軸グラフ
次は棒グラフと折れ線グラフから成る複合グラフをDatabricksで再現します。検証の要所は2つのグラフの軸を同期させる箇所となります。

Databricksでも棒グラフと折れ線グラフの組合せは複合グラフとして表現可能です。また、2つのグラフの軸は同期と非同期どちらも可能という結果となりました。今回のスクリーンショットでは同期したグラフの方をお見せします。

結果サマリ(比較検証結果)
上記に取り上げたものは基本的な機能となりますが、Databricks でも Tableau で表現できるものを再現可能でした。
検証期間中にも Databricks の機能が進化を続けており、初期段階で利用出来なかった機能が後に可能になる、という進展もあり、今後の機能拡充には大きな期待が持てます。
そのためデータの収集・蓄積だけでなく、ダッシュボード機能も Databricks を利用し、End to End の運用を行なうのが適切です。
結び
今後も Databricks の特有の機能を調査、発信して参ります。
執筆者

- 高山 智博
- デジタルソリューション事業部 ビッグデータ統括部 ビッグデータ技術担当 担当部長
- BI/DWH 領域に小売業を中心に20年以上携わり、SIer の立場からユーザ企業の情報システム担当まで幅広く経験。
近年は Databricks に注力し、Databricks Champion として活動中。

- 鈴木 朗規
- デジタルソリューション事業部 ビッグデータ統括部 ビッグデータ技術担当
- 製造業や小売業の BI/DWH 構築へ多数従事。当該領域の ETL からダッシュボード製造にかけてを主な技術領域とする。近年は PoC などを通して Databricks 導入の支援へ携わるようになる。