Databricks Assistantの機能検証(2)
- Databricks
- Bigdata
- ビッグデータ
- AI
- 生成AI
- DX
- Data Lake
- データレイク
- レイクハウス
- DWH
- 機械学習
- 可視化
- ダッシュボード
はじめに
前編「Databricksダッシュボードの機能検証」では Databricks のダッシュボード機能について取り上げました。
そこでは Databricks のダッシュボード機能でも Tableau の基本的なグラフを再現できることをご紹介しました。
Databricks の機能の一つに、データの可視化をサポートする Databricks Assistant があります。この機能によってデータ可視化のスキルがなくても容易にダッシュボードを作成することが可能です。
このコラムでは Databricks Assistant の機能をご紹介しながら、データ可視化のスキルがなくともダッシュボード作成が可能であることを検証します。
Databricks Assistantの機能
Databricks Assistant は、データクエリやコード生成を支援する AI ベースのアシスタントです。
主な機能には、SQL や Python コードの自動生成、コードの説明と最適化、エラーの自動修正、データの可視化等があります。
Databricks Assistant を活用することで、データエンジニアリング、データサイエンス、AI/ML、データガバナンス等の分野において、効率的かつ効果的なデータ分析と処理が可能になります。
これにより、ビジネスの洞察をより迅速に得ることが可能となります。
Databricks Assistant によるダッシュボード作成では、可視化したいデータから最大3つまでの項目を指定し、集計方法やグラフの種類をプロンプトとして入力することでデータを可視化することができます。
入力プロンプト例:
・都道府県別の合計売上と平均原価の散布図を作成してください。
・各製品の地域別週間平均売上はいくらですか?
機能検証の概要
前編の検証にて Databricks の GUI で作成したダッシュボードを、Databricks Assistant のプロンプトのみで生成しました。
データは前編と同様、疑似的な小売店の POS データを使用します。

機能検証結果
Databricks の GUI で作成したダッシュボードを Databricks Assistant のプロンプトのみで再現します。
■ 円グラフ
GUI で作成した円グラフは下図のとおりです。

このグラフを生成するため、次のプロンプトを実行しました。
実行プロンプト:地域別売上割合

プロンプトで直接円グラフを指定しなくとも、割合を表現するのに適したグラフを Databricks Assistant が判断してグラフを生成しています。
■ 散布図
次に、GUI で作成した以下のグラフを Databricks Assistant で生成してみます。

次のプロンプトで生成を試みます。
実行プロンプト:店舗別の合計売上と合計利益の分布

グラフは生成されましたが、想定と異なる結果になりました。 GUI で作成したような散布図が生成されることを期待していましたが、実際に生成されたのは積み上げ棒グラフでした。円グラフの時とは異なり、グラフの種類によってはより具体的な指示が必要なこともあるようです。
ここで、グラフの種類を明確に指定するため、プロンプトを次のように変更しました。
実行プロンプト:店舗別の合計売上と合計利益の散布図

今度はGUIで作成したグラフと同様のものが得られました。
このように作成するグラフの種類を具体的に指定すればDatabricks Assistantのプロンプト入力のみで求めるグラフを生成することができました。
結果サマリ
Databricks Assistant にプロンプトを入力するだけで GUI で作成するよりも早くダッシュボードを生成することができました。
入力するプロンプトのコツさえ押さえておけばデータ可視化のスキルがなくとも Databricks Assistant を利用することでデータを可視化できます。
一方で、データ活用において可視化に使用するデータの品質が重要であることは変わりません。
Databricks は高品質のデータ整備をはじめとしたデータエンジニアリングの一連の流れやデータの利活用まで幅広くサポートしており、データ利用を推進する際の大きな助けとなります。
結び
今後の生成AI技術の発展に伴い、既存のデータ活用の高速化や新たなデータ活用の開拓に期待が高まります。
当社でも Databricks の新機能や活用事例を継続的に調査し、最新情報をお届けして参ります。どうぞご期待ください。
執筆者

- 伊藤 透
- デジタルソリューション事業部 ビッグデータ統括部 ビッグデータ技術担当
- BI領域の構築・運用業務に従事。
労務データを用いたETLやダッシュボード製造、機械学習を用いた兆候検知分析を経験。
近年はDatabricksの導入支援に携わるようになる。