Tableau Prep Builder の新機能: SAP HANA への接続とデータの自動標準化

データ値の標準化は、面倒でも重要なデータ準備作業ですが、最新リリース (Tableau Prep Builder 2019.1.4) ではシンプルに、そして短時間で行えるようになりました。手入力や異なるビジネスプロセスのためにデータ値に不整合が見られる場合、たいていは似た値を苦労して見つけ出し、グループ化したり正しい値と関連付けたりする必要があります。Prep Builder のあいまいグループ化アルゴリズムにより、グループ化のレベルをコントロールして、求めるデータセットを得ることができるようになりました。さらに、新しい一致アルゴリズムを使って、地理的データの役割で無効な値を正しいものに置換することも可能です。

また、お客様から最もリクエストが多いデータソースの 1 つである SAP HANA、そして Azure SQL Data Warehouse と MariaDB にも接続できるようになりました。 Tableau Prep Builder の最新リリースをさっそくダウンロードし、このブログでその詳細についてご覧ください。

自動グループ化の感度調整

Tableau Prep Builder はあいまいグループ化アルゴリズムを使って、類似したデータ値を自動的にグループ化します。しかし、自動グループ化の感度を調整して、作成するグループを多くしたり少なくしたりしたいと思ったことはありませんか? それがついにできるようになりました。[スペル] や [読み方] で値をグループ化する場合、スライダーを調整するだけでより厳密にグループ化を行えます。この機能を使うと時間を節約できるほか、全グループに対して手作業で項目を追加、削除する作業を行わなくても、データ値のセットを求めるものに近づけられます。

ファジースライダーのアニメーション

無効な値の [データの役割] による自動標準化

昨年、Tableau Prep Builder に [データの役割] が追加され、データ品質の問題を自動的に検出できるようになりました。しかし、無効な値を最も近い有効な値に置換して修正する作業は、依然として面倒であることもわかりました。そこで、新しいグループ化アルゴリズムの [データの役割の一致] を利用して、ワンクリックでこの作業が行えるようになりました。

[グループ化と置換] メニューにあるこの新しいオプションは、スペルや読み方に基づいて、無効な値を最も近い有効な値に一致させます。フィールドに適切な [データの役割] を割り当てて、データ値が自動的に検証されるようにします。そして新しい [データの役割の一致] オプションを使うと、無効な値を簡単に標準化できます。この機能は、Tableau Desktop でサポートされている 5 種類の地理的データの役割で利用可能です。

データの役割の一致のアニメーション

Tableau Prep Builder の最新リリースを今すぐダウンロードしてください。