
v15からExploratoryのサマリ・ビューには、データの外れ値を効率的に探索できる「外れ値モード」が追加されました。この機能を使うことで、数値列の外れ値に該当するデータの特徴を、件数や割合の観点からすばやく把握することができます。
予測モデルの構築前にデータ品質を確認したい方、未知のデータの特性を素早く把握したい方にお役立ていただける機能です。
データ分析の現場では、予測モデルの精度向上のために外れ値を事前に確認したい場合や、初めて扱うデータの外れ値の分布を把握したい場合など、さまざまな場面で外れ値の探索が必要になります。しかし、複数の列や属性にまたがって外れ値を効率よく確認する方法が求められます。
Exploratoryのサマリビューには「ハイライトモード」「相関モード」に加えて「外れ値モード」が用意されており、指定した列の外れ値の状況をクリック一つで視覚的に探索することができます。(今回利用しているデータはこちらからダウンロードいただけます)

外れ値の検出方法にはIQR(四分位範囲)などの複数の手法が利用可能です。

件数と割合の2つの表示モードを切り替えながら分析を進められます。(デフォルトでは「割合」が利用されます。)
件数

割合

ノート形式で、サマリ・ビューの外れ値モードの機能の詳細を確認されたい方は以下のノートをご参考ください。