忍者ブログ
Slic3rの設定についてまとめてます。Slic3rの日本語版が見当たらなかったので、使い方をまとめました。 最近はC#のメモ帳代わりになってます。

機械学習の学習日記 | Microsoft Azure Machine Learning / Missing Values Scrubber モジュール

スポンサーリンク
Microsoft Azure Machine Learning (Azure ML)のMissing Values Scrubber モジュールについて。

現在、非推奨のモジュールになっているようです。これの代わりにClean Missing Data モジュールを推奨していました。
Data Transformation > Manipulation > Missing Values Scrubber
欠損しているデータの処理を行います。

 

For missing values  プロパティ

ドロップダウンで欠損しているデータに対する処理の方法を選択します。

Replace using MICER

「Multiple Imputation by Chained Equations」という方法で統計的に偏りの無いように欠損データを置き換えます。

Custom substitution value

要素を指定したデータに置き換えます。

Replace with mean

列の平均値(mea)で置き換えます。

Replace with median

列の中央値(median)で置き換えます。

Replace with mode

列の最頻値(mode)で置き換えます。

Remove entire row

欠損している行を削除します。


Number of iterations プロパティ(Replace using MICERの場合)

「Multiple Imputation by Chained Equations」のパラメータ?
試行回数?
1~10を設定する。

Replace with value プロパティ(Custom substitution valueの場合)

欠損しているデータを設定した値で置き換えます。
整数列に対して小数点付きのデータを指定した場合、近い整数が設定されます。


Cols with all MV プロパティ

MV:欠損値
すべての要素が欠損している列を維持するか、削除するかを指定します。
KeepColumns:列を維持します。
RemoveColumns:列を削除します。

MV indicator column プロパティ

MV:欠損値
欠損した要素を編集したかどうかの列を新たに追加するか否かを選択します。
DoNotGenerate:列を追加する。
Generate:列を追加しない

例えば下のデータセットに対して欠損要素を平均値で置き換えます。
nomalized losses の列に欠損した要素があります。

MV indicator column を Generate に設定しておくと、次のように新しい列が追加されます。
nomalized losses is Missing の列が追加され、欠損要素を補ったか否かの情報が追加されます。


関連記事