未分類

タスク,性能評価,経験

機械学習アルゴリズムとは

経験Eを積み重ねながらあるクラスのタスクTを処理するコンピュータアルゴリズムで,何らかの方法Pでそのアルゴリズムの性能を評価すれば,Eをより多く積み重ねていくにつれて性能が上がるもの

とあります.

タスクT

Tには次のような種類があります.

  • 分類
  • 入力値がところどころ欠けた分類
  • 回帰
  • 転写(複数の出力を持つ分類)
  • 確率密度推定
  • 異常検知
  • 模倣
  • 欠損値の予測

/*確率密度推定はここに挙げた他のすべてのタスクを一般化したものです.他のすべてのタスクは結局確率密度推定に行き着くらしいです*/

性能評価P

AIの性能の評価方法としては,トレーニングデータとは別に用意したテストデータでどれだけうまく結果を出せるかというのを見ます.

その「結果」というのはタスクTに関連した「損失」(分類の失敗回数,回帰によって得られた式からのテストデータの乖離等)がどの程度になるかによって測られます.

しかし,損失の決定方法を決めるのは時に難しいことがあります.

例えば回帰において,全データから平均して近い式を得ることをよしとするのか,幾つか外れ値があってもその他のほとんどのデータでうまく当てはまった式を得れば良いのか,といった場合です.

また,性能を上げていくためにはなめらかなシグナル(勾配など)を利用する必要がありますが,しばしばシグナルがなめらかでなかったりします.

例えば,分類を行わせる場合,評価関数のパラメータにごく僅かな変化を加えても分類結果は全く変化しないでしょう./*つまり,損失の大きさは変わらない,と*/

したがってどのようにパラメータを変更すればより性能が上がるのか検討をつけることが出来ません.

このように直接的に性能評価しづらい場合には間接的に性能評価を行う「代理の性能評価関数」を使います.

経験E

経験にも様々な種類がありますが,最もシンプルなのは例題となるデータセットをアルゴリズムに観察させるものです.

/*active learningやreinforcement learningではより豊かな経験を詰むために追加データを要求したり環境とやりとりし続けたりするらしいです*/

データセットは対象となるデータの特徴量を集めたものです.

例えば画像だったら輝度などがデータセットの構成要素となります.

例となるデータの特徴量ベクトルを行ベクトルとする行列を計画行列(design matrix)といいます.

/*このテキストでは各アルゴリズムが計画行列をどのように処理するかということを解説していくそうです*/

計画行列を得るためにはデータが特徴量ベクトルで表せる必要がありますが,画像サイズが異なるなどうまくベクトルに出来ない場合もあります.

そのような場合にも対処法は存在し,後ほど述べられます.

また,各例データにはラベルが付与されることがあります.(人が写った写真には0,車が写った写真には1など)

ラベルは数値であることもあれば文字列であることもあります.

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中