「 データマイニング辞典 」一覧

NO IMAGE

鎖効果

定義 鎖効果とは、クラスター分析において、ある1つのクラスターに対象が1つずつ順番に吸収されながらクラスターが形成される現象のこと。最短距離法で起こりやすい。望ましくない現象であるため、鎖効果の起きにくいウォード法が使用されることが多い。

NO IMAGE

クラスター間の距離の定義方法

クラスター分析において、観察対象と観察対象の距離の定義は1つしか無いが、クラスターとクラスターの距離には複数の定義がある。実務的にはウォード法を使用するのが一般的である。 方法 定義 最短距離法 2つのクラスターに含まれる対象の全組み合わせの距離を求め、最も近い距離=クラ...

NO IMAGE

クラスター分析(cluster analysis)

定義 観測対象を、いくつかの似た者同士のグループ(=クラスター)に分類するデータマイニングのデータマイニングの1手法である。 クラスター分析の分類 クラスター分析は「階層的手法」と「非階層的手法」に分類される。 階層的クラスター分析では全ての観測対象を枝分かれしていく1本の木(ツリー構造...

NO IMAGE

プルーニング(pruning)

同義語 プルーニング、枝刈り、剪定、pruning 定義 プルーニングとは複雑なモデルをあえて単純化させることにより、実運用上、よりあてはまりのよいモデルを構築する手続きのことである。 解説 一般に統計モデルのあてはまり(fitting)を改善する方法としては、(1)単純なモデルを複雑化す...

NO IMAGE

決定木の分岐基準

定義 決定木の計算過程では、逐次的に分岐を繰り返しながら決定木を成長させていくことになる。 この過程では、どのように決定木を成長させるか、即ち多数ある分岐の候補の中から、いかにして最適な分岐を選択するかという判断が必要となる。この判断基準を「分岐基準」と呼ぶ。 一般的によく使用される分岐基...

NO IMAGE

決定木(decision tree)

定義 決定木(decision tree)とは、オブザベーションの分類(classification)を目的とした機械学習の結果として出力される図である。 機械学習によってデータを最も良く説明する分類を生成するのだが、この分類がツリー状のMECEな階層構造に構築されたものが決定木である。 ...

NO IMAGE

エキスパートシステム(expert system)

同義語 エキスパートシステム、expert system 定義 エキスパート・システムは、人工知能の実装の1つである。具体的にはプロダクション・システムと呼ばれる論理命題の集合(要するに既知の知識の集合体)を事前に登録しておき、それに基づく判断を下すシステムである。 1980年代の人工知...

NO IMAGE

交差妥当化 (cross validation)

定義 交差妥当化(cross validation)とは、統計モデルが、そのモデルを構築する際に使用したデータ=学習データ)とは別のデータセットに対してどの程度、一般化可能であるかを評価する手法である。要するに統計モデルの評価法の外的妥当性 (external validity)の評価方の1つであ...

NO IMAGE

連関規則 (association rule)

同義語 連関規則、連想規則、アソシエーションルール 定義 連関規則とは、属性Aを持つオブザベーションが属性Bも持つ確率が高い、という知識のことである。上記の連関規則は、A → B、と表記する。 例えばAmazonでは「この商品を買った人はこんな商品も買っています」というオススメが表示されるが...

スポンサーリンク
レクタングル(大)
レクタングル(大)
1 2