記述統計(1変数)

NO IMAGE 記述統計(1変数)

5要約統計量(five number summary)

同義語 Tukey's five number summary 定義 5要約統計量(five number summary)とはあるデータセットの最小値(minimum)、下位ヒンジ(lower-hinge)、中央値(median
NO IMAGE 記述統計(1変数)

尖度(kurtosis)

定義 尖度(kurtosis)は分布の尖り具合の指標である。 平たい分布をplatykurtic、尖った分布をleptokurtic、両者の中間の分布をmesokurticと呼ぶ。 分類 例 platyku
NO IMAGE 記述統計(1変数)

歪度(skewness)

定義 歪度(skewness)は分布の非対称性の指標である。以下の式のg1で定義される。 $$ { g }_{ 1 }=\frac { 1 }{ n } \frac { \sum _{ i=1 }^{ n }{ { ({
NO IMAGE 記述統計(1変数)

順序統計(order statistic)

定義 順序統計(order statistic)とは、x1,x2,x3...,xnからなるデータセットがある時、データを昇順で並び替えて作った以下のものことである。 $$ { x }_{ (1) }\le { x }_{ (2)
NO IMAGE 記述統計(1変数)

CUSS (Center, Unusual features, spread, and shape)

定義 CUSS (Center, Unusual features, Spread, and Shape)とは、分布の特徴を表す4つの指標の略語(acronym)である。 Center(中心):分布の中心を表す値。平均や中央値(me
NO IMAGE 記述統計(1変数)

データの型(types of data)

Kernsの分類 データの型の分類方法には様々なものがあるが、Kernsは以下の分類を提唱している。 量的(qualitative) 連続(continuous) 離散(discrete) 質的(quantitative)
NO IMAGE 記述統計(1変数)

箱ひげ図(box plots)

定義 箱ひげ図(box plots)はデータの分布を視覚的に表現する図の1種である。 箱ひげ図では以下の数値が表現される。 25th パーセンタイル=lower quartile (Q1) 50th パーセンタイル=medi
NO IMAGE 記述統計(1変数)

最頻値(mode)

定義 最頻値(mode)とは、データの値ごとの出現回数を数えた場合に、最も出現回数の多い値のことである。最頻値は代表値の1種である。最頻値を平均値の1種とする流儀もある。 関連 代表値 平均値
NO IMAGE 記述統計(1変数)

中央値(median)

同義語 中位数、中央値、メディアン、median 定義 中央値(median)とは、データを大きさの順に並べた時に、ちょうど真ん中に位置するデータの値のことである。データ数nが奇数の場合は(n+1)/2番目のデータ、データ数nが偶数の
NO IMAGE 記述統計(1変数)

平均(mean)

定義 平均値は代表値の1種である。 平均の分類 実際には平均値にはいくつかの種類(定義)がある。単に平均といった場合、算術平均を意味する。 算術平均 (arithmetic mean)(=相加平均) 幾何平均(geomet
NO IMAGE 記述統計(1変数)

平方平均の平方根(root mean square : RMS)

定義 平方平均の平方根(root mean square : RMS)とは、以下の数式で定義される平均(の1種)である。 $${m_{RS}} = \sqrt {\tfrac{1}{n}\sum\limits_{i = 1}^n
NO IMAGE 記述統計(1変数)

絶対平均(mean absolute value)

定義 絶対平均(mean asbolute value ; mA)とは、データの絶対値の算術平均である。 $${m_A} = \tfrac{1}{n}\sum\limits_{i = 1}^n {\left| {{x_i}} \
NO IMAGE 記述統計(1変数)

調和平均(harmonic mean)

定義 調和平均mHは以下の式で定義される平均(の1種)である。 $${m_H} = \frac{1}{{\frac{1}{n}\sum\limits_{i = 1}^n {(\frac{1}{{{x_i}}}} )}} = \f
NO IMAGE 記述統計(1変数)

幾何平均(geometric mean)

定義 幾何平均(geometric mean)とは、以下の数式で定義される平均(の1種)である。 $${m_G} = \root n \of {{x_1}{x_2} \cdots {x_n}}  = {(\prod\limits
NO IMAGE 記述統計(1変数)

分散(variance)

定義 分散(variance)とは、偏差(実現値-期待値)の二乗の平均値のことである。 ある変数Xの分散はVと表記され、以下の数式で定義される。 V=E)^2] 関連 期待値 (expectation value)
NO IMAGE 記述統計(1変数)

質的変数(質的尺度)

同義語 名義変数(nominal variables),カテゴリー変数(categorical variables),離散変数(discrete variables), 質的変数(qualitative variables), attri
NO IMAGE 記述統計(1変数)

量的変数

同義語 量的変数、数値尺度、numeric variable, quantitative variable、measurement variable 定義 量的変数(数値尺度)とは、データ値が数値である変数のことである。 量的変
NO IMAGE 記述統計(1変数)

順序尺度 (ordinal variables)

同義語 順序尺度、ranked variables, ordinal variables 定義 順序尺度とは、順序にのみ意味がある尺度である。順序は順位を意味するのみであり、各順位の間隔に関しては何も保証しない。四則演算は意味をなさな
NO IMAGE 記述統計(1変数)

名義尺度 (nominal scale)

定義 名義尺度(nominal scale)とは分類のみに意味があり、数値としての解釈ができない尺度である。例えば血液型、性別などは名義尺度の例である。数値としての解釈ができないとは、加減乗除の四則演算のいずれもできないこと、順序関係の評
NO IMAGE 記述統計(1変数)

生データ(raw data)

定義 生データ(raw data)とは、集計や視覚化などの要約処理を行う以前の収集されたデータそのもののことである。これに対して要約統計を行う。
NO IMAGE 記述統計(1変数)

Stevensの4つの尺度水準(尺度の分類)

Stevens(1946)は尺度(scale)を4つの水準(level)に分類した。尺度をそれが含む情報量によって4種類に分類したものである。 低水準尺度から高水準尺度の順に以下4つである。 Nominal scale(名義
NO IMAGE 記述統計(1変数)

要約統計 (summary statistic)

同義語 要約統計(summary statistic)、記述統計(descriptive statistic) 定義 記述統計(要約統計)とは、生データの情報を圧縮し、データの本質を理解しやすい要約情報を生成し表現する手法の総称である
NO IMAGE 記述統計(1変数)

数値要約

定義 数値要約とはデータを少数の数値に要約する要約統計の手法である。(要約統計の2本柱は数値要約と視覚化である。) 数値要約を構成するキー概念は、代表値と散布度である。
NO IMAGE 記述統計(1変数)

要約統計量 (descriptive statistic)

同義語 記述統計量(descriptive statistics value) descriptive statistic, descriptive measure 基本統計量 定義 要約統計量とは生データを要約するための「関数
NO IMAGE 記述統計(1変数)

代表値(representative value)

定義 代表値(representative value)とは、1組のデータ(あるいは分布)を代表する1つの数値のことである。データを代表するとは、データの分布の中心的位置を示すことを意味する。 実際に何をもって代表値とするのかに関し
NO IMAGE 記述統計(1変数)

相加平均=算術平均 (arithmetic mean)

同義語 相加平均、算術平均(arithmetic mean) 定義 算術平均(arithmetic mean)とは、各データをxi(x1,x2,x3....)とする時、 Σ(xi-t)2  を最小化する値tのことである
NO IMAGE 記述統計(1変数)

散布度(dispersion)

同義語 散布度、分散度、散らばり、ばらつき、dispersion 定義 散布度(dispersion)とは、データの分布(散らばり具合/まとまり具合)を表現する要約統計量である。 分布、代表値、散布度の組み合わせ 代表値と散布度に
NO IMAGE 記述統計(1変数)

分散(variance)

定義 分散は各データと平均値の差(=偏差)の2乗和の平均である(分散=平均偏差平方和)。 観測対象が平均的に平均値からどれだけ離れているかを表す散布度の指標の1つである。 $$ {S^2}x = \frac{1}{n}
NO IMAGE 記述統計(1変数)

標準偏差(standard deviation; SD)

定義 標準偏差は分散の平方根である。 $Sx = \sqrt {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{({X_i} - \bar X)}^2}} $ 分散は元データに対して
NO IMAGE 記述統計(1変数)

中心化(センタリング)

同義語 中心化、センタリング、centering 定義 中心化(centering)とは、ある変数の得点から定数を引くことである。 引く定数として何を使用するのかは、研究の文脈によって様々である。通常は、その変数の平均値を使用し
NO IMAGE 記述統計(1変数)

標準化(standardization)

定義 標準化(standardization)とは、各データから平均値を引いた上で(即ち中心化した上で)、更にその結果を標準偏差で割ることである。 使用方法 標準化は統計学のあらゆる分野で使用される。 正規分布に従うデータを標準化す
スポンサーリンク