-
( )とは、実験や観察、調査などで得たデータについて、( )(グラフ化含む)などをすることによってその( )や( )を把握しようとする分野。記述統計学、特徴、性質
-
( )とは、全体のデータ( )から一部のデータを取り出し、その情報を用いて、全体の情報を推測する。 全体のデータを収集するのに手間や費用などが膨大であるときなどで用いる。推測統計学
-
( )…測定値と真の値とのずれ
精密さ
⇒精度が高い = 測定値のバラつきの小ささ
正確さ
⇒測定値の平均と真の値とのずれの小ささ誤差 -
( )値
⇒ほかの測定値から大きく異なった特徴がある値、統計処理では外れ値を除いて処理することが多い外れ -
( )値
取得できなかったデータ
・一時的な停電、機器の故障など
・アンケート調査の記入漏れ
・回答者が答えたくなかった項目
・外れ値を取り除いた部分欠損 -
時間とともに変化する量は前後のデータから類推できるので ( )を行う場合もある。データの補完
-
①:( )と統計量
データ分析
➡データの特徴を捉えたり, ほかと比較したりするために 新たな情報を作り出す。
• データの処理には( )が利用される。Excel、表計算ソフトウェア -
( )の方法
⇒コピーしたい範囲を指定し,右下の■印に
マウスポインタを合わせて,+(黒十字)をコピー方向にドラッグオートフィル -
広く多くの人が利用できるように公開されたデータを( )、一部の組織や業界のみで利用されているデータを( )という。オープンデータ、クローズドデータ
-
( )参照(デフォルト)
アルファベットと数値の座標で参照するセルを指定する方法。
データがあるセルと参照するセルの位置関係がコピー先でも適用される。
( )参照
どのセルからでも同じセルを参照するように指定する方法。
「( )」を付ける。相対、絶対、$ -
計算ソフトには,計算式を簡略化するために多様な( )が用意されている。
⇒合計、平均、順位、検索etc
関数の()内に並べられた計算の基になるデータのひとつひとつを( )という。関数、引数 -
引数
→数値やセル番地,数値を入力した範囲,関数などを「,」( )で区切って並べる。
範囲は矩形領域で,左上端と右下端のセル番地を「:」( )で区切って表す。
( )
→関数による計算の結果カンマ、コロン、戻り値 -
条件処理を行う関数
=( )(論理式,値1,値2)
論理式を判断して,真の場合は値( ),偽の場合は値( )を返す。
論理積の関数
=( )(値1,値2・・・)
すべての引数が TRUE のときに TRUE を返す。
論理和の関数
=( )(値1,値2・・・)
いずれかの引数が TRUE のときに TRUE を返す。
※「真」とは条件が成り立つこと。
コンピュータ上は「TRUE」と表す。「偽」は「FALSE」IF、1、2、AND、OR -
( )表
➡データの値または階級ごとにデータ数を整理した表度数分布 -
( )
➡度数分布表を棒グラフで表したものヒストグラム -
( )が出るデータを扱いたい理由は?
⇒物事を分析する際に影響を与える( )(ファクター)を分けてシンプルにすることが求められる。
( )や( )の原因が残されたまま、統計量を算出し、分析するとあてにならないどころか誤解が生じたまま分析結果を出すことになる単峰性、因子、二峰性、多峰性 -
( ): 個々のデータの1乗を総和したものを1つあたりにした
( ): 個々のデータの2乗を総和したものを1つあたりにした
( ): 個々のデータの3乗を総和したものを1つあたりにした
( ): 個々のデータの4乗を総和したものを1つあたりにした
( )されたデータを用いる平均、分散、歪度、尖度、標準化 -
( )
⇒正規分布からの歪み具合(左右の対称、非対称)の度合いを示す。負ならばグラフの右、正ならばグラフの左に偏りがある。歪度 -
( )
⇒データの偏り具合を計るための尺度
小さいほどデータの散らばりが小さい。標準偏差 -
偏差値の求め方
平均値m、標準偏差σ、得点n点と置くと、
( )+〈( )-( )〉÷( )×( )50、n、m、σ、10 -
( )
⇒統計学において検定や推定、モデルの作成など様々な場面で最も活用される(連続型確率分布)。
正規分布は左右対称の形をしていて、横軸は( )を、縦軸はそのときの( )を表している。
( )関数の一種。
釣鐘型の分布であることや、平均値と中央値、最頻値が( )であることも特徴にあげられる。
( )分布の試行回数を無限に増やすと、正規分布の形になる。正規分布、確率変数、確率密度、確率密度、同値、二項 -
( )(Standardization)
⇒複数あるデータを平均「 」
分散「 」(すなわち標準偏差も) にする( )のこと。標準化、0、1、変数変換 -
調査を行いたい対象全体を( )という。
母集団が大きすぎるなどの理由で、一部を無作為に選び出すことがある。 このような操作を( )といい、抽出された集団を( )、その標本ひと組内のデータ数のことを( )という。母集団、抽出、標本、サンプル数 -
母集団の平均を( )
母集団の分散を( )といい、
標本の平均を( )
標本の分散を( )という。
母平均、母分散のような母集団 の特徴を表したものを( )という。母平均、母分散、標本平均、標本分散、母数 -
その母数を推定する際に使われる統計量、
標本平均や標本分散は( )とも呼ばれる。
具体的に算出した母数の推定量の値を( )と呼ぶ。推定量、推定値 -
( )とは
⇒母集団について立てた仮説が正しいといえるかどうかを、標本から判定する手続き。
統計的な検定を始めるには、まず2つの仮説を用意します。一つは( )。「これは違うぞ・・・」といった仮説や「無に帰して棄てたい」と思う仮説。
もう一つは( )。棄てたい帰無仮説に対して、「正しい」と主張したい仮説。検定、帰無仮説、対立仮説 -
( 、【 】)
⇒有意性の有無を判断するため、検定統計量(Z値,t値,χ2乗値など)の基準。一定の確率未満になるとなる基準。
確率(有意確率,p値)が5%未満( )の場合「有意性がある」と判断することが多い。
医療問題など、慎重な判断が必要な場合には
有意水準1%(100回に1回)とする場合もある臨海値、棄却限界値、有意水準 -
( )⇒大小の一方だけを検証する検定
「AはBより小さい」という仮説を示す
「Bより有意に大きいA」の有無の検証
( )⇒大小の両方を検証する検定
「AとBには差がない」という仮説を示す
「Bより有意に大きいA」
「Bより有意に小さいA」 の両方の有無を検証
( )⇒帰無仮説を棄却する範囲片側検定、両側検定、棄却域 -
( )
⇒母集団が正規分布に従っている、母平均と母分散がわかっている場合に利用できる
( )と( )が統計的に等しいといえるかを検定Z検定、標本平均、母平均 -
Z検定をするには、( )平均から( )平均を引き、それを平方根化した( )分の( )の( )で割る。標本、母、サンプル数、母集団、標準偏差
-
( )
⇒母集団が正規分布に従っている,
母平均がわかっている
母分散がわからない場合に利用
標本平均と母平均が統計的に等しいといえるか
を検定t検定 -
他のデータから求めることのできない独立したデータの数を( )といい、一般にサンプル数nの場合、自由度は( )となる。自由度、n-1
-
( )
⇒一定時間範囲のデータの平均値をその範囲の代表値とする方法。
・細かな変動を取り除き、データを平滑化して傾向を捉える
・移動平均法のほかに、中央値を利用する( )がある移動平均法、移動中央値法 -
( )
⇒複数の系列データに対し、その間に成り立つ関係を関数を使って表現する手法。
・( )…相関を表す点が直線関係(一次関数)と仮定して近似すること
※(回帰直線)…近似された直線
・( )…直線近似以外にも、2つの変数間の関係を関数で表せる。回帰分析、直線回帰、モデル関数 -
・( )…変数間の相関の強さを表した値
⇒データの広がりを表す値を( )という。相関係数、共分散 -
( )
⇒標本を分析することで、母集団の統計量を推定する。
( )
⇒予想の確からしさ、確率(%)で表現
( )
⇒予想される値の範囲区間推定、信頼度、信頼区間 -
( )…
問題解決のための「最適な手段」
この最適な手順に従ってやれば誰でも特定の問題を解決できるということ。アルゴリズム
ログイン