平均と中央値、どちらを使うべき? 例えば、ある全国模試の結果を思い浮かべて下さい。
例題 10個の値 2, 3, 3, 4, 4, 5, 7, 7, 7, 8からなるデータについて、そのデータの中央値を求めよ。
名前 数学(点数) Aさん 60 Bさん 80 Cさん 90 Dさん 40 Eさん 70 以上の5人の数学の点数をもとに以下、平均、偏差、分散、標準偏差を考えます。
すべてのデータからの影響がしっかり反映されるというメリットがある一方で、外れ値 集団の中で際立って他の値と違う値 の影響を受けやすいというデメリットもあります。
例えば、100人の村の例でも、たとえ1人の年収が10億でも100億でも、最頻値には全く関係ありません。
箱ひげ図の作り方は以下の通りです。
この使い分けが上手くできていない例が「平均年収」です。
評定が3のところに最も値が集中しさえしておけば、残りのデータがどこにあろうと影響はありませんね。
データ数が「奇数」のとき の2通りあるんだ。
例で確認してみましょう。
そこで,データを度数分布表にした上で度数が最も大きい階級の階級値を最頻値とすることもあります。
結果を表示するセルを選択 中央値の結果を表示するセルを選択します。
「平均値」をもっと詳しく 「平均値」は、 集団内のデータをすべて足し合わせ、データの個数で割ると求められます。
次の表は13軒の屋台が出している食べ物の値段をまとめたものです。
例題でいうと、 ちょうど真ん中の「7」がメジアンだ。
すべての値の総和なので、全体的な傾向を見るのにもってこいなのです。
A クラスの得点データは上に挙げた例と同じです。
次のような[1,1,1,1,2,2,3,4]配列では、1が4回出現しているため、1が最頻値となります。
「数値1」に中央値を求める対象となるセル範囲を入力します。
平均とは?中央値とは? 平均は、集団内のデータ(数字)を足し合わせてデータの個数で割った値を指します(ここで言うのは最も使われている相加平均であり、以降も相加平均を指します)。
この数値の前には 5 個のデータが、後にも 5 個のデータがあることから、ちょうど真ん中にあることを確認できますね。
この時、次の不等式を満たす実数 m を中央値(メディアン)と呼ぶ。
費用が安い!月額1980円で全教科全講義が見放題です。
つまり平均値とは集団内のデータを組み合わせて、新たに生成する値です。