【数学IA】箱ひげ図と四分位数を理解しましょう!(データの分析)
データ分析2020.01.21
みなさん、こんにちは。数学IAのコーナーです。前回は、データの分析、特にデータの整理について勉強しました。データの分析をする際に、データを集めたらまず初めにすること、度数分布表とヒストグラムについて説明しました。前回の記事「【数学IA】データの整理について理解しましょう!(データの分析)」をまだ読んでない人は読んでください。

度数分布表とヒストグラム(データの整理)の問題を解ける!【数学IA】
みなさん、こんにちは。数学IAのコーナーです。今回は、数学IAの中で「データの分析」のテーマの前半部分、データの整理について説明します。具体的には度数分布表とヒストグラムについて解説を加えていきます。 何をしているのかよくわからない…となり...
そして、今回の数学IAも、引き続き【データの分析】について説明します。
前回は集めたデータを度数分布表にまとめ、ヒストグラムでデータの分布を視覚的にとらえやすくしました。今回は、箱ひげ図というグラフを勉強し、複数のグループのデータの分布について比較しやすくなるようにします。では、始めていきましょう。
ここでは、数学のテストで安定して得点できるようになるために、基礎から応用へとステップを踏んで説明します。数学が苦手な人は、始めは基礎の部分だけを克服して、苦手意識が払拭できてきたら徐々に応用に進んでもいいでしょう。
まずは、各カテゴリーで少しずつでも得点し、試験でどんな範囲が出ても安定的に得点できるようにすることが目標です。次のステップでは、入試対策として苦手な科目やカテゴリーを戦略的に克服して、できるだけ満点に近づけるように持っていきましょう。
まず、箱ひげ図ってどんなグラフ?

まず、結論から言って四分位数と箱ひげ図の言葉の定義を言います。しっかりと理解しましょう。
四分位数:全てのデータを小さい順に並べて四つに等しく分けたときの三つの区切りの値を表します。ちなみに、小さい方から第1四分位数、第2四分位数、第3四分位数といいます。
箱ひげ図:最小値、第1四分位数、中央値(第2四分位数)、第3四分位数、最大値を箱と線(ひげ)を用いて一つの図で表したものを指します。
具体的に箱ひげ図は下記の画像のように表せます。あるデータの最大値をM、最小値をm、第1四分位数をQ1、第2四分位数をQ2、第3四分位数をQ3 とし、これら5つの値に対してまとめた、下のような図が箱ひげ図です。

さらに、Q1,Q2,Q3 について、定義を下にまとめます。
第1四分位数(Q1):データを小さい順に並べ、Q2 を境にしてそのデータを前半と後半に分けた、前半部分の中央値。
第2四分位数(Q2):データを小さい順に並べたときの中央値(メジアン)。
第3四分位数(Q3):データを小さい順に並べ、Q2 を境にしてそのデータを前半と後半に分けた、後半部分の中央値。
四分位範囲:Q3−Q1
四分位偏差:Q3−Q12
上の値を求める順は、
① Q2 を求めます。…前回説明した、中央値を求める方法と同じです。データ数が奇数のときは真ん中のデータの数値そのもの、偶数のときは中央の2つの値の平均を計算します。
② Q1 を求めます。…データ数が奇数のときは、Q2 であるデータそのものを含まずに、前半部分の中央値を求めます。偶数のときは、Q2 を求めるときに使った2つの値のうち、小さい方だけを含めた前半部分の中央値を求めます。
③ Q3 を求めます。…データ数が奇数のときは、Q1 のときと同じく、Q2 であるデータの数値を含まずに、後半部分の中央値を求めます。偶数の場合も、Q1 のときと同じく、Q2 を求めるときに使った2つの値のうち、大きい方だけを含めた後半部分の中央値を求めます。

また、四分位数を求めよと言われたら、第1四分位数・第2四分位数・第3四分位数の3つすべてを答えます。
四分位数の定義は、他にもあります。データの値を大きさの順に並べて4 等分する位置の値を四分位数と呼ぶのは、他の定義も同じですが、データの個数を4 で割った余りの違いで4 等分する位置の値が単純には決まらず、その扱い方の違いが、他にも定義が存在する理由です。
教科書に上の定義が採用されたのは、もっとも簡単で、基本を押さえるのに最適だからです。しかし、データの個数が多いときには、その定義の差は、その後の考察にほとんど影響ありません。
[L1_wsbStart][L_wsbAvatar]https://wearewhatwerepeatedlydo.com/wp-content/uploads/2019/10/43ca64de9520f178ab62afe94fdec80d-e1571795746292.png[L_wsbName]たかし君[L_wsbText]箱ひげ図とヒストグラムの違いは?[L_wsbEnd]
まず、箱ひげ図は、データのばらつき度合いを知りたいときに役立ちます。最小値・最大値を見れば、データがどれだけの範囲で分布しているのかが一目瞭然ですし、四分位範囲でデータのうちの半数が集中している範囲もわかります。
一方、ヒストグラムは、そのグラフが、中央値を中心に左右対称か、あるいは左右どちらかに偏っていたり絶壁になっていたり、という形でもそのデータの特性を読むことができます。また、前々回の所得の分布のグラフのように、平均値が信頼のおける値なのかを確認することにも役立ちます。
問題を解いてみよう!

では、内容を理解できているか、練習問題で確認してみましょう。
例題次のデータはAさんとBさんの数学のテストの得点である。下の問いに答えよ。
(1) A さん、B さんのそれぞれのデータについて、四分位数、四分位範囲、四分位偏差を求めよ。
(2) A さんとB さんのデータについて、四分位範囲を比べることによって、データの散らばり度合いを比較せよ。
定義に沿って求めていけば解ける問題です。
(1) まずはそれぞれのデータを小さい順に並べかえます。ここを間違えると、正しい答えは得られません。しっかり確認してから進めます。
A さんについてです。
Q2 は、中央値なので61 点です。Q1 は、Q2 を除く前半部分の中央値で、47 点です。Q3 は、Q2 を除く後半部分の中央値なので、77 点です。四分位範囲は、Q3−Q1=77−47=30(点)となり、四分位偏差はこれを2 で割り、15 点と求められます。
解答:A さん:Q147 点、Q261 点、Q377 点、四分位範囲30 点、四分位偏差15 点
という形になります。理解できましたか?では、次に、B さんについては説明なしで解いてみましょう。(A)さんと同じ形で解いてみます。わからなければ解説をもう一度みて自分で解けるようにします。
(2) A さん、B さんの四分位範囲はそれぞれ、30 点、18 点でした。四分位範囲は、データの散らばり度合いを見る指標になりますが、その大小はどういうことを意味するのかを問う問題です。
(A\) さんの四分位範囲の方が、B さんの四分位範囲より大きいので、A さんの方がデータの散らばり具合いが大きい。
理解できたでしょうか。
過去問を解いてみよう!

最後に、センター試験で以前出題された問題に挑戦してみます。
例題A 組から
D 組の各組
30 人の生徒に対して理科のテストを行った。次の図
1 は、各組ごとに理科のテストの得点を箱ひげ図にしたものである。

(1) 次の( ア )、( イ )に当てはまるものを、下の
0~
5 のうちから一つずつ選べ。ただし、解答の順序は問わない。
図
1 の箱ひげ図について述べた文として誤っているものは( ア )と( イ )である。
0:
A,B,C,D の
4 組全体の最高点がいるのは
B 組である。
1:
A,B,C,D の
4 組で比べたとき、四分位範囲が最も大きいのは
A 組である。
2:
A,B,C,D の
4 組で比べたとき、範囲が最も大きいのは
A 組である。
3:
A,B,C,D の
4 組で比べたとき、第
1 四分位数と中央値の差が最も小さいのは
B 組である。
4:
A 組では、
60 点未満の人数は
80 点以上の人数より多い。
5:
A 組と
C 組で
70 点以下の人数を比べたとき、
C 組の人数は
A 組の人数以上である。
(2) 次の( ウ )に当てはまるものを、下の
0~
3 のうちから一つ選べ。
図
1 の
C 組の箱ひげ図のもとになった得点をヒストグラムにしたとき、対応するものは( ウ )である。ただし、ヒストグラムは〔1〕の表2の度数分布表と同じ階級を用いて作成した。

[2016 大学入試センター試験 追試【4】〔2〕]
(1) まずは、範囲についての復習からです。
●範囲=最大値−最小値
●四分位範囲=第3四分位数−第1四分位数
それでは、選択肢を一つずつ確認します。
0:箱ひげ図の右端が一番右まで伸びているのはB 組ですね。→正
1:上で復習したとおり、第3四分位数と第1四分位数の差を見るので、箱ひげ図のうち、箱の部分の横幅を確認します。一番幅が広い、つまり四分位範囲が最も大きいのはC 組です。→誤
2:こちらも上で復習したとおり、範囲は最大値と最小値の差を見るので、箱ひげ図のうち、箱とひげを合わせた部分の横幅を確認します。幅が一番広い、つまり範囲が最も大きいのはA 組です。→正
3:第1四分位数と中央値の差なので、中央値と箱の左端の間隔を確認します。一番差が小さいのはB 組です。→正
4:A 組の箱ひげ図から、第1四分位数は60 点、第3四分位数は80 点です。生徒の数は30 人なので、点数の低い順に並べて8 番目が60 点、23 番目が80 点ということがわかります。60 点と80 点の人数が複数のであるる可能性も含めて、60 点未満の人数は最大でも7 人、80 点以上の人数は最小でも8 人です。→誤
5:箱ひげ図を見ると、A 組の中央値は70 点より大きいです。生徒の数は30 人と偶数なので、中央値を求めるときに使う15 番目と16 番目の得点のうち、16 番目の得点は必ず70 点を超えています。
また、15 番目の得点については、70 点を超えている可能性も超えていない可能性もあります。さらに、15 番目の得点が70 点を超えている場合、14 番目の得点も70 点を超えることもあります。よって、70 点以下の人数は最大でも15 人です。
一方、C 組の中央値は70 点です。この場合の中央値は、15 番目と16 番目の得点の平均値なので、両者に差がある場合はこの2 つの得点の間に存在します。
つまり、15 番目の得点は必ず70 点より低く、16 番目の点数は必ず70 点より高いです。この場合、70 点以下の人数は15 人です。また、差がない場合、つまり15 番目の得点と16 番目の得点が同じ場合は、どちらも70 点ということになり、70 点以下の人数は16 人となります。つまり、C 組の70 点以下の人数は最小でも15 人ということになります。→正
よって、
(2) まずはC 組の箱ひげ図からわかることをまとめます。
・最小値は40 点以上50 点未満の階級にある。
・第1四分位数は60 点以上70 点未満の階級にあるので、得点の低い方から8 番目の得点はこの階級に属する。
・第2四分位数は、(1)でも説明したとおり、15,16 番目はどちらも70 点か、15 番目が70 点未満で16 番目は70 点より高い。後者の場合、第1四分位数が60 点を超えているので、15 番目の得点は60 点を超えている。平均が70 点ということから、16 番目の得点が80 点を超えることはない。つまり、15 番目の得点は60 点以上70 点未満の階級に、16 番目の得点は70 点以上80 点未満の階級に入る。
・第3四分位数は80 点以上90 点未満の階級にあるので、得点の低い方から23 番目の得点はこの階級に属する。
・最大値は90 点以上100 点未満の階級にある。
それでは、選択肢のヒストグラムと照らし合わせます。
0:上から8 番目(=下から23 番目)の得点が70 点以上80 点未満の階級に属している。→誤
1:下から8 番目の得点が50 点以上60 点未満の階級に属している。→誤
2:矛盾はない。
3:上から8 番目の得点が70 点以上80 点未満の階級に属している。→誤
");const o=ie?ie.createHTML(e):e;if(nt===tt)try{t=(new W).parseFromString(o,at)}catch(e){}if(!t||!t.documentElement){t=le.createDocument(nt,"template",null);try{t.documentElement.innerHTML=ot?ae:o}catch(e){}}const i=t.body||t.documentElement;return e&&n&&i.insertBefore(r.createTextNode(n),i.childNodes[0]||null),nt===tt?ue.call(t,Ie?"html":"body")[0]:Ie?t.documentElement:i},bt=function(e){return ce.call(e.ownerDocument||e,e,H.SHOW_ELEMENT|H.SHOW_COMMENT|H.SHOW_TEXT|H.SHOW_PROCESSING_INSTRUCTION|H.SHOW_CDATA_SECTION,null)},St=function(e){return e instanceof B&&("string"!=typeof e.nodeName||"string"!=typeof e.textContent||"function"!=typeof e.removeChild||!(e.attributes instanceof z)||"function"!=typeof e.removeAttribute||"function"!=typeof e.setAttribute||"string"!=typeof e.namespaceURI||"function"!=typeof e.insertBefore||"function"!=typeof e.hasChildNodes)},Rt=function(e){return"function"==typeof b&&e instanceof b},wt=function(e,t,n){pe[e]&&u(pe[e],(e=>{e.call(o,t,n,ut)}))},Ct=function(e){let t=null;if(wt("beforeSanitizeElements",e,null),St(e))return _t(e),!0;const n=st(e.nodeName);if(wt("uponSanitizeElement",e,{tagName:n,allowedTags:Ne}),e.hasChildNodes()&&!Rt(e.firstElementChild)&&_(/<[/\w]/g,e.innerHTML)&&_(/<[/\w]/g,e.textContent))return _t(e),!0;if(e.nodeType===J)return _t(e),!0;if(Me&&e.nodeType===Q&&_(/<[/\w]/g,e.data))return _t(e),!0;if(!Ne[n]||Ce[n]){if(!Ce[n]&&Dt(n)){if(we.tagNameCheck instanceof RegExp&&_(we.tagNameCheck,n))return!1;if(we.tagNameCheck instanceof Function&&we.tagNameCheck(n))return!1}if(Ye&&!qe[n]){const t=re(e)||e.parentNode,n=oe(e)||e.childNodes;if(n&&t){for(let o=n.length-1;o>=0;--o){const r=X(n[o],!0);r.__removalCount=(e.__removalCount||0)+1,t.insertBefore(r,$(e))}}}return _t(e),!0}return e instanceof R&&!Et(e)?(_t(e),!0):"noscript"!==n&&"noembed"!==n&&"noframes"!==n||!_(/<\/no(script|embed|frames)/i,e.innerHTML)?(ke&&e.nodeType===Z&&(t=e.textContent,u([fe,de,he],(e=>{t=g(t,e," ")})),e.textContent!==t&&(p(o.removed,{element:e.cloneNode()}),e.textContent=t)),wt("afterSanitizeElements",e,null),!1):(_t(e),!0)},Lt=function(e,t,n){if(Be&&("id"===t||"name"===t)&&(n in r||n in mt))return!1;if(ve&&!Le[t]&&_(ge,t));else if(De&&_(Te,t));else if(!Se[t]||Le[t]){if(!(Dt(e)&&(we.tagNameCheck instanceof RegExp&&_(we.tagNameCheck,e)||we.tagNameCheck instanceof Function&&we.tagNameCheck(e))&&(we.attributeNameCheck instanceof RegExp&&_(we.attributeNameCheck,t)||we.attributeNameCheck instanceof Function&&we.attributeNameCheck(t))||"is"===t&&we.allowCustomizedBuiltInElements&&(we.tagNameCheck instanceof RegExp&&_(we.tagNameCheck,n)||we.tagNameCheck instanceof Function&&we.tagNameCheck(n))))return!1}else if(Ze[t]);else if(_(Ae,g(n,Ee,"")));else if("src"!==t&&"xlink:href"!==t&&"href"!==t||"script"===e||0!==T(n,"data:")||!Ke[e]){if(Oe&&!_(ye,g(n,Ee,"")));else if(n)return!1}return!0},Dt=function(e){return"annotation-xml"!==e&&h(e,_e)},vt=function(e){wt("beforeSanitizeAttributes",e,null);const{attributes:t}=e;if(!t)return;const n={attrName:"",attrValue:"",keepAttr:!0,allowedAttributes:Se};let r=t.length;for(;r--;){const i=t[r],{name:a,namespaceURI:l,value:c}=i,s=st(a);let p="value"===a?c:y(c);if(n.attrName=s,n.attrValue=p,n.keepAttr=!0,n.forceKeepAttr=void 0,wt("uponSanitizeAttribute",e,n),p=n.attrValue,n.forceKeepAttr)continue;if(At(a,e),!n.keepAttr)continue;if(!xe&&_(/\/>/i,p)){At(a,e);continue}if(Me&&_(/((--!?|])>)|<\/(style|title)/i,p)){At(a,e);continue}ke&&u([fe,de,he],(e=>{p=g(p,e," ")}));const f=st(e.nodeName);if(Lt(f,s,p)){if(!We||"id"!==s&&"name"!==s||(At(a,e),p=Ge+p),ie&&"object"==typeof G&&"function"==typeof G.getAttributeType)if(l);else switch(G.getAttributeType(f,s)){case"TrustedHTML":p=ie.createHTML(p);break;case"TrustedScriptURL":p=ie.createScriptURL(p)}try{l?e.setAttributeNS(l,a,p):e.setAttribute(a,p),St(e)?_t(e):m(o.removed)}catch(e){}}}wt("afterSanitizeAttributes",e,null)},Ot=function e(t){let n=null;const o=bt(t);for(wt("beforeSanitizeShadowDOM",t,null);n=o.nextNode();)wt("uponSanitizeShadowNode",n,null),Ct(n)||(n.content instanceof s&&e(n.content),vt(n));wt("afterSanitizeShadowDOM",t,null)};return o.sanitize=function(e){let t=arguments.length>1&&void 0!==arguments[1]?arguments[1]:{},n=null,r=null,i=null,l=null;if(ot=!e,ot&&(e="\x3c!--\x3e"),"string"!=typeof e&&!Rt(e)){if("function"!=typeof e.toString)throw A("toString is not a function");if("string"!=typeof(e=e.toString()))throw A("dirty is not a string, aborting")}if(!o.isSupported)return e;if(Ue||ft(t),o.removed=[],"string"==typeof e&&(je=!1),je){if(e.nodeName){const t=st(e.nodeName);if(!Ne[t]||Ce[t])throw A("root node is forbidden and cannot be sanitized in-place")}}else if(e instanceof b)n=Nt("\x3c!----\x3e"),r=n.ownerDocument.importNode(e,!0),r.nodeType===V&&"BODY"===r.nodeName||"HTML"===r.nodeName?n=r:n.appendChild(r);else{if(!Fe&&!ke&&!Ie&&-1===e.indexOf("<"))return ie&&ze?ie.createHTML(e):e;if(n=Nt(e),!n)return Fe?null:ze?ae:""}n&&Pe&&_t(n.firstChild);const c=bt(je?e:n);for(;i=c.nextNode();)Ct(i)||(i.content instanceof s&&Ot(i.content),vt(i));if(je)return e;if(Fe){if(He)for(l=se.call(n.ownerDocument);n.firstChild;)l.appendChild(n.firstChild);else l=n;return(Se.shadowroot||Se.shadowrootmode)&&(l=me.call(a,l,!0)),l}let m=Ie?n.outerHTML:n.innerHTML;return Ie&&Ne["!doctype"]&&n.ownerDocument&&n.ownerDocument.doctype&&n.ownerDocument.doctype.name&&_(q,n.ownerDocument.doctype.name)&&(m="\n"+m),ke&&u([fe,de,he],(e=>{m=g(m,e," ")})),ie&&ze?ie.createHTML(m):m},o.setConfig=function(){let e=arguments.length>0&&void 0!==arguments[0]?arguments[0]:{};ft(e),Ue=!0},o.clearConfig=function(){ut=null,Ue=!1},o.isValidAttribute=function(e,t,n){ut||ft({});const o=st(e),r=st(t);return Lt(o,r,n)},o.addHook=function(e,t){"function"==typeof t&&(pe[e]=pe[e]||[],p(pe[e],t))},o.removeHook=function(e){if(pe[e])return m(pe[e])},o.removeHooks=function(e){pe[e]&&(pe[e]=[])},o.removeAllHooks=function(){pe={}},o}();return oe}))
タイトルとURLをコピーしました
コメント