

散布図を「なんとなく見るだけ」でいると、相関係数が0.4でも「強い相関アリ」と誤判断して、収納スペース改善のために買った棚が全部ムダになります。
散布図(英:scatter plot)とは、2種類のデータを座標平面上に点として書き込み、その分布のかたちから2変量の関係性を視覚的に読み取るグラフです。高校数学Ⅰ「データの分析」で登場し、統計学・品質管理(QC7つ道具のひとつ)・ビジネスデータ分析など、幅広い分野で使われています。
散布図が扱うのは「2変量データ」です。たとえば、クラス全員の「数学の点数」と「物理の点数」をそれぞれ1人ひとり記録したとき、1人あたり2つの数値を持つデータのことを2変量データといいます。これを座標平面に書き出すことで、数学が得意な生徒は物理も得意かどうか、といった傾向を一目で確認できます。
1変量データ(身長だけ、気温だけ)では見えなかった「2つの量の関係」が見えてくる。それが散布図の最大の強みです。
散布図は「相関図」とも呼ばれます。横軸に一方のデータ(例:数学の点数)、縦軸にもう一方のデータ(例:物理の点数)を設定し、各ペアのデータを「点(プロット)」として打っていくだけで完成します。完成した散布図を見て点の分布が「右上がり」「右下がり」「バラバラ」のどれに近いかを判断することで、2変量間の相関関係を把握できます。
つまり、散布図=「2つのデータの関係を点で表した図」です。
参考:総務省統計局による散布図の定義と基本的な見方
総務省統計局「散布図」解説ページ
散布図の書き方は、大きく4つのステップで進めます。難しい計算は不要です。手順さえ覚えればすぐに作れます。
① 相関を調べたい2種類のデータを用意する
まず、関係性を調べたい2つのデータを揃えます。たとえば「数学の点数」と「英語の点数」のように、ある程度関係がありそうな2変量を選びましょう。一方が「原因(要因)」でもう一方が「結果(特性)」の関係にある場合は、原因を横軸・結果を縦軸に置くのが基本的なルールです。
注意が必要なのはデータ数です。後述しますが、データが少なすぎると相関係数が不安定になり、信頼性が落ちます。最低でも30個以上のデータを用意するのが理想的です。
② 縦軸と横軸の範囲・目盛りを決める
次に、用意したデータすべてをグラフ上にプロットできる範囲を設定します。最小値と最大値をデータから確認し、余白を少し持たせた目盛りを縦軸・横軸に設定しましょう。
たとえば横軸が「数学の点数(0〜100点)」なら、目盛りは0〜100の範囲で20点刻みにするとバランスよく見えます。目盛りの間隔が不均一だと、点の分布が歪んで見えるため注意してください。原点Oの記載も忘れないようにしましょう。
③ データを1つずつプロット(打点)する
縦軸と横軸が決まったら、データを1組ずつ点として打っていきます。「横軸の値」と「縦軸の値」が交わる場所に点をひとつ打つ、という作業を全データ分繰り返します。
もし同じ場所に2つ以上のデータが重なる場合は、点を二重丸(◎)にするか、すぐ隣にずらして打つなど、重なりがわかるように工夫してください。この作業が地味に重要です。
④ タイトルと補足情報を記入する
すべてのデータをプロットしたら、「何と何の関係を示した図なのか」がわかるようにタイトルを書きます。学校のテストではそこまで問われませんが、ビジネス・研究の場では、データの取得期間・対象・作成者なども記載すると伝わりやすくなります。
以上が散布図の書き方の基本4ステップです。
参考:散布図の書き方の手順を詳しく解説したBacklogの記事
Backlog「散布図とは?作る目的や書き方を紹介!」
散布図が完成したら、次は「どんな分布の形か」を読み取ります。散布図に現れるパターンは大きく3種類です。
パターン1:正の相関
散布図の点が全体的に「右上がり」の直線状に分布しているとき、2つの変量の間には「正の相関がある」といいます。一方の値が増えるともう一方も増える関係です。たとえば「数学の点数が高い人は物理の点数も高い傾向がある」といった場合がこれにあたります。
パターン2:負の相関
点が全体的に「右下がり」の直線状に並ぶとき、「負の相関がある」といいます。一方が増えるともう一方が減る関係です。「運動量が増えるほど体脂肪率が下がる」といったケースが典型例です。
パターン3:相関がない(無相関)
点がバラバラに散らばっていて、直線的なパターンが見えない場合は「相関がない」と判断します。たとえば「数学の点数」と「100m走のタイム」の関係を散布図にすると、多くの場合このパターンになります。
さらに、正の相関・負の相関はそれぞれ「強い」「弱い」の2段階に分かれます。点が直線に近くビタッと集まっているほど強い相関、直線からばらつきが大きいほど弱い相関です。
| パターン | 点の形 | 意味 |
|----------|--------|------|
| 強い正の相関 | 右上がりの直線に密集 | 一方が増えるとほぼ確実にもう一方も増える |
| 弱い正の相関 | 右上がりだがバラつきが大 | 増える傾向はあるがばらつきが多い |
| 強い負の相関 | 右下がりの直線に密集 | 一方が増えるともう一方はほぼ確実に減る |
| 弱い負の相関 | 右下がりだがバラつきが大 | 減る傾向はあるがばらつきが多い |
| 無相関 | バラバラ | 2変量に直線的な関係はない |
3パターンが基本です。
参考:散布図の相関パターンをわかりやすく図解した解説
数学の景色「散布図の書き方や見方がよくわかる!」
散布図を目で見るだけでは、「強い」「弱い」の判断が人によってぶれることがあります。そこで登場するのが「相関係数(r)」です。相関係数は、2変量の間の直線的な関係の強さを、−1から+1の数値で表す指標です。
$$r = \frac{s_{xy}}{s_x \cdot s_y}$$
ここで $s_{xy}$ は共分散、$s_x$ と $s_y$ はそれぞれ x と y の標準偏差です。相関係数の値は必ず −1 以上 +1 以下になります。
相関係数の目安は以下の通りです。
| 相関係数 r の絶対値 | 相関の強さの目安 |
|--------------------|-----------------|
| 0.9 以上 | 非常に強い相関 |
| 0.7 〜 0.9 未満 | 強い相関 |
| 0.5 〜 0.7 未満 | 中程度の相関 |
| 0.3 〜 0.5 未満 | 非常に弱い相関 |
| 0.3 未満 | ほぼ無相関 |
rが正の値なら正の相関、負の値なら負の相関です。r = 1 または r = −1 の場合、すべての点が一直線に並んでいることを意味します。
相関係数を手計算で求めるときは、表を作成しながら進めるのがミスを防ぐコツです。①まず x と y それぞれの平均値を求める、②偏差(各データ−平均)を計算する、③偏差の合計が0になっていることを確認する、④偏差の2乗と偏差の積を計算して分散・共分散を求める、⑤最後に相関係数を算出する、という流れで進めます。分散を平方根して標準偏差にするのを忘れがちなので注意が必要です。
相関係数が条件です。数値で確認することで、散布図の視覚的判断と合わせてより精度の高い分析が可能になります。
参考:共分散と相関係数の求め方・証明まで詳解した記事
受験の月「共分散・散布図と相関係数rの関係一覧」
散布図や相関係数を扱うときには、見落とされがちな注意点がいくつかあります。これを知らずにいると、誤った結論を出すリスクがあります。
注意点1:相関関係は因果関係ではない
散布図から読み取れるのは「相関関係」であって「因果関係」ではありません。因果関係とは「AだからB」という原因と結果のつながりのことです。たとえば、1月の鍋料理を食べる世帯数とインフルエンザ患者数の間には正の相関が見られますが、「鍋を食べるとインフルエンザになる」という因果関係はありません。どちらも「冬という同じ原因」から生じているだけです。散布図で相関を確認した後も、必ず因果関係を別途検討する姿勢が大切です。
注意点2:データ数が少ないと相関係数は信頼できない
データの個数が少ない場合、たまたまの結果として相関係数が大きな値を示すことがあります。一般的には最低でも30個、より信頼性を高めるなら100個以上のデータを用意するのが望ましいとされています。データが10個や15個しかない状態で「強い相関がある」と結論づけるのは危険です。
注意点3:外れ値が相関係数を大きく歪める
相関係数は外れ値(他のデータから大きくかけ離れた値)の影響を強く受けます。外れ値が1つ入っただけで、相関係数が0から0.9近くに変化することもあるほどです。散布図を作成したら、必ず全体を目視して、極端に離れた点がないかを確認してください。外れ値が見つかった場合は、その原因を調べた上で分析に含めるかどうかを判断します。
注意点4:相関係数は直線的な関係しか表せない
相関係数が0でも、2変量が無関係とは限りません。たとえばU字型(2次関数的)の関係がある場合、相関係数は0に近くなりますが、実際には明確な関係があります。散布図を目視して関係性のかたちを確認することが、相関係数の数値だけに頼らないためにも重要です。
散布図と相関係数はセットで使うのが原則です。数値だけで判断せず、必ず図も確認する習慣をつけましょう。
参考:相関係数の注意点・データ数・外れ値の扱いを詳しく解説
データ分析lab「相関係数とは?意味や求め方、ロジックをわかりやすく解説」
ここからは少し視点を変えます。「収納・整理整頓」に関心がある方にとって、散布図は意外なほど実用的なツールになります。
たとえば、「収納棚の数」と「部屋の片付け頻度」の関係を散布図で表すとどうなるでしょうか。棚が増えれば片付けが楽になるはず、と直感では思いがちです。しかし実際にデータを取ってみると、棚を増やしすぎると逆にモノが増えて散らかりやすくなる、という負の相関が出るケースも報告されています。感覚だけで収納を増やすより、実際のデータを可視化してみることで「本当に必要な収納量」が浮き彫りになります。
また、「モノの使用頻度」と「収納場所までの距離(歩数・手順数)」の関係を散布図にするのも有効です。正の相関(よく使うモノほど遠い場所にある)が出た場合、収納の配置を見直す大きな根拠になります。実際、この視点は整理収納アドバイザーの分野でも「使用頻度と収納距離の一致」として語られている概念で、散布図で可視化すると家族への説明もスムーズに進みます。
このように散布図は、学校の数学の問題を解くだけでなく、日常生活の「なんとなくの判断」をデータで裏付けるためのツールとしても機能します。必要なのはExcelや無料の統計ツール(GoogleスプレッドシートにはCORREL関数が標準搭載)で、2列のデータさえあれば数分で散布図が作れます。
これは使えそうです。
日々の収納改善やライフスタイルの見直しに「数値で見る習慣」を取り入れると、感覚的な失敗を減らせるという大きなメリットがあります。散布図の書き方を覚えたあとは、ぜひ身の回りのデータで試してみてください。

Rutexc農業用噴霧器ホースリールは、農作業、農薬散布、ガーデニングに最適です。厚みのあるホースに対応し、ホースリールフレームと高圧噴霧ホース収納機能を備えています(詳細は寸法図をご覧ください)。 (赤い吊り下げ式パイプ巻き機(300メートル))