2021年6月2日 / 最終更新日時 : 2021年7月15日 admin-telefonista データサイエンス [データ入門]データの線形な関係を見定めよう!相関係数を理解する データの直線的な関係を考える 「相関がある」と言うフレーズを聞いたことはありませんか?例えば「身長と体重」、「家の広さと家賃」、「最高気温とアイスの売れ行き」などは相関があるとされます。 数学・統計において相関とは一方の […]
2021年3月24日 / 最終更新日時 : 2021年3月24日 admin-telefonista データサイエンス [データ入門]さまざまな代表値(4) 分散・標準偏差 前回記事:[データ入門]さまざまな代表値(3) 最大値・最小値では、最大値と最小値の差から求められる範囲が簡易的にデータの散らばりを把握するのに役立つとご紹介しました。ではより詳しく散らばりを知るためにはどういった計算を […]
2021年3月3日 / 最終更新日時 : 2021年3月2日 admin-telefonista データサイエンス [データ入門]さまざまな代表値(3) 最大値・最小値 最大値・最小値 データの代表値として忘れてはならないのが最大値と最小値です。 データの中で最も大きな値を最大値、最も小さな値を最小値と呼びます。 意味が単純で感覚的につかみやすく、これといった計算もなく求められるため、広 […]
2021年2月10日 / 最終更新日時 : 2021年2月10日 admin-telefonista データサイエンス [データ入門]さまざまな代表値(2) 中央値 今回は代表値のひとつ、中央値についてご紹介します。中央値はその名の通り、データを順に並べたときに中央にある値のことです。 例えば以下のデータの場合 3, 1, 4, 2, 5, 1, 2, 4, 3, 6, 2, 2, […]
2021年1月27日 / 最終更新日時 : 2021年12月27日 admin-telefonista データサイエンス [データ入門]さまざまな代表値(1) 最頻値 これまで触れてきた幾つかの平均値などのように、データから求められるデータの分布の特長を示す値を代表値(要約統計量)と言います。 今回はそんな代表値の一つ、最頻値についてご紹介します。最頻値は読んで字の如く、データのうち最 […]
2021年1月6日 / 最終更新日時 : 2021年1月4日 admin-telefonista データサイエンス [データ入門]さまざまな平均(2) 調和平均 今回は算術平均、幾何平均に次いで3つ目の平均値「調和平均」についてご紹介します。少し求め方が分かり辛いのでまずは定義から。 $$\bf\LARGE 調和平均値=\frac{1}{データの逆数の算術平均}$$ ※逆数:ある […]
2020年12月16日 / 最終更新日時 : 2021年1月4日 admin-telefonista データサイエンス [データ入門]さまざまな平均値(1) 幾何平均 ある商品の売上個数が下のように推移したとします。 売上が向上していることはわかるのですが一年当たりどのくらい向上しているのでしょう?前年比の売上変化率を計算すると次のようになりました。 では次の年もこのままの勢いで売り上 […]
2020年12月2日 / 最終更新日時 : 2021年1月4日 admin-telefonista データサイエンス [データ入門]データサイズと平均 データから何らかの情報を得るために最も身近なのは平均値ではないでしょうか。今回はその平均値について紹介します。 Aクラスの生徒の身長は Bクラスの生徒の身長は どちらの方が身長が高いクラスといえるでしょう? 平均値の求め […]
2020年11月18日 / 最終更新日時 : 2021年1月4日 admin-telefonista データサイエンス [データ入門]データサイエンティストって? ネット社会に生きる私たちは情報にあふれたこの社会に見慣れてしまっていますが、一般へのインターネットの普及は1990年代とさほど遠い過去ではありません。私たちはまだ情報の海から価値を取り出すことを完全に熟しきれてはいないの […]