統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#001
こんにちは!こーたろーです。
今日は、統計学の基礎をやってみます。
というのも、データ分析は機械学習や深層学習だけではなく、統計も必要となってくるからです。
実社会では、AI分野を除けば基本的に統計学の方がよく使うのではないか?と勝手に考えて、今回から統計もやることにしました。
教材は【やさしく学ぶ データ分析に必要な統計の教科書 できるビジネスシリーズ】を使用していきます。
こちらは、データ分析をExcelで行っているのですが、これをこのブログではGoogle ColabratoryでPythonを使って行ってみたいと思います!
課題 2-1
データの最大値、最小値を求める。
1.必要なライブラリをインポートする。
import pandas as pd
2.データの読み込み
sample_df = pd.read_csv('2_1.csv' , sep=',')
3.データを確認
sample_df
こんな感じです。
性別と年齢情報と1日当たりのインターネット利用時間(分)がデータとして160件入っています。
4.最大、最小値を求めて表示させます。
a = sample_df['minutes'].max() b = sample_df['minutes'].min() print('max is {0}, min is {1}'.format(a,b))
結果は、最大が287分、最小が10分という結果になりました。
こんな感じで、こちらのテキストをpythonで行い、統計を行いながら
Pythonの基礎操作についても学んでいけたらと思います。
次回からはもう少したくさんやります。
ではでは。