福岡の社会人データサイエンティストの部屋

データサイエンスを極めるため、日々の学習を綴っています。

統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#001

こんにちは!こーたろーです。

今日は、統計学の基礎をやってみます。
というのも、データ分析は機械学習や深層学習だけではなく、統計も必要となってくるからです。
実社会では、AI分野を除けば基本的に統計学の方がよく使うのではないか?と勝手に考えて、今回から統計もやることにしました。

教材は【やさしく学ぶ データ分析に必要な統計の教科書 できるビジネスシリーズ】を使用していきます。

こちらは、データ分析をExcelで行っているのですが、これをこのブログではGoogle ColabratoryでPythonを使って行ってみたいと思います!

課題 2-1
データの最大値、最小値を求める。


1.必要なライブラリをインポートする。

import pandas as pd

2.データの読み込み

sample_df = pd.read_csv('2_1.csv' , sep=',')


3.データを確認

sample_df 

f:id:dsf-kotaro:20210129213837p:plain

こんな感じです。
性別と年齢情報と1日当たりのインターネット利用時間(分)がデータとして160件入っています。



4.最大、最小値を求めて表示させます。

a = sample_df['minutes'].max()
b = sample_df['minutes'].min()
print('max is {0}, min is {1}'.format(a,b))

f:id:dsf-kotaro:20210129214024p:plain

結果は、最大が287分、最小が10分という結果になりました。

こんな感じで、こちらのテキストをpythonで行い、統計を行いながら
Pythonの基礎操作についても学んでいけたらと思います。

次回からはもう少したくさんやります。

ではでは。