福岡人データサイエンティストの部屋

データサイエンスを極めるため、日々の学習を綴っています。

機械学習でコストダウン???【コラム】#008


こんにちは!こーたろーです。

なんだか春が近づいたかと思えば雪降ったりで、体調崩しやすい環境ですが、皆さん元気にされていますか?

もう2月も半分すぎて、そろそろ年度末の処理や新年度の準備が始まりますね。


さてさて、今日の話題はコチラです!


gigazine.net

続きを読む

RNNでテキスト生成やってみた!(自然言語処理)【図解速習DeepLearning】#015

こんにちは!こーたろーです。

本日もやってまいりましょう!【図解速習DEEP LEARNING】の自然言語処理の課題です。

今回は、テキストの生成ということで、RNNを用いて作成していきます。




  • 必要なライブラリーのインポート
  • データセットのダウンロード
  • データの前処理
  • モデルの構築
  • モデルを訓練する
  • テキストを生成する
続きを読む

株の予測って難しいよね。。。【コラム】#007

こんにちは!こーたろーです。


最近、コラムにしたい記事がたまってしまっているので、少しだけコラム枠増やしています。


1日に2記事投稿なんかも考えていますので、興味がある方は是非見てみてください!


本日はこちらのニュースです!

ai-biblio.com

続きを読む

統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#002

こんにちは!こーたろーです。

今日は、統計学の基礎をやってみます。

というよりは、統計学のやさしめの教材を学びつつ、データサイエンスに必要な探索的データ分析(EDA)の練習を兼ねています。

是非、皆さんもやってみてくださいね。

教材は【やさしく学ぶ データ分析に必要な統計の教科書 できるビジネスシリーズ】を使用します。

早速トレーニング!
データは前回のブログで紹介したものと同じものを使用します。
参考:統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#001 - 福岡の社会人データサイエンティストの部屋


せっかくなので、初めからやってみます。

  • 必要なライブラリのインポート
  • データの読み込み、表示
    • 【操作2-1】 分布の上限と下限を確認
    • 【操作2-2】 階級数の幅を求める
    • 【操作2-3】階級を設定する
    • 【操作2-4】【操作2-5】度数分布表を作成する
    • 【操作2-6】ヒストグラムを作成する。
続きを読む

Universal Encoder使ってみた!(自然言語処理)【図解速習DeepLearning】#014

こんにちは!こーたろーです。

本日は、また課題テキストの【図解速習DEEP LEARNING】に戻って、課題を進めていきます!

今回は、TF-Hubが提供しているUniversal Sentence Encoderという学習済みモデルを使って、文章の類似度を判定していきます!

続きを読む

PyData.Fukuoka参加してみた!【イベント】#0003

こんにちは!こーたろーです。


本日2つ目のイベントに参加してきました。

PyData.Fukuokaのイベントです。
PyData.Fukuoka Meetup #10【オンライン開催】 - connpass



ちょっとメモチックですが、内容を記載させていただきました。

続きを読む