福岡人データサイエンティストの部屋

データサイエンスを極めるため、日々の学習を綴っています。

GitHubのコードをVScodeウェブで閲覧??【コラム】#009



こんにちは!こーたろーです。


最近は毎日ウォーキングやっております。


もうかれこれ1か月以上休まず続いているという。


私としてはかなり長続きしているような気がします。



では!! 本日はこちらの記事です。




forest.watch.impress.co.jp


続きを読む

seq2seqで翻訳してみた!(自然言語処理)【図解速習DeepLearning】#016


こんにちは!こーたろーです。


本日も【図解速習DEEP LEARNING】の自然言語処理を行っていきます。

今回は、seq2seq(sequence to sequence)を使って、スペイン語から英語へ翻訳してみます。

  • 必要なライブラリのインポート
  • データセットをダウンロードする
  • データセットの前処理
  • モデルを作成
    • GRUを定義
    • エンコーダを定義
    • デコーダを定義
    • エンコーダ・デコーダ作成
    • オプティマイザーと損失関数を定義
    • チェックポイントを定義し、学習途中の状態を保存できるようにする
  • モデルの学習
  • モデルを評価
    • 翻訳用の関数を定義する
    • チェックポイントデータの呼び出し
    • 翻訳し、モデルを確認
続きを読む

機械学習でコストダウン???【コラム】#008


こんにちは!こーたろーです。

なんだか春が近づいたかと思えば雪降ったりで、体調崩しやすい環境ですが、皆さん元気にされていますか?

もう2月も半分すぎて、そろそろ年度末の処理や新年度の準備が始まりますね。


さてさて、今日の話題はコチラです!


gigazine.net

続きを読む

RNNでテキスト生成やってみた!(自然言語処理)【図解速習DeepLearning】#015

こんにちは!こーたろーです。

本日もやってまいりましょう!【図解速習DEEP LEARNING】の自然言語処理の課題です。

今回は、テキストの生成ということで、RNNを用いて作成していきます。




  • 必要なライブラリーのインポート
  • データセットのダウンロード
  • データの前処理
  • モデルの構築
  • モデルを訓練する
  • テキストを生成する
続きを読む

株の予測って難しいよね。。。【コラム】#007

こんにちは!こーたろーです。


最近、コラムにしたい記事がたまってしまっているので、少しだけコラム枠増やしています。


1日に2記事投稿なんかも考えていますので、興味がある方は是非見てみてください!


本日はこちらのニュースです!

ai-biblio.com

続きを読む

統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#002

こんにちは!こーたろーです。

今日は、統計学の基礎をやってみます。

というよりは、統計学のやさしめの教材を学びつつ、データサイエンスに必要な探索的データ分析(EDA)の練習を兼ねています。

是非、皆さんもやってみてくださいね。

教材は【やさしく学ぶ データ分析に必要な統計の教科書 できるビジネスシリーズ】を使用します。

早速トレーニング!
データは前回のブログで紹介したものと同じものを使用します。
参考:統計の基礎やってみた【やさしく学ぶデータ分析に必要な統計の教科書】#001 - 福岡の社会人データサイエンティストの部屋


せっかくなので、初めからやってみます。

  • 必要なライブラリのインポート
  • データの読み込み、表示
    • 【操作2-1】 分布の上限と下限を確認
    • 【操作2-2】 階級数の幅を求める
    • 【操作2-3】階級を設定する
    • 【操作2-4】【操作2-5】度数分布表を作成する
    • 【操作2-6】ヒストグラムを作成する。
続きを読む