福岡の社会人データサイエンティストの部屋

データサイエンスを極めるため、日々の学習を綴っています。

Peformance RNN使ってみた【図解速習DeepLearning】#021



こんにちは!こーたろーです。


春からDeepLearningや機械学習を教えることになりました。


今は準備でばたばたしております。


合間を縫ってブログを書いていきます。


毎日書くのは大変!


ということで、今回も【図解速習DEEP LEARNING】やっていきます!


今回はPerformance RNNで音源を作っていきます。

  • 事前準備
  • 環境の準備
  • モデルを取得する
  • 曲の生成及び演奏データの生成


続きを読む

MusicVAEで作曲してみた!【図解速習DeepLearning】#020



こんにちは!こーたろーです。


久々の投稿です。


一週間ほどお休みいただきました。


結構ブログって大変ですね。


毎日書くのは大変!


ということで、今回も【図解速習DEEP LEARNING】やっていきます!


今回はMusicVAEで作曲していきます!

  • 環境の準備
  • データセットについて
    • 2小節ドラムモデル
      • 学習済みモデルの取得
      • サンプルを生成
      • サンプルをダウンロード
      • ファイルのアップロード
      • 補間を生成
      • 補間を生成(詳細チューニング)
    • 2小節メロディモデル
      • 学習済みモデルを取得
      • サンプルを生成
      • サンプルをダウンロード
      • ファイルのアップロード
      • 補間を生成
      • 補間を生成(詳細チューニング)
    • 16小節メロディモデル
      • 学習済みモデルを取得
      • サンプルを生成
      • サンプルをダウンロード
      • ファイルのアップロード
      • 補間を生成
      • 補間を生成(詳細チューニング)
    • 16小節「トリオ」モデル(リード、ベース、ドラム)
      • 学習済みモデルを取得
      • サンプルを生成
      • サンプルをダウンロード
      • ファイルのアップロード
      • 補間を生成
      • 補間を生成(詳細チューニング)


続きを読む

バッチ正則化が進化しました。【コラム】#011



こんにちは!こーたろーです。


毎日忙しくしています。


しかしながら、ブログで技術的なことを発信するのは結構リラックスできて、続けられそうな気がします。


今日のテーマはコチラです。


ai-scholar.tech

続きを読む

E-X NSynthで新しい音を作ってみた!【図解速習DeepLearning】#019



こんにちは!こーたろーです。


昨日は、データサイエンスのオンラインイベントに参加してきました。


皆さん、いろいろな現場での悩みなどがあり、データサイエンスの位置づけとは!みたいなことで盛り上がっていました。


データサイエンスは現場あって初めて価値がでますし、データがないと何も始まらないということが言われています。


早く現場でやってみたいですね。勉強だけでは技術的に身につかない部分が多いです。特にコンサルの部分。




それでは今回も【図解速習DEEP LEARNING】やっていきます!


今日は、Googleの深層学習のアート適用プロジェクトMagenta(https://magenta.tensorflow.org/)を使って、音声を合成することで、新しい音を作ってみます。

続きを読む

人気のプログラミング言語について【コラム】#010

こんにちは!こーたろーです。


いま、技術ブログの記事のためのプログラムを動かしているのですが、実行に時間がかかっているため、コラム書きます。


今日の記事はこちらです。


news.yahoo.co.jp



やるなら今!プログラミング副業〜独学で稼ぐ入門書〜: 転職やフリーランスを目指す初心者のための教科書

続きを読む

mimi-APIで音声認識試してみた!【図解速習DeepLearning】#018



こんにちは!こーたろーです。


Deep Learning の2021年度の学習計画をそろそろ立てようかと思っています。


いい参考書などありましたら教えて頂けると幸いです。


それでは今回も【図解速習DEEP LEARNING】やっていきます!


今日は、「mimi」というWebAPIサービスを利用していきます。


こちらは、フェアリーデバイセズ株式会社が提供しているものです。



  • mimiのアカウント作成
  • アプリケーションIDおよびクライアントIDの発行
  • アクセストークンの取得
  • 音声認識を試す
    • mimi🄬 ASR 版
    • mimi🄬 ASR powerd by NICT
  • 機械翻訳を試す
  • 音声合成を試す




続きを読む

日本語音声認識試してみた!【図解速習DeepLearning】#017



こんにちは!こーたろーです。


今日から【図解速習DEEP LEARNING】のSection11の「音を取り扱う深層学習」を行っていきます。


昔から音楽好きのため、音に関する知識は結構勉強しました。


下準備はばっちりだと思います。


本日はまず、ブラウザから日本語音声認識ができるサイトでの音声認識の体験をしてみます。


それでは早速参ります。




続きを読む