福岡人データサイエンティストの部屋

データサイエンスを極めるため、日々の学習を綴っています。

PyData.Fukuoka参加してみた!【イベント】#0003

こんにちは!こーたろーです。


本日2つ目のイベントに参加してきました。

PyData.Fukuokaのイベントです。
PyData.Fukuoka Meetup #10【オンライン開催】 - connpass



ちょっとメモチックですが、内容を記載させていただきました。




1.「書籍「AI・データ分析プロジェクトのすべて」の解説と使い所」

登壇者: NOB DATA株式会社 代表取締役  大城 信晃氏


近年、AI・データ分析の導入を使用と試みる会社が多いようですが、失敗例も多くあるようです。

実務では、自社システムが他言語だったり、分析組織がなかったり、本業がITではないなどなど。


こちらの図書は、実務におけるこれらの課題の打開策などの内容が書かれているらしいです。

私も購入しました!!!




1.既存業務をまずは日曜プログラミング

・業務外でプロトタイピングして、自分の提携業務を楽にする。
・業務外でスモールスタートのアウトプットで成功事例を作っていく。


2.プロトタイプをもって「働き方改革

Python利用比率20%くらい想定でおこなう。
・「中期事業計画」「働き方改革」の方で提案して、業務へ織り込んでいく。
・特にデータ分析は業務効率化では必須。
・この段階では、既存業務の効率化を目的に進めるのがベター。
システム開発としては、プロトタイプまではありかもしれない。
・新規ビジネス創出・研究開発は、工数が足りないので、Pythonまでたどり着くのに時間がかかる。


とにもかくにもまずはデータ分析から取り掛かるのが成功のカギということですかね。


3.分析チームの設立 or チームへの参画

・20%稼働によりある程度自分の業務効率化が進み、会社としてもその価値を認められた場合、チームの立ち上げへ。
・50%程度は業務でPythonを利用できる状態を想定。
・今後の業務改革のスピードに関わる重要なフェーズ。


4.全社展開 or スペシャリスト化

・分析チーム設立から数年後のフェーズ。
・マネジメントに回るか、技術者・分析者としてスペシャリストを目指すかは検討が必要。
・この状況であれば、他社のニーズもあるため、転職を検討することもあり。
Pythonを使って、最終的に何を成し遂げたいか、Pythonを目的とするのか、手段とするのかで各自判断。




この書籍の特徴としては、これまでは、技術に着目した本が多かった中で、「ビジネス」の観点を加えた、AI・データ分析プロジェクトの解説書として書かれていることが挙げられます。これによって、プロジェクトに潜む様々な「罠」をある程度予見することが可能になり、プロジェクトがとん挫するケースが減るかも・・・?以降、書籍の内容を掻い摘んで説明されていました。



なかなかおもしろかったです。特に、プロジェクトの立ち上げのところは非常に難しいので、読み甲斐があります!



講演中、私からも質問させて頂きました。



【DSF-Kotaro】(質問)

「ITリテラシーの低い企業へのコンサルティングで、AI導入を行う時に、大変な思いをしました。常に費用対効果を求められる風潮ですので、プロトタイピングなどに費用をかけにくい状態が続きました。こういった顧客を相手にするときはどのように対応されていますか?」

【大城さん】(回答)

「規模(プロジェクトの金額)によりますが、非常に答えづらいです(汗 めちゃくちゃ辛い場合はお断りする場合もあります。少額の場合は、無料でできる勉強会を進めたり、簡単なアドバイザーとしてとどまるなどして、お客さんの要件を満たせないか検討します。費用対効果については、いずれにしても「投資回収3年でできます!」というような形は見せる必要があります。段階・フェーズを切って、説明し、お客さんに選んでもらうようにするといいかとおもいます。日本企業の8割程度はIT企業なので、そっちの方がビジネスチャンスになるのではないでしょうか。」


なるほど。。


素晴らしい回答です。有難うございました。





2:LT


(1)LT1 Airbnbのオープンデータ触ってみる

講演者:@tommy_tomtoru


宿泊業界へジョブチェンジしたが、宿泊業界のデータをどのように利用しればいいかが分からないので、勉強しよう!ということで、airbnbのオープンデータを活用して、分析してみたということでした。
「Inside Airbnb」というサイトで、Airbnbの宿泊施設のデータを公開(CSVファイル)しており、そちらをEDAされていました。コチラのデータでは、各国ごとに「宿泊施設情報」「日々の空室状況」「各施設価格」「その国の地名情報」(74カラム)+カレンダーCSVなどが利用できるようです。但し、個人でスクレ―ピングを行って作ったアンオフィシャルなデータらしいので、使う時は注意が必要とのことでした。EDAのデータをみて、地図上でマッピングされて非常に映えていました!geopandとplotlyは後々使ってみて、紹介したいと思います!


(2)LT2  お天気データを触ってみた
講演者:@hide ogawa


はんなりkaggle部やデータ分析ハンズオンを開催されている方のようです。


今回のLTでは、2種類の気象データを使用してみたというものでした。一つ目は「JAXA-P-TREEにあるひまわりデータ」、二つ目は「全国合成レーダーGPV」というものでした。これらのデータの使い方、データ形式とどのように加工すればいいかを説明されていました。ファイル形式の問題とかって、発生すると面倒なところあるので、結構為になりました。データについては、plotlyで可視化するところまで。



私も電力関係の予測なんかやってたりするので、気象データは扱う必要があったりします。
参考になりました!


(3)LT3  twitterAPIでclubhouseに関するtweet取得しただけの話
講演者:@shinpsan  

最後は、飛び入り参加のLTで、瞬殺でしたね(笑  巷で流行っている「clobhouse」という音声SNSについて、Twitter上でどのようにつぶやかれているかというものを分析されていました。EDAです。またこのLTの中で、Pandasのタイムゾーンについて、調べた結果も説明されていました。こういった細かな部分って、結構気にし始めると気になり続けるものですよね。。先日の投稿であった、Twitter API使ってデータ取得から分析までされていたので、私にとってはとても旬な話でした。



PyData.Fukuoka Meetup #10【オンライン開催】 - connpass

上記ページで、発表の資料が一部挙がっていますので、興味がある方は見てみてください!



ではでは。。