僕なりストリート人工知能論
人工知能について書くとか言ったので書きます。
人工知能はいかにして強くなるのか? 対戦型AIで学ぶ基本のしくみ (ブルーバックス)
- 作者: 小野田博一
- 出版社/メーカー: 講談社
- 発売日: 2017/01/18
- メディア: 新書
- この商品を含むブログを見る
この本、ざっと読んだ感じ、割りかしGoogleの出したAlphaGoとか僕らに比較的馴染みのある題材を選んで、人工知能技術ってこんなんだよーって擦り寄ってきてくれる良書なんじゃないかと思ってあげました。詳しく知りたいガチ勢は、今は青色の人工知能解説本とか、黄色本の『パターン認識と機械学習』とかあるからそっちを読みましょう。より詳しい解説は詳細の中川研究室の講義スライドとかオススメです。(Slide Shareでも見れる。)後はQiitaなりgithubなり見て調べて貰えば大概誰かアタマの良い方が解説してくれてたり、コード落としたりしてくれてます。
さて、僕が人工知能、ひいてはpythonなどに出会った経緯を語ります。今回は僕もわからないことが多く。断片的な知識を吸収してきた為、多分な憶測とまとまりの無い話の塊だと思います。どうかご容赦を。まぁ、毎回そうか。
僕は研究室でLinuxを押し付けられたのに加えて、今の生物やるのにデータサイエンスの知識がいる事を悟りました。僕はこの時Linuxも今までシッカリ触った事などなく、Windowsで1人でオープンソースソフトウェアをインストールしたことがないくらいにはパソコンについては無知でした。『ディレクトリってファイルの事だろ?』『インストールとダウロードって一緒じゃね?』『パス?は?経路が何?』くらいの知識でした。その為、とりまなんか勉強しようと思いました。
研究室にはその為に有償のMatlabと言う解析ソフトが存在してました。コレが優秀でこれさえあればなんでもできるんですね。でも、僕は思いました。
「金払わないといけないのなんかムカつくな。分かった気もしねーし。タダでなんかイイもんねーかな。」そんな無知のくせに持ってしまった生意気な動機で解析ソフトから探す旅を11月下旬から始めました。
工学部に所属していたこともあり、少しはデータサイエンスかじってるやつとか、人工知能の歴史のあらすじ知ってるやつとかいたんで、なんかそう言うコトか何かが根が深いブームになっているし、今の時代タダでなんか出来んだろってのも薄っすら感じ取っての事でした。
取り敢えず、なんかプログラミングできるものないかな?って本屋行ってよく見たのはpythonという文字。周りもなんかpythonかRとかいうの使ってるみたい。
じゃまぁ、なんかよくわかんねーけどpython入れる練習からしてみよう。
こんな感じでした。誰も知ってるやつがいなかったんで、適当に一冊本を買って家のノーパソ開いてやってみました。
科学技術計算のためのPython入門 ――開発基礎、必須ライブラリ、高速化
- 作者: 中久喜健司
- 出版社/メーカー: 技術評論社
- 発売日: 2016/09/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
数時間後ヒシヒシある事に気がつきました。
「この本pythonの使い方書いてあるけど、pythonを使う設定の解説一切ない…。」
なけなしの3500円が無駄になるかどうかギリギリの境界線上に今立たされてる事に気がつきました。
もう腹をくくりGoogle先生に聞きまくりました。オレの問題どーやったら解決するんだ!って。そして気がつきました。
「アレ…?8割くらい問題解決してるの英語だ…。(^_^;)」って事に。腹をくくって英語や日本語のブログを読みあさりました。その中で幾つかある記事を読んでいき気がついたことがあります。
理論の本は世の中多くあったけど、肝心のセットアップについては誰も言及していない。しかし、皆環境を整えている事実に。より詳細に調べているとまたある壁にぶち当たりました。
「アレ…pythonってもしかしてWindowsで使ってる奴いない…??」
そう。本には書いていない言外の意味が多くあったのです。みんなpython使うやつらはMacかUbuntuしか使ってない。故にWindowsの解決方法がそもそもない。誰もそれについて直接言及してるやつはいませんでした。ただ一つ。知ってるやつは知ってる。ウェブからヒシヒシと分かる暗黙の了解。そして本には本当に必要なことが書いてないという事に気づきました。
ナンジャコリャ!!
まぁ、そんな感じでなんとか人に少し聞いては1人でセットアップしていきました。
セットアップに数日かかりここまでやったんだから何か凄いことしてやろうと思いまた色々調べて気がつきました。
人工知能ってRやpythonしかも主にpythonでタダで今開発競争している。という事実に。
ナンジャコリャ!!!!
一番衝撃を受けたのはシリコンバレーのGPUベンチャーNvidiaがAIについてまとめたこの資料。(決してハイレゾなゲーム作ってるだけの会社じゃなかった…。)
Google…IBM…スタンフォード…Microsoft…Facebook…
何かが起きてる…(^_^;)
日本で戦えてるのこれ見る限りPrefered Networks社だけ…
終わってる…(^_^;)
そして、なんでGPUでAIなん?そもそもGPUって何?(^_^;)
謎は深まる。(後にパソコンの計算速度上げる為にもうCPUじゃ限界きたから今度は計算マシンの構造とかGPUの性能あげて性能上げようぜってなったってのは後で知りました。)
ドンドン調べていくと、人工知能用ソフトも色々ありました。古参ぶる人工知能ブロガーは、caffeが…tensorflowが…chainerは…etcとか言うpython用の人工知能ソフトについてコメント言うだけ。
呪文の嵐でした。
でも悟りました。pythonの下に数々のITメーカーがフリーソフトの開発でしのぎを削っているのだろうと言う事に。
ただそれでも意味がわからないことがたくさんあります。
コイツラこんなタダ働きみたいなことなのになんで全力出して宣伝活動とか開発競争とかしてるんだ…??
これだけ見たら企業原理の真逆いってんぞ?
色々調べていき薄々ある仮説にたどり着きました。
「もしかしたらGoogleは人工知能を含むソフトからハードに至るサービスを掌握しようとしてるんじゃねーか」って事に。他の会社もそれをテコにビジネスを展開しようとしてるんじゃねーかってことに。
特にGoogleは全てを独占すれば一部がフリーでも金は一部だけ払うようにしておけば大丈夫。まさに勝ち組の論理。
具体的には、人工知能ソフト以外にクラウドサービス、クラウド管理ソフト、そして量子コンピュータ(これは実現するか分からないけど。)
ハードからソフトまで見て動いてる事に気がつきました。
tensorflow
Cloud9
kubernets(クラウド管理ソフト、厳密には違うけど俺はそう言う認識)
人工知能の車なんかももうとっくに作ってる…(日本は最近作ろうとか言い出してたけど、トヨタのconcept-愛iとか日産とか…)
Googleが特に目立ちますが、先に書いたようにIBM、Facebook、Amazonなど、「え?お前らも?」みたいなアプリケーション系の企業までジャンジャンそこ周辺をターゲットに動いてる様です。それが遺伝情報と言うビッグデータや、人工知能診断など医療とも最近は融合しています。
あ、あと今回はGoogleを主に大きく取り上げましたが、個人的にはGoogleは手を出してる幅が広いだけで、クラウドサービスはAWS(Amazon Web Service)、クラウド管理ソフト(ホントーはコンテナソフトとか言われてる。)はdockerなんかがシェアを握ってるイメージを持ってます。一応注意って形です。量子コンピュータもどうなってるか分からないし笑。
バーチャル内の隠れた市場争い。ビビりました。
まぁ、色々語りましたが、そんなこんなで人工知能のセットアップまで最近はこぎつけました。
やってみて分かったんですが、イマイチ人工知能などの理論が理解できてなくてもチュートリアルだけでも十分遊べるんですね。コレが。
理論要らないじゃん。って感じですね。
人工知能系に至っては本では情報が古いからネット(Twitterとかで専門家とか探してフォローする。)でキャッチアップするしかないんですねー。
イヤーオドロキです。
そして、全てがオープン(タダ)こんな首突っ込み得なこともねーぜ!って感じで取り敢えず僕は人工知能系の界隈にのめり込んでったってことですね。全然使いこなせねーけど。
最後にRはもっと色々楽でした。
詳細
中川研究室(昔は勉強会資料など良い資料がフリーであったんですが消されたかも…。)
SlideShare-nakagawa | 中川研究室
pythonの有名な人工知能ライブラリーの解説動画などはこのチャンネルを参照してください。
Nvidiaスライド
https://images.nvidia.com/content/APAC/events/deep-learning-day-2016-jp/NVIDIA-DeepLearning-Intro.pdf
Rの人用
Rはデータサイエンスで使う(機械学習とは毛色が違う)からそれやりたい方は緑本とか読みましょう。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
因みにバイオ系でゲノムデータを扱う場合は今はRが主流の様です。企業がRのパッケージを出してるみたいなんですね。
必要なパッケージはGoogle先生に聞くか、この本を参考にしましょう。
次世代シークエンス解析スタンダード〜NGSのポテンシャルを活かしきるWET&DRY
その他講義動画
Tensorflow and deep learning - without a PhD by Martin Görner - YouTube