暇人大学放浪記

モラトリアムを持て余した暇人が日々起こった出来事に対する所感を徒然に書いていきます。

お題目

データサイエンスと生物と時々ビッグデータ

最近はてなブログでちゃんとした本の貼り方を知りました。笑

はてなブログ優秀ですね。

今回は本とかもちょくちょく紹介しながら内容薄〜く、ぬるぬる〜って進もうとか言うコンセプトで描いてるんですけど、もう挫折しかけてます笑。

薄い本とかにドンドン手が伸びていきます。読んでた本の貯金も既に底をつき始めた笑。不勉強が見え隠れしますね。

っつーか買いだめてたタラレバ娘。も読まないと。って感じです。

 

去年の後半は僕は狂ったようにパソコンを調べたり、機械学習についてのセットアップについて調べていました。

 

僕をよく知る人たちは「何でコイツいきなり生物なのにパソコンやり始めてるの?」って思ったと思います。

 

それは、生物の今の解析がビッグデータの処理になってる事に気がついたからです。

詳細については以下の様な本があります。大分テクニカルな内容が主な中身になっているしオススメ出来るとは言い難いけど。(時間がなくて全然手が回ってないし、理解もあまりできていないんですけど…笑)

 

生命情報処理における機械学習 多重検定と推定量設計 (機械学習プロフェッショナルシリーズ)

生命情報処理における機械学習 多重検定と推定量設計 (機械学習プロフェッショナルシリーズ)

 

ゲノムデータ解析 (統計学One Point 1)

ゲノムデータ解析 (統計学One Point 1)

 

この内容を読んでいけば分かるのですが、最近の生物は検定について色々議論する事に加え、「得られたデータをどう言う風に意味あるカタチに落とし込むか。」と言うことも重要になってきている様に感じます。

その為に、データ解析の手法である人工知能技術などが導入されたり(バイオインフォマティックスとか言う)、まとめ方も多種多様になってきていたりします。イメージとしては下記の様な感じ。(僕もよく読み方わかってるとは言い難い)

 

バイオリンプロット

f:id:kazubon35_2438168:20170215024808p:image

 

qqplot

 f:id:kazubon35_2438168:20170215024811p:image

 

クラスタリング

f:id:kazubon35_2438168:20170215024949j:image

 

こう言うのを見ると、データが読めないよ!解析どーなってんだよ!!って気持ちしか出てきません。

 

 その為に、作り方を学ばないと!って思って僕はパソコンとついに向き合わなくてはイケナクナッタって経緯ですね。

 

いやはや…世の中難しくなり過ぎています。

 

次はそんな動機でデータ処理についてネットサーフィンして、人工知能などの技術にズブズブ溺れていった話でもしようと思います。

 

詳細(適当に貼ってみたかっただけだからいい資料だと言う保証はない。qqplotだけは保証できる。)

バイオリンプロット

 

qqplot

 

クラスタリング

 

その他(こんな感じの処理もあるよーって紹介程度)

 

講義動画

1. Introduction to Computational and Systems Biology - YouTube