データの境界

なんちゃって理系がデータ分析業界に入ってからの汗と涙の記録。

「ビッグデータ」で「ほぼ100%予想」と言われると普通は懐疑的になるよね

京都大学がなんだか凄いタイトルのプレスリリースを出してた

京都大学 ニュースリリース

しかし現在は上記ページで記事が閲覧できなので以下に転載された内容のページを貼っておく。

japan.zdnet.com

 京都大学の江谷典子医学研究科特定研究員は22日、薬剤やその副作用、疾患の原因のとなる遺伝子などのビッグデータを解析することで、副作用をほぼ確実に予測できるとの研究成果を発表した。 

(略)さらに、これを元にした統計や機械学習を用いたシステムを開発し、副作用の種類や発症率を予測したところ、ほぼ100%予測できたという。 

また、既存の薬剤の中で、元々のターゲット以外の疾患に効果を発揮する可能性があるものについての予測も行ない、今まで治療薬が公開されていない疾患に対して300件以上の候補を発見した。

「ほぼ100%」と書いちゃってるところにツイッターなどでは科学者の人たちからネガティブなコメントがでている。サイエンスの世界で「100%」とかいっちゃうとツッコまざるをえない。

そんなアクセス増の影響かオフィシャルのニュースリリースは現在アクセスしても記事が見れない状態になっている

 

このリリースを出している研究者とは別の方だが、京都大学にはKEGGという世界中で使われるバイオインフォマティクスデータベースが存在する。そういった周辺背景も有り、「京都大学のデータベース」と聞くと信用したい気も生まれるが実際はどうなのでしょう。

論文がみれないのでどんな内容なのか気になる気になる...