データの境界

なんちゃって理系がデータ分析業界に入ってからの汗と涙の記録。

機械学習

メルカリに学ぶ深層学習基盤

tensorflow(keras)やchainerのおかげで深層学習モデルを実装できる人は増えてきたわけですが、そのモデルをシステムとして安定運用する基盤(機械学習基盤)は、作り方や運用の仕方を含めてまだ世の中的にもベストプラクティスを模索中のようです。 ちなみ…

噂の「TensorFlowでキュウリの仕分けを行うマシン」がMFT2016に展示されていたので実物を見てきた

個人的には最近聞いた話の中でひさびさにワクワクした話。 「医療」「教育」「農業」のようなIT未開の分野に黙々と取り組んでいる人達はヒーローに見える Google Cloud Platform Japan 公式ブログ: キュウリ農家とディープラーニングをつなぐ TensorFlow 約…

「k-meansの最適なクラスター数を調べる方法」を書きました

会社の勉強会ネタとして以下の記事を書きました qiita.com この記事を書くきっかけになったのは以下の記事です mercan.mercari.com この記事では、デモグラ情報を持っていないユーザーを対象に、各ユーザの時間帯別のアクセス量を元にユーザをクラスタリング…

独学で機械学習を勉強したい人のための勉強本決定版か?「Python機械学習プログラミング」が良い感じ

4月から予約開始してようやく先日届いたpythonの機械学習本 Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear) 作者: Sebastian Raschka,株式会社クイープ,福島真太朗 出版社/メーカー: インプレス 発売日: 2016…

今をときめくPythonの深層学習ライブラリー Kerasの日本語ドキュメントが公開

Kerasのドキュメンテーションの日本語訳は完成されました。https://t.co/u0tOJwyjRq 協力した皆さん、どうもありがとうございます! — François Chollet (@fchollet) 2016年6月12日 Kerasの作者 @fchollet 氏(Deep learning at Google)は日本への留学経験…

機械学習用の学習データをイチから自力で作るには愛がないと無理だと悟った

いつも面白いネタを書かれるすぎゃーん氏の機械学習ネタスライド コードや説明など細かく書いて公開されているのですごく勉強になる speakerdeck.com 上記のスライドのテキスト内容(ブログ記事)がこの辺になるらしい 機械学習の結果の精度はツール自体(ア…

SVMとRandomForestのお勉強

分析でSVMとRandomForestを使いたかったので尾崎先生の著書を写経。 そういえば、分析はいつもJupyter notebook上で行ってるんですが、そのコードを共有するのが如何せん面倒だった。 ipynbファイルを渡しても展開できない人がいるし、その都度 ipynbからhtm…

Webサービスにも存在する「不気味の谷」

この前、会社の研究開発部の方がおもしろい話をしていたので紹介したい。 ネタとしてはフレッシュではないが、Goolgeが提供するGmailにおいて、ディープラーニングによる"返信分のサジェスト"をサービスに加えようとしている話。詳細やサービスのイメージな…

Pythonの機械学習ライブラリ"scikit-learn"のお勉強

仕事でpythonの機械学習ライブラリ scikit-learnを使いたいのでその勉強をしていた土日でした scikit-learn: machine learning in Python — scikit-learn 0.17 documentation pythonも初心者レベルを抜け出せないし、機械学習のアルゴリズムはもっと謎なので…

機械学習でモノクロ動画をカラー動画に自動変換

Webでバズってる記事ですね。どうでもいんですが、「畳み込み」って響きがなんだか好きだなっていつも思います naotokui.net 自分もNHKの「戦時下の白黒フィルムをカラーにする」という番組を見てかなり衝撃的だったのを覚えています。一つには、かなり鮮や…