データの境界

なんちゃって理系がデータ分析業界に入ってからの汗と涙の記録。

2016-04-01から1ヶ月間の記事一覧

英ガーディアン社のデータジャーナリズム分析の解説

前回のパナマ文書の記事に引き続き非常にハイクオリティーな文章を書かれる@c_zさんの記事。今回はデータジャーナリズム的なお話。長いけど読み応えある記事なのでオススメ。 medium.com こちらが翻訳元の記事。D3.jsで描写されているだけあって、ヌルヌル動…

データ解析コンペのお話が会社のブログにも載りました

blog.brainpad.co.jp 2016年2月にデータ解析コンペに参加した時の記事を書いたのですが、会社のオフィシャルブログでも公開されたので記念にペタリ。記事を書かれた方は私とは別人ですよと。 kskbyt.hatenablog.jp 会社名が出ちゃってて書くのも微妙なのです…

熊本震災周りに見る技術の話いろいろ

2016年4月14日午後9時26分頃、九州地方を震源とするマグニチュード6.4の地震が起こりました。熊本県益城(ましき)町では震度7が観測されました。ちなみに「震度7」は気象庁震度階級で定義される最大震度らしいです。 地震発生直後からすぐにTwitterでも地震…

AbemaTVから考える、動画コンテンツの最適な配信方法

現在はメディア系の分析のお仕事やってるので関心度高いっす。テンション上がったー toyokeizai.net 約三行要約 Amebaとテレ朝(業界2位)がスマホアプリ向けの動画アプリ"AbemaTV"を公開 動画の間にCMが入るのでユーザーは無料で利用できる テレビ離れの20…

cytoscapeの中の人によるパナマ文書グラフ化プロセスの解説

良記事。勉強になった。 medium.com 約三行要約 データベースの構築はもとより、画像データのテキスト化、お金の流れを追える専門家が泥臭く作業して頑張った。こういった作業に「人工知能で自動化してウンヌン」という世界はまだまだ先の話。 Linkuriousと…

パナマ文書の取引や株主の情報がグラフ構造として公開されてるらしい

マジか。 https://linkurious.icij.org/widget/45747ce9 その前にそもそも「パナマ文書」ってなんだよって人はコチラのページ参照 blog.livedoor.jp このデータは「Panama Papers Dataset 2016」というタイトルで、githubにて公開されている github.com こち…

SVMとRandomForestのお勉強

分析でSVMとRandomForestを使いたかったので尾崎先生の著書を写経。 そういえば、分析はいつもJupyter notebook上で行ってるんですが、そのコードを共有するのが如何せん面倒だった。 ipynbファイルを渡しても展開できない人がいるし、その都度 ipynbからhtm…