データの境界

なんちゃって理系がデータ分析業界に入ってからの汗と涙の記録。

大河ドラマでコンテンツ分析

コンテンツ分析の凄さと大変さ

Netflixが行っているようなコンテンツ分析に興味があります。

Netflixはすべての映画に、真似できないほどの詳細なタグ情報をすべての映画に対して均一に付与することで、「なぜその映画が良く見られたか/見られなかったか」を分析しています。

今となっては、逆に、特定のタグが付くことで「どれくらい視聴率upが見込めるか」を算出できるまでになっているそうです。 つまり、「監督」と「主演」、「映画ジャンル」などが決まった段階でおおよその視聴率とそれによって獲得できるNetflix新規契約者数なども予想できているらしい

日本ではあまりそういった話は聞きません。 というより、「均一に番組にタグを振る」ことがあまりにも大変すぎて、面倒なんだとおもいます。

ただ、正確にその映画のコンテンツ分析を行うなら今となっては必須の作業ですね。人工知能などによって機械的にタグを正確に付けれたらハッピーなのですが。

大河ドラマ」でやってる人がいた...

そんなことを思っていると、なんと個人的にNHKの「大河ドラマ」にタグを振り、視聴率予測をされている猛者を見つけました。

ameblo.jp

まだコードなど詳細に見れてませんが、実際によい視聴率のモデルができているそうです。

また、この方の過去のエントリーでは、『「花燃ゆ」が最低視聴率更新するかも』という予測もたてて、実際に2015年終わりでかなり際どい数字をだしちゃったそうですね

ameblo.jp

www.asahi.com

このブログエントリーのSNSリンクを見る限りあまりバズってはないみたいですが、けっこう凄いことをされていると思います。

大河ドラマはだんだん視聴率は下がってますが、コンテンツ的には安定してそうなので、だいたい平均視聴率11~16%当たりをうろうろするのだろうなーという印象です。

Audience Rating TV > 視聴率 > NHK大河ドラマ

こうしてみると宮崎あおいの「篤姫」はすごかったんですねー