AKB428は荒野を目指す

秋葉原で働くエンジニアなブログ

「この素晴らしき世界に祝福を!」のニコニコ実況コメント数をBigQueryで解析

今クール最強の面白さを誇るアニメ、「この素晴らしき世界に祝福を!」(このすば)の、ニコニコ実況のコメント数を解析してみました。

ニコニコ実況はTV放送にコメントを付ける機能で、各種WindowsアプリやPS3/PS4のトルネからコメントを見ることができます。

今回対象の「このすば」は東京MX AM01:05〜01:35放映分とします。

 

まず各話のコメント合計数はこちら。

f:id:rakuda00:20160212035214p:plain

 

1話 8042コメから5話9303コメと確実にコメント数を伸ばしています。

 

ニコニコ実況のコメントは以下のソフトで取得しています

GitHub - AKB428/niconico_get_comment_sample: niconico_get_comment_sample

 

TSVをGoogleBigQueryに読み込ませることで、SQLで各話のコメント数や、分単位でのコメント数合計などが解り、シーン毎の勢いの解析ができるため、どの場面が人気があったのかがすぐわかるようになります。

 

テーブルのカラム形式は以下の画像のようになっています。

f:id:rakuda00:20160212035901p:plain

thread: STRING,no: INTEGER,vpos: INTEGER,date: INTEGER,mail: STRING,user_id: STRING,premium: STRING,anonymity: STRING,leaf: STRING,fork: STRING,deleted: STRING,content: STRING

 

でいったん全部STRINGで定義した後

 

    
SELECT
INTEGER(thread) as thread,
INTEGER(no) as no,
INTEGER(vpos) as vpos,
INTEGER(date) as date,
mail,
user_id,
content
FROM [niconico_comment.jk8_9_bs211]




こんな感じでカラム形式を変換した結果テーブルを保存して解析します。

各話の分単位のコメント数を出すにはこのようなSQLを実行します。

BigQuery_minute_interval_SQL

 

 

上記のSQLから出した各話のニコニコ実況コメントの推移はこちら

f:id:rakuda00:20160212041005p:plain

f:id:rakuda00:20160212041019p:plain

f:id:rakuda00:20160212041033p:plain

 

f:id:rakuda00:20160212041046p:plain

f:id:rakuda00:20160212041105p:plain

 

グラフ化すると、どの箇所が盛り上がったのかが一目瞭然なので素敵です。

BigQueryはブラウザでSQLをどんどんトライアンドエラーで試せるのでMySQLをローカルに入れてガチャガチャやる必要もありません。

これからはデータをgsutilでファイルをGoogleCloudStorageに上げてBigQueryで解析するだけの時代になりそうです。

できればTableauみたいなグラフ化機能まであれば最高なので是非Googleには頑張ってもらいたい。