AKB428は荒野を目指す

秋葉原で働くエンジニアなブログ

2015-01-01から1年間の記事一覧

「ご注文は何のアニメですか?」というアニメ推薦サービスをリリースしました

http://tv-anime.biz/ Twitterでツイートのデータを三ヶ月ぐらい貯めて、それをBigQueryで加工。 加工するフォーマットは協調フィルタリングにかけられるように TwitterID,アニメ作品,Rate のCSVにする。 協調フィルタリング(SparkMLlib)はUserIDとProductID…

ついにニコニコのコメントを取得するプログラムを書いてみた(2015 現代版)

ニコニコのAPIは正式には公開されておらず、ユーザーが解析している情報を集めて使うしかないのだけれど、あまりその考え方は好きじゃない(公式がAPIを閉鎖するのは簡単にできるので)のだが、ビッグデータのソースがTwitterだけだと足りなくなってきたので…

【機械学習】マイクロソフトのクラウドAI Project Oxfordで秋葉原歩行者天国の性別と年齢の分布をとってみた

マイクロソフトのクラウドAI・・Azure MLのグループに位置するProject Oxford https://www.projectoxford.ai/ 画像認識や音声認識のサービスを提供してますが、メインで取り上げられるのは人物の年齢判定と性別判定になります。 APIでも利用可能なのでRestAP…

TwitterのTV実況の盛り上がりを監視するため、マイクロつぶやきビッグデータ(関東テレビ局版)を作ってみた

http://telev.net/5/ http://telev.net/60/ こんなの。 関東(というか東京)地上波のTV局Twitterハッシュタグを監視 やはりアニメの実況が露骨に多いw しかし、未だにutaware(うたわれるもの),ガルパン(garupan)が人気な今クールのアニメっていったい・・…

Twitterのつぶやきビッグデータから見るコミックマーケットの時系列(C88 3日目)

http://i.imgur.com/pwXwN8O.png C88 3日目 コスプレが強いのは相変わらず。 TOPスコアの1位2位を「コミケ」「コスプレ」で争っています。 C88 3日目は Twitterの盛り上がりから見ると 「小林幸子」「バイオハザード」「ゆりかもめ全線停止」 に集約され…

Twitterのつぶやきビッグデータから見るコミックマーケットの時系列(C88 2日目)

http://i.imgur.com/VhR8rJV.png Twitterの呟きから見るコミケ88のイベント時系列 1日目の昼以降、コスプレのワードが爆発した後は、コスプレ関連のワード「紫色のセル」が多く呟かれてるのがわかります。 2日目で目立ったのは 「ジェイソン」「警察」 …

Twitterのつぶやきビッグデータから見るコミックマーケットの時系列(C88 1日目)

コミケ期間中の8/14-8/16にツイッターのストリームからコミケに関するツイートをクローリングしていました。 データを日本語単語に分解、カウントし時系列順に並べ、その時間帯に多く呟かれている単語を1位〜10位までを表にしてみました。 http://i.imgur.co…

RMagickでラブライブの映画フィルムっぽく画像を加工するサービス作ってみた

Ruby + RMagick(Image Magick) + Sinatra + Unicorn + Nginx で。 Movie Film Creater 以外と画像処理コードは少なくすんだ。 アップロードされた画像を縮小して、透過して4コマに貼り付けて終了。 コード全体はこちら Project-Nightingale/nozomi · GitHub …

世界最強のエロゲサイト、Getchu.comをNokogiriでスクレイピングする方法

私が、最も利用し世界で一番優れていると思うサイトはもちろんAmazon様なのですが、では「二番目に尊敬するサイトは?」と言われると間違いなく「getchu.com」を上げると思います。http://www.getchu.com/top.html エロゲを全く知らない人にわかりやすく説明…

MySQLのダンプをOpenStackオブジェクトストレージに転送するスクリプト書きました

AKB428/chino_util_mysqlbackup AKB428/chino_util_mysqlbackup · GitHub 半年ぐらいためてたMySQLがクラッシュしてデータが消えて泣いたので 泣きながらスクリプト作った。