AKB428は荒野を目指す

秋葉原で働くエンジニアなブログ

2014-10-01から1ヶ月間の記事一覧

SSL 3.0 問題に関連してか imgur APIでエラーが出まくって涙目

rubyでimgurに定期的に画像をアップロードするボットを作っていたが SSL3 うんたらかんたらと英語でエラーが表示されて投稿できなくなった。 ワケガワカラナイヨ状態だったが 「とりあえず bundle updateしときゃいいだろ」 とbundle updateしてhttpclientモ…

まさか、TwitterのHadoop解析をファイヤーホース無しで? (3)

makiちゃんを使って実際にTwitter Streaming APIを利用してデータを取得してみる。 AKB428/maki AKB428/maki · GitHub とりあえずCSVにデータを保存するだけなので、sakuraサーバーのメモリ2GのVPSで動作させる。 フィルタへのキーワードは240程度(MAX40…

まさか、TwitterのHadoop解析をファイヤーホース無しで? (2)

とりあえず既存のTwitter画像収集ツールをコピーして、ブランチ切ってHBaseロジックを足したものを作成。 OSXにはHBaseはサクっとインストールできる。 hadoop - Mac OSXでHBaseを使う - Qiita hadoop - Mac OSXでHBaseを使う - Qiita AKB428/maki · GitHub …

TwitterのHadoop解析をファイヤーホース無しで? (1)

やりたい。 設計としては TwitterからStreamingAPIでかたっぱしからデータを抜き出し - CSV - Fluend/Flume - HBase の3アプローチのいずれかでデータを保存。 CSV/Fluend/FulmeのデータはHDFS->Hiveに格納。 HiveのデータはHiveかImpalaで解析。 とりあえ…