2014-10-12から1日間の記事一覧
やりたい。 設計としては TwitterからStreamingAPIでかたっぱしからデータを抜き出し - CSV - Fluend/Flume - HBase の3アプローチのいずれかでデータを保存。 CSV/Fluend/FulmeのデータはHDFS->Hiveに格納。 HiveのデータはHiveかImpalaで解析。 とりあえ…
やりたい。 設計としては TwitterからStreamingAPIでかたっぱしからデータを抜き出し - CSV - Fluend/Flume - HBase の3アプローチのいずれかでデータを保存。 CSV/Fluend/FulmeのデータはHDFS->Hiveに格納。 HiveのデータはHiveかImpalaで解析。 とりあえ…