Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースソフトウェアです。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHiveなど多彩な環境を備えています。また、行指向DBのHBaseやログコレクタのFluentdの基盤としても利用できるなど、Hadoopには高い汎用性があります。第2版である本書では、実システムで多く利用されているCloudera社のCDH4ディストリビューションを軸に、システムの拡張や監視、メンテナンス方法など、より現場での利用を意識した最新のノウハウをまとめました。Hadoopを導入してその効果を得るためのいろいろな情報をまとめた一冊です。
第1部Hadoopの基礎(Hadoopの基礎知識;MapReduceアプリケーションの活用例ほか);
第2部MapReduceアプリケーション開発(MapReduceプログラミングの基礎―Javaによる開発(1);MapReduceプログラミングの応用―Javaによる開発(2)ほか);
第3部Hadoopクラスタの構築と運用(環境構築の効率化;可用性の向上ほか);
第4部Hadoopを活用するための技術(Hadoopチューニング;分散型データベースHBaseほか)