Apache Spark入門
Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。 Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。 本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。 話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。
ジャンル
電子
通信
分類専門
判型B5
ページ数308
著者名NTTデ-タ 猿田浩輔 土橋昌
初版年月2015/10
内容量1冊
通信
書籍 の新着商品
カテゴリ
商品レビュー
よくあるご質問(FAQ)
- 質問:
- 製品の安全データシート(SDS)や有害物質使用制限に関するデータ(RoHS)等の書面が必要ですがどうすれば良いですか。
- 回答:
- お手数ですが下記URLのお問合せフォームよりご依頼ください。
お問合せ種類 *必須の中から必要な書類をお選びご依頼ください。
https://help.monotaro.com/app/ask
書類名)
1:SDS(MSDS)
2:RoHS(2)
3:非該当証明書
4:ChemSHERPA
5:その他(ミルシート・出荷証明書)
2022-04-07