OSC2015
2016-11-06 (日)   14時00分

分散処理技術のスタンダードHadoopやSparkの本当のところを教えます!

このエントリーをはてなブックマークに追加

講師:ラナヴィーラ ラヴィンドラ(株式会社NTTデータ)
担当:株式会社NTTデータ
レベル:入門編
対象者:ビッグデータの活用を考えている人。既存処理を分散処理によって改善したい人。
前提知識:前提知識は不要ですが、少々でもHadoopやSparkに触れたことがありますとと良いかもしれません。

Apache Hadoopが登場して10年が経ち、今や分散処理技術として重要なものになりました。
Hadoopによって大量データの蓄積や分散処理による高速化の恩恵を受けてきました。
そして、単純なログ集計から分析・機械学習といったより高度な活用を推進しています。
高度な利用ではApache Sparkが欠かせない技術です。Sparkを利用することで、分析や機械学習を
容易に扱えるようになり、これまで結果を得るために必要だった時間を大幅に削減することができるようになりました。
本セッションでは、HadoopやSparkを利用する上での基礎的な仕組み、抑えておくべきポイントといった本当のところを
お伝えします!

【カテゴリ】分散処理/データベース/クラウド


www.ospn.jp