2014-08-02 (土) 14時00分
NTTデータにおける Apache Spark への取り組み
講師:下垣 徹(基盤システム事業本部 システム方式技術事業部)
担当:株式会社NTTデータ
レベル:入門編
対象者:DBMSでは扱いきれない大量データに対してリアルタイムな処理の実現を検討している人。
前提知識:DBMSやHadoopでの処理について経験のある方。データの分析に関する知識のある方。
大量データに対する処理の基盤として Hadoop の導入が当たり前になってきた中で、
Hadoop では難しいリアルタイム(低レイテンシ)な処理を実現するための並列分散処理基盤として
Apache Spark が注目を集めています。本セッションでは Apache Spark の概要を説明し、Hadoop との
違いや Apache Spark の最近の動向および適用事例などについてお話します。
【カテゴリ】データベース/クラウド/並列分散処理