2016-01-29 (金) 15時10分
Apache Hadoopによる並列分散処理入門
講師:佐々木 徹
担当:株式会社NTTデータ
レベル:入門編
対象者:DBMSでは扱いきれない大量・多件数データに対してバッチ・リアルタイム問わず処理を実現したい方
前提知識:特になし(DBMSやHadoopでの処理、データ分析について経験・理解があるとなお良いです)
大量データに対する処理基盤として、Apache Hadoopが登場して10年になります。
この10年の間にHadoopは多くのシステムで利用されるようになり、それに伴い新たな
機能の追加等も順次行われてきました。
本セッションではHadoopの基本知識のほか、Hadoop上で動かすアプリケーションの1つ
であるMapReduceと最新のApache Sparkの概要をお話しします。
【カテゴリ】データベース/クラウド/Linux