At a glance
スケジュールと申し込み ビッグデータ研修コーススケジュール
コースお申込フォーム
コースコード H7G34S
日数(開始時間〜終了時間) 4日間(9:30〜17:30)
会場
受講料 ¥328,000(税抜)

コースの概要

Cloudera University の 4 日間のデータアナリストトレーニングコースでは、Apache Pig, Apache Hive, Apache Impala (incubating)に焦点を当て、従来のデータ分析とビジネスインテリジェンスのスキルをビッグデータに適用する方法について学習します。

  • Pig、Hive、Impala を使用したデータの取得、保存、分析
  • Hadoop のツールを使った基本的な ETL(抽出、変換、およびロード)処理の実行
  • 典型的な分析処理の生産性を向上させるための Pig、Hive、Impala の活用
  • 価値あるビジネスの洞察を得るために多様なデータセットを結合
  • データセットに対する複雑なリアルタイムクエリの実行

主な対象者

  • SQL や慣れ親しみのあるスクリプト言語を使用して、Hadoop 上にある大規模かつ複雑なデータを管理、操作、クエリしたい方

前提条件

このコースは、SQL と基本的な UNIX または Linux のコマンドの使用経験がある、データアナリスト、ビジネスインテリジェンスのスペシャリスト、開発者、システムアーキテクト、データベース管理者向けに設計されています。 SQL の知識と基本的な Linux コマンドラインに慣れていることが前提条件となります。1 つ以上のスクリプト言語(Bash スクリプト、Perl、Python、Ruby など)の知識があれば役立ちますが、必須ではありません。Apache Hadoop に関する予備知識も必要ではありません。

コース内容

(時間配分は変更になる場合があります)
−−−1 日目AM−−−
1. はじめに
2. Hadoop の基本
3. Pig 入門
4. Pig による基本的なデータ解析
−−−1 日目PM−−−
5. Pig で複雑なデータを処理する
6. Pig による複数データセットの操作
−−−2 日目AM−−−
7. Pig のトラブルシューティグと最適化
8. Apache Hive と Impala の紹介
9. Apache Hive と Impala でクエリする
−−−2 日目PM−−−
10. Apache Hive と Impala のデータ管理
11. データストレージとパフォーマンス
−−−3 日目AM−−−
12. Apache Hive と Impala によるリレーショナルデータの分析
13. Apache Hive と Impala による複雑なデータ
−−−3 日目PM−−−
14. Apache Hive と Impala によるテキストの分析
15. Apache Hive の最適化
−−−4 日目AM−−−
16. Apache Impala の最適化
17. Apache Hive と Impala を拡張する
18. ジョブに最適なツールを選択する
19. まとめ

※本コースはCloudera社主催コースです。