Szkolenie: Big Data i platforma Hadoop - wprowadzenie
Szkolenie skupia się na platformie Hadoop, jej podstawowych komponentach oraz najważniejszych narzędziach
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:BIGDATA/BASE
Big Data i platforma Hadoop - wprowadzenie
Cele szkolenia
Wprowadzenie do koncepcji Big Data
Zapoznanie z platformą Hadoop oraz dostępnymi narzędziami
Dla kogo?
Analitycy i programiści, którzy chcą rozpocząć przygodę z analizą dużych zbiorów danych
Zalety
Praktyczne wprowadzenie do tematyki Big Data
Warsztatowy charakter zajęć, umożliwiający przyswojenie wiedzy, niezbędnej do przeprowadzania analizy dużych ilości danych
Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how
Wymagania
Podstawy SQL oraz hurtowni danych
Podstawowa umiejętność programowania, najlepiej w: Java, Python
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Wprowadzenie do Big Data
Czym jest Big Data?
Typy przetwarzania w Big Data
Dystrybucje Big Data
Rozwiązania w chmurze
Apache Hadoop
Wprowadzenie do platformy Hadoop
MapReduce
HDFS
YARN
Apache Pig
Wprowadzenie
Architektura
PigLatin w szczegółach
Uruchamianie zadań
Różne źródła danych
Funkcje wbudowane
Biblioteki, makra
Funkcje użytkownika (UDF)
Warsztaty Pig
Apache Hive
Czym jest Hive
Model danych w Hive
Formaty przechowywania danych
HiveSQL
Uruchamianie zadań
Różne źródła danych
Korzystanie w konsoli
Interfejsy użytkownika
Funkcje wbudowane
Funkcje użytkownika (UDF)
Wykorzystanie Apache Tez i optymalizacja zadań
Warsztaty Hive
Wprowadzenie do baz danych NoSQL
Historia
Podstawowe cechy
Przyczyny sukcesu
Problem spójności
Przegląd modeli NoSQL
Powiązane technologie
HBase
Wprowadzenie
Case Study
Organizacja danych
Widoki danych: koncepcyjny i fizyczny
Architektura
Jak to wszystko działa?
Interfejsy
Warsztaty HBase
Warsztaty HBase z wykorzystaniem zewnętrznych narzędzi: Pig i Hive