Trwają zapisy do grupy

Szkolenie: Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Szkolenie obejmujące podstawy projektowania i tworzenia platform Big Data przy pomocy narzędzi Apache (Kafka, Spark, NiFi, Druid, Airflow)

Trenerzy praktycy
Kameralne grupy

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:BIGDATA/APACHE

javascalabig-dataspark

Dostępne terminy szkolenia

Termin:

28 kwietnia

Trener:

Trener Sages

Cena:

2805 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

9 czerwca

Trener:

Trener Sages

Cena:

2805 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

13 października

Trener:

Trener Sages

Cena:

2805 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Zapytaj o szkolenie

Powiadom o kolejnych terminach

Interesuje Cię szkolenie w innym terminie?

Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Cele szkolenia

Praktyczna umiejętność projektowania platformy do przetwarzania dużej ilości danych
Zdobycie wiedzy na temat powszechnie używanych narzędzi typu open-source w Big Data

Dla kogo?

Programiści chcący poznać podstawy Big Data
Osoby które chciałby rozszerzyć swoją więdzę na temat narzędzi Big Data

Zalety

Warsztatowy charakter zajęć
Użycie wielu różnych narzędzi niezbędnych w codziennej pracy z Big Data
Ćwiczenia praktyczne odbywają się w środowisku chmury obliczeniowej (Google Cloud Platform)
Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest uzupełniana praktycznymi zadaniami
Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Wymagania

Praktyczna wiedza z programowania obiektowego w języku Java
Silnie rekomendowane jest posiadanie wiedzy i umiejętności z zagadnień ujętych w ramach szkolenia Big Data i platforma Hadoop - wprowadzenie

W cenie otrzymasz:

Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Wprowadzenie do świata Big Data

Przedstawienie domeny
Problemy Big Data - wydajność, skalowalność, dostępność
Przegląd typów przetwarzania Big Data
Omówienie narzędzi wykorzystywanych w ramach kursu

Programowanie w Scala

Zalety programowania funkcyjnego
Różnice w stosunku do języka Java
Elementy języka wykorzystywane w kontekście Big Data
Ćwiczenia praktyczne (case class, companion object, pattern matching, implicit)

Apache Spark

Architektura i konfiguracja
RDD vs Spark SQL
Transformacje i akcje
Tworzenie aplikacji w środowisku IDE
Uruchamianie zadań
Koncepcje partycjonowania i przesyłania (shuffling) danych
Catalyst i mechanizmy optymalizacji
Integracja z Apache Hadoop

Apache Spark Structured Streaming

Podstawy i zastosowanie Spark Structured Streaming
Model przetwarzania
Projektowanie aplikacji przetwarzającej strumienie danych
Znaczniki czasowe i operatory okna
Obsługa zdarzeń nieuporządkowanych

Apache NiFi

Automatyzacja pobierania danych z różnych źródeł
Architektura
Przykładowe zastosowania
Integracja danych między MySQL i GCS
Przykłady transformacji danych
Partycjonowanie danych przy zapisie

Apache Kafka

Architektura
Porównanie z podobnymi narzędziami
Pub/Sub vs Producer/Consumer
Tworzenie i konfiguracja producenta oraz konsumenta
Tematy i partycjonowanie
Konsumenci i grupy konsumentów
Replikacje i retencja
ZooKeeper

Apache Druid

Opis i architektura
Struktura danych
Zarządzanie komponentami
Indeksacja danych
Druid i platformy Big Data oparte na Apache Hadoop
Przetwarzanie real-time i batch

Apache Airflow

Automatyzacja przetwarzania
Tworzenie data pipeline
Python vs Bash
Definiowanie Acyklicznych Grafów Skierowanych Przetwarzania (DAG)
Architektura

Autorem szkolenia jest Krzysztof Jankiewicz

Konsultant IT i wykładowca akademicki. Specjalista w zakresie ogólnie rozumianego przetwarzania danych. Począwszy od relacyjnych systemów baz danych, poprzez architekturę, utrzymanie i wykorzystywanie hurtowni danych, bazy danych NoSQL, systemy danych przestrzennych, po narzędzia i platformy Big Data. Od samego początku pracy zawodowej stara się jako konsultant znajdować czas na kontakty przemysłem, gdzie swoją wiedzę może konfrontować i rozwijać w oparciu o rzeczywiste przypadki. Począwszy od…

Wybrane opinie

Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

4.8

20.03.2025

Nawiązywało do przypadków bliskich naszemu biznesowi

Uczestnik szkolenia “Projektowanie modeli domen z wykorzystaniem Domain-Driven Design i Event Storming”Wojciech Pyszko

Więcej opinii

Podobne szkolenia

Zaawansowane przetwarzanie strumieni danych w Apache Flink

Liczba dni: 3

2805 PLN

Szkolenie obejmuje praktyczne wykorzystanie platformy Apache Flink do zaawansowanego przetwarzania strumieni danych w środowiskach Big Data z wykorzystaniem języków Java, Scala i SQL, a także platformy Google Cloud Platform (GCP).

javabig-datagcpsql

Przetwarzanie strumieni danych w Apache Spark

Liczba dni: 1

1300 PLN

Szkolenie "Przetwarzanie strumieni danych w Apache Spark" pozwala nie tylko poznać mechanizmy przetwarzania strumieni danych w Apache Spark, ale także usystematyzować i uporządkować wiedzę na temat przetwarzania strumieni oraz szczegółowo przyjrzeć się możliwościom i ograniczeniom, z jakimi mamy do czynienia w ramach tej platformy.

pythonscalaspark

Apache Spark z wykorzystaniem języka Python

Liczba dni: 2

2365 PLN

Praktyczne przetwarzanie Big Data przy pomocy Apache Spark w języku Python

mlibsparkspark-sql

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

Data Science i Big Data w zarządzaniu

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia

Referencje

Opinie ze szkoleń

Zespół

Kariera

Wszystkie wpisy

Case studies

Aktualności

Artykuły

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

Data Science i Big Data w zarządzaniu

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia

Referencje

Opinie ze szkoleń

Zespół

Kariera