Trwają zapisy do grupy

Szkolenie: Analiza danych tekstowych i języka naturalnego

Podczas szkolenia uczestnicy dowiedzą się jak pozyskiwać i przetwarzać informacje z danych tekstowych, wykorzystując do tego programowanie w języku Python. Dodatkowo poznają również zagadnienia związane z Large Language Models (LLM).

  • Trenerzy praktycy
  • Kameralne grupy

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:ANA/TXT

text-mininginformation-retrievalmachine-learning

Dostępne terminy szkolenia

  • Termin
  • Trener
  • Cena
  • Zapis
  • Lokalizacja

Termin:

3 marca
Trwają zapisy na szkolenie

Trener:

Patryk Palej

Cena:

3685 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Termin:

30 czerwca
Trwają zapisy na szkolenie

Trener:

Trener-Sages

Cena:

3685 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Termin:

29 września
Trwają zapisy na szkolenie

Trener:

Trener-Sages

Cena:

3685 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Powiadom o kolejnych terminach

Interesuje Cię szkolenie w innym terminie?

Analiza danych tekstowych i języka naturalnego

Cele szkolenia

  • Zdobycie praktycznych umiejętności i wiedzy pozwalających na wykonywanie analiz języka naturalnego z wykorzystaniem języka Python

  • Zapoznanie z problemami przetwarzania, czyszczenia oraz eksploracji danych tekstowych, a także z wykorzystaniem przygotowanych danych między innymi do budowania modeli uczenia maszynowego

  • Wprowadzenie do Large Language Models (LLM)


Dla kogo?

  • Programiści, pragnący zastosować w swoich systemach metody odkrywania wiedzy z danych tekstowych

  • Analitycy, którzy chcą rozbudować swój warsztat analityczny o narzędzie analizy danych tekstowych

  • Osoby zainteresowane zastosowaniem narzędzi statystycznych, metod uczenia maszynowego w pracy z danymi tekstowymi


Zalety

  • Obszerne wprowadzenie do świata analizy danych tekstowych

  • Wykorzystanie modeli LLM od OpenAI

  • Przegląd zarówno klasycznych jak i współczesnych podejść do analizy tekstu


Wymagania

  • Podstawowa znajomość języka Python


W cenie otrzymasz:

  • Materiały szkoleniowe

  • Certyfikat ukończenia szkolenia

  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Program szkolenia

Pobierz program w PDF

Regex

  • Czym są wyrażenia regularne?

  • Patterny

  • Znaki specjalne

  • Funkcje biblioteki re

Pozyskiwanie tekstu

  • API

  • Web scraping

Preprocessing tekstu

  • Tokenizacja

  • Eliminacja interpunkcji i znaków specjalnych

  • Usuwanie stopwords

  • Stemming i lematyzacja

  • Wykrywanie i usuwanie danych osobowych

Wizualizacja danych tekstowych

  • Word cloud

  • Wykres częstości słów

  • Wykres długości zdań

Wektoryzacja i embeddingi

  • Document-term matrix

  • TF-IDF

  • word2vec

  • fasttext

  • doc2vec

Miary podobieństwa tekstu

  • Odległość Hamminga

  • Odległość Levenshteina

  • Odległość Cosinusowa

Uczenie maszynowe w analizie języka naturalnego

  • Klasyfikacja dokumentów

  • Analiza sentymentu

  • Klasteryzacja dokumentów

Rozpoznawanie nazw własnych

Large Language Models

  • Wprowadzenie do LLM na przykładzie modelu GPT

  • OpenAI API

  • Zamiana tekstu na obraz i audio

  • LangChain

Autorem szkolenia jest Patryk Palej

Od 2018 roku zajmuje się analizą danych, uczeniem maszynowym oraz programowaniem w Pythonie. W międzyczasie ukończył studia na kierunku Energetyka w trakcie których zajmował się matematycznym modelowaniem procesów transportu ciepła i masy. Szybko jednak przebranżowił się do IT i jako data scientist pracował przy projektach dla takich sektorów jak finanse, telekomunikacja czy media. Poza tym prowadzi szkolenia, warsztaty oraz zajęcia na bootcampie z zagadnień na pograniczu Pythona i data science.…