Trwają zapisy do grupy

Analiza danych tekstowych i języka naturalnego

Podczas szkolenia uczestnicy dowiedzą się jak pozyskiwać i przetwarzać informacje z danych tekstowych, wykorzystując do tego programowanie w języku Python. Dodatkowo poznają również zagadnienia związane z Large Language Models (LLM).

3350 PLN+23% VAT (4120 PLN brutto / 1 os.)

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:ANA/TXT

text-mininginformation-retrievalmachine-learning

Dostępne terminy

  • Termin
  • Trener
  • Cena
  • Zapis
  • Lokalizacja

Termin:

7 października
Trwają zapisy na szkolenie

Trener:

Patryk Palej

Cena:

3350 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Termin:

9 grudnia
Trwają zapisy na szkolenie

Trener:

Patryk Palej

Cena:

3350 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Dostępne terminy

Interesują Cię inne terminy?

Analiza danych tekstowych i języka naturalnego

Cele szkolenia

  • Zdobycie praktycznych umiejętności i wiedzy pozwalających na wykonywanie analiz języka naturalnego z wykorzystaniem języka Python
  • Zapoznanie z problemami przetwarzania, czyszczenia oraz eksploracji danych tekstowych, a także z wykorzystaniem przygotowanych danych między innymi do budowania modeli uczenia maszynowego
  • Wprowadzenie do Large Language Models (LLM)

Dla kogo?

  • Programiści, pragnący zastosować w swoich systemach metody odkrywania wiedzy z danych tekstowych
  • Analitycy, którzy chcą rozbudować swój warsztat analityczny o narzędzie analizy danych tekstowych
  • Osoby zainteresowane zastosowaniem narzędzi statystycznych, metod uczenia maszynowego w pracy z danymi tekstowymi

Zalety

  • Obszerne wprowadzenie do świata analizy danych tekstowych
  • Wykorzystanie modeli LLM od OpenAI
  • Przegląd zarówno klasycznych jak i współczesnych podejść do analizy tekstu

Wymagania

  • Podstawowa znajomość języka Python

W cenie otrzymasz:

  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia
  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Program

Pobierz program w PDF

Regex

  • Czym są wyrażenia regularne?
  • Patterny
  • Znaki specjalne
  • Funkcje biblioteki re

Pozyskiwanie tekstu

  • API
  • Web scraping

Preprocessing tekstu

  • Tokenizacja
  • Eliminacja interpunkcji i znaków specjalnych
  • Usuwanie stopwords
  • Stemming i lematyzacja
  • Wykrywanie i usuwanie danych osobowych

Wizualizacja danych tekstowych

  • Word cloud
  • Wykres częstości słów
  • Wykres długości zdań

Wektoryzacja i embeddingi

  • Document-term matrix
  • TF-IDF
  • word2vec
  • fasttext
  • doc2vec

Miary podobieństwa tekstu

  • Odległość Hamminga
  • Odległość Levenshteina
  • Odległość Cosinusowa

Uczenie maszynowe w analizie języka naturalnego

  • Klasyfikacja dokumentów
  • Analiza sentymentu
  • Klasteryzacja dokumentów

Rozpoznawanie nazw własnych

Large Language Models

  • Wprowadzenie do LLM na przykładzie modelu GPT
  • OpenAI API
  • Zamiana tekstu na obraz i audio
  • LangChain

Autorem szkolenia jest Patryk Palej

Od 2018 roku zajmuje się analizą danych, uczeniem maszynowym oraz programowaniem w Pythonie. W międzyczasie ukończył studia na kierunku Energetyka w trakcie których zajmował się matematycznym modelowaniem procesów transportu ciepła i masy. Szybko jednak przebranżowił się do IT i jako data scientist pracował przy projektach dla takich sektorów jak finanse, telekomunikacja czy media. Poza tym prowadzi szkolenia, warsztaty oraz zajęcia na bootcampie z zagadnień na pograniczu Pythona i data science.…