Data Science
Prowadzący
Czas Trwania Warsztatów
20 godzin - 25 jednostek lekcyjnych w ciągu 5 dni zajęć

Data Science
Praktyczna wizualizacja danych
Na każdym kroku życia otaczają nas dane. Liczba spalonych kalorii, oddechów na minutę, tętno, liczba znajomych na Facebooku, przeglądane przez nas strony w Internecie. Jednak same dane dużo nam nie dają. Musimy umieć wyciągnąć z nich jakieś wnioski oraz wizualizować nasze konkluzje, tak, aby każdy je rozumiał. Jak ma się tętno do kroków? Czy kolor włosów ma wpływ na przewidywaną długość trasy do pracy i jeśli tak, to jaki? Właśnie na takie pytania odpowiada na co dzień Data Scientist, a jego pracę ma na celu przybliżyć ten warsztat.
Do kogo kierowany jest ten warsztat?
Warsztat skierowany do licealistów chcących rozpocząć przygodę z Data Science. Umiejętność wizualizacji danych to podstawa pracy w branży analizy danych. Jedno to stworzyć model matematyczny, który rozumieją ludzie związani z programowaniem, a drugie to przedstawić dane w taki sposób, aby rozumiała je osoba zupełnie niezwiązana ze światem informatyki.
Do uczestnictwa w warsztatach nie jest wymagana wiedza programistyczna, choć podstawowa znajomość jakiegoś języka programowania (np. C++ lub Python) lub elementarna wiedza o bazach danych na pewno przyspieszą zapoznanie się z niektórymi aspektami warsztatu (ale umiejętności te nie są konieczne). Wskazana jest jednak umiejętność posługiwania się komputerem (nawigacja w Eksploratorze plików itp.), zdolność logicznego myślenia oraz chęć do nauki.
Niezbędny sprzęt i oprogramowanie
Do uczestnictwa w warsztatach wymagany jest własny laptop o minimalnych parametrach:
- System Windows 11, 10, 8, 7 (SP1, 64 bitowy), Linux (64 bitowy) lub MacOS
- 4 GB RAM
- 15 GB wolnego miejsca na dysku (na środowisko programistyczne oraz program do obróbki grafiki wektorowej)
- Uprawnienia administratora (do instalowania wymaganych na zajęciach pakietów)
Wymagane programy (wszystkie są darmowe):
1. RStudio: https://www.rstudio.com/products/rstudio/download/#download (jak ktoś preferuje inne środowisko do pracy w R, to można korzystać z dowolnego, ale prowadzący zna najlepiej RStudio)
2. R: https://cran.r-project.org/bin/
3. Inkscape: https://inkscape.org/release/inkscape-1.1.1/
Dlaczego warto wziąć udział w tym warsztacie?
Uczestnicy warsztatu:
- poznają język R,
- nauczą się pozyskiwać dane na interesujący ich temat,
- poznają narzędzia wykorzystywane przy pracy programisty Data Science,
- przeprowadzą eksploracyjną analizę danych,
- nauczą się robić poprawne oraz czytelne wykresy,
- nauczą się pracować z grafiką wektorową,
- zrobią swoją pierwszą infografikę,
- rozwiną umiejętność rozwiązywania problemów oraz prezentowania danych.
Program warsztatu
Dzień pierwszy
Zdobywanie danych, typy zmiennych, wstęp do R
Pierwszego dnia warsztatów uczestnicy poznają sposoby pozyskiwania interesujących ich danych. Poznają różnice między rożnymi typami danych (ilościowe, jakościowe oraz ich podtypy). Zapoznają się również z podstawami języka R oraz środowiska programistycznego RStudio.
Dzień drugi
Eksploracyjna analiza danych
Tego dnia warsztaty rozpoczniemy pracą z pakietem dplyr – nauczymy się jak z ogromnego zbioru danych wyciągać interesujące nas informacje. Oprócz tego uczestnicy przeprowadzą swoją pierwszą analizę eksploracyjną danych – dowiedzą się, jak wykrywać zależności między zmiennymi, jak wykrywać anomalnie w danych oraz jak podsumować zbiór danych.
Dzień trzeci
Wykresy, grafika wektorowa
Pierwszy dzień pracy z wykresami. Uczestnicy poznają najważniejsze typy wykresów, błędy przy ich tworzeniu (oraz jak ich unikać) oraz dowiedzą się, jak stworzyć zrozumiały wykres w zależności od posiadanych danych. Tego dnia rozpoczniemy również pracę z grafiką wektorową – upiększymy nasze wykresy.
Dzień czwarty
Rozpoczęcie pracy nad infografiką
Czwartego dnia rozpoczniemy projekty – celem będzie stworzenie infografiki na wybrany przez grupę temat (grupy 2-4 osobowe) wykorzystując umiejętności nabyte przez pierwsze 3 dni warsztatu (tematyka dowolna, np. seriale, superbohaterowie, środowisko). W tym celu po wybraniu tematu uczestnicy zbiorą dane, przeanalizują je, zrobią wykresy oraz umieszczą je na plakacie (na komputerze w programie graficznym, nie papierze 😉).
Dzień piąty
Finalizacja projektów
Ostatniego dnia warsztatu sfinalizujemy infografiki – doszlifujemy je od strony graficznej oraz technicznej. Na koniec grupy zaprezentują efekt ich pracy.
Perfekcję osiąga się nie wtedy, kiedy nie można już nic dodać, ale wtedy, kiedy nie można już nic ująć.