Logo Obozu Naukowego

Data Science

Prowadzący

Czas Trwania Warsztatów

20 godzin - 25 jednostek lekcyjnych w ciągu 5 dni zajęć

Data Science

Praktyczna wizualizacja danych

Na każdym kroku życia otaczają nas dane. Liczba spalonych kalorii, oddechów na minutę, tętno, liczba znajomych na Facebooku, przeglądane przez nas strony w Internecie. Jednak same dane dużo nam nie dają. Musimy umieć wyciągnąć z nich jakieś wnioski oraz wizualizować nasze konkluzje, tak, aby każdy je rozumiał. Jak ma się tętno do kroków? Czy kolor włosów ma wpływ na przewidywaną długość trasy do pracy i jeśli tak, to jaki? Właśnie na takie pytania odpowiada na co dzień Data Scientist, a jego pracę ma na celu przybliżyć ten warsztat. 

Do kogo kierowany jest ten warsztat?

Warsztat skierowany do licealistów chcących rozpocząć przygodę z Data Science. Umiejętność wizualizacji danych to podstawa pracy w branży analizy danych. Jedno to stworzyć model matematyczny, który rozumieją ludzie związani z programowaniem, a drugie to przedstawić dane w taki sposób, aby rozumiała je osoba zupełnie niezwiązana ze światem informatyki.

Do uczestnictwa w warsztatach nie jest wymagana wiedza programistyczna, choć podstawowa znajomość jakiegoś języka programowania (np. C++ lub Python) lub elementarna wiedza o bazach danych na pewno przyspieszą zapoznanie się z niektórymi aspektami warsztatu (ale umiejętności te nie są konieczne). Wskazana jest jednak umiejętność posługiwania się komputerem (nawigacja w Eksploratorze plików itp.), zdolność logicznego myślenia oraz chęć do nauki.

Niezbędny sprzęt i oprogramowanie

Do uczestnictwa w warsztatach wymagany jest własny laptop o minimalnych parametrach:

  • System Windows 11, 10, 8, 7 (SP1, 64 bitowy), Linux (64 bitowy) lub MacOS
  • 4 GB RAM
  • 15 GB wolnego miejsca na dysku (na środowisko programistyczne oraz program do obróbki grafiki wektorowej)
  • Uprawnienia administratora (do instalowania wymaganych na zajęciach pakietów)

Wymagane programy (wszystkie są darmowe):

1. RStudio: https://www.rstudio.com/products/rstudio/download/#download  (jak ktoś preferuje inne środowisko do pracy w R, to można korzystać z dowolnego, ale prowadzący zna najlepiej RStudio)

2. R: https://cran.r-project.org/bin/  

3. Inkscape: https://inkscape.org/release/inkscape-1.1.1/  

Dlaczego warto wziąć udział w tym warsztacie?

Uczestnicy warsztatu:

  • poznają język R,
  • nauczą się pozyskiwać dane na interesujący ich temat,
  • poznają narzędzia wykorzystywane przy pracy programisty Data Science,
  • przeprowadzą eksploracyjną analizę danych,
  • nauczą się robić poprawne oraz czytelne wykresy,
  • nauczą się pracować z grafiką wektorową,
  • zrobią swoją pierwszą infografikę,
  • rozwiną umiejętność rozwiązywania problemów oraz prezentowania danych.

Program warsztatu

Dzień pierwszy

Zdobywanie danych, typy zmiennych, wstęp do R

Pierwszego dnia warsztatów uczestnicy poznają sposoby pozyskiwania interesujących ich danych. Poznają różnice między rożnymi typami danych (ilościowe, jakościowe oraz ich podtypy). Zapoznają się również z podstawami języka R oraz środowiska programistycznego RStudio. 

Dzień drugi

Eksploracyjna analiza danych

Tego dnia warsztaty rozpoczniemy pracą z pakietem dplyr – nauczymy się jak z ogromnego zbioru danych wyciągać interesujące nas informacje. Oprócz tego uczestnicy przeprowadzą swoją pierwszą analizę eksploracyjną danych – dowiedzą się, jak wykrywać zależności między zmiennymi, jak wykrywać anomalnie w danych oraz jak podsumować zbiór danych.

Dzień trzeci

Wykresy, grafika wektorowa 

Pierwszy dzień pracy z wykresami. Uczestnicy poznają najważniejsze typy wykresów, błędy przy ich tworzeniu (oraz jak ich unikać) oraz dowiedzą się, jak stworzyć zrozumiały wykres w zależności od posiadanych danych. Tego dnia rozpoczniemy również pracę z grafiką wektorową – upiększymy nasze wykresy. 

Dzień czwarty

Rozpoczęcie pracy nad infografiką  

Czwartego dnia rozpoczniemy projekty – celem będzie stworzenie infografiki na wybrany przez grupę temat (grupy 2-4 osobowe) wykorzystując umiejętności nabyte przez pierwsze 3 dni warsztatu (tematyka dowolna, np. seriale, superbohaterowie, środowisko). W tym celu po wybraniu tematu uczestnicy zbiorą dane, przeanalizują je, zrobią wykresy oraz umieszczą je na plakacie (na komputerze w programie graficznym, nie papierze 😉). 

Dzień piąty

Finalizacja projektów 

Ostatniego dnia warsztatu sfinalizujemy infografiki – doszlifujemy je od strony graficznej oraz technicznej. Na koniec grupy zaprezentują efekt ich pracy. 


Perfekcję osiąga się nie wtedy, kiedy nie można już nic dodać, ale wtedy, kiedy nie można już nic ująć.

Antoine de Saint-Exupry