Adatelemzés Pythonban

Áttekintés
A kétszer félnapos workshop  során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési könyvtárának, a pandas-nak segítségével fogjuk feldolgozni és transzformálni a beolvasott adatokat.

Az adatok elemzése során sok esetben találkozunk olyan feladatokkal, amelyek sok kézi munkát igényelnek, gyakran ismétlődnek, vagy éppen nehezen oldhatóak meg a szokásos eszközökkel. Tanfolyamunk bemutatja, hogy lehet ezeket az adatelemzési feladatokat egyszerű, Pythonban írt miniprogramok segítségével hatékonyan elvégezni.

A Python méltán az egyik legnépszerűbb eszköz az adatelemzés területén. Elsősorban könnyen olvasható és tanulható, letisztult nyelvezete, valamint a hozzá tartozó gazdag elemzési, adatfeldolgozási és vizualizációs funkciókat támogató eszköztár teszi értékessé.

Az adatfeldolgozás mellett érinteni fogjuk a vizuális adatfeltárást és -elemzést is és a tanfolyam végére megtanuljuk, hogy hogyan tudunk felépíteni és automatizálni egy teljes elemzési folyamatot a nyersadatok beolvasásától kezdve egészen eredmények elmentéséig.

Kinek szól?
Ezt a tanfolyamot azoknak  javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési és feldolgozási feladatokkal és szeretnék megismerni a Python nyelv ezt támogató eszközeit.

Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.

Tematika

Bevezetés a Pythonba

  • Mi is az a Python? Mire használható az adatelemzésben?
  • Ismerkedés a Python  alapokkal
  • A fontosabb adatelemzési könyvtárak: pandas és barátai

Adatelemzés egyszerűen

  • Adatok betöltése forrásállományokból (XLS, CSV)
  • Az adatok feltérképezése, adatszerkezet vizsgálata
  • Az adatok lekérdezése, sorok és oszlopok szűrése
  • Aggregációk számítása
  • Vizuális adatelemzés, egyszerű grafikonok készítése

Az adatok tisztítása és gazdagítása

  • Számított mezők készítése
  • Feltételes kifejezések használata
  • Szöveges és dátum mezők kezelése
  • Adatok csoportosítása és rendezése

Több adattábla kezelése

  • Két tábla összekapcsolása
  • Kódszótárak (Lookup) használata

Eredmények elmentése

  • Adatok mentése  XLS állományokba
  • Szöveges állományok készítése
  • Grafikonok mentése képállományként

Kitekintés, további lehetőségek

  • Amit a Python környezetekről tudni kell
  • Adatbázisok kezelése
  • Webes adatok feldolgozása
  • Dokumentumok generálása
  • Haladó adatvizualizációk lehetőségek

Előfeltételek
Általános informatikai ismeretek szükségesek, némi jártasság az elemzés és jelentéskészítés területén hasznos.