Áttekintés
A kétszer félnapos workshop során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési könyvtárának, a pandas-nak segítségével fogjuk feldolgozni és transzformálni a beolvasott adatokat.
Az adatok elemzése során sok esetben találkozunk olyan feladatokkal, amelyek sok kézi munkát igényelnek, gyakran ismétlődnek, vagy éppen nehezen oldhatóak meg a szokásos eszközökkel. Tanfolyamunk bemutatja, hogy lehet ezeket az adatelemzési feladatokat egyszerű, Pythonban írt miniprogramok segítségével hatékonyan elvégezni.
A Python méltán az egyik legnépszerűbb eszköz az adatelemzés területén. Elsősorban könnyen olvasható és tanulható, letisztult nyelvezete, valamint a hozzá tartozó gazdag elemzési, adatfeldolgozási és vizualizációs funkciókat támogató eszköztár teszi értékessé.
Az adatfeldolgozás mellett érinteni fogjuk a vizuális adatfeltárást és -elemzést is és a tanfolyam végére megtanuljuk, hogy hogyan tudunk felépíteni és automatizálni egy teljes elemzési folyamatot a nyersadatok beolvasásától kezdve egészen eredmények elmentéséig.
Kinek szól?
Ezt a tanfolyamot azoknak javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési és feldolgozási feladatokkal és szeretnék megismerni a Python nyelv ezt támogató eszközeit.
Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.
Tematika
Bevezetés a Pythonba
- Mi is az a Python? Mire használható az adatelemzésben?
- Ismerkedés a Python alapokkal
- A fontosabb adatelemzési könyvtárak: pandas és barátai
Adatelemzés egyszerűen
- Adatok betöltése forrásállományokból (XLS, CSV)
- Az adatok feltérképezése, adatszerkezet vizsgálata
- Az adatok lekérdezése, sorok és oszlopok szűrése
- Aggregációk számítása
- Vizuális adatelemzés, egyszerű grafikonok készítése
Az adatok tisztítása és gazdagítása
- Számított mezők készítése
- Feltételes kifejezések használata
- Szöveges és dátum mezők kezelése
- Adatok csoportosítása és rendezése
Több adattábla kezelése
- Két tábla összekapcsolása
- Kódszótárak (Lookup) használata
Eredmények elmentése
- Adatok mentése XLS állományokba
- Szöveges állományok készítése
- Grafikonok mentése képállományként
Kitekintés, további lehetőségek
- Amit a Python környezetekről tudni kell
- Adatbázisok kezelése
- Webes adatok feldolgozása
- Dokumentumok generálása
- Haladó adatvizualizációk lehetőségek
Előfeltételek
Általános informatikai ismeretek szükségesek, némi jártasság az elemzés és jelentéskészítés területén hasznos.