(Datová analytika)
Přestavujeme ti naši lektorku Zuzku Wolfovou, která tě zásobí pořádnou dávkou dat. A nejen to, naučí tě se v nich orientovat a přemýšlet o nich v širších souvislostech. Nudnější teorii okoření zážitky a zkušenostmi z praxe i svým neotřelým humorem. Podělila se s námi o svůj příběh, jak se k datové analytice dostala, o svůj postoj k datům nebo o to, jak s ní kurz probíhá.
Trochu oklikou, ale všechno to tam směřovalo :). Studovala jsem kde co – strojírenství a ekonomiku na střední, český jazyk a poté pedagogiku na vysoké. Po škole jsem začala pro změnu pracovat jako junior IT analytik pro IBM a léta jsem se pak pohybovala v oblasti software asset managementu.
Spousta komunikace, pravidel, dokumentů a právničiny. A trochu té datové analytiky. A ta mě z celé té omáčky kolem vždy nejvíc bavila – nejspokojenější jsem byla, když jsem dostala report s hromadou dat a mohla se v nich hrabat :). Když mi něco nešlo, koumala jsem tak dlouho, než jsem na to přišla. Znalosti a dovednosti se nabalovaly a já jsem nakonec shodou mnoha náhod začala pracovat právě jako datový analytik v oblasti cybersecurity, kde jsem doteď.
Spousta lidí by asi řekla, že je fascinuje ten výsledek – jak z čísel vytvořit nějaký příběh, nějaké sdělení. Mě samotnou však baví spíše dopady těch příběhů. Některé z těch nejzajímavějších se snažím svým studentům v úvodu kurzu zprostředkovat a převyprávět tak, aby i oni pochopili, jak moc dokážou data ovlivňovat svět, ať už v tom pozitivním, či negativním smyslu.
V současné době se pochopitelně hodně mluví o machine learning a umělé inteligenci. To jsou asi ta nejžhavější témata, ač mají tedy spíše blíž k data science než k datové analytice jako takové. Na druhou stranu tím, že se budete snažit pochopit, jak tyhle věci fungují, si do budoucna ušetříte spoustu trápení (nyní si všichni představme babičku s chytrým telefonem 🙂 ). Neříkám, že by se každý měl naučit vytvářet velké jazykové modely, ale minimální porozumění bude nutností.
Můžu sdílet své nadšení a radost ze vzorečků, příkazů, programů a grafů s těmi, co o to mají zájem 😁.
Někdy se může studentům zdát, že je výuka hodně o teorii. To je naprosto v pořádku. Mám ráda citát jednoho z nejslavnějších fyziků 20. století, nositele Nobelovy ceny, prof. Richarda Feynmana: „Knowledge isn’t free. You have to pay attention.“, tedy ve volném překladu „Znalosti nejsou zdarma, musíte dávat pozor.“ 🙂
Někdy, hlavně na začátku, tedy musíme přetrpět klasické přednášení, natlouct si do hlavy základy a pak se přijde ta zábava. Takže tu klasiku ráda prokládám veselými historkami z natáčení, jak se mi něco povedlo, jak se mi něco nepovedlo (to má úspěch!), zmíním best practices apod. Do prezentací ráda přidávám prvek názornosti, vytvářím různé diagramy a občas se mi (bohužel) povede i nějaký ten trapný vtip. Ale i ty trapné vtipy mají nakonec tu vlastnost, že přitáhnou pozornost.
Nejraději však mám kombinaci nějakého reálného cíle, tedy malého hodinového projektu a živého streamování, kdy studentům od začátku do konce ukazuji, jak bych daný případ vyřešila, jak bych postupovala a snažím se jim předávat své myšlenkové pochody.
Určitě je to zvídavost, bez té se nepohnete. Jakmile vás nezajímá, co za všemi těmi čísly je, tak to pak moc nemá smysl. Dále logika, ta je v programování docela užitečná. No a nakonec určitě kreativní myšlení, tzv. out of the box – když něco nefunguje standardně, jak docílit toho, aby to i přesto fungovalo?
Nejenom v datové analytice, ale např. v programování obecně, jde spoustu věcí vyřešit rozličnými způsoby. Nejlepší je, že můžete vidět něčí kód a říct si: „Skvělý, funguje to, ale já bych to napsala jinak.“ A ten váš kód taky bude fungovat. A kód dalšího kolegy, ač také úplně jiný, bude taky fungovat. 🙂
Pojďme si promluvit o Excelu. 🙂 Některými zatracovaný, jinými (mnou!) milovaný. Švýcarský nůž každého datového analytika. Bez něj se neobejdete.
Nemusíte být zrovna Excel fanatikem, ale vězte, že základy práce v tabulkách jsou v dnešní době stále potřeba. Excel je svým konceptem práce se sloupci a řádky skvělým základem pro pochopení struktury dat v databázích. Zároveň syntax excelovských vzorců je velice podobný jazyku DAX používaného ve vizualizačním nástroji Power BI. Takže takové základy Excelu jsou naprosto skvělý schůdek dál do světa datové analytiky a programování.
Dvě strany mince. Žijeme v době, kdy se na celém světě vytváří stovky milionů terabytů dat každý den. To je naprosto neuvěřitelné množství. Algoritmy, sociální sítě, AI chatboti, IoT, to je jen ta vyhypovaná špička ledovce. Data jsou ale úplně všude, a bude jich ještě víc. Na základě dat se podniky rozhodují, zda investovat tam či onam, které výrobky slevnit, komu lépe prodat; na základě dat lze vyrábět léky „na míru“ pro pacienty se vzácnými onemocněními; na základě dat vám sociální síť vybírá obsah, který vás zajímá.
Je zde však i druhá strana mince. Podvody s kryptoměnami, krádeže identity, dezinformace a další bezpečnostní rizika, která tady dříve nebyla, kdy obezřetnost je víc než na místě. I to je dáno tím, jak moc velké množství dat kolem nás je.
Takže ano, žijeme prostě v době datové a jinak tomu minimálně dalších pár (desítek?) let nebude (snad?).