Data science je multidisciplinární přístup pro hledání, extrahování a zvýrazňování vzorců v datech. Kvůli svému potenciálu se do analytických nástrojů investují miliony dolarů ročně. S datovou analytikou je spojeno spoustu zvláštních mýtu, některé se pokusíme v následujícím článku vysvětlit.
Přibližně 70 % dat v databázích podniků nejsou vhodné, protože analytický tým s nimi nemůže pracovat. A zároveň je všeobecně známo, že 80 % času stráví datoví vědci na úpravách a transformaci dat a pouze 20 % času věnují analýzám.
Problém úpravy dat tkví v tom, že jde o velmi jednotvárnou činnost. Tato práce se většinou předává datovým inženýrům, kteří mají na starosti všechny činnosti ohledně transformace, extrakce a dalších potřebných úprav dat. Potom se hlásí ke slovu datový vědci, kteří s daty dále pracují a upravují si je podle svých potřeb, aby je mohli použít v analýzách a modelech. Špatná souhra mezi lidmi, procesy a nástroji má potom za následek neefektivní přístup k analytice, neustálou komunikaci mezi všemi zúčastněnými, zpoždění a chyby.
Pravda: Datoví vědci mohou být stejné osoby jako datoví údržbáři. Stejně každý den pracují s daty a různými datovými formáty. Moderní přístupy v data science zahrnují všechny osoby od datových inženýrů, přes vědce až po analytiky. Každá z těchto osob se podílí na čistění a transformaci dat. Díky spolupráci všech členů týmu na časově náročných částech procesu, mohou společnosti zvýšit produktivitu týmu.
Datoví vědci jsou v centru pozornosti již řadu let. Hlavní ekonom Google, Hall Varian, řekl, že je to “nejvíc sexy práce na světě”.
Brzy na to vývojáři softwarů přišli s tím, že nástroje datových vědců jsou tak jednoduché na použití, že jejich práce v budoucnu již nebude potřeba. Avšak přišlo se na to, že datoví vědci jsou nepostradatelní v oblasti predikce. Na každý tým analytiků totiž existuje tým vedoucích pracovníků, kteří využívají jejich data k lepšímu rozhodování v podniku.
Pravda: Datoví vědci zůstávají. Jsou jádrem podniku a měli by být podporování nástroji, technologiemi a postupy, které jim pomohou rozšiřovat znalosti a talent. Data science je v současné době dostupná na vysokých školách. Brzy se počítá s tím, že bude dostupná i mladším generacím.
Datoví vědci jsou důležití dnes a budou důležití i v budoucnosti.
Analytické týmy potřebují rychlý a snadný přístup k datům. Jenže data jsou pravděpodobně nejcennějším aktivem podniků bez ohledu na jejich oblast působení. Musí být chráněna a zpracovávána s nejvyšší mírou zabezpečení. Správci databází a big dat jsou obvykle pověřeni zpřístupňováním dat v rámci svého podniku, avšak zároveň si musí být jisti, že přístup k datům dodržuje zásady správy a zabezpečení společnosti. Z toho důvodu přístup k datům v rámci podniku může poněkud váznout.
Pravda: Leadři v oblasti analytiky se naučili vytvářet procesy a závádět nástroje, které umožňují přístup do databází na základě rolí a tím umožňují plynulou komunikaci mezi datovými inženýry, datovými vědci, analytiky a manažery. Zaměstnanci firmy díky tomu mají možnost okamžitě vyhledat a prozkoumat datasety, které potřebují.
Licence a kurzy - (+420) 739 569 987
Volejte Po - Pá: 9.00 - 16.00 hod
info@statistica.pro
Odpovíme do 1 pracovního dne
Školící centrum:
DataFriends s.r.o.
Uruguayská 17
120 00 Praha 2
Sídlo společnosti:
DataBon s.r.o.
Korunní 2569/108, 101 00 Praha 10
IČ: 09743804
DIČ: CZ09743804