12 klíčových tipů pro výuku datových věd

Autor: Laura McKinney
Datum Vytvoření: 3 Duben 2021
Datum Aktualizace: 1 Červenec 2024
Anonim
12 klíčových tipů pro výuku datových věd - Technologie
12 klíčových tipů pro výuku datových věd - Technologie

Obsah


Zdroj: Artinspiring / Dreamstime.com

Odnést:

Vědci dat očividně potřebují silné matematické a kódovací dovednosti, ale pro úspěch jsou také nezbytné komunikační a jiné měkké dovednosti.

Datový vědec se řadí mezi nejlepší práce pro rok 2019 v Americe na Glassdoor. S průměrným základním platem 108 000 USD a se stupněm spokojenosti s prací 4,3 z 5 a předvídaným množstvím otevřených pozic to není překvapivé. Otázka zní: Co musí člověk udělat, aby se dostal na cestu, aby se kvalifikoval pro tuto práci?

Abychom to zjistili, hledali jsme radu poskytovanou těm, kteří se chtějí dostat na tuto kariéru. Hodně jde o tvrdé dovednosti v kódování a matematice. Samotné silné výpočty to však nezastaví. Úspěšní vědci v oblasti dat musí také být schopni hovořit s podnikateli podle svých vlastních podmínek, což vyžaduje schopnosti spojené s měkkými dovednostmi a vedením. (Chcete-li se dozvědět více o povinnostech datového vědce, viz Job Role: Data Scientist.)


Budování vzdělávací nadace: Tři základní tipy

Drace Zhan, datová vědkyně na NYC Data Science Academy, zdůrazňuje potřebu vzdělávací nadace, která zahrnuje základy kódování a matematické schopnosti:

  1. R / Python + SQL. Pokud nemáte zkušenosti s kódováním, potřebujete k posílení tohoto schodku spoustu síťového výkonu a dalších oblastí. Viděl jsem datové vědce se slabým matematickým a malými zkušenostmi s doménou, ale vždy byli neseni silnou schopností kódování. Python je ideální, ale R je skvělý pomocný nástroj. Nejlepší je mít oba ve svém arzenálu. SQL je také nesmírně důležitý pro Data Analyst.

  2. Silné matematické dovednosti. Velmi dobré porozumění několika běžně používaným metodám: zobecněné lineární modely, rozhodovací strom, K-průměr a statistické testy jsou lepší než mít široký obraz různých modelů nebo specializací, jako je RNN.

To jsou hlavní dovednosti, na nichž lze stavět, i když je k nim přidávají někteří odborníci. Například seznam KDnuggets obsahuje komponenty kódování, které Zhan zmínil, a přidává další užitečné věci, které je třeba znát na technické stránce, včetně platformy Hacheop Apache Spark, vizualizace dat, nestrukturovaných dat, strojového učení a umělé inteligence.


Pokud ale vezmeme naše podněty z průzkumu o nejčastěji používaných nástrojích určených pro použití v reálném životě průzkumem Kaggle, dostaneme poněkud odlišné výsledky. Jak můžete vidět z grafu 15 nejlepších možností níže, Python, R a SQL snadno udělají první tři, ale čtvrtý jsou notebooky Jupyter, dále TensorFlow, Amazon Web Services, unixový shell, Tableau, C / C ++, NoSQL. , MATLAB / Octave a Java, vše před Hadoopem a Sparkem. Dalším dodatkem, který může lidi překvapit, je Microsoft Excel Data Mining.

Obrázek se svolením Kaggle

Seznam KDnuggets obsahuje také tip týkající se formálního vzdělávání. Většina vědců s údaji má pokročilé tituly: 46 procent má titul PhD a 88 procent má alespoň magisterský titul. Vysokoškolské tituly, které vlastní, jsou obecně rozděleny mezi příbuzné oblasti. Asi třetina je v matematice a statistikách, což je pro tuto kariéru nejoblíbenější. Další nejoblíbenější je titul z oblasti informatiky, který je držen 19 procent, a inženýrství, výběr 16 procent. Technické nástroje, které se týkají zejména vědy o údajích, se samozřejmě ve studijních programech často neučí, ale ve specializovaných zaváděcích táborech nebo prostřednictvím online kurzů.

Více než kurzy: Dva další tipy

Hank Yun, výzkumný asistent plicního oddělení ve Weill Cornell Medicine a student NYC Data Science Academy, doporučuje aspirujícím vědcům v oblasti dat, aby naplánovali, na čem budou pracovat, a našli mentora. Řekl:

Žádné chyby, žádný stres - Váš průvodce krok za krokem k vytváření softwaru pro změnu života, aniž by došlo ke zničení vašeho života

Nemůžete zlepšit své programovací schopnosti, když se nikdo nestará o kvalitu softwaru.

Nedělejte chybu, kterou jsem udělal tím, že si řeknete, že znáte vědu o údajích, protože jste absolvovali kurz a získali certifikát. To je skvělý začátek, ale když začnete studovat, jděte na projekt. Pak najděte mentora v terénu a hned zahajte vášnivý projekt! Když jste čerství, nevíte, co nevíte, takže vám pomůže, když je tu někdo, kdo vás provede tím, co je pro vás důležité a co ne. Nechceš trávit spoustu času studiem, aniž bys za to ukazoval!

Vědět, který nástroj vyjmout ze sady nástrojů: Tip, abyste zůstali před křivkou

Vzhledem k rozdílnosti v pořadí nástrojů pro vědu o údajích se mohou někteří cítit zmateni, na co se zaměřit. Celeste Fralick, vedoucí výzkumu dat v bezpečnostní softwarové společnosti McAfee, řeší problém v článku CIO, který se zabývá základními dovednostmi pro datového vědce a prohlašuje: „Datový vědec musí zůstat před křivkou ve výzkumu a také pochopit, jakou technologii použít, když. “To znamená, že se nelíbí„ sexy “a nová, když skutečný problém vyžaduje něco mnohem běžnějšího. "Vědět o výpočetních nákladech na ekosystém, interpretovatelnosti, latenci, šířce pásma a dalších systémových hraničních podmínkách - a také o zralosti zákazníka - samo o sobě pomáhá vědcům údajů pochopit, jakou technologii použít."

Základní měkké dovednosti: Dalších šest tipů

Bod, který Fralick přináší, se týká netechnických dovedností, které vyžaduje práce vědců s údaji. Seznam KDnuggets proto obsahuje tyto čtyři: intelektuální zvědavost, týmová práce, komunikační dovednosti a obchodní zájmy. Zhan také zahrnul klíčové měkké dovednosti do svých tipů pro vědce v oblasti dat, identifikoval „komunikační dovednosti“, jako je KDnuggets, ale místo „business acumen“ používal „doménové expertízy“. podnikání. (Další informace o komunikačních dovednostech naleznete v části Význam komunikačních dovedností pro technické odborníky.)

Olivia Parr-Rud nabídla své vlastní točení, přidala další dvě měkké dovednosti, s důrazem na roli kreativity, a tvrdila: „Myslím, že věda o údajích je stejně umění jako věda,“ něco, co vyžaduje kreslení silné stránky obou stran mozku. "Mnoho lidí mluví o vědě o datech jako o kariéře, která používá především levý mozek." Zjistil jsem, že k tomu, aby byli úspěšní, musí vědci používat celý mozek. “

Vysvětlila, že pokrok v této oblasti vyžaduje nejen technickou kompetenci, ale také kreativitu a vizi potřebnou pro vedení:

Většina úloh levého mozku / lineáře může být automatizována nebo zadávána externě. Abychom mohli jako vědci v oblasti dat nabídnout konkurenční výhodu, musíme být schopni rozeznat vzorce a syntetizovat velké množství informací pomocí obou stran našeho mozku. A my musíme být inovativní myslitelé. Mnoho nejlepších výsledků vyplývá z integrace levého a pravého mozku.

Také zdůraznila, proč je komunikace s vizí nezbytná:

Jako vědci v oblasti dat je naším cílem používat data, která našim klientům pomohou zvýšit jejich zisky. Většina vedoucích pracovníků nechápe, co děláme nebo jak to děláme. Musíme tedy myslet jako vůdci a sdělit svá zjištění a doporučení v jazyce, kterému naši zúčastněné strany rozumí a kterým důvěřují.

Dozen dat

Klíčové tipy zahrnují větší množství technických nástrojů, dovedností a schopností, jakož i méně kvantifikovatelné vlastnosti, jako je schopnost kreativity a vedení. Nakonec to není jen hra čísel. Protože věda o datech není jen o vytváření modelů ve vakuu, ale přichází s praktickými aplikacemi pro řešení problémů skutečného života pro podniky, ti, kteří uspějí v této oblasti, musí nejen zvládnout technologii, ale znát svou obchodní doménu a pochopit potřeby různí členové týmu v práci.