Úloha práce: Data Scientist

Autor: Roger Morrison
Datum Vytvoření: 28 Září 2021
Datum Aktualizace: 11 Smět 2024
Anonim
Úloha práce: Data Scientist - Technologie
Úloha práce: Data Scientist - Technologie

Obsah


Zdroj: Sergey Khakimullin / iStockphoto

Odnést:

Vědci údajů mají rozsáhlé úkoly, které se v závislosti na aplikaci značně liší. Ale jedna věc, kterou všichni mají, je snaha o dobré využití dat.

Co dělá vědec v oblasti umělé inteligence a strojového učení? Spousta profesionálů, kteří se každý den zabývají těmito druhy projektů, by řekla, že na tuto otázku je těžké odpovědět jednoduše. Lepší otázkou by bylo: Co vědci v oblasti dat NEJSOU?

Datový vědec je nedílnou součástí procesu AI nebo ML v tom smyslu, že všechny tyto projekty závisí na velkých datech nebo složitých vstupech. Vědec údajů je nezbytný kariérista, který ví, jak s daty pracovat, aby dosáhl výsledků.

Existuje však několik způsobů, jak hovořit o tom, co vědec údajů dělá, jaké kvalifikace potřebuje a jaká je jeho role v tomto procesu.


Číst: 6 koncepcí klíčových datových věd, které můžete zvládnout prostřednictvím online učení

Různé definice, různé povinnosti

Mnoho odborníků, kteří popisují práci datového vědce, o ní hovoří obecně.

„V malých společnostech nebo při práci na novém trhu je úkolem datového vědce převádět relativně nové (ale zřejmé) zdroje dat do věcí, které řeší problém pro koncového uživatele, což by dříve nebylo možné, kde použité technologie neexistovaly, “říká Antonio Hicks, Account Manager ve společnosti Mercury Global Partners. "Ideálním kandidátem je někdo, kdo je matematik, softwarový inženýr a podnikatel."

Jiní opakují tuto základní myšlenku a zmiňují, co vědci v oblasti dat potřebují k řešení modelových projektů.


"Nejdůležitějším atributem, který vědec potřebuje, je hluboká zvědavost o světě kolem nich - ať už zodpovídají otázky, nebo vytvářejí modely, touha porozumět problému před nimi je klíčová," říká Erin Akinci, manažer Data Scientist v Asaně. "Odtud bude většina lidí vyžadovat dovednosti v matematice a programování, aby našla řešení, ale konkrétní druhy matematiky a programování se velmi liší v závislosti na oblasti odborných znalostí v oblasti vědy o datech."

Žádné chyby, žádný stres - Váš průvodce krok za krokem k vytváření softwaru pro změnu života, aniž by došlo ke zničení vašeho života

Nemůžete zlepšit své programovací schopnosti, když se nikdo nestará o kvalitu softwaru.

"Vynikající vědecká práce má více společného s tím, jak vědec přemýšlí o problému, než s nástroji, které používají k jejich řešení," dodává Charlie Burgoyne, zakladatel a generální ředitel společnosti Valkyrie Intelligence. Valkyrie je aplikovaná vědecká poradenská společnost s působivými projekty pod jejím křídlem, jako je Mark I, specializované síťové zařízení, které podporuje školení a testování neuronových sítí a zlepšuje to, co je možné, s předchozími platformami strojového učení na cloudu.

"Trh vyžaduje vědce, kteří jsou zdatní ve vývoji Pythonu, designu neuronových sítí a schopnosti přetvořit datové úložiště do nejnovější architektury databáze," říká Burgoyne. "Tyto schopnosti jsou však sázkou pro talentovaného vědce." Méně zřejmé je schopnost vědce pro neohroženou zvědavost, agresivní vynalézavost a dodržování vědecké metody. “

Dovednosti datového vědce

Pokud jde o praktické dovednosti, vědci v oblasti dat potřebují, pokud jde o modelování, určitou míru kreativity a důvtipu. Mohou také hodně těžit z toho, že mají „tvrdé dovednosti“, jako je kódování zkušeností v Pythonu, C ++ nebo jiných běžných jazycích aplikovaných na projekty ML.

„Python a C ++ jsou zásadní a jsou schopny kombinovat kódovací dovednosti s analýzou a zpracováním dat a statistika jsou základní dovednosti, díky nimž bude datový vědec vynikat jako silný kandidát nebo zaměstnanec,“ říká Val Streif v Prampu, online platforma pro rozhovor pro softwarové inženýry, vývojáře a datové vědce. "I když některé programovací dovednosti by se mohly postarat spárováním datového vědce s vývojářem, je mnohem jednodušší, pokud máte obě dovednosti kombinované v jednom z pohledu společnosti."

Další odborníci přidávají do seznamu R, Hadoop, Spark, Sas a Java a technologie jako Tableau, Hive a MATLAB.

Všichni z nich vytvářejí působivý životopis, ale někteří z těch, kteří mají zkušenosti s náborem datových vědců, říkají i další „lidské“ vedlejší stránky. (Jeden typ datového vědce je občanský datový vědec. Více se dozvíte v Role občanských datových vědců ve světě velkých dat.)

"Tradičně lidé s různorodým svobodným uměleckým vzděláním dělají vynikající vědce v oblasti dat," říká Burgoyne a rozlišuje mezi inženýry, kteří jsou na straně budovy, a vědci, jejichž práce může být mnohem koncepčnější. Pokračuje:

Odbornost v tradičním oboru STEM s doplňkovým zaměřením na humanitní, umělecké nebo obchodní oblasti přináší ty vlastnosti, které jsou vynikajícím průmyslově orientovaným vědcem. Je třeba říci, že je stejně důležité pro schopnost organizace tyto vlastnosti využít a formovat jejich zápal a metody produktivním způsobem. Všiml jsem si, že když je iniciativa v oblasti vědy o údajích neúspěšná, organizace bude stejně vinná jako vědci. Vědci nejsou inženýři. Nejsou poháněni k provádění a stavbě. Jsou vedeni k objevování a porozumění. Organizace, které pochopí tento rozdíl, jsou dobře odměněny za kultivaci obou polí.

Pokud jde o to, na co se vědci obvykle vztahují, souvisí to s hlavními cíli společnosti. Některé firmy pronásledují decentralizovaný internet - některé si hrají s IoT nebo SaaS. Jiní se pokoušejí propagovat „uživatelsky přívětivou“ nebo „etickou“ či „průhlednou“ umělou inteligenci.

V každém případě vědci s údaji pravděpodobně překonají propast mezi tvrdými metrikami na datech, která používají, v jakémkoli technologickém zásobníku, který je ve hře, a prací na volném pojetí konceptualizace funkčnosti AI / ML.

„Najímáme vědce s údaji, aby spravovali sběr a čištění dat, a také je převádíme do smysluplných informací,“ říká Michael Hupp, manažer datových věd a analytiků v G2 Crowd. Vypracovává:

Obvykle to znamená správu všech důležitých algoritmů, které řídí podnikový datový stroj a jsou plynulé v klíčových analytických nástrojích a jazycích, ale v posledních letech také zahrnovaly vznikající oblasti, jako je zpracování přirozeného jazyka, strojové učení, jiné formy analýzy umožňující AI. Nejúspěšnější vědci v oblasti dat jsou ti, kteří kombinují své tvrdé dovednosti se schopností rychle se učit a schopnost efektivně komunikovat informace, které odhalí, takže budou mít smysl pro jejich podnikání.

Díky těmto typům poznatků je pro mladé odborníky nebo studenty snazší zjistit, zda by pro ně byl datový vědec dobrá role a jak získat dovednosti. STEM učení je stále dostupnější ve školách po celé zemi, ale nenahradí vás vášeň pro kódování a technologii a schopnost učit se za běhu.