Data Science nebo Machine Learning? Heres Jak rozpoznat rozdíl

Obsah

Data Science and Machine Learning: Široká a úzká terminologie
Sady dovedností v oblasti vědy o datech a strojovém učení
Žádné chyby, žádný stres - Váš průvodce krok za krokem k vytváření softwaru pro změnu života, aniž by došlo ke zničení vašeho života
Jak zaměřit strojové učení
Dva disciplíny řezání hran

Zdroj: Elnur / Dreamstime.com

Odnést:

Věda o údajích a strojové učení se v klíčových způsobech liší. V některých ohledech lze jednu považovat za podskupinu druhé. Oba jsou důležité pro současný pokrok v IT.

V tomto novém světě umělé inteligence a správy dat je snadné se zmást některými pojmy, které se v IT světě nejčastěji používají.

Například věda o datech a strojové učení mají hodně společného. Není divu, že mnoho lidí, kteří mají pouze předávání těchto oborů, by mělo potíže přijít na to, jak se od sebe liší.

Zde je nejlepší způsob, jak oddělit vědu o údajích od strojového učení, zásadně a jako technologický přístup.

Data Science and Machine Learning: Široká a úzká terminologie

Zaprvé, věda o údajích je opravdu široká, zastřešující kategorie technologií, která zahrnuje mnoho různých typů projektů a kreací. (Pro více informací o tom, co se podílí na práci s datovou vědou, viz Job Role: Data Scientist.)

Věda o údajích je v podstatě praxí práce s velkými daty. Ukázalo se, že Mooreův zákon a rozšiřování efektivnějších paměťových zařízení vedlo k tomu, že společnosti a další strany shromažďovaly obrovské množství dat. Poté velké datové platformy a nástroje, jako je Hadoop, začaly předefinovat výpočetní techniku změnou fungování správy dat. Nyní s cloudem a kontejnerizací a zbrusu novými modely se velká data stala hlavním hnacím motorem způsobů, jak pracujeme a žijeme.

Ve své nejjednodušší podobě je datová věda způsob, jakým s nimi nakládáme, od jejich čištění a rafinace až po jejich použití ve formě poznatků.

Definice strojového učení je mnohem užší. Ve strojovém učení technologie přijímají data a propouští je pomocí algoritmů, aby simulovaly lidské kognitivní procesy popsané jako „učení“. Jinými slovy, počítač je schopen převzít data a vyškolit je a je schopen poskytovat své vlastní výsledky , kde se zdá, že se technologie poučila z procesů, které programátoři zavedli.

Sady dovedností v oblasti vědy o datech a strojovém učení

Dalším způsobem, jak porovnat vědu o údajích a strojové učení, je podívat se na různé dovednosti, které jsou pro odborníky v těchto oblastech nejcennější.

Žádné chyby, žádný stres - Váš průvodce krok za krokem k vytváření softwaru pro změnu života, aniž by došlo ke zničení vašeho života

Nemůžete zlepšit své programovací schopnosti, když se nikdo nestará o kvalitu softwaru.

Existuje obecná shoda, že vědci v oblasti dat těží z hlubokých analytických a matematických dovedností, praktických zkušeností s databázovými technologiemi a znalostí programovacích jazyků, jako je Python nebo jiných balíčků, které se používají pro analýzu velkých dat.

„Každý, kdo má zájem o vybudování silné kariéry v oboru (věda o údajích), by měl získat klíčové dovednosti ve třech odděleních: analytika, programování a znalosti domén,“ píše Srihari Sasikumar ve společnosti Simplilearn. "Pokud jde o úroveň hlouběji, následující dovednosti vám pomohou vydobýt mezeru jako datový vědec: Silné znalosti Pythonu, SAS, R (a) Scaly, praktické zkušenosti s kódováním SQL databáze, schopnost pracovat s nestrukturovanými daty z různé zdroje, jako je video a sociální média, porozumět více analytickým funkcím (a) znalostem strojového učení. “

Na straně strojového učení odborníci často uvádějí dovednosti modelování dat, znalosti pravděpodobnosti a statistiky a širší znalosti programování jako užitečné nástroje v sadě nástrojů strojového učení.

Jak zaměřit strojové učení

Klíčem je to, že všechny druhy věcí zahrnují práci s datovými vědami, ale nejde o strojové učení, pokud nemáte nastaven velmi přísný režim, který by pomohl počítači učit se z jeho vstupů.

Když je to na místě, vytváří to překvapivě schopné systémy, které mohou mít široký dopad na náš život.

"Hodně z toho, co děláme se strojovým učením, se děje pod povrchem," řekl zakladatel Amazonu Jeff Bezos a poukázal na některé z aplikací těchto typů systémů. „Strojové učení řídí naše algoritmy pro předpovídání poptávky, hodnocení produktového vyhledávání, doporučení produktů a obchodů, umístění reklamních předmětů, detekci podvodů, překlady a mnoho dalšího. Ačkoli méně viditelný, bude mít velký dopad strojové učení tohoto typu - tiše, ale významně zlepšující základní operace. “

Jedním z nejužitečnějších příkladů je vznik neuronové sítě - jedná se o běžnou a oblíbenou metodu nastavení procesů strojového učení.

Ve své nejzákladnější podobě je neurální síť složena z vrstev umělých neuronů. Každý jednotlivý umělý neuron má funkčnost ekvivalentní biologickému neuronu - ale místo synapsí a dendritů má vstupy, aktivační funkci a případné výstupy.

Neuronová síť je vytvořena jako lidský mozek a odborníci na strojové učení tento model často využívají k vytváření výsledků strojového učení.

To však není jediný způsob, jak udělat strojové učení. Některé další základní strojové učební projekty jednoduše zahrnují ukázání počítače širokému spektru fotografií (nebo jejich dodávání s jinými nezpracovanými daty), vkládání nápadů v procesu používání kontrolovaného strojového učení a označování dat a nechání počítače nakonec být schopno rozlišovat mezi různé tvary nebo položky ve vizuálním poli. (Základní informace o strojovém učení najdete v části Strojové učení 101.)

Dva disciplíny řezání hran

Závěrem je strojové učení cennou součástí vědy o datech. Věda o údajích však představuje hranici katastrofy a podmínky, ve kterých probíhá strojové učení.

Určitě byste mohli říci, že strojové učení by se nikdy nestalo bez velkých dat. Samotná velká data však nevytvořila strojové učení - místo toho, poté, co jsme společně shromáždili tolik dat, že jsme téměř nevěděli, co s tím dělat, přišly top mysli s těmito bioimulujícími procesy jako přeplňovaný způsob poskytování informací.

Další dobrou věcí, kterou je třeba mít na paměti, je to, že věda o údajích může být aplikována dvěma hlavními způsoby - můžeme přijmout strojové učení a umělou inteligenci, nechat počítače myslet na nás, nebo můžeme dát vědu o údajích zpět k přístupu více zaměřenému na člověka, kde počítač jednoduše přináší výsledky a my jako lidé přijímáme rozhodnutí.

To vede některé odborníky, včetně některých z dnešních nejlepších inovátorů, k tomu, aby požadovali živější účetnictví o tom, jak tyto technologie využíváme.

„(AI) je schopen mnohem více, než téměř kdokoli ví, a míra zlepšení je exponenciální,“ citoval Elon Musk, zatímco varuje, že strojové učení a programy AI vyžadují dohled.

V každém případě, jak věda o údajích, tak strojové učení jsou hlavními součástmi pokroku, kterého my jako společnosti dnes dosahujeme v technologii.