6 velkých mýtů o správě velkých dat

Autor: Eugene Taylor
Datum Vytvoření: 15 Srpen 2021
Datum Aktualizace: 22 Červen 2024
Anonim
6 velkých mýtů o správě velkých dat - Technologie
6 velkých mýtů o správě velkých dat - Technologie

Obsah


Zdroj: Dwnld777 / Dreamstime.com

Odnést:

Velká data jsou velké firmy, ale pouze pokud jsou správně použity.

V květnu 2014 vydal Forrester Research dvě zprávy, které vyvodily určité závěry o humbuk kolem velkých dat. Výzkumná společnost provedla průzkum více než 250 vedoucích pracovníků v oblasti marketingu a rozvoje podnikání. Podle autorů zpráv je velká rétorika dat vždy vysoká a prodejci technologií nabízejí produkty, které se zdají být neuvěřitelnými tvrzeními.

Gartner souhlasí s Forrester Research; velká humbuk obklopuje velká data. Ve zprávě ze září 2014 společnost Gartner odhaluje pět největších datových mýtů a analytici společnosti Gartner nabízejí svůj názor na to, co je nepochopení velkých dat a jeho manipulace. Takže jaké jsou velké mýty o velkých datech? Pojďme se podívat.

Mýtus: Každý je před námi v přijímání velkých dat.

Gartner říká, že zájem o velká data je stále nejvyšší. Navzdory tomu má téměř 13 procent dotázaných pracovní systémy. Důvod: většina společností musí teprve přijít na to, jak vytěžit jakoukoli hodnotu z velkých úložišť dat. Zde je průzkum společnosti Gartner optimističtější než zpráva společnosti Forrester, která zjistila, že pouze 9 procent účastníků průzkumu uvedlo, že v příštím roce plánují implementovat velké datové technologie. (Velká data mají co nabídnout. Další informace naleznete v 5 problémech reálných světů, která mohou velká data vyřešit.)

Mýtus: Máme tolik dat; nemusíme si dělat starosti s každou malou chybou dat.

Gartner se bojí o to, co lidé mají: „Máme toho tolik, na tom malém, co je špatné, nebude záležet.“ Ted Friedman, viceprezident a významný analytik společnosti Gartner, věří, že toto je nesprávný způsob, jak se podívat na situaci.

"Ve skutečnosti, i když každá jednotlivá vada má mnohem menší dopad na celý soubor dat, než tomu bylo v případě méně údajů, existuje více nedostatků než dříve, protože existuje více dat," řekl Friedman. „Celkový dopad údajů nízké kvality na celý soubor dat proto zůstává stejný.“

Friedman přidává další důvod k obavám. Velký sběr dat často zahrnuje data mimo podnik, což má tedy neznámou strukturu a původ. Tím se zvyšuje riziko chyb.

Mýtus: Technologie velkých dat eliminuje potřebu integrace dat.

Na velká data lze použít dvě klíčové strategie analýzy dat: „schéma při zápisu“ nebo „schéma při čtení“. Až donedávna byla jedinou použitou metodou schéma při zápisu. Schéma při čtení je aktuální šílenství ve správě databází. Na rozdíl od schématu při zápisu, které vyžaduje strukturovaný formát, jsou data načtena do databází schématu při čtení v surovém formátu. Vývojáři - pomocí nestrukturovaných databázových platforem jako Hadoop - ohýbají různorodá data do použitelného formátu. Schéma čtení má zřejmé výhody, ale jak uvádí Gartner, v určitém okamžiku musí dojít k integraci dat.

Mýtus: Použití datového skladu pro pokročilé analýzy je zbytečné.

Trávení času na vytvoření datového skladu se zdá být zbytečným pro mnoho informačních manažerů, zejména když se nově zachycená data liší od datových skladů. Gartner však opět varuje, že i pokročilá analytika dat bude používat datové sklady a nová data, což znamená, že integrátoři dat musí:
  • Upřesněte nové typy dat tak, aby byly vhodné pro analýzu
  • Rozhodněte se, která data jsou relevantní a úroveň potřebné kvality dat
  • Určete, jak agregovat data
  • Pochopte, že k upřesnění dat může dojít i na jiných místech, než je datový sklad

Mýtus: Datová jezera nahradí datový sklad.

Datová jezera jsou úložištěm nesourodých dat, na rozdíl od datových skladů, kde jsou data ve strukturovaném formátu. Vytvoření datového jezera vyžaduje ve srovnání s datovými sklady malé počáteční úsilí (není třeba data formátovat), a proto jsou datová jezera zajímavá.

Gartner zdůrazňuje, že mít data není smyslem - smyslem je manipulovat se získanými daty pro informované rozhodování. Kromě toho je použití (poněkud neověřených) datových jezer k usnadnění rozhodování problematické.

„Datové sklady již mají schopnost podporovat širokou škálu uživatelů v celé organizaci,“ řekl Nick Heudecker, ředitel výzkumu společnosti Gartner. "Vůdci správy informací nemusejí čekat, až dohrají datová jezera." (Další informace o přijímání velkých dat v 7 věcech, které musíte vědět o velkých datech před přijetím.)

Big Data Works - Nové metody manipulace s daty nemusí

Důvod, proč Gartner řekl „největší datové mýty“ místo „velkých datových mýtů“, je zřejmý po přečtení zprávy. Gartner není pochybnost o velkých datech. Gartner je leery těch, kteří cítí, že novější metody manipulace s velkými daty jsou připraveny na „hlavní čas“.