10 velkých dat dělá a nedělá

Autor: Eugene Taylor
Datum Vytvoření: 13 Srpen 2021
Datum Aktualizace: 22 Červen 2024
Anonim
10 velkých dat dělá a nedělá - Technologie
10 velkých dat dělá a nedělá - Technologie

Obsah



Zdroj: Rawpixelimages / Dreamstime.com

Odnést:

Velká data jsou pro většinu společností novou a vznikající doménou. Aby to fungovalo, je třeba pečlivě doladit a používat osvědčené postupy.

Velká data přináší mnoho příslibů pro všechny typy průmyslových odvětví. Pokud budou tato velká data využívána efektivně a efektivně, mohou mít významný dopad na rozhodování a analytiku. Přínos velkých dat však lze dosáhnout pouze tehdy, pokud je spravován strukturovaným způsobem. Postupně se zavádějí osvědčené postupy pro velká data, ale pokud jde o implementaci, již existují určité jasné pokyny a nedělá.

Následující pokyny jsou založeny na praktických zkušenostech a znalostech získaných z reálných projektů. Zde jsou mé nejlepší velké údaje a dary.

Zapojte všechny obchodní sekce do velké datové iniciativy

Iniciativa velkých dat není izolovanou a nezávislou činností a zapojení všech obchodních jednotek je nutností k získání skutečné hodnoty a pochopení. Velká data mohou organizacím pomoci využít velké objemy dat a získat nahlédnutí do chování zákazníků, událostí, trendů, předpovědí atd. To není možné s datovým snímkem, který zachycuje pouze část celého objemu dat zpracovávaných ve velkých datech. V důsledku toho se společnosti stále více soustředí na všechny typy dat pocházejících ze všech možných cest / obchodních jednotek, aby pochopily správný vzorec.

Vyhodnoťte všechny modely infrastruktury pro implementaci velkých dat

Objem dat a jeho správa je hlavním problémem jakékoli iniciativy s velkými daty. Protože velká data se zabývají petabyty dat, jediným řešením je správa dat pomocí datových center. Současně je třeba před výběrem a dokončením jakéhokoli skladovacího zařízení vzít v úvahu nákladovou složku. Cloudové služby jsou často nejlepší volbou, ale služby různých cloudových prostředí musí být vyhodnoceny, aby se určilo vhodné. Protože úložiště je jednou z nejdůležitějších součástí jakékoli implementace velkých dat, je to faktor, který by měl být v každé velké datové iniciativě vyhodnocen velmi pečlivě. (Získejte další perspektivu v dnešních velkých datových výzvách pramenících z rozmanitosti, nikoli objemu nebo rychlosti.)

Při plánování velkých dat zvažte tradiční zdroje dat

Existují různé zdroje velkých dat a počet zdrojů se každým dnem také zvyšuje. Tento obrovský objem dat se používá jako vstup pro zpracování velkých dat. V důsledku toho si některé společnosti myslí, že tradiční zdroje dat jsou k ničemu. To není pravda, protože tato tradiční data jsou kritickou součástí úspěchu jakéhokoli velkého datového příběhu. Tradiční data obsahují cenné informace, takže by se měla používat ve spojení s jinými velkými zdroji dat. Skutečnou hodnotu velkých dat lze odvodit, pouze pokud jsou brány v úvahu všechny zdroje dat (tradiční i netradiční). (Další informace naleznete v tématu Vezměte to, velká data! Proč mohou malá data zabalit větší úder)

Zvažte konzistentní soubor dat

V prostředí velkých dat pocházejí data z různých zdrojů. Formát, struktura a typy dat se v jednotlivých zdrojích liší. Nejdůležitější část je, že data nejsou očištěna, pokud jde o vaše velké datové prostředí. Než tedy důvěřujete příchozím datům, je třeba zkontrolovat konzistenci opakovaným pozorováním a analýzou. Jakmile je konzistence dat potvrzena, lze s nimi zacházet jako s konzistentní sadou metadat. Nalezení konzistentní sady metadat pečlivým pozorováním vzoru je nezbytným úkolem při plánování velkých dat.

Distribuujte data

Při zvažování prostředí pro zpracování je objem dat velkým problémem. Kvůli velkému objemu dat, se kterými velká data naráží, není zpracování na jednom serveru možné. Řešením je prostředí Hadoop, což je distribuované výpočetní prostředí, které běží na komoditním hardwaru. Poskytuje sílu rychlejšího zpracování na více uzlech. (Další informace o 7 věcech o Hadoopu.)

Nespoléhejte se na jediný přístup založený na velké analýze dat

Na trhu jsou k dispozici různé technologie pro zpracování velkých dat. Základem všech velkých datových technologií jsou Apache Hadoop a MapReduce. Proto je důležité vyhodnotit správnou technologii pro správný účel. Některé z důležitých analytických přístupů jsou prediktivní analytika, preskriptivní analytika, analytika, analýza datových proudů atd. Výběr vhodné metody / přístupu je důležitý pro dosažení požadovaného cíle. Je nejlepší vyhnout se spoléhání na jediný přístup, ale prozkoumat různé přístupy a vybrat perfektní shodu pro vaše řešení.

Než začnete, nezačínejte iniciativu velkých dat

Pro každou iniciativu s velkým objemem dat se vždy doporučuje začít malými kroky. Začněte tedy s pilotními projekty, abyste získali odborné znalosti, a poté se pusťte do skutečné implementace. Potenciál velkých dat je velmi působivý, ale skutečné hodnoty lze dosáhnout pouze tehdy, když snížíme počet chyb a získáme více odborných znalostí.

Nepoužívejte data izolovaně

Velké zdroje dat jsou rozptýleny kolem nás a každým dnem rostou. Pro získání správného analytického výstupu je důležité všechna tato data integrovat. Na trhu jsou k dispozici různé nástroje pro integraci dat, ale měly by být před použitím řádně vyhodnoceny. Integrace velkých dat je složitý úkol, protože data z různých zdrojů mají různý formát, ale je velmi důležité získat dobrý analytický výsledek.

Nevšímejte si zabezpečení dat

Bezpečnost dat je hlavním aspektem plánování velkých dat. Zpočátku (před provedením jakéhokoli zpracování) jsou data v petabajtech, takže zabezpečení není přísně implementováno. Ale po nějakém zpracování dostanete podmnožinu dat, která poskytuje určitý přehled. V tomto okamžiku se stává nezbytná bezpečnost dat. Čím více jsou data zpracovávána a vyladěna, tím cennější je pro organizaci často. Tato jemně vyladěná výstupní data jsou duševním vlastnictvím a musí být zabezpečena. Zabezpečení dat musí být implementováno jako součást životního cyklu velkých dat.

Nezanedbávejte výkonovou část analýzy velkých dat

Výstup analýzy velkých dat je užitečný pouze tehdy, poskytuje-li dobrý výkon. Velká data nabízejí více poznatků na základě zpracování velkého množství dat vyšší rychlostí. Proto je nezbytné jej efektivně a efektivně řídit. Pokud výkon velkých dat nebude řádně spravován, způsobí to problémy a celé úsilí zmizí.

V naší diskusi jsme se zaměřili na dos a dary velkých datových iniciativ. Velká data jsou nově se rozvíjející oblastí a pokud jde o implementaci, mnoho společností je stále ve fázi plánování. Je nezbytné porozumět osvědčeným postupům pro velká data, aby se minimalizovalo riziko a chyby. Body diskuse byly odvozeny ze zkušeností se skutečným projektem, takže budou uvedeny některé pokyny pro úspěšné provedení velké datové strategie.