Dnešní Big Data Challenge pramení z rozmanitosti, nikoli objemu nebo rychlosti

Autor: Judy Howell
Datum Vytvoření: 28 Červenec 2021
Datum Aktualizace: 1 Červenec 2024
Anonim
Dnešní Big Data Challenge pramení z rozmanitosti, nikoli objemu nebo rychlosti - Technologie
Dnešní Big Data Challenge pramení z rozmanitosti, nikoli objemu nebo rychlosti - Technologie

Obsah


Odnést:

Příliš mnoho IT oddělení hází všechno, co mají, v otázkách objemu a rychlosti dat, zapomíná řešit základní problém rozmanitosti dat.

Podle Doug Laney, viceprezidenta pro výzkum v Gartneru, výzva správy a využití velkých dat pochází ze tří prvků. Laney poprvé poznamenal před více než deseti lety, že velká data představují pro podnik takový problém, protože zavádí obtížně spravovatelný objem, rychlost a rozmanitost. Problém spočívá v tom, že příliš mnoho IT oddělení hází všechno, co mají, v otázkách objemu a rychlosti dat a zapomíná řešit základní problém rozmanitosti dat.

V roce 2001 Laney napsal, že „přední podniky budou stále více používat centralizovaný datový sklad k definování společného obchodního slovníku, který zlepšuje interní a externí spolupráci.“ Otázka této slovní zásoby - a variabilita, která brání společnostem v jejím vytváření - zůstává dnes nejméně osloveným aspektem velkého datového hlavolamu. (Podívejte se, co říkají jiní odborníci. Podívejte se na odborníky na velká data, která byste měli sledovat.)


Tři Vs velkých dat

Řada podniků našla metody, jak využít zvýšený objem a rychlost dat. například dokáže analyzovat obrovské objemy dat. Tato data jsou samozřejmě často předkládána znovu a znovu ve stejných parametrech. To vedlo k technologickým inovacím, jako jsou sloupcové databáze, které jsou dnes široce využívány jinými společnostmi, které čelí stejně velkým obchodům s podobnými datovými položkami.

Pokud jde o rychlost zkrocení, prodejci jako Splunk pomáhají podnikům analyzovat rychle vytvořená data prostřednictvím souborů protokolu, které zachycují několik tisíc událostí za sekundu. Tato analýza velkoobjemových událostí je zaměřena na případy použití monitorování bezpečnosti a výkonu. Stejně jako v případě problému s objemem dat se výzva týkající se rychlosti z velké části řeší pomocí sofistikovaných technik indexování a analýzy distribuovaných dat, které umožňují škálovatelnost kapacity zpracování se zvýšením rychlosti dat.


Pokud jde o rozmanitost, příliš mnoho podniků však stále čelí velkému problému v přístupu k analýze velkých dat. Tento problém je způsoben třemi faktory: Zaprvé, díky růstu, akvizicím a technologickým inovacím, které přidávají nové systémy do životního prostředí, jsou podniky uzamčeny ve vysoce heterogenním prostředí a tato heterogenita se časem zvyšuje. Podniky musí sledovat celou řadu typů systémů a spravovat desítky tisíc datových typů a stejná data, která jsou zastoupena pomocí různých nomenklatur a formátů.

Za druhé, tyto systémy a typy dat v mnoha případech uvádějí jak relevantní informace, tak informace, které lze bezpečně odfiltrovat jako irelevantní pro řešený problém. Je třeba spolehlivě identifikovat vlivné informace.

Třetí dimenzí odrůdy je neustálá variabilita nebo změna prostředí. Systémy jsou upgradovány, jsou zavedeny nové systémy, přidány nové datové typy a zavedena nová nomenklatura. To ještě více deformuje naši schopnost skrýt výzvu rozmanitosti dat. To přidá další vrstvu k rozmanitosti výzvu. (Chcete-li získat podrobnější informace, podívejte se na Big Data: Jak je zachyceno, rozdrceno a zvyknuto na obchodní rozhodnutí.)

Řešení problému rozmanitosti dat

Pro řešení problému rozmanitosti dat musí podniky začít s IT doménou, protože často představuje nejhorší pachatele i nejhorší oběti problému rozmanitosti. Prvním krokem je začít ucelenou definicí nebo taxonomií všech IT prvků nebo aktiv. Toto poskytuje základní linii nebo základ pro odkazování na cokoli v IT nebo o IT a umožňuje podnikům zvládat rostoucí heterogenitu proti známé taxonomii nebo terminologii.

Žádné chyby, žádný stres - Váš průvodce krok za krokem k vytváření softwaru pro změnu života, aniž by došlo ke zničení vašeho života

Nemůžete zlepšit své programovací schopnosti, když se nikdo nestará o kvalitu softwaru.

Dalším krokem je identifikace četných způsobů, jak je stejný objekt zastoupen napříč různými systémy záznamu. To umožňuje IT profesionálům prohlížet si jejich heterogenní prostředí a vysoce filtrovat a komprimovat data do relevantních a spravovatelných bloků.

A konečně, IT manažeři musí přijmout proces neustálého zkoumání prostředí pro změny, jako jsou nové typy zavedených prvků nebo nová nomenklatura, které odkazují na stejný prvek.

Díky těmto krokům mohou IT organizace zvládnout rozmanitost problému a odvodit hluboké poznatky, které historicky unikly týmům IT. Navíc zvládnutí problému rozmanitosti výrazně zvyšuje jejich návratnost investic do nástrojů a technik, které řeší tradiční problémy s objemem a rychlostí velkých dat.