Open-Source analýza velkých dat

Autor: Laura McKinney
Datum Vytvoření: 1 Duben 2021
Datum Aktualizace: 14 Smět 2024
Anonim
Open-Source analýza velkých dat - Technologie
Open-Source analýza velkých dat - Technologie

Obsah

Definice - Co znamená Open-Source Big Data Analytics?

Open-source analýza velkých dat se týká použití open-source softwaru a nástrojů pro analýzu velkého množství dat za účelem shromažďování relevantních a použitelných informací, které může organizace použít k dosažení svých obchodních cílů. Největším hráčem v open-source analytice velkých dat je Apaches Hadoop - je to nejpoužívanější softwarová knihovna pro zpracování obrovských datových souborů v klastru počítačů pomocí distribuovaného procesu pro paralelismus.


Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje open-source analýzu velkých dat

Open-source analýza velkých dat využívá open-source software a nástroje k provádění analýzy velkých dat pomocí celé softwarové platformy nebo různých open-source nástrojů pro různé úkoly v procesu analýzy dat. Apache Hadoop je nejznámější systém pro analýzu velkých dat, ale před sestavením skutečného analytického systému jsou nutné další komponenty.

Hadoop je open-source implementace algoritmu MapReduce propagovaného společností Google a Yahoo, takže je základem většiny analytických systémů dnes. Mnoho velkých datových analytických nástrojů využívá otevřený zdroj, včetně robustních databázových systémů, jako je open-source MongoDB, sofistikovaná a škálovatelná databáze NoSQL, která je velmi vhodná pro aplikace velkých dat, stejně jako další.


Služby open-source analýzy velkých dat zahrnují:

  • Systém sběru dat
  • Řídicí středisko pro správu a monitorování klastrů
  • Knihovna strojového učení a těžby dat
  • Služba koordinace aplikací
  • Vypočítejte motor
  • Rámec provádění