Hadoop Ekosystém

Autor: Roger Morrison
Datum Vytvoření: 18 Září 2021
Datum Aktualizace: 19 Červen 2024
Anonim
Hadoop Ekosystém - Technologie
Hadoop Ekosystém - Technologie

Obsah

Definice - Co znamená ekosystém Hadoop?

Ekosystém Hadoop odkazuje na různé komponenty softwarové knihovny Hacheop Apache, na příslušenství a nástroje poskytované Apache Software Foundation pro tyto typy softwarových projektů a na způsoby, jak spolupracují.


Hadoop je Java-based framework, který je velmi populární pro zpracování a analýzu velkých souborů dat.

Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje Hadoop Ecosystem

Jak základní balíček Hadoop, tak jeho příslušenství, jsou většinou projekty s otevřeným zdrojovým kódem licencované společností Apache. Myšlenka ekosystému Hadoop zahrnuje použití různých částí základní sady Hadoop, jako je MapReduce, rámec pro zpracování obrovského množství dat a Hadoop Distributed File System (HDFS), sofistikovaný systém zpracování souborů. Existuje také YARN, správce prostředků Hadoop.


Kromě těchto základních prvků společnosti Hadoop dodala společnost Apache také vývojářům další druhy doplňků nebo doplňkových nástrojů. Patří mezi ně Apache Hive, nástroj pro analýzu dat; Apache Spark, obecný motor pro zpracování velkých dat; Apache Pig, jazyk toku dat; HBase, databázový nástroj; a také Ambarl, který lze považovat za manažera ekosystému Hadoop, protože pomáhá společně spravovat používání těchto různých zdrojů Apache. Díky tomu, že se Hadoop stal de facto standardem pro sběr dat a stal se všudypřítomný v mnoha organizacích, se manažeři a vývojoví vedoucí dozvědí vše o ekosystému Hadoop a o tom, jaké věci se podílejí na obecném nastavení Hadoopu.