Nestrukturovaná těžba dat

Autor: Eugene Taylor
Datum Vytvoření: 13 Srpen 2021
Datum Aktualizace: 22 Červen 2024
Anonim
Nestrukturovaná těžba dat - Technologie
Nestrukturovaná těžba dat - Technologie

Obsah

Definice - Co znamená nestrukturovaná těžba dat?

Nestrukturovaná těžba dat je zvykem prohlížet relativně nestrukturovaná data a snažit se z nich získat podrobnější soubory dat. Často spočívá v extrakci dat ze zdrojů, které se tradičně nepoužívají pro činnosti v oblasti dolování dat.

Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje nestrukturovanou těžbu dat

Obecně platí, že dolování dat je praktikováním česání prostřednictvím datových sad a snahou získat jen ty nejcennější kousky informací do specifického formátu. To je obvykle obtížnější u relativně nestrukturovaných dat. IT odborníci definují nestrukturovaná data jako data, která nejsou ve specifickém formátu, data, která jsou „těžká“ nebo data „skrytá“ v nepřesných dokumentech, které nejsou formálně objednány k poskytnutí technických informací.

Příkladem nestrukturovaného dokumentu by byl dopis nebo korespondence mezi dvěma nebo více stranami. V případě nestrukturované těžby dat by technologie rozebíraly tento dopis a hledaly konkrétní identifikátory a kousky informací, jako jsou jména spřízněných stran, data zaslání dopisů, jména zúčastněných podniků, měny nebo jiné vyčíslení. kousky dat nebo kódy přiřazené konkrétním produktům, službám nebo obchodům. Tyto druhy dat jsou těženy a poté ukládány do formátu, který mohou podniky nebo jiné strany použít pro rychlou orientaci nebo pro vyvinuté aplikace business intelligence.