Předběžné zpracování dat

Autor: Louise Ward
Datum Vytvoření: 11 Únor 2021
Datum Aktualizace: 17 Smět 2024
Anonim
Předběžné zpracování dat - Technologie
Předběžné zpracování dat - Technologie

Obsah

Definice - Co znamená předzpracování dat?

Předzpracování dat je technika dolování dat, která zahrnuje transformaci prvotních dat do srozumitelného formátu. Data v reálném světě jsou často neúplná, nekonzistentní a / nebo chybí určitá chování nebo trendy a pravděpodobně obsahují mnoho chyb. Předzpracování dat je osvědčenou metodou řešení takových problémů. Předběžné zpracování dat připraví nezpracovaná data pro další zpracování.

Předzpracování dat jsou používány databázové aplikace, jako je řízení vztahů se zákazníky a aplikace založené na pravidlech (jako jsou neuronové sítě).


Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje předběžné zpracování dat

Během předzpracování data procházejí řadou kroků:

  • Čištění dat: Data jsou čištěna procesy, jako je vyplnění chybějících hodnot, vyhlazení hlučných dat nebo vyřešení nesrovnalostí v datech.
  • Integrace dat: Data s různými reprezentacemi jsou spojena a konflikty v datech jsou vyřešeny.
  • Transformace dat: Data jsou normalizována, agregována a generalizována.
  • Redukce dat: Cílem tohoto kroku je představit sníženou reprezentaci dat v datovém skladu.
  • Diskrétizace dat: Zahrnuje snížení počtu hodnot spojitého atributu dělením rozsahu intervalů atributů.