Čištění dat

Autor: Louise Ward
Datum Vytvoření: 11 Únor 2021
Datum Aktualizace: 17 Smět 2024
Anonim
Čištění dat - Technologie
Čištění dat - Technologie

Obsah

Definice - Co znamená Scrubování dat?

Čištění dat se týká postupu úpravy nebo odstranění neúplných, nesprávných, nesprávně formátovaných nebo opakovaných dat v databázi. Klíčovým cílem čištění dat je zpřesnit a konzistentní data.


Čištění dat je zásadní strategií pro zajištění toho, aby databáze zůstaly přesné. Je to zvláště důležité v odvětvích náročných na údaje, včetně telekomunikací, pojišťovnictví, bankovnictví a maloobchodu. Dělení dat systematicky vyhodnocuje data na chyby nebo chyby pomocí vyhledávacích tabulek, pravidel a algoritmů.

Čištění dat je také označováno jako čištění dat.

Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje čištění dat

Chyby databáze jsou běžné a mohou pocházet z následujících:
  • Lidské chyby při zadávání údajů
  • Sloučení databáze
  • Absence datových standardů pro celé odvětví nebo společnosti
  • Systémy ve věku, které obsahují zastaralá data
V minulosti bylo čištění dat prováděno ručně. To nejenže zvýšilo čas potřebný k dokončení procesu, ale také proces mnohem dražší a náchylnější k chybám. To vedlo k vytvoření účinných nástrojů pro čištění dat, které systematicky vyhodnocují údaje o vadách, které nebylo možné identifikovat v procesu ručního čištění.

Obecně se nástroj pro čištění databáze skládá z řešení, která jsou ideální pro opravu několika specifických druhů chyb, jako je nalezení duplicitních záznamů nebo nahrazení chybějících PSČ. Sloučení chybných nebo poškozených dat je nejsložitějším problémem. Je to dokonce popsáno jako problém „špinavých dat“, protože každý rok stojí organizace miliony dolarů. Tento jev se zvyšuje se zavedením složitějších obchodních prostředí s více systémy a daty. Dočasné čištění dat pomáhá organizacím řešit tyto problémy poskytováním výkonných nástrojů pro čištění dat k identifikaci a odstranění nedostatků dat.