Analýza hlavních komponent (PCA)

Autor: Roger Morrison
Datum Vytvoření: 22 Září 2021
Datum Aktualizace: 19 Červen 2024
Anonim
Analýza hlavních komponent (PCA) - Technologie
Analýza hlavních komponent (PCA) - Technologie

Obsah

Definice - Co znamená analýza hlavních komponent (PCA)?

Analýza hlavních komponent (PCA) je technika používaná k identifikaci menšího počtu nekorelovaných proměnných známých jako hlavní komponenty z větší sady dat. Tato technika se široce používá k zdůraznění variace a zachycení silných vzorců v sadě dat. Vynalezený Karlem Pearsonem v roce 1901, analýza hlavních komponent je nástroj používaný v prediktivních modelech a analýzách průzkumných dat. Analýza hlavních komponent je považována za užitečnou statistickou metodu a používá se v takových oblastech, jako je komprese obrazu, rozpoznávání obličeje, neurověda a počítačová grafika.


Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje analýzu hlavních komponent (PCA)

Hlavní analýza součástí pomáhá usnadnit vyhledávání a vizualizaci dat. Je to jednoduchá neparametrická technika pro extrahování informací ze složitých a matoucí datových sad. Analýza hlavních komponent je zaměřena na maximální rozptyl s nejmenším počtem hlavních složek. Jednou z výrazných výhod spojených s analýzou hlavních komponent je, že jakmile jsou v příslušných datech nalezeny vzory, je podporována také komprese dat. Jeden používá analýzu hlavních komponent k eliminaci počtu proměnných nebo v případě příliš velkého množství prediktorů ve srovnání s počtem pozorování nebo k vyhnutí se vícečetnosti. Je úzce spjata s kanonickou korelační analýzou a využívá ortogonální transformace, aby se převedla sada pozorování obsahujících korelované proměnné do sady hodnot známých jako hlavní složky. Počet hlavních složek použitých v analýze hlavních složek je menší nebo roven menšímu počtu pozorování. Analýza hlavních komponent je citlivá na relativní škálování původně používaných proměnných.


Analýza hlavních složek je široce používána v mnoha oblastech, jako je průzkum trhu, sociální vědy a v průmyslových odvětvích, kde se používají velké soubory dat. Tato technika může také pomoci při poskytování zmenšeného obrazu původních dat. V případě analýzy hlavních komponent je zapotřebí jen minimální úsilí, aby se složitý a matoucí soubor dat zmírnil na zjednodušenou sadu užitečných informací.