Jak mohou společnosti používat náhodné lesní modely pro předpovědi?

Obsah

Q:

A:

Společnosti často používají náhodné lesní modely k vytváření předpovědí s procesy strojového učení. Náhodný les používá více rozhodovacích stromů k provedení holističtější analýzy daného souboru dat.

Jeden rozhodovací strom pracuje na základě oddělení určité proměnné nebo proměnných podle binárního procesu. Například při posuzování datových souborů vztahujících se k sadě automobilů nebo vozidel může jediný rozhodovací strom třídit a třídit každé jednotlivé vozidlo podle hmotnosti a rozdělit je na těžká nebo lehká vozidla.

Náhodný les vychází z modelu stromu rozhodování a činí ho sofistikovanějším. Odborníci hovoří o náhodných lesích jako o „stochastické diskriminaci“ nebo „stochastické hádání“ na datech aplikovaných na vícerozměrné prostory. Stochastická diskriminace bývá způsobem, jak zlepšit analýzu datových modelů nad rámec toho, co může udělat jediný rozhodovací strom.

V podstatě náhodná doménová struktura vytváří mnoho individuálních rozhodovacích stromů pracujících na důležitých proměnných s použitím určité datové sady. Jedním z klíčových faktorů je to, že v náhodné struktuře se sada dat a analýza proměnných každého stromu rozhodování obvykle překrývají. To je důležité pro model, protože náhodný lesní model bere průměrné výsledky pro každý strom rozhodování a promítá je do váženého rozhodnutí. Analýza v podstatě bere všechny hlasy různých rozhodovacích stromů a vytváří konsenzus, který nabízí produktivní a logické výsledky.

Jeden příklad produktivního použití náhodného lesního algoritmu je k dispozici na webu R-blogger, kde spisovatel Teja Kodali bere příklad určování kvality vína pomocí faktorů, jako je kyselost, cukr, hladiny oxidu siřičitého, hodnota pH a obsah alkoholu. Kodali vysvětluje, jak algoritmus náhodných doménových struktur používá malou náhodnou podmnožinu funkcí pro každý jednotlivý strom, a pak využívá výsledné průměry.

S ohledem na to podniky, které chtějí pro prediktivní modelování používat náhodné algoritmy strojového učení lesa, nejprve izolují prediktivní data, která je třeba převést do souboru produkcí, a poté je aplikují na model náhodného lesa s využitím určité sady školení. data. Algoritmy strojového učení berou tato tréninková data a pracují s nimi, aby se vyvinuly za omezení jejich původního programování. V případě náhodných lesních modelů se tato technologie učí vytvářet sofistikovanější prediktivní výsledky pomocí těchto jednotlivých rozhodovacích stromů k vytvoření svého náhodného lesního konsensu.

Jedním ze způsobů, jak to lze aplikovat na podnikání, je vzít různé proměnné vlastností produktu a použít náhodný les k označení potenciálního zájmu zákazníků. Například, pokud existují známé faktory zájmu zákazníků, jako je barva, velikost, trvanlivost, přenositelnost nebo cokoli jiného, o co zákazníci projevili zájem, mohou být tyto atributy vloženy do datových souborů a analyzovány na základě jejich vlastního jedinečného dopadu na multifaktor analýza.