Posílení učení

Autor: Lewis Jackson
Datum Vytvoření: 11 Smět 2021
Datum Aktualizace: 15 Smět 2024
Anonim
Posílení učení - Technologie
Posílení učení - Technologie

Obsah

Definice - Co znamená Výztužné učení?

Učení zesílení v kontextu umělé inteligence je typem dynamického programování, které trénuje algoritmy pomocí systému odměňování a trestů.


Algoritmus posilování učení nebo agent se učí interakcí se svým prostředím. Agent dostává odměny správným provedením a pokuty za nesprávné provedení. Agent se učí bez zásahu člověka tím, že maximalizuje jeho odměnu a minimalizuje jeho trest.

Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje posilování učení

Učení zesílení je přístup ke strojovému učení, který je inspirován behavioristickou psychologií. Je to podobné tomu, jak se dítě učí provádět nový úkol. Učení zesílení kontrastuje s jinými přístupy strojového učení v tom, že algoritmu není výslovně řečeno, jak provést úkol, ale tento problém sám řeší.


Jako agent, kterým může být vůz s vlastním řízením nebo program hrající šachy, komunikuje se svým prostředím, dostává stav odměny v závislosti na tom, jak se chová, jako je bezpečná jízda do cíle nebo vyhrání hry. Naopak agent dostane pokutu za nesprávné provedení, jako je např. Vyjet z cesty nebo být mat.

Agent v průběhu času se rozhoduje maximalizovat svou odměnu a minimalizovat svůj trest pomocí dynamického programování. Výhodou tohoto přístupu k umělé inteligenci je to, že umožňuje programu AI se učit, aniž by programátor upřesnil, jak by agent měl úkol plnit.