Q-učení

Autor: Roger Morrison
Datum Vytvoření: 24 Září 2021
Datum Aktualizace: 6 Smět 2024
Anonim
Q-učení - Technologie
Q-učení - Technologie

Obsah

Definice - Co znamená Q-learning?

Q-learning je termín pro strukturu algoritmu představující učení bez vyztužení bez modelu. Vyhodnocení politiky a použití stochastického modelování najde Q-learning nejlepší cestu vpřed v Markovově rozhodovacím procesu.


Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje Q-learning

Technické složení algoritmu Q-learning zahrnuje agenta, sadu stavů a ​​sadu akcí na stav.

Funkce Q používá váhy pro různé kroky ve spojení s diskontním faktorem, aby ocenil odměny.

I když se to může zdát jako jednoduchý nápad, Q-učení má zásadní význam v mnoha typech modelů posilování učení a hlubokého učení. Jedním z nejlepších příkladů je situace, kdy se hluboké Q-učení používá k tomu, aby pomohlo programům strojového učení se naučit strategie hraní her v různých typech videoher, například ve hrách Atari z 80. let. Zde konvoluční neuronová síť odebírá vzorky hraní her, aby vytvořila stochastický model, který pomůže počítači vědět, jak hrát hru v průběhu času lépe.


Q-learning má velký potenciál pro pomoc při rozvoji umělé inteligence a strojového učení.