AI / Machine Learningproces

uczenie poza polityką

Tryb uczenia, w którym agent ocenia lub ulepsza politykę docelową na podstawie danych zebranych przez inną politykę zachowania.

Typ
proces
Pojęcie nadrzędne
tryb uczenia ze wzmocnieniem
Źródło
Sutton, Barto, Reinforcement Learning: An Introduction, 2nd ed.

Zobacz też

uczenie zgodne z politykąQ-learning

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja