AI / Machine Learningproces

kształtowanie nagrody

Modyfikacja sygnału nagrody przez dodanie pomocniczych składników, przyspieszająca uczenie bez zmiany optymalnej polityki przy zachowaniu niezmienniczości.

Typ
proces
Pojęcie nadrzędne
technika projektowania nagrody
Źródło
Ng i in., Policy invariance under reward transformations, ICML 1999

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja