RLHF
Reinforcement Learning from Human Feedback
Uczenie ze wzmocnieniem na podstawie preferencji ludzi — dostrajanie modelu tak, by jego wyjścia maksymalizowały nagrodę odzwierciedlającą oceny człowieka.
- Typ
- proces
- Pojęcie nadrzędne
- uczenie ze wzmocnieniem
- Kategoria
- AI / Machine Learning · Modele generatywne i LLM
- Źródło
- Christiano et al., Deep RL from Human Preferences, 2017
Zobacz też
Powiązane pojęcia · AI / ML / DL / NLP
Zgodność deklarowanych prawdopodobieństw modelu z empiryczną częstością zdarzeń; dobrze skalibrowany model ma trafne oceny pewności.
czułośćUdział poprawnie wykrytych przypadków pozytywnych wśród wszystkich rzeczywistych pozytywów; mierzy zdolność wykrywania klasy docelowej.
miara F1Średnia harmoniczna precyzji i czułości, łącząca obie w jedną wartość; szczególny przypadek miary F dla równej wagi.
precyzjaUdział poprawnych wskazań klasy pozytywnej wśród wszystkich wskazań tej klasy; mierzy frakcję trafnych spośród przewidzianych pozytywów.
AUCPole pod krzywą ROC; prawdopodobieństwo, że losowy pozytyw otrzyma wyższą ocenę niż losowy negatyw, miara separowalności klas.
krzywa ROCWykres odsetka trafień względem odsetka fałszywych alarmów przy zmiennym progu decyzyjnym klasyfikatora binarnego.
Chcesz wykorzystać AI w swojej firmie?
Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.
Bezpłatna konsultacja