The concept of criticality in reinforcement learning

Yitzhak Spielberg, Amos Azaria

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

5 ציטוטים ‏(Scopus)

תקציר

This paper introduces a novel idea in human-aided reinforcement learning - the concept of criticality. The criticality of a state indicates how much the choice of action in that particular state influences the expected return. In order to develop an intuition for the concept, we present examples of plausible criticality functions in multiple environments. Furthermore, we formulate a practical application of criticality in reinforcement learning: The criticality-based varying stepnumber algorithm (CVS) - a flexible stepnumber algorithm that utilizes the criticality function, provided by a human, in order to avoid the problem of choosing an appropriate stepnumber in n-step algorithms such as n-step SARSA and n-step Tree Backup. We present experiments in the Atari Pong environment demonstrating that CVS is able to outperform popular learning algorithms such as Deep Q-Learning and Monte Carlo.

שפה מקוריתאנגלית
כותר פרסום המארחProceedings - IEEE 31st International Conference on Tools with Artificial Intelligence, ICTAI 2019
מוציא לאורIEEE Computer Society
עמודים251-258
מספר עמודים8
מסת"ב (אלקטרוני)9781728137988
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - נוב׳ 2019
אירוע31st IEEE International Conference on Tools with Artificial Intelligence, ICTAI 2019 - Portland, ארצות הברית
משך הזמן: 4 נוב׳ 20196 נוב׳ 2019

סדרות פרסומים

שםProceedings - International Conference on Tools with Artificial Intelligence, ICTAI
כרך2019-November
ISSN (מודפס)1082-3409

כנס

כנס31st IEEE International Conference on Tools with Artificial Intelligence, ICTAI 2019
מדינה/אזורארצות הברית
עירPortland
תקופה4/11/196/11/19

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'The concept of criticality in reinforcement learning'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי