The concept of criticality in reinforcement learning

Yitzhak Spielberg, Amos Azaria

نتاج البحث: فصل من :كتاب / تقرير / مؤتمرمنشور من مؤتمرمراجعة النظراء

5 اقتباسات (Scopus)

ملخص

This paper introduces a novel idea in human-aided reinforcement learning - the concept of criticality. The criticality of a state indicates how much the choice of action in that particular state influences the expected return. In order to develop an intuition for the concept, we present examples of plausible criticality functions in multiple environments. Furthermore, we formulate a practical application of criticality in reinforcement learning: The criticality-based varying stepnumber algorithm (CVS) - a flexible stepnumber algorithm that utilizes the criticality function, provided by a human, in order to avoid the problem of choosing an appropriate stepnumber in n-step algorithms such as n-step SARSA and n-step Tree Backup. We present experiments in the Atari Pong environment demonstrating that CVS is able to outperform popular learning algorithms such as Deep Q-Learning and Monte Carlo.

اللغة الأصليةالإنجليزيّة
عنوان منشور المضيفProceedings - IEEE 31st International Conference on Tools with Artificial Intelligence, ICTAI 2019
ناشرIEEE Computer Society
الصفحات251-258
عدد الصفحات8
رقم المعيار الدولي للكتب (الإلكتروني)9781728137988
المعرِّفات الرقمية للأشياء
حالة النشرنُشِر - نوفمبر 2019
الحدث31st IEEE International Conference on Tools with Artificial Intelligence, ICTAI 2019 - Portland, الولايات المتّحدة
المدة: ٤ نوفمبر ٢٠١٩٦ نوفمبر ٢٠١٩

سلسلة المنشورات

الاسمProceedings - International Conference on Tools with Artificial Intelligence, ICTAI
مستوى الصوت2019-November
رقم المعيار الدولي للدوريات (المطبوع)1082-3409

!!Conference

!!Conference31st IEEE International Conference on Tools with Artificial Intelligence, ICTAI 2019
الدولة/الإقليمالولايات المتّحدة
المدينةPortland
المدة٤/١١/١٩٦/١١/١٩

بصمة

أدرس بدقة موضوعات البحث “The concept of criticality in reinforcement learning'. فهما يشكلان معًا بصمة فريدة.

قم بذكر هذا