OpenAI усовершенствовала метод машинного обучения, основанный на любопытстве

Команда OpenAI опубликовала результаты исследования машинного обучения с подкреплением, основанного на вознаграждении за правильные предсказания. Учёные представили метод тренировки ИИ-агентов RND (Random Network Distillation). При сохранении современн…