Как система наград и миллионов параметров лишают ботов свободы выбора
Разработчиками не позавидуешь, они не смогли создать модель, обучающуюся всему сама с нуля, поэтому пришлось заходить на территорию математики. Сначала задачи были лёгкими: встань на колёса, пни мяч туда, подержи на крыше, сделай двойной прыжок.