Зарежда Събития
Това събитие е минало събитие.

Следващото заседание на семинара “Алгебра и логика” ще се проведе на 29 ноември 2019 г. (петък) от 13:00 часа в зала 578 на ИМИ – БАН.

Доклад на тема

ЗА ДА НАМЕРИМ МОДЕЛ, ТРЯБВА ДА СЕ ОТКАЖЕМ ОТ СЪВЪРШЕНСТВОТО

ще изнесе Димитър ДОБРЕВ.

Поканват се всички желаещи.

От секция „Алгебра и логика” на ИМИ – БАН

Резюме.

При Reinforcement Learning предполагаме, че съществува модел на света. Предполагаме, че този модел е съвършен (тоест, че описва света напълно и еднозначно). В тази статия ще покажем, че няма смисъл да търсим съвършения модел, защото този модел е твърде сложен и на практика не може да бъде намерен. Ще покажем, че трябва да се откажем от съвършенството и вместо това да търсим event-driven модели. Тези модели са обобщение на Markov decision process (MDP) моделите. Това обобщение е много важно, защото без него нищо не може да бъде намерено. Вместо един съвършен MDP модел, ние ще търсим голям брой простички event-driven модели, всеки от които описва някаква проста зависимост или свойство. Тоест, ще заменим търсенето на един сложен съвършен модел с търсенето на голям брой прости модели.

Линк към статията, която съдържа доклада: http://dobrev.com/AI/Perfection_bg.pdf