교육

ACADEMIC

대학원과정

교육

ACADEMIC

대학원과정

대학원과정

강화학습이론

과목코드
주요연구
학점
과목구분
EE619
Computer
3
선택(석/박사)

불확실성을 가지는 대규모 동적시스템의 연속의사결정 이론과 이 문제의 복잡성과 불확실성을 극복하기 위한 학습이론을 다룬다. 이 문제는 전자공학 분야의 제어이론, 경제학/OR 분야의 의사결정이론, 통계학 분야의 학습이론의 융합문제로서 최근 AI 분야의 강화학습 문제로 발전해왔다. 본 강의는 강화학습 알고리즘의 실제 응용 보다는 그 수학적 근간, 알고리즘 수렴성 및 수렴속도, 최적성, 계산복잡도, 샘플효용성 등을 수학적인 툴을 가지고 엄밀히 탐구하며 다양한 강화학습 변종 알고리즘들이 지니는 수학적 특성 및 장단점을 분석한다.

 

권장과목