NAME : JANG JAEHYEOK
UID : 20200999
“I keep the promises between Prof. and I”
HW7
R.L의 문제점
- 특정 환경에서는 잘 작동하지만, 새로운 환경이나 상황에 대한 일반화가 어렵다.
- 단순한 작업을 배우는 데에도 너무 많은 시도와 데이터가 필요하다. 즉, 샘플 효율성이 매우 떨어진다
- 대규모의 데이터와 시뮬레이션이 필요하기 때문에, 복잡한 문제에서는 수백만 번의 학습 시도가 필요해 시간이 오래 걸리고 계산 자원이 많이 요구된다.
- 현실에서는 학습 과정에서 실수나 실패가 큰 비용을 초래할 수 있다.
EX) 자율주행차가 학습 과정 중 사고를 일으키면 큰 피해
- 학습 과정이 불안정할 수 있으며, 학습이 끝나도 최적의 정책에 도달하지 못할 가능성이 존재한다.
HW6
HW5
Max
Hw4
Hw3