Uid: 20231152

Name: Hyeon Jun Jin

“I will keep promises between the prof. Lee and I


HW7

Reinforcement Learning

cost 

week

42W

43W

44W

45W

46W

47W

demand

4

3

5

7

4

6

result

week

42W

43W

44W

45W

46W

47W

demand

4

3

5

7

4

6

x_i

2

3

6

6

4

6

s_i

2

0

0

1

0

0

Min cost  = 2765

solution

reinforcement learning의 한계점

  1. 실제 demand는 고정되어 있지 않고 시간에 따라 변화한다. 그러나 RL로 문제를 풀기 위해서는 미래에 대한 수요를 고정시킨 후 계산을 하게 되어 정확한 결과를 얻을 수 없다.
  2. 재고와 생산을 할 수 있는 범위가 제한되어 있다. 즉, 연속형 데이터이다.
  3. cost를 나타내는 변수가 2로만 표현되어 있지만 실제로는 더 많고 그렇게 되면 table로 표현되지 않는다.
  4. 비용에 관한 함수를 정확하게 계산할 수 없기 때문에 정확한 결과를 얻기 힘들다.
  5. table이 커지면 커질수록 계산량이 기하급수적으로 많아진다.

HW6

HW5

Max

HW4

Objective function

HW3

제품명: Elantra N

HW2

Objectives

Constraints

Result

 Coding