박경태
[Python] 강화학습 예제, CartPole-v1 같은 행동 10번 반복 할 때 관찰값