박경태
[Python] 강화학습 예제, CartPole-v1 행동 이후의 관찰값 확인