https://github.com/ParkGyeongTae/dqn-atari-breakout/tree/main/1_cartpole-v1-example
## 사용방법
### Step 1) 아나콘다 가상환경 만들기
- conda create -n py37 python=3.7
### Step 2) 가상환경 접속
- conda activate py37
### Step 3) 라이브러리 설치
- pip install gym==0.23.1
- pip install pygame==2.1.2
8_cartpole-v1-step-single.py
import gym
env = gym.make('CartPole-v1')
max_time_step = 10
action = 0
# action = 1
env.reset()
for time_step in range(max_time_step):
env.render()
observation, reward, done, info = env.step(action)
print(observation, done)
if done:
print("Max Time Step : ", time_step + 1)
break
env.close()
python 8_cartpole-v1-step-single.py
'''
import gym
env = gym.make('CartPole-v1')
# 에피소드 실행
env.reset()
# 10 timestep을 실행
for i in range(10):
# GUI로 현재 진행상황을 출력
env.render()
# 카트를 왼쪽으로만 밀었을 때
observation, reward, done, info = env.step(0)
# 카트를 오른쪽으로만 밀었을 때
# observation, reward, done, info = env.step(1)
print(observation, done)
# 정상 범위를 벗어나면 done = True 다.
if done:
break
env.close()
# 결과
# [-0.02204866 -0.19100833 -0.00498798 0.24236873] False
# [-2.5868827e-02 -3.8605869e-01 -1.4060331e-04 5.3347415e-01] False
# [-0.03359 -0.58117867 0.01052888 0.82611275] False
# [-0.04521357 -0.776443 0.02705114 1.1220884 ] False
# [-0.06074243 -0.97190905 0.04949291 1.4231323 ] False
# [-0.08018062 -1.1676068 0.07795555 1.7308645 ] False
# [-0.10353275 -1.3635277 0.11257284 2.046749 ] False
# [-0.1308033 -1.5596104 0.15350783 2.372038 ] False
# [-0.16199552 -1.7557245 0.20094858 2.7077043 ] False
# [-0.19711 -1.9516525 0.25510266 3.0543644 ] True
'''
'Programming Language > Python' 카테고리의 다른 글
[Python] No module named 'gym' 해결방법 (0) | 2022.04.23 |
---|---|
[Python] 강화학습, CartPole-v1 기울기값에 따른 행동 변화 (0) | 2022.04.23 |
[Python] 강화학습 예제, CartPole-v1 행동 이후의 관찰값 확인 (0) | 2022.04.22 |
[Python] 강화학습 예제, CartPole-v1 게임 조건 확인하기 (0) | 2022.04.22 |
[Python] 강화학습 예제, CartPole-v1 에피소드(episode) 경험해보기 (0) | 2022.04.22 |