Q-Learning
๊ฐํ ํ์ต(Reinforcement Learning)์์ ์ฌ์ฉํ๋ Q-Learning์ ๋ํด์ ์์ ๋ณด๊ณ Gym์์ ์ ๊ณตํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๊ณ ๋ฆฌ๋ฌ์ ๋ง๋ค์ด ๋ณด์.
๊ฐํ ํ์ต(Reinforcement Learning)์์ ์ฌ์ฉํ๋ Q-Learning์ ๋ํด์ ์์ ๋ณด๊ณ Gym์์ ์ ๊ณตํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๊ณ ๋ฆฌ๋ฌ์ ๋ง๋ค์ด ๋ณด์.
๊ฐํ ํ์ต(Reinforcement Learning)์์ ์ฌ์ฉํ๋ SARSA์ ๋ํด์ ์์ ๋ณด๊ณ Gym์์ ์ ๊ณตํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๊ณ ๋ฆฌ๋ฌ์ ๋ง๋ค์ด ๋ณด์.