인공지능 기반 강화학습 모델 구축

교육과정AI 아카데미머신러닝

일수/시간	4일 / 32시간 (09:00~18:00)	강사	한컴아카데미전문강사
과정매니저	정승호 (031-622-7684)
교육비	990,000원 (VAT포함)
실습장비	python
정원	20명

전체 교육일정

교육일정	신청마감일	수강신청	교육장소
2025.10.13(월) ~ 2025.10.16(목)			분당교육센터

과정개요

알파고의 토대가 된 강화학습 알고리즘에 대해 이론과 실습을 병행하는 과정입니다. 강화학습이 동작하는 기본 원리부터 일반적인 강화학습으로 풀기 어려운 문제에 대해 좋은 결과를 보여주는 최신 기술까지 살펴봅니다. 전체 수업을 체계적인 순서에 따라 진행하기 때문에, 과정 종료 후 일차별 및 시간별 복습을 통해 부족했던 부분을 채울 수 있습니다.

교육목적

- 강화학습 기초 이론에 대해 이해하고 이를 코드로 구현한다.

- 심화 이론 및 최신 이론에 대해 이해하고 설명한다.

- 주어진 문제에 대해 강화학습 알고리즘 적용을 통한 해결방안을 제시한다.

교육대상

- 딥러닝을 수강하고 딥러닝으로 좀 더 유의미한 모델을 개발하고 싶은 분

- 강화학습의 원리를 이해하고 싶은 개발자

- 인공지능 기술을 현업에 적용하기 위한 연구를 진행 중인 개발자

교육효과

- 강화학습에 관한 기초이론과 심화이론, 최신이론을 이해하여 알고리즘 적용을 통한 해결방안을 제시할 수 있습니다.

교육내용

구분	목차	세부목차
1일차	- 강화학습 입문	- 강화학습 개요 및 개발 환경 구축 - 전체 프로세스 및 핵심 용어 정리(행동, 상태, 보상, 할인, 에이전트) - MDP(Marcov Decision Process), 벨만 방정식 알고리즘 - Multi-Armed Bandit 문제 해결
2일차	- 강화학습 기초	- Q-Learning 알고리즘 정리 및 모델 구축 - Discounted, Soochastic 이론 적용을 통한 모델 업그레이드 - Custom Map 추가를 통한 New World 생성 - Q-Network 모델을 적용한 CartPole 프로젝트
3일차	- 강화학습 활용	- Deep Q-Network 이론 적용을 통한 모델 업그레이드 - Policy Gradient 알고리즘 정리 - 오락실 게임 연동을 위한 ATARI 모듈 설치 - DQN 알고리즘을 적용한 Packman 프로젝트
4일차	- 강화학습 심화	- Actor-Critic 소개 및 알고리즘 - 가치기반 강화학습과 정책 경사의 만남 - A2C, A3C - DDPG, SAC, TAC