인공지능 기반 강화학습 모델 구축

홈으로교육과정AI 아카데미딥러닝

일수/시간 4일 / 32시간 (09:00~18:00) 강사 한컴아카데미전문강사
과정매니저  정승호 (031-622-7684)
교육비 990,000원 (VAT포함)
실습장비 python
정원 20명
전체 교육일정
교육일정 신청마감일 수강신청 교육장소
2023.12.18(월) ~ 2023.12.21(목) 신청하기 교육장소 분당교육센터
과정개요

알파고의 토대가 된 강화학습 알고리즘에 대해 이론과 실습을 병행하는 과정입니다. 강화학습이 동작하는 기본 원리부터 일반적인 강화학습으로 풀기 어려운 문제에 대해 좋은 결과를 보여주는 최신 기술까지 살펴봅니다. 전체 수업을 체계적인 순서에 따라 진행하기 때문에, 과정 종료 후 일차별 시간별 복습을 통해 부족했던 부분을 채울 수 있습니다.

교육목적

- 강화학습 기초 이론에 대해 이해하고 이를 코드로 구현한다.

- 심화 이론 및 최신 이론에 대해 이해하고 설명한다.

- 주어진 문제에 대해 강화학습 알고리즘 적용을 통한 해결방안을 제시한다.

교육대상

- 딥러닝을 수강하고 딥러닝으로 좀 더 유의미한 모델을 개발하고 싶은 분

- 강화학습의 원리를 이해하고 싶은 개발자

- 인공지능 기술을 현업에 적용하기 위한 연구를 진행 중인 개발자

교육효과

- 강화학습에 관한 기초이론과 심화이론, 최신이론을 이해하여 알고리즘 적용을 통한 해결방안을 제시할 수 있습니다.

교육내용

구분

목차

세부목차

1일차

- 강화학습 입문

- 강화학습 개요 및 개발 환경 구축

- 전체 프로세스 및 핵심 용어 정리(행동, 상태, 보상, 할인, 에이전트)

- MDP(Marcov Decision Process), 벨만 방정식 알고리즘

- Multi-Armed Bandit 문제 해결

2일차

- 강화학습 기초

- Q-Learning 알고리즘 정리 및 모델 구축

- Discounted, Soochastic 이론 적용을 통한 모델 업그레이드

- Custom Map 추가를 통한 New World 생성

- Q-Network 모델을 적용한 CartPole 프로젝트

3일차

- 강화학습 활용

- Deep Q-Network 이론 적용을 통한 모델 업그레이드

- Policy Gradient 알고리즘 정리

- 오락실 게임 연동을 위한 ATARI 모듈 설치

- DQN 알고리즘을 적용한 Packman 프로젝트

4일차

- 강화학습 심화

- Actor-Critic 소개 및 알고리즘

- 가치기반 강화학습과 정책 경사의 만남

- A2C, A3C

- DDPG, SAC, TAC


첨부파일

[과정소개서]_인공지능 기반 강화학습 모델 구축_2023.pdf

페이스북트위터구글즐겨찾기이메일

확인