ÀΰøÁö´É ±â¹Ý °­È­ÇнÀ ¸ðµ¨ ±¸Ãà

ȨÀ¸·Î±³À°°úÁ¤AI ¾ÆÄ«µ¥¹Ì¸Ó½Å·¯´×

Àϼö/½Ã°£ 4ÀÏ / 32½Ã°£ (09:00~18:00) °­»ç ÇÑÄľÆÄ«µ¥¹Ì Àü¹®°­»ç
°úÁ¤¸Å´ÏÀú  Á¤½ÂÈ£ (031-622-7684)
±³À°ºñ 990,000¿ø (VATÆ÷ÇÔ)
½Ç½ÀÀåºñ python
Á¤¿ø 20¸í
Àüü ±³À°ÀÏÁ¤
±³À°ÀÏÁ¤ ½Åû¸¶°¨ÀÏ ¼ö°­½Åû ±³À°Àå¼Ò
2025.10.13(¿ù) ~ 2025.10.16(¸ñ) ½ÅûÇϱ⠱³À°Àå¼Ò ºÐ´ç±³À°¼¾ÅÍ
°úÁ¤°³¿ä

¾ËÆÄ°íÀÇ Åä´ë°¡ µÈ °­È­ÇнÀ ¾Ë°í¸®Áò¿¡ ´ëÇØ À̷аú ½Ç½ÀÀ» º´ÇàÇÏ´Â °úÁ¤ÀÔ´Ï´Ù. °­È­ÇнÀÀÌ µ¿ÀÛÇÏ´Â ±âº» ¿ø¸®ºÎÅÍ ÀϹÝÀûÀÎ °­È­ÇнÀÀ¸·Î Ç®±â ¾î·Á¿î ¹®Á¦¿¡ ´ëÇØ ÁÁÀº °á°ú¸¦ º¸¿©ÁÖ´Â Ãֽбâ¼ú±îÁö »ìÆìº¾´Ï´Ù. Àüü ¼ö¾÷À» ü°èÀûÀÎ ¼ø¼­¿¡ µû¶ó ÁøÇàÇϱ⠶§¹®¿¡, °úÁ¤ Á¾·á ÈÄ ÀÏÂ÷º° ¹× ½Ã°£º° º¹½ÀÀ» ÅëÇØ ºÎÁ·Çß´ø ºÎºÐÀ» ä¿ï ¼ö ÀÖ½À´Ï´Ù.


»ç¾÷ÁÖÈÆ·Ã
±³À°¸ñÀû


±³À°´ë»ó

- µö·¯´×À» ¼ö°­ÇÏ°í µö·¯´×À¸·Î Á» ´õ À¯ÀǹÌÇÑ ¸ðµ¨À» °³¹ßÇÏ°í ½ÍÀº ºÐ

- °­È­ÇнÀÀÇ ¿ø¸®¸¦ ÀÌÇØÇÏ°í ½ÍÀº °³¹ßÀÚ

- ÀΰøÁö´É ±â¼úÀ» Çö¾÷¿¡ Àû¿ëÇϱâ À§ÇÑ ¿¬±¸¸¦ ÁøÇà ÁßÀÎ °³¹ßÀÚ


±³À°È¿°ú

- °­È­ÇнÀ ±âÃÊ À̷п¡ ´ëÇØ ÀÌÇØÇϰí À̸¦ ÄÚµå·Î ±¸ÇöÇÑ´Ù.

- ½ÉÈ­ ÀÌ·Ð ¹× ÃֽŠÀ̷п¡ ´ëÇØ ÀÌÇØÇÏ°í ¼³¸íÇÑ´Ù.

- ÁÖ¾îÁø ¹®Á¦¿¡ ´ëÇØ °­È­ÇнÀ ¾Ë°í¸®Áò Àû¿ëÀ» ÅëÇÑ ÇØ°á¹æ¾ÈÀ» Á¦½ÃÇÑ´Ù.


±³À°³»¿ë
±¸ºÐ ¸ñÂ÷ ¼¼ºÎ¸ñÂ÷
1ÀÏÂ÷ - °­È­ÇнÀ ÀÔ¹®
  • °­È­ÇнÀ °³¿ä ¹× °³¹ß ȯ°æ ±¸Ãà
  • Àüü ÇÁ·Î¼¼½º ¹× ÇÙ½É ¿ë¾î Á¤¸®(Çൿ, »óÅÂ, º¸»ó, ÇÒÀÎ, ¿¡ÀÌÀüÆ®)
  • MDP(Marcov Decision Process), º§¸¸ ¹æÁ¤½Ä ¾Ë°í¸®Áò
  • Multi-Armed Bandit ¹®Á¦ ÇØ°á
2ÀÏÂ÷ - °­È­ÇнÀ ±âÃÊ
  • Q-Learning ¾Ë°í¸®Áò Á¤¸® ¹× ¸ðµ¨ ±¸Ãà
  • Discounted, Soochastic ÀÌ·Ð Àû¿ëÀ» ÅëÇÑ ¸ðµ¨ ¾÷±×·¹À̵å
  • Custom Map Ãß°¡¸¦ ÅëÇÑ New World »ý¼º
  • Q-Network ¸ðµ¨À» Àû¿ëÇÑ CartPole ÇÁ·ÎÁ§Æ®
3ÀÏÂ÷ - °­È­ÇнÀ Ȱ¿ë
  • Deep Q-Network ÀÌ·Ð Àû¿ëÀ» ÅëÇÑ ¸ðµ¨ ¾÷±×·¹À̵å
  • Policy Gradient ¾Ë°í¸®Áò Á¤¸®
  • ¿À¶ô½Ç °ÔÀÓ ¿¬µ¿À» À§ÇÑ ATARI ¸ðµâ ¼³Ä¡
  • DQN ¾Ë°í¸®ÁòÀ» Àû¿ëÇÑ Packman ÇÁ·ÎÁ§Æ®
4ÀÏÂ÷ - °­È­ÇнÀ ½ÉÈ­
  • Actor-Critic ¼Ò°³ ¹× ¾Ë°í¸®Áò
  • °¡Ä¡±â¹Ý °­È­ÇнÀ°ú Á¤Ã¥ °æ»çÀÇ ¸¸³²
  • A2C, A3C
  • DDPG, SAC, TAC

ÆäÀ̽ººÏÆ®À§Åͱ¸±ÛÁñ°Üã±âÀ̸ÞÀÏ

È®ÀÎ