<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
  <dcvalue element="contributor" qualifier="advisor">박상철</dcvalue>
  <dcvalue element="contributor" qualifier="author">안상현</dcvalue>
  <dcvalue element="date" qualifier="issued">2023-08</dcvalue>
  <dcvalue element="identifier" qualifier="other">32971</dcvalue>
  <dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;aurora.ajou.ac.kr&#x2F;handle&#x2F;2018.oak&#x2F;24497</dcvalue>
  <dcvalue element="description" qualifier="none">학위논문(석사)--산업공학과,2023.&#x20;8</dcvalue>
  <dcvalue element="description" qualifier="abstract">강화학습은&#x20;게임에서부터&#x20;시작되어&#x20;여러&#x20;산업에&#x20;다양한&#x20;측면으로&#x20;활발히&#x20;연구되고&#x20;있다.&#x20;강화학습은&#x20;변화하는&#x20;다양한&#x20;환경에서&#x20;최적의&#x20;의사&#x20;결정에&#x20;적절한&#x20;분야로서&#x20;시행착오에&#x20;의해&#x20;학습을&#x20;진행한다.&#x20;그러나&#x20;강화학습을&#x20;적용하기&#x20;위해서는&#x20;강화학습&#x20;알고리즘의&#x20;지식과&#x20;인공지능&#x20;네트워크&#x20;구조에&#x20;대한&#x20;지식,&#x20;그리고&#x20;시뮬레이션&#x20;지식을&#x20;모두&#x20;갖추고&#x20;있어야&#x20;올바른&#x20;학습&#x20;결과를&#x20;얻을&#x20;수&#x20;있다.&#x20;보편적으로&#x20;산업에서는&#x20;문제를&#x20;해결하기위해&#x20;이미&#x20;시뮬레이터를&#x20;구축하여&#x20;여러&#x20;시도를&#x20;해본&#x20;상황이기에&#x20;시뮬레이션&#x20;엔지니어가&#x20;올바른&#x20;강화학습을&#x20;적용하기에는&#x20;진입장벽이&#x20;높은&#x20;편에&#x20;속한다.&#x0A;&lt;br&gt;&#x20;본&#x20;연구에서는&#x20;시뮬레이터의&#x20;수정을&#x20;최소로하여&#x20;강화학습을&#x20;적용하는&#x20;강화학습&#x20;자동화&#x20;방법론을&#x20;제안한다.&#x20;당면한&#x20;문제에&#x20;대해&#x20;강화학습에&#x20;맞춰&#x20;목적함수를&#x20;재정의하는&#x20;것부터&#x20;강화학습에&#x20;제공하는&#x20;상태의&#x20;형상&#x20;및&#x20;액션을&#x20;정의하면&#x20;정의된&#x20;상태와&#x20;액션을&#x20;토대로&#x20;인공지능&#x20;네트워크를&#x20;자동으로&#x20;생성한다.&#x20;상태와&#x20;액션이&#x20;정의되고&#x20;만들어진&#x20;인공지능&#x20;네트워크를&#x20;토대로&#x20;학습을&#x20;진행하여&#x20;결과를&#x20;분석하고&#x20;최적&#x20;강화학습&#x20;알고리즘을&#x20;채택한&#x20;다음&#x20;Self-play&#x20;구조로&#x20;변경하여&#x20;강화학습&#x20;알고리즘의&#x20;하이퍼파라미터와&#x20;NAS(Network&#x20;Architecture&#x20;Search)를&#x20;동시에&#x20;진행한다.&#x0A;&lt;br&gt;&#x20;실험&#x20;결과로는&#x20;보상함수와&#x20;상태,&#x20;액션을&#x20;정의한&#x20;네&#x20;환경에&#x20;대해&#x20;강화학습&#x20;알고리즘&#x20;선정,&#x20;인공지능&#x20;네트워크&#x20;제작,&#x20;하이퍼파라미터&#x20;튜닝을&#x20;자동으로&#x20;진행하여&#x20;총&#x20;1000번의&#x20;환경에서&#x20;높은&#x20;보상으로&#x20;유의미한&#x20;결과가&#x20;나왔으며&#x20;시뮬레이션&#x20;엔지니어가&#x20;시뮬레이터&#x20;수정을&#x20;최소로&#x20;하여&#x20;강화학습과&#x20;인공지능&#x20;네트워크&#x20;구조에&#x20;대한&#x20;지식&#x20;없이도&#x20;강화학습이&#x20;적용&#x20;가능함을&#x20;확인하였다.</dcvalue>
  <dcvalue element="description" qualifier="tableofcontents">제1장&#x20;서론&#x20;1&#x0A;&lt;br&gt;&#x20;제1절&#x20;이산&#x20;사건&#x20;시뮬레이션&#x20;1&#x0A;&lt;br&gt;&#x20;제2절&#x20;강화학습&#x20;3&#x0A;&lt;br&gt;&#x20;제3절&#x20;연구&#x20;목적&#x20;7&#x0A;&lt;br&gt;제2장&#x20;강화학습&#x20;자동화&#x20;방법론&#x20;11&#x0A;&lt;br&gt;&#x20;제1절&#x20;목적&#x20;전이&#x20;11&#x0A;&lt;br&gt;&#x20;제2절&#x20;Self-play&#x20;및&#x20;알고리즘&#x20;채택&#x20;16&#x0A;&lt;br&gt;&#x20;제3절&#x20;알고리즘&#x20;및&#x20;네트워크&#x20;구조&#x20;개선&#x20;19&#x0A;&lt;br&gt;&#x20;제4절&#x20;대상&#x20;환경&#x20;및&#x20;자동화&#x20;적용&#x20;23&#x0A;&lt;br&gt;제3장&#x20;최적화&#x20;실험&#x20;36&#x0A;&lt;br&gt;&#x20;제1절&#x20;알고리즘&#x20;결정&#x20;36&#x0A;&lt;br&gt;&#x20;제2절&#x20;하이퍼파라미터&#x20;튜닝&#x20;및&#x20;네트워크&#x20;구조&#x20;최적화&#x20;38&#x0A;&lt;br&gt;&#x20;제3절&#x20;최적화&#x20;결과&#x20;41&#x0A;&lt;br&gt;제4장&#x20;결론&#x20;42&#x0A;&lt;br&gt;&#x20;제1절&#x20;자동화&#x20;방법론&#x20;42&#x0A;&lt;br&gt;&#x20;제2절&#x20;향후&#x20;연구&#x20;42&#x0A;&lt;br&gt;참고문헌&#x20;43&#x0A;&lt;br&gt;Abstract&#x20;49</dcvalue>
  <dcvalue element="language" qualifier="iso">kor</dcvalue>
  <dcvalue element="publisher" qualifier="none">The&#x20;Graduate&#x20;School,&#x20;Ajou&#x20;University</dcvalue>
  <dcvalue element="rights" qualifier="none">아주대학교&#x20;논문은&#x20;저작권에&#x20;의해&#x20;보호받습니다.</dcvalue>
  <dcvalue element="title" qualifier="none">이산사건&#x20;시뮬레이션용&#x20;강화학습&#x20;자동화&#x20;방법론</dcvalue>
  <dcvalue element="title" qualifier="alternative">The&#x20;Automation&#x20;Method&#x20;of&#x20;Reinforcement&#x20;Learning&#x20;for&#x20;Discrete-Event&#x20;Simulation</dcvalue>
  <dcvalue element="type" qualifier="none">Thesis</dcvalue>
  <dcvalue element="contributor" qualifier="affiliation">아주대학교&#x20;대학원</dcvalue>
  <dcvalue element="contributor" qualifier="alternativeName">Sanghyeon&#x20;An</dcvalue>
  <dcvalue element="contributor" qualifier="department">일반대학원&#x20;산업공학과</dcvalue>
  <dcvalue element="date" qualifier="awarded">2023-08</dcvalue>
  <dcvalue element="description" qualifier="degree">Master</dcvalue>
  <dcvalue element="identifier" qualifier="url">https:&#x2F;&#x2F;dcoll.ajou.ac.kr&#x2F;dcollection&#x2F;common&#x2F;orgView&#x2F;000000032971</dcvalue>
  <dcvalue element="subject" qualifier="keyword">Discrete-Event&#x20;Simulation</dcvalue>
  <dcvalue element="subject" qualifier="keyword">Reinforcement&#x20;Learning</dcvalue>
</dublin_core>
