<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
  <dcvalue element="contributor" qualifier="advisor">손경아</dcvalue>
  <dcvalue element="contributor" qualifier="author">차문수</dcvalue>
  <dcvalue element="date" qualifier="issued">2017-02</dcvalue>
  <dcvalue element="identifier" qualifier="other">24547</dcvalue>
  <dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;aurora.ajou.ac.kr&#x2F;handle&#x2F;2018.oak&#x2F;11380</dcvalue>
  <dcvalue element="description" qualifier="none">학위논문(석사)--아주대학교&#x20;일반대학원&#x20;:소프트웨어특성화학과,2017.&#x20;2</dcvalue>
  <dcvalue element="description" qualifier="abstract">책,&#x20;뉴스,&#x20;블로그,&#x20;소셜&#x20;네트워크&#x20;서비스&#x20;등&#x20;다양한&#x20;종류의&#x20;데이터들이&#x20;생성됨에&#x20;따라서,&#x20;이를&#x20;분석하고&#x20;탐구하기&#x20;위한&#x20;텍스트&#x20;마이닝에&#x20;대한&#x20;수요는&#x20;지속적으로&#x20;증가되어&#x20;왔다.&#x20;기존의&#x20;텍스트마이닝에서&#x20;시도되었던&#x20;연구들은&#x20;대부분&#x20;BOW(Bag&#x20;of&#x20;Words)&#x20;모델을&#x20;기반으로&#x20;TF-IDF&#x20;모델이&#x20;자주&#x20;사용되고&#x20;있다.&#x20;BOW&#x20;모델은&#x20;단어의&#x20;순서를&#x20;고려하지&#x20;않고&#x20;오직&#x20;단어의&#x20;빈도를&#x20;고려하는&#x20;방식이기&#x20;때문에&#x20;의미론적&#x20;특성을&#x20;읽어버린다는&#x20;단점을&#x20;가지고&#x20;있다.&#x20;그래서&#x20;이를&#x20;해결하고자&#x20;3&#x20;계층적&#x20;베이지안&#x20;생성&#x20;확률&#x20;모델이&#x20;LDA(Latent&#x20;Dirichlet&#x20;Allocation)가&#x20;나왔다.&#x20;LDA는&#x20;단어들은&#x20;비슷한&#x20;토픽으로&#x20;묶는&#x20;역할을&#x20;잘&#x20;해주었지만&#x20;단어자체가&#x20;가지는&#x20;의미론적&#x20;특성을&#x20;가지지는&#x20;못하였다.&#x20;최근&#x20;들어서&#x20;신경망&#x20;네트워크를&#x20;기반으로&#x20;단어의&#x20;의미론적&#x20;특성과&#x20;문법적&#x20;특성을&#x20;고려하는&#x20;단어&#x20;임베딩기술이&#x20;나왔다.&#x20;단어&#x20;임베딩은&#x20;단어가&#x20;나오는&#x20;순서를&#x20;고려하여&#x20;단어를&#x20;낮은&#x20;차원의&#x20;연속적인&#x20;벡터로서&#x20;변환해주는&#x20;것을&#x20;말한다.&#x20;단어를&#x20;같은&#x20;공간상에&#x20;연속&#x20;벡터로&#x20;표현됨으로써&#x20;단어간의&#x20;유사도&#x20;분석,&#x20;거리분석이&#x20;가능하고,&#x20;의미론적&#x20;특성과&#x20;문법적인&#x20;특성이&#x20;이전의&#x20;BOW모델들의&#x20;비해서&#x20;잘&#x20;고려한다.&#x20;&#x0A;본&#x20;연구는&#x20;BOW모델로&#x20;사전&#x20;연구된&#x20;두&#x20;가지&#x20;문제를&#x20;단어&#x20;임베딩을&#x20;적용하여&#x20;비교&#x20;실험을&#x20;진행하였다.&#x20;첫&#x20;번째&#x20;사전&#x20;연구는&#x20;짧은&#x20;문장&#x20;토픽&#x20;카테고리&#x20;분류에&#x20;대한&#x20;연구이다.&#x20;사전&#x20;연구에서는&#x20;소셜&#x20;데이터에&#x20;대한&#x20;토픽&#x20;카테고리&#x20;분류를&#x20;수행하기&#x20;위해서&#x20;이미&#x20;잘&#x20;정제된&#x20;뉴스&#x20;미디어&#x20;자료를&#x20;사용하는&#x20;크로스&#x20;미디어&#x20;전략을&#x20;수행하여&#x20;이러한&#x20;문제를&#x20;해결하였다.&#x20;하지만&#x20;기존의&#x20;BOW모델이&#x20;가지는&#x20;단점으로&#x20;인해&#x20;많은&#x20;전처리와&#x20;수작업이&#x20;필요하고,&#x20;의미론적인&#x20;특성을&#x20;잃어버린&#x20;BOW모델에서는&#x20;높은&#x20;성능이&#x20;나오지&#x20;않는&#x20;문제를&#x20;가지고&#x20;있었다.&#x20;그래서&#x20;이러한&#x20;문제를&#x20;해결하기&#x20;위해&#x20;단어&#x20;임베딩을&#x20;문제에&#x20;적용하였고&#x20;기존&#x20;대비&#x20;성능&#x20;향상을&#x20;이룰&#x20;수&#x20;있었다.&#x20;또한&#x20;기존&#x20;BOW&#x20;모델에서는&#x20;중성&#x20;토픽&#x20;카테고리에&#x20;대한&#x20;분류를&#x20;위해&#x20;클러스터링&#x20;기법을&#x20;사용하여&#x20;단어&#x20;수를&#x20;줄이는&#x20;전략을&#x20;사용하였는데,&#x20;이러한&#x20;전략은&#x20;성능&#x20;하락이라는&#x20;단점을&#x20;가지고&#x20;있었다.&#x20;하지만&#x20;단어&#x20;임베딩을&#x20;사용하는&#x20;경우&#x20;단어&#x20;사이의&#x20;유사도를&#x20;기준으로&#x20;이러한&#x20;문제를&#x20;해결&#x20;할&#x20;수&#x20;있다.&#x20;두&#x20;번째로&#x20;임상의사결정지원(CDS)시스템을&#x20;연구하였다.&#x20;사전&#x20;연구에서는&#x20;BOW&#x20;모델&#x20;기반의&#x20;질의&#x20;가능도&#x20;언어&#x20;모델에&#x20;Jelinek&#x20;Mercer&#x20;평탄화(LMJM)방법을&#x20;적용하고&#x20;온톨로지와&#x20;PRF&#x20;기반의&#x20;질의&#x20;확장을&#x20;통해&#x20;성능을&#x20;향상&#x20;시켜왔었다.&#x20;본&#x20;논문에서는&#x20;기존대비&#x20;성능&#x20;향상을&#x20;목표로&#x20;단어&#x20;임베딩&#x20;질의&#x20;확장방식과&#x20;LMJM&#x20;방식의&#x20;단어임베딩(LMJMWE)을&#x20;적용한&#x20;새로운&#x20;언어모델을&#x20;제안한다.&#x20;우리는&#x20;다양한&#x20;파라미터&#x20;실험과&#x20;질의확장에&#x20;대한&#x20;실험을&#x20;통해서&#x20;기존&#x20;대비&#x20;LMJMWE&#x20;방식이&#x20;더&#x20;좋은&#x20;성능을&#x20;보이고&#x20;있다는&#x20;것을&#x20;보여주었다.&#x20;&#x0A;본&#x20;논문을&#x20;통해서&#x20;우리는&#x20;기존의&#x20;BOW모델들로&#x20;풀고&#x20;있던&#x20;문제들을&#x20;단어&#x20;임베딩문제를&#x20;이용해서&#x20;단어의&#x20;의미론적&#x20;분석이&#x20;향상됨에&#x20;따라서&#x20;기존&#x20;대비&#x20;더&#x20;좋은&#x20;성능과&#x20;효율을&#x20;얻을&#x20;수&#x20;있었으며,&#x20;더욱&#x20;쉽게&#x20;적용&#x20;및&#x20;구축이&#x20;가능해졌다.</dcvalue>
  <dcvalue element="description" qualifier="tableofcontents">제１장&#x20;서론&#x20;1&#x0A;&#x20;１.&#x20;연구&#x20;배경&#x20;1&#x0A;&#x20;２.&#x20;연구&#x20;목적&#x20;3&#x0A;&#x20;３.&#x20;관련&#x20;연구&#x20;4&#x0A;&#x20;４.&#x20;논문&#x20;구성&#x20;6&#x0A;제２장&#x20;문서&#x20;처리&#x20;기법&#x20;7&#x0A;&#x20;１.&#x20;문서로부터&#x20;의미&#x20;있는&#x20;단어&#x20;추출&#x20;방법&#x20;7&#x0A;&#x20;２.&#x20;TF-IDF&#x20;9&#x0A;&#x20;３.&#x20;Latent&#x20;Dirichlet&#x20;Allocation&#x20;10&#x09;&#x0A;&#x20;４.&#x20;Word&#x20;Embedding&#x20;12&#x0A;&#x20;&#x20;４.１.&#x20;Word&#x20;to&#x20;Vector&#x20;12&#x0A;제３장&#x20;짧은&#x20;문장&#x20;토픽&#x20;카테고리&#x20;분류&#x20;16&#x0A;&#x20;１.&#x20;문제&#x20;정의&#x20;16&#x0A;&#x20;２.&#x20;시스템구조도&#x20;18&#x0A;&#x20;３.&#x20;방법론&#x20;19&#x0A;&#x20;&#x20;３.１.&#x20;문장&#x20;특징&#x20;추출&#x20;방법&#x20;19&#x0A;&#x20;&#x20;３.２.&#x20;분류&#x20;알고리즘&#x20;20&#x0A;&#x20;４.&#x20;실험&#x20;결과&#x20;20&#x0A;&#x20;&#x20;４.１.&#x20;실험&#x20;데이터&#x20;20&#x0A;&#x20;&#x20;４.２.&#x20;실험&#x20;평가&#x20;20&#x0A;제４장&#x20;임상의사결정지원(CDS)을&#x20;위한&#x20;검색&#x20;시스템&#x20;24&#x0A;&#x20;１.&#x20;문제&#x20;정의&#x20;24&#x0A;&#x20;２.&#x20;시스템구조도&#x20;25&#x0A;&#x20;３.&#x20;방법론&#x20;26&#x0A;&#x20;&#x20;３.１.&#x20;Query&#x20;Expansions&#x20;26&#x0A;&#x20;&#x20;３.２.&#x20;Similarity&#x20;Retrieval&#x20;Models&#x20;28&#x0A;&#x20;４.&#x20;실험&#x20;결과&#x20;33&#x0A;&#x20;&#x20;４.１.&#x20;실험&#x20;데이터&#x20;33&#x0A;&#x20;&#x20;４.２.&#x20;실험&#x20;평가&#x20;34&#x0A;제５장&#x20;결론&#x20;및&#x20;향후&#x20;연구방향&#x20;41&#x0A;참&#x20;고&#x20;문&#x20;헌&#x20;43&#x0A;ABSTRACT&#x20;47</dcvalue>
  <dcvalue element="language" qualifier="iso">kor</dcvalue>
  <dcvalue element="publisher" qualifier="none">The&#x20;Graduate&#x20;School,&#x20;Ajou&#x20;University</dcvalue>
  <dcvalue element="rights" qualifier="none">아주대학교&#x20;논문은&#x20;저작권에&#x20;의해&#x20;보호받습니다.</dcvalue>
  <dcvalue element="title" qualifier="none">단어&#x20;임베딩을&#x20;통한&#x20;문서의&#x20;의미분석&#x20;개선</dcvalue>
  <dcvalue element="type" qualifier="none">Thesis</dcvalue>
  <dcvalue element="contributor" qualifier="affiliation">아주대학교&#x20;일반대학원</dcvalue>
  <dcvalue element="contributor" qualifier="department">일반대학원&#x20;소프트웨어특성화학과</dcvalue>
  <dcvalue element="date" qualifier="awarded">2017.&#x20;2</dcvalue>
  <dcvalue element="description" qualifier="degree">Master</dcvalue>
  <dcvalue element="identifier" qualifier="url">http:&#x2F;&#x2F;dcoll.ajou.ac.kr:9080&#x2F;dcollection&#x2F;jsp&#x2F;common&#x2F;DcLoOrgPer.jsp?sItemId=000000024547</dcvalue>
  <dcvalue element="subject" qualifier="keyword">BOW</dcvalue>
  <dcvalue element="subject" qualifier="keyword">단어임베딩</dcvalue>
  <dcvalue element="subject" qualifier="keyword">문장분류</dcvalue>
  <dcvalue element="subject" qualifier="keyword">임상의사결정지원</dcvalue>
  <dcvalue element="subject" qualifier="keyword">의미분석</dcvalue>
</dublin_core>
