<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
  <dcvalue element="contributor" qualifier="advisor">권순선</dcvalue>
  <dcvalue element="contributor" qualifier="author">김근교</dcvalue>
  <dcvalue element="date" qualifier="issued">2022-02</dcvalue>
  <dcvalue element="identifier" qualifier="other">31736</dcvalue>
  <dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;aurora.ajou.ac.kr&#x2F;handle&#x2F;2018.oak&#x2F;20996</dcvalue>
  <dcvalue element="description" qualifier="none">학위논문(석사)--아주대학교&#x20;일반대학원&#x20;:인공지능학과,2022.&#x20;2</dcvalue>
  <dcvalue element="description" qualifier="abstract">텍스트&#x20;데이터에서의&#x20;핵심&#x20;내용을&#x20;추출하기&#x20;위해&#x20;사용되는&#x20;방법&#x20;중&#x20;하나는&#x20;해당&#x20;텍스트&#x20;데이터에서&#x20;많이&#x20;사용된&#x20;단어들을&#x20;찾는&#x20;것이다.&#x20;이&#x20;방법은&#x20;텍스트&#x20;데이터에서&#x20;자주&#x20;사용되는&#x20;단어들은&#x20;중요한&#x20;의미를&#x20;갖고&#x20;있으며&#x20;문서의&#x20;핵심내용을&#x20;대략적으로&#x20;확인할&#x20;수&#x20;있게&#x20;하는&#x20;단서라고&#x20;해석한다.&#x20;하지만,&#x20;단어&#x20;빈도를&#x20;계산하는&#x20;방법은&#x20;단어&#x20;간의&#x20;상관관계를&#x20;계산하지&#x20;않고&#x20;단순빈도&#x20;만을&#x20;기반으로&#x20;분석하기&#x20;때문에&#x20;문서의&#x20;성격과&#x20;맥락을&#x20;이해하고&#x20;분석하기에는&#x20;한계가&#x20;존재한다.&#x20;의미가&#x20;없는&#x20;단어가&#x20;단순&#x20;반복되어서&#x20;빈도수가&#x20;높게&#x20;측정될&#x20;수도&#x20;있고,&#x20;해당&#x20;문서에서&#x20;중요한&#x20;핵심&#x20;내용과는&#x20;전혀&#x20;상관없는&#x20;단어가&#x20;중요&#x20;단어로&#x20;잘못&#x20;추출될&#x20;수&#x20;있다.&#x0A;&#x0A;이에&#x20;본&#x20;논문에서는&#x20;단순&#x20;단어빈도가&#x20;아닌&#x20;단어&#x20;간의&#x20;상관관계를&#x20;계산한&#x20;후&#x20;단어들&#x20;사이에서&#x20;중심역할을&#x20;하는&#x20;단어들을&#x20;찾아내는&#x20;방법을&#x20;사용한다.&#x20;웹페이지를&#x20;크롤링하여&#x20;정제한&#x20;후&#x20;데이터를&#x20;저장하고&#x20;단어&#x20;네트워크&#x20;맵을&#x20;그리는&#x20;과정인&#x20;텍스트&#x20;마이닝&#x20;과정을&#x20;수행하는&#x20;KTDA(Korean&#x20;Text&#x20;Data&#x20;Analysis)함수를&#x20;제작하고,&#x20;한글&#x20;텍스트&#x20;문서에&#x20;대한&#x20;통계적&#x20;분석과&#x20;텍스트&#x20;분석에&#x20;적용하는&#x20;것이&#x20;본&#x20;연구의&#x20;목표이다.</dcvalue>
  <dcvalue element="description" qualifier="tableofcontents">1.&#x20;서론&#x20;1&#x0A;2.&#x20;연구&#x20;방법론&#x20;2&#x0A;&#x20;2.1&#x20;웹&#x20;크롤링&#x20;2&#x0A;&#x20;2.2&#x20;단어&#x20;분석&#x20;3&#x0A;&#x20;&#x20;2.2.1&#x20;TF-IDF&#x20;3&#x0A;&#x20;&#x20;2.2.2&#x20;매개중심성&#x20;5&#x0A;&#x20;2.3&#x20;시각화&#x20;6&#x0A;&#x20;&#x20;2.3.1&#x20;워드&#x20;클라우드&#x20;6&#x0A;&#x20;&#x20;2.3.2&#x20;단어&#x20;네트워크&#x20;맵&#x20;6&#x0A;&#x20;2.4&#x20;연관성&#x20;분석&#x20;8&#x0A;3.&#x20;KTDA(Korean&#x20;Text&#x20;Data&#x20;Analysis)&#x20;함수&#x20;구현&#x20;10&#x0A;&#x20;3.1&#x20;KTDA&#x20;함수&#x20;10&#x0A;&#x20;3.2&#x20;텍스트&#x20;마이닝&#x20;11&#x0A;&#x20;&#x20;3.2.1&#x20;데이터&#x20;수집&#x20;12&#x0A;&#x20;&#x20;3.2.2&#x20;텍스트&#x20;정제&#x20;12&#x0A;&#x20;&#x20;3.2.3&#x20;차원&#x20;축소&#x20;14&#x0A;&#x20;&#x20;3.2.4&#x20;텍스트&#x20;분석&#x20;15&#x0A;4.&#x20;한글&#x20;텍스트&#x20;분석&#x20;16&#x0A;&#x20;4.1&#x20;갑상선암&#x20;관련&#x20;뉴스&#x20;데이터&#x20;17&#x0A;&#x20;4.2&#x20;최신&#x20;다음&#x20;뉴스&#x20;데이터&#x20;22&#x0A;5.&#x20;결론&#x20;26&#x0A;참고문헌&#x20;27</dcvalue>
  <dcvalue element="language" qualifier="iso">kor</dcvalue>
  <dcvalue element="publisher" qualifier="none">The&#x20;Graduate&#x20;School,&#x20;Ajou&#x20;University</dcvalue>
  <dcvalue element="rights" qualifier="none">아주대학교&#x20;논문은&#x20;저작권에&#x20;의해&#x20;보호받습니다.</dcvalue>
  <dcvalue element="title" qualifier="none">뉴스&#x20;웹페이지&#x20;크롤링과&#x20;텍스트&#x20;정제&#x20;및&#x20;중요단어&#x20;추출&#x20;함수구현</dcvalue>
  <dcvalue element="title" qualifier="alternative">News&#x20;web&#x20;page&#x20;crawling,&#x20;text&#x20;purification,&#x20;and&#x20;important&#x20;word&#x20;extraction&#x20;function&#x20;implementation</dcvalue>
  <dcvalue element="type" qualifier="none">Thesis</dcvalue>
  <dcvalue element="contributor" qualifier="affiliation">아주대학교&#x20;일반대학원</dcvalue>
  <dcvalue element="contributor" qualifier="alternativeName">Kim&#x20;Keun&#x20;Gyo</dcvalue>
  <dcvalue element="contributor" qualifier="department">일반대학원&#x20;인공지능학과</dcvalue>
  <dcvalue element="date" qualifier="awarded">2022.&#x20;2</dcvalue>
  <dcvalue element="description" qualifier="degree">Master</dcvalue>
  <dcvalue element="identifier" qualifier="uci">I804:41038-000000031736</dcvalue>
  <dcvalue element="identifier" qualifier="url">https:&#x2F;&#x2F;dcoll.ajou.ac.kr&#x2F;dcollection&#x2F;common&#x2F;orgView&#x2F;000000031736</dcvalue>
  <dcvalue element="subject" qualifier="keyword">TF-IDF</dcvalue>
  <dcvalue element="subject" qualifier="keyword">단어&#x20;네트워크&#x20;맵</dcvalue>
  <dcvalue element="subject" qualifier="keyword">매개중심성</dcvalue>
  <dcvalue element="subject" qualifier="keyword">웹&#x20;크롤링</dcvalue>
  <dcvalue element="subject" qualifier="keyword">텍스트&#x20;마이닝</dcvalue>
</dublin_core>
