북한 핵활동 분석시스템 개발(2020-2021)
[고객]
- 국내 중앙행정기관
[주요 목표]
- 텍스트 기반의 북한 핵활동 정보(논문, 특허, 뉴스 등)를 웹에서
자동으로 수집하고 이를 전문가의 분석과 평가를 통해 유용하게 사용 가능한 정보로 가공함으로써 북한의 핵활동을 상시 감시할 수 있는 공개출처정보
기반의 핵활동 분석시스템을 구축
[주요 내용]
데이터 수집) 웹크롤링 방식을 통한 논문, 특허, 국내외 뉴스, 인물/기관 데이터 수집
데이터 전처리)
- 주요 키워드 및 자연어 처리 사전 구축(지정어/유의어/제외어)
- 데이터 중요도 평가를 위한 주요 용어(핵심어) 사전 구축
데이터 분석)
- 기초 통계 분석: 워드 클라우드, 연도별 빈도추이 등
- 단어 간 네트워크 생성
- 인물 간 네트워크 생성: 논문/특허 데이터의 공저/공출원 관계 네트워크 구성
- 네트워크 분석: 인물의 중요도(영향력) 평가
• 연결중심도(degree centrality), 근접중심도(closeness
centrality), 매개중심도(betweenness centrality), 위세중심도(eigenvector centrality)를 적용
[결과 활용]
- 북한 핵활동 관련 주요 논문/특허 및 핵심 단어의 연도별 추세 파악
- 북한 핵활동 관련 주요 연구자 및 기관 파악
- 북한 핵활동 관련 키워드-인물-기관-논문-특허-뉴스의 연계정보(Link Information) 제공
- 미신고 의심 전략물자(전쟁을 하기 위하여 가치가
있다고 인정되는 물자) 탐색
ð 핵심 정보를 활용한 북한 핵활동 동향 파악, 미신고 의심 전략물자 탐색