2023년 NetMiner를 이용한 데이터 수집과 분석 오픈 세미나
안녕하세요, 사이람입니다.
2023년 11월 24일, 「NetMiner를 이용한 데이터 수집과 분석 – 커뮤니티, 뉴스, 유튜브 데이터 이용하기」 라이브 줌(zoom) 오픈 세미나가 진행되었습니다.
이번 무료 공개 세미나는 넷마이너 데이터 수집기와 활용 방향, 기존의 SNS Data Collector(YouTube)와 올해 7월과 10월에 새롭게 출시한
News Data Collector & Community Data Collector 사용법 및 이를 활용한 분석 사례에 대해서 이야기를 나누는 자리였습니다.
대학(원)생, 연구 기관, 교수 및 연구원, 초중고교 교사, 정부 기관 등 넷마이너 분석 소프트웨어 서비스를 이용하고 계신 많은 분들이 이번 오픈 세미나에 열정적으로 참여 해주셨습니다.
넷마이너 데이터 수집기 종류와 소개
넷마이너 데이터 수집기는 Biblio Data Collector, SNS Data Collector, News Data Collector, Community Data Collector 총 4 종류로 구성 되어있습니다.
기존에는 데이터 수집부터 분석 결과를 도출하기 까지의 과정이 매우 어렵고 오랜 시간이 걸린다는 고충이 있었습니다.
하지만, 넷마이너 데이터 수집기는 연구자들의 이런 고민을 해결하는데 매우 효과적인 도구입니다!
넷마이너 데이터 수집기는 공개 API 및 웹 크롤링 방식으로 데이터를 수집하고, 수집한 텍스트에 대한 자연어 처리와 네트워크 데이터 구성을 하는 확장 프로그램입니다.
프로그래밍에 익숙하지 않은 이용자들에게 No Code 방식의 온라인 데이터 수집 기능을 제공하고, 전문 분석 소프트웨어인 'NetMiner'와 연동하여 다양한 분석까지 가능한 매우 편리한 도구입니다.
SNS Data Collector는 FaceBook · Instagram · Twitter · YouTube에서 데이터를 수집할 수 있었는데, 최근 SNS 플랫폼에서 사이트 변동이 많아 데이터 수집에 애로사항이 발생했고,
현재는 YouTube에서만 데이터 수집이 가능합니다.
News Data Collector에서 수집하는 데이터 출처는 다음과 같습니다.
경향 · 동아일보 · 중앙일보 · 조선일보 · 한겨레 · 한국일보 총 6개의 신문사와 KBS · MBC · SBS 3개의 방송사 총 9곳의 언론사에서 데이터를 수집합니다. (2023년 11월 기준)
Community Data Collector에서 수집하는 데이터 출처는 다음과 같습니다.
디시인사이드 · MLBPARK · 루리웹 · SLR클럽 · 뽐뿌 · 클리앙 · 82Cook · 웃긴대학 · 와이고수 · 이토렌드 · 인벤 · 일간베스트 총 12곳의 커뮤니티에서 데이터를 수집합니다. (2023년 11월 기준)
커뮤니티의 경우, 해당 커뮤니티의 모든 게시판에서 데이터를 수집하는 것이 아니라 정치 및 사회적 이슈를 다루는 게시판에서 수집하는 것으로 제한하여 이용자가 데이터 수집을 효율적으로 할 수 있게 합니다.
넷마이너와 넷마이너 데이터 수집기를 활용한 분석 방법론
1. 수집된 데이터를 이용하여 다양한 개체 간 관계를 구성할 수 있습니다
- 통계적인 관점 또는 일반적인 데이터 분석 관점에서는 단지 어떤 매체 또는 이용자에 대해서만 분석을 진행하지만, 넷마이너의 관점에서는 데이터 요소들 간의 관계를 고려한 네트워크 분석을 진행할 수 있습니다.
2, 다층적 융복합 분석 방법을 적용할 수 있습니다.
- 넷마이너와 넷마이너 데이터 수집기를 연동하여 Mixed Method Social Network Analysis 방법론을 적용할 수 있습니다.
- 사회 네트워크 구조를 이해하고 분석하기 위해 정량적인 분석뿐만 아니라 정성적 방법을 통해 문맥적이고 깊은 이해를 추가하는데 유용합니다.
3. 뉴스 · SNS · 온라인 커뮤니티의 텍스트를 이용하여 다양한 연구 주제를 선정할 수 있습니다.
- 여론 동향 분석(공공정책, 사회적/정치적 이슈, 여론을 이야기하는 행위자들 단의 관계, 브랜드 및 제품)
- 재난 및 위기 상황 정보 전파 분석
- 사람들의 인식 변화 분석 & 트랜드 분석(건강 및 웰빙, 환경 보호, 교육 변화 및 온라인 학습)
- 사회적 영향 분석(기술 발전, 문화 및 엔터테인먼트) 등
넷마이너 데이터 수집기 사용법
News Data Collector와 Community Data Collector는 기존 넷마이너 확장 프로그램인 SNS Data Collecto, Biblio Data Collector와 굉장히 유사한 모양을 갖고 있어,
이를 이용하신 경험이 있으신 분들은 익숙하게 다룰 수 있습니다.
첫 번째, 검색어만 입력하면 곧바로 온라인에서 뉴스 또는 커뮤니티 데이터를 수집할 수 있습니다.
두 번째, 클릭 몇 번으로 텍스트에서 쉽게 단어를 추출하고, 다양한 네트워크 데이터를 자동으로 구조화해서 저장합니다.
세 번째, 텍스트 마이닝과 네트워크 분석을 단 1개의 프로그램에서 할 수 있습니다.
<News Data Collector 시연 영상>
<Community Data Collector 시연 영상>
분석 사례1. 유튜브 이용자 네트워크와 감성 분석(검색어: '간호법 제정')
올해 5월, 간호법 거부권 행사로 이슈가 되었습니다. 유튜브 댓글에서는 간호법에 대한 여론이 어떻게 형성되었는지 파악해보도록 하겠습니다.
데이터는 간호법 제정과 관련된 유튜브 영상 중, 간호법에 관련된 의견을 댓글로 표현한 111명의 이용자를 판별했고 이들이 댓글을 작성한 총 258개의 영상을 대상으로 분석을 시작하였습니다.
전체적인 시각화 결과를 살펴보면, 긍정적 이용자끼리 응집되지 않은, 감성이 혼재된 네트워크 구조를 보였습니다.
하나의 거대한 컴포넌트와 소규모의 컴포넌트로 구성된 파편화된 구조를 보이고 있습니다.
그리고 평균적으로 1명의 이용자가 3명의 이용자와 같은 2개 이상의 비디오에 댓글을 달았다는 것을 알 수 있습니다.
이용자 수는 부정적인 댓글을 작성한 사람이 긍정적인 댓글을 작성한 이용자보다 더 많았습니다.
같은 감성을 가진 사람들보다 다른 감성을 가진 사람들 간의 링크 연결이 다소 많은 것으로 나타났습니다. 동일한 이슈에 대해 같은 감성을 가진 사람들의 반응만 나타나는 것은 아니라는 것을 알 수 있습니다.
앞서 확인했던 거대 컴포넌트를 추출한 다음, 이용자 간 네트워크에서 응집구조 분석을 진행하여 네트워크 구조상으로 응집된 그룹이 공통의 감성을 갖고 있는지 확인했습니다.
그 결과, 총 6개의 커뮤니티로 묶이는 것을 확인할 수 있었습니다.
1번과 3번 커뮤니티는 부정적인 댓글을 작성한 이용자의 비중이 더 컸고, 2번과 6번 커뮤니티는 긍정적인 댓글을 작성한 이용자의 비중이 더 큰 것을 확인할 수 있었습니다.