국내 커뮤니티에서 본 '이스라엘-하마스 전쟁' 여론은?
2023년 10월 7일 하마스가 이스라엘을 상대로 대규모 침공으로 이스라엘과 하마스 전쟁이 발발했습니다. 전문가들은 종교, 영토, 정치, 주변국 등 여러 복잡한 요인들이 원인이라고 말합니다. 이로 인해 양국의 국민들이 피해를 고스란히 떠안고 있고 심지어는 인질로 잡힌 제3국의 국민들까지도 피해를 보고 있는 상황입니다. 국내뿐만 아니라 해외 국민들도 이번 전쟁에 많은 관심을 갖고 있습니다.
이와 관련하여 국내 커뮤니티에서는 ‘이스라엘-하마스 전쟁’과 관련하여 어떤 주제의 이야기들이 오고 갔는지 NetMiner 커뮤니티 데이터 수집기(Community Data Collector)로 한 번 확인해 보겠습니다.
1. NetMiner Community Data Collector(CDC)로 데이터 수집하기
데이터 수집
먼저 Community Data Collector를 활용하여, ‘이스라엘’, ‘하마스’, ‘팔레스타인’ 관련 커뮤니티를 수집합니다.
데이터는 조사시점인 2023년 10월 13일까지 생성된 국내 12곳 커뮤니티 사이트(디시인사이드, 루리웹, 뽐뿌, 와이고수, SLR클럽, MLBPARK, 웃긴대학, 이토렌트, 인벤, 일간베스트, 클리앙, 82Cook)에서 커뮤니티를 수집했습니다.
다음은 커뮤니티 데이터 수집기(Community Data Collector)로 수집된 결과입니다.
검색한 키워드로 추출된 커뮤니티 데이터는 좌측의 데이터 관리 영역(Data Management)에서 확인할 수 있습니다. 데이터 관리 영역에서 확인할 수 있는 항목은 다음과 같습니다.
- Data Name: 수집 시 입력한 검색어 혹은 검색 조건(기간 등)이 데이터 이름이 됩니다.
- Collection time: 데이터가 수집된 실제 시간이 표시됩니다.
- Preprocess: 데이터 관리 영역에서 Preprocess를 수행한 경우 “Yes”가 표시되며, 최초 데이터가 수집되었을 때는 “No”가 표시됩니다.
- # of Posts: 수집된 커뮤니티 게시글 개수가 표시됩니다.
데이터 관리 영역에서 데이터 아이템을 클릭하면, 결과 산출 영역(Data Output)에서 데이터 테이블과 쿼리(Query) 항목이 나타납니다. 결과 산출 영역에서 확인할 수 있는 정보는 다음과 같습니다.
- Post ID: 게시글 ID
- Title: 게시글 제목
- URL: 게시글 URL
- Category: 게시글 분류(게시판 내 분류 정보가 없으면 공란)
- Writer: 작성자
- Created_Time: 일시
- Content: 본문 내용(본문 내용이 이미지 혹은 동영상으로만 작성되어 있으면 공란)
- View_Count: 조회 수
- Like_Count: 추천/공감 수
- Dislike_Count: 비추천 수
- Comment_Count: 댓글 수
- Source: 수집 커뮤니티 명
- Table_Name: 수집 게시판 명
데이터 병합
조금 전 데이터를 ‘이스라엘’, ‘하마스’, ‘팔레스타인’ 개별 단어로 커뮤니티 데이터를 수집했었습니다. 따라서, 각 3개의 키워드를 포함한 커뮤니티 데이터를 수집한 다음 병합(merge)을 해서 하나의 데이터로 통합을 해야 합니다.
데이터 관리 영역에서 ‘이스라엘’, ‘하마스’, ‘팔레스타인’ 데이터를 선택한 후 하단의 Merge 버튼을 클릭하면 병합된 데이터 이름을 지정하는 팝업 창이 나타나는 것을 확인할 수 있습니다. 데이터 이름을 ‘이스라엘_하마스’로 지정하면 하나로 통합된 데이터가 생성됩니다. 결과적으로 5,509개의 커뮤니티 데이터를 얻을 수 있었습니다.
수집된 데이터에 ‘이스라엘-하마스 전쟁’과 관련이 낮은 커뮤니티 데이터(예. 백신, 접종, 코로나, 확진, 감염, 화이자 등)가 존재했습니다. 이를 제거하기 위해선 결과 산출 영역에 있는 Filtering 기능을 활용해야 합니다.
Add direct 버튼을 클릭하고 불필요한 단어를 입력하고 Target field에서 삭제할 영역을 선택합니다. 그리고 Apply 버튼을 클릭하면 해당 단어가 들어있는 행은 모두 삭제됩니다. 해당 결과를 저장하고 싶으면 결과 산출 영역에서 Save 버튼을 클릭하면 됩니다.
텍스트 전처리
그리고 텍스트 전처리를 진행해 보겠습니다. 텍스트 전처리 기능은 NetMiner를 활용하여 비정형 텍스트에서 품사를 구분 및 추출하고, 이용자가 직접 작성한 사전(dictionary)을 적용함으로써 유의어, 불용어 처리 등을 쉽게 할 수 있도록 해줍니다.
- Target Data에서 전처리 대상이 되는 부분을 선택합니다.
- Language에서 전처리할 언어를 선택합니다. (영어/한국어)
- Path of Speech to Extract에서 추출한 단어의 품사를 지정합니다.
- Dictionary에서 Thesaurus에는 유의어를 지정해 줍니다(‘아이’, ‘어린이’ 단어를 동일하게 아이라는 단어로 변경).
- Defined Words에는 지정어를 지정해 줍니다(‘오사마 빈라덴’ 단어를 ‘오사마’, ‘빈라덴’ 2개의 단어로 분리하지 않고 하나의 단어로 취급).
- Exception List에는 분석에 필요 없는 제외어를 지정해 줍니다.
- Start 버튼을 클릭하면 전처리가 실행됩니다.
※ 품사 선택 및 사전 적용의 자세한 방법은 NetMiner 사용자 매뉴얼 'NetMiner Semantic Network Analysis'의 'Importing Data' >> 'Filter and Dictionary Settings' 항목을 참고해 주세요.
2. 수집된 커뮤니티 데이터 살펴보기
전체 5,509개의 데이터 중에서 가장 많이 수집된 커뮤니티 사이트는 MLBPARK였고 1,337개의 데이터가 수집됐습니다. MLBPARK, 루리웹, SLR클럽, 일간베스트, 클리앙 총 5개의 커뮤니티에서 수집된 데이터가 전체의 약 84.2%의 비중을 차지하고 있습니다.
각 커뮤니티별로 조회 수와 댓글이 가장 많은 게시글이 무엇인지 알아보도록 하겠습니다.
조회 수
댓글 수
3. 커뮤니티 데이터에서 하위 주제(토픽) 뽑아보기
이번에 수집한 커뮤니티 데이터에서는 토픽 일관성 계산 결과 중 c_v값(상세보기>>)을 참조하여 아래와 같이 6개의 토픽을 뽑았습니다.
Topic1 ~ Topic6에 주제 지정하고 각 토픽을 대표하는 주요 단어와 주요 커뮤니티 게시글 제목을 확인하겠습니다.
이 중 가장 많은 비중을 차지한 토픽은 ‘Topic4. 이스라엘-하마스 전쟁으로 인한 무고한 민간인들의 피해’(26%)였습니다.
4. 커뮤니티별 주요 주제 살펴보기
지금부터는 각 커뮤니티마다 어떤 토픽 위주의 게시글이 있는지 확인해 보도록 하겠습니다.
디시인사이드
디시인사이드에서는 전체 274개의 게시글 중 ‘중동지역에서의 유대인과 아랍인 간의 관계’와 관련된 게시글이 73개로 가장 많은 토픽 비중을 차지하고 있습니다. 반면에 ‘이스라엘-팔레스타인의 종교분쟁(기독교vs이슬람교)’과 관련된 게시글은 14개로 가장 적은 비중을 차지하고 있습니다.
루리웹
루리웹에서는 전체 1,119개의 게시글 중 ‘이스라엘-하마스 전쟁으로 인한 무고한 민간인들의 피해’와 관련된 게시글이 348개로 가장 많은 토픽 비중을 차지하고 있습니다. 반면에 ‘이스라엘-팔레스타인의 종교분쟁(기독교vs이슬람교)’과 관련된 게시글은 40개로 가장 적은 비중을 차지하고 있습니다.
뽐뿌
뽐뿌에서는 전체 54개의 게시글 중 ‘이스라엘 극우정권의 미국-이란과의 관계’와 관련된 게시글이 20개로 가장 많은 토픽 비중을 차지하고 있습니다. 반면에 ‘이스라엘-팔레스타인의 종교분쟁(기독교vs이슬람교)’과 관련된 게시글은 1개로 가장 적은 비중을 차지하고 있습니다.
5. 주요 토픽의 세부 내용 파악하기
가장 많은 비중을 차지한 주제인 ‘이스라엘-하마스 전쟁으로 인한 무고한 시민들의 피해’에 대한 내용을 좀 더 상세히 확인해 보겠습니다.
초록색 동그라미는 단어를, 단어와 단어 사이 연결선은 단어들이 함께 등장한 횟수를 의미합니다. 단어 동그라미의 크기는 해당 단어가 ‘이스라엘-하마스 전쟁으로 인한 무고한 시민들의 피해’ 주제에 포함될 확률을 의미합니다.
분석 결과를 기반으로 해석하면...
- 이스라엘-하마스 전쟁으로 인해 아이와 여성이 가장 많은 피해를 입었고 그들을 대상으로 한 각종 범죄 및 만행과 같은 전쟁의 참혹한 실상이 언론/뉴스를 통해 영상으로 급속도로 퍼지고 있는 것을 알 수 있습니다.
- 이번 전쟁이 비단 이스라엘-팔레스타인 두 국가의 문제만이 아니라 미국, 러시아와 같은 제3국에도 영향을 미치고 있다고 해석할 수도 있겠습니다.
- 이스라엘-하마스(팔레스타인) 전쟁을 보도하고 있는 전 세계 언론을 통해서 이스라엘을 옹호하는 의견과 팔레스타인을 옹호하는 의견이 첨예하게 대립하고 있다는 것 또한 알 수 있겠습니다.
이번에는 “아이”와 직접적으로 연결된 단어들을 추출한 에고 네트워크를 시각화 해보겠습니다.
총 62개의 단어가 “아이”와 직접적으로 연결되었습니다. “아이” 주변에 성범죄, 트위터, 학살, 군대, 공개, 민간인, 사진 등의 단어가 위치하는 것을 확인할 수 있습니다.
아이와 여성을 대상으로 성범죄가 발생했고 민간인을 포함하여 납치하고 참수를 하는 등 잔인하게 살해하고 학살하여 시체가 돌아다니는 장면이 트위터, 뉴스를 통해 전쟁 범죄의 만행과 그 피해자들의 모습이 전 세계적으로 보도되고 있음을 알 수 있습니다.
이번에는 “여성”과 직접적으로 연결된 단어들을 추출한 에고 네트워크를 시각화 해보겠습니다.
총 58개의 단어가 “여성”과 직접적으로 연결되었습니다. “여성” 주변에 피해자, 이슬람, 학살, 만행, 뉴스, 시신, 인질, 외국인, 만행 등의 단어가 위치하는 것을 확인할 수 있습니다.
아이와 같이 성범죄의 대상이 되어 전쟁 범죄 및 만행으로 인해 여성 피해자가 많이 발생했다는 것을 알 수 있고, 우리나라 여성이 생각하는 군대에 대한 인식과 독일 여성이 생각하는 군대에 대한 인식을 비교하는 의견도 있고 축제 중이었던 민간인들을 납치하여 잔인하게 살해하는 만행이 알려지면서 전 세계적으로 시위가 일어나고 있다는 것을 알 수 있습니다.
이번에는 “가자”와 직접적으로 연결된 단어들을 추출한 에고 네트워크를 시각화 해보겠습니다.
총 41개의 단어가 “가자”와 직접적으로 연결되었습니다. “가자” 주변에 보복, 악마, 납치, 군대, 폭격, 미국, 백린탄, 희생 등의 단어가 위치하는 것을 확인할 수 있습니다.
가자지구가 위치한 팔레스타인을 옹호하는 의견과 비판적인 시각을 갖는 의견이 대립하고 있음을 알 수 있습니다. 또한 이스라엘이 가자지구에 폭격을 가하고 민간인 거주 지역에 백린탄 무기를 사용한 것을 확인할 수 있습니다. 이스라엘에서 축제 중이었던 사람들을 학살하고 인질로 잡아갔으며 대부분이 여성과 아이를 비롯한 민간인이라는 것을 알 수 있었습니다.
데이터 분석을 위한 가장 쉬운 방법, NetMiner
관심 있는 이슈에 대해 커뮤니티에서 무슨 이야기를 했는지 궁금하시다면,
NetMiner 확장 프로그램인 Community Data Collector로 데이터를 수집하여 분석/비교할 수 있습니다.
Community Data Collector는 NetMiner 홈페이지에서 구입하실 수 있으며, 누구나 무료로 7일간 사용할 수 있습니다.
NetMiner Community Data Collector 보러가기 >>
NetMiner + Community Data Collector 무료로 시작하기 >>
사이람 온라인 교육 과정 - 텍스트 네트워크 분석 >>