News Data Collector Plus AI 분석 리포트 생성 기능 업데이트!!!
안녕하세요 사이람입니다.
이번에 News Data Collector가 News Data Collector Plus로 새롭게 업데이트하면서 새롭게 추가된 ‘AI 분석 리포트 생성’ 기능에 대해 소개해드리고자 합니다.
AI 분석 리포트 생성 솔루션의 특징은 무엇인가요?
- Easy
원하는 국내 뉴스 기사 수집을 단 몇 번의 클릭만으로 누구나 쉽게 할 수 있습니다. No Code 기반으로 복잡하고 어려운 프로그래밍 지식이 없어도 누구보다 빠르게 사용자가 원하는 기사를 수집할 수 있습니다.
- AI
자동화된 텍스트 분석 프로세스를 통해
심플하게 요약 정리된 리포트(PPT)를 완성해 주고 AI가
해석해준 결과를 참고해서 사용자 맞춤형으로 편집할 수 있어 유연하고 효율적인 작업 환경을 제공합니다.
- Saving
정확한 데이터 분석과
사용자 맞춤형 편집이 결합된 최적의 보고서 작성 솔루션을 통해 시간과 노력을 절약할 수 있습니다.
- Yourself
데이터 분석 또는
프로그래밍 지식이 없는 사용자들도 스스로 데이터 수집 및 분석을 쉽게 할 수 있습니다.
이처럼 News Data Collector Plus의 AI 분석 리포트 생성 기능을 통해 연구자들은 수집된 뉴스 데이터로 복잡하고 다양한 네트워크
분석 결과와 분석 리포트를 한 번에 확인할 수 있습니다.
따라서, 복잡한 데이터를 신속하고 정확하게 분석하여 효율적인 의사결정을
지원함으로써 시간과 비용을 절감하고 성과를 극대화할 수 있습니다.
1. 업데이트 기능 소개
새롭게 업데이트된 ‘AI 분석 리포트’ 기능을 어떻게 이용해야 하는지 구체적으로 살펴보겠습니다.
Collect & Analyze 화면
1) 기존의 News
Data Collector UI 및 기능을 유지하고 ’AI 분석
리포트‘영역이 새로 추가되었습니다.
2) ’AI 분석 리포트‘기능을 사용하기 위해서는 두 가지 프로그램(Microsoft PowerPoint, Excel) 과 Open
AI의 유료 GPT API Key(GPT-4o)가 필요합니다.
- OpenAI의 유료 GPT
API Key를 발급받으신 다음, News Data Collector Plus 메뉴의 File > Preference에서 인증키를 입력 후 Add 버튼을
클릭하고 OK를 눌러 저장합니다.
- Open AI의 유료 GPT API Key 발급 방법: News Data Collector Plus 실행 후 >
Help > Open Manual 참조
News Data Collector Plus - API Key 입력화면
3) 이제 수집하고자 하는 기사의 수집 조건을 입력합니다.
4) AI 분석 리포트 > 데이터
처리, 분석에서 ‘데이터 수집과 분석
리포트까지 한 번에 확인할게요’ 옵션을 선택하고 ‘리포트 생성’ 버튼을 클릭합니다.
5) 데이터 수집부터 자동화된 분석 프로세스에 의해 AI 리포트가 자동으로 생성됩니다.
2. 세부 기능 소개
각 기능들에 대해 좀 더 자세히 살펴보겠습니다.
1) AI 분석
리포트의 ‘데이터 처리, 분석’에는 3가지 옵션을 선택할 수 있습니다.
① ‘데이터 수집만 할게요.’를 선택하시면 기존 News Data Collector와
동일하게 뉴스 기사만을 수집하실 수 있습니다.
② ‘이미 수집된 데이터의
분석 리포트를 볼게요.’를 선택하시면 기존에 수집하신 데이터로 AI 분석
리포트를 생성할 수 있습니다.
③ ‘데이터 수집과 분석
리포트까지 한 번에 확인 할게요.’를 선택하시면 데이터 수집부터 분석 및 리포트 생성을 클릭 한 번으로
수행하실 수 있습니다.
데이터 처리, 분석 옵션 화면
2) ‘데이터 처리, 분석’을 선택하신 다음 ‘설정’ 버튼을 클릭하시면 ‘데이터 처리 및 분석 옵션’을 수정할 수 있습니다.
설정 화면
3) 설정에서 사용자가 수정할 수 있는 항목은 다음과 같습니다.
l 비정형
텍스트 처리
① 분석 대상 선택
② 사용자 사전 파일 확인
- News Data Collector Plus에서는 ㈜사이람의 분석 컨설팅 노하우를 기본으로 한 샘플 사전 파일을 제공하며, 이 사전을 이용하여 사전 처리가 진행됩니다.
- 반드시, AI 분석 리포트 작성 전 샘플 사전 확인하여 연구 및 전문
분야에 맞추어 사전을 수정하신 후 사용하시는 것을 권해드립니다.
l 키워드
네트워크 구성
① 일반 단어 삭제 기준: 뉴스
기사에서 자주 사용되는 관용적인 단어를 제거하기 위해, 사용자가 TF-IDF의 하위 퍼센트 값을 입력합니다.
② 단어 간 링크 방향: 키워드
네트워크의 단어 간 링크 방향을 설정합니다.
③ 최소 동시 등장 빈도: 자주
동시 등장한 단어 쌍을 추출하기 위해, 단어 간 최소 동시 등장 빈도를 입력합니다.
l 분석
① 시계열 분석 단위: 뉴스
데이터 및 토픽의 시기별 비중을 살펴보기 위해 기간 단위를 설정합니다.
② 최적 토픽 모델 탐색을 위한 토픽 수 범위: 토픽 분석 전, 적합한 토픽 수를 찾기 위한 시뮬레이션
범위를 지정합니다(최대 토픽 수는 30까지만 입력할
수 있습니다).
l 리포트
① 파일 위치: AI 분석
리포트와 분석 결과의 저장 경로를 지정합니다.
※ 기능 별 자세한 사항은 반드시 News
Data Collector Plus의 매뉴얼을 확인해주세요.
※ 매뉴얼 위치: News
Data Collector Plus 실행 > Help > Open
Manual
3. 결과물
확인하기
AI 생성된 리포트에는 어떤 결과물들로 구성되었을까요?
AI 분석 리포트에서 확인할 수 있는 결과는 총 3가지로 구분됩니다.
1. 시계열 빈도 분석
‘노벨 문학상’ 기사가 언급된 기사량에 대한 빈도 분석 결과입니다.
이처럼 ‘시계열 빈도 분석’을
통해 특정 키워드와 관련된 전반적인 기사량 변화 및 각 언론사별 보도량까지 세밀한 결과를 확인하실 수 있습니다.
2. 핵심 키워드 분석
특정 키워드로 검색한 기사에서 가장 많이 언급된 단어들과 주요 단어 간의 관계를 워드 클라우드, 단어 네트워크 맵 등의 시각화 결과로 확인할 수 있습니다.
3. 이슈 분석
토픽 모델링 산출 결과를 토대로 생성된 토픽 수와 각 토픽의 비중을 언론사 별로 확인함으로써 특정 키워드에 대해 언론사가 집중적으로 다룬 주제를 파악할 수 있고,
여론 동향을 파악할 수 있습니다.
이전에는 News Data Collector로 뉴스 기사를
수집한 이후 여러 복잡한 분석 과정을 사용자가 직접 실행하고 결과를 문서로 정리하는데 많은 시간이 소요되었던 반면,
새롭게 추가된 AI 분석 리포트
생성 기능을 통해 복잡한 분석 절차와 리포트 생성까지 'One Click'으로
빠르고 정확하게 결과물을 확인할 수 있게 되었습니다.
또한 생성된 결과물에서 연구자 필요에 따라 추가적인 분석을 진행할 수 있고 리포트 결과도 연구자 입맛에 맞는
표현이나 문장으로 내용을 수정할 수도 있어 업무에 유연하게 활용할 수 있을 것으로 기대됩니다.
<참고 사항>
※ AI 분석 리포트는 NetMiner를 활용한 자동화된 분석 결과와 이에 대한 언어모델(OpenAI
gpt4-o)의 해석이 포함되어 있습니다. 언어모델의 해석은 오류가 있을 수 있으므로
분석결과 산출물을 직접 확인함으로써 검증해야할 필요가 있습니다(리포트 저장 위치의 분석 결과와 nmf 파일 확인)
※ NetMiner 최소 메모리 할당(7G) 환경에서는 대용량 데이터 대상으로 분석이 원활하게 수행되지 않아 AI 분석 리포트를 확인하기 어려울 수 있습니다(성능
테스트 조건: 뉴스 기사 수 – 1만7천개, 단어(노드) 수: 3만개, 단어-뉴스 네트워크 링크 수 - 150만개).
이 경우 뉴스 기사 수를 축소하여 분석하거나, NetMiner에 할당된
메모리를 증가시켜야 합니다.
[구입 안내]
※ 기존 고객 중
NetMiner 홈페이지 계정이 없거나 홈페이지에서 라이선스 내역이 확인되지 않으실 경우,
netminer@cyram.com으로 보유하고 계신 라이선스의 Product ID 정보를
보내주시기 바랍니다.