연구개발(R&D) 업무에서 그래프 분석 활용방향
안녕하세요,
그래프 데이터 사이언스(Graph Data Science) 기술 기업 ㈜사이람입니다.
여러분들께서 수행하는 연구개발(R&D) 업무에서 그래프 분석을 활용하면 효율성과 효과를 높일 수 있습니다. 그래서 연구개발(R&D) 업무에서 그래프 분석을 어떻게 활용할 수 있는지 설명 드리고자 합니다.
아래 첨부 자료에는 표로 요약한 내용도 확인하실 수 있으니, 많은 관심 부탁 드립니다 :)
저희가 제공해 드리는 자료가 여러분의 업무에 많은 도움이 되기를 바랍니다.
연구개발(R&D) 업무는 일반적으로 다음과 같은 주요 단계로 구성됩니다.
과제 기획(연구 설계) 단계
연구 수행 단계
성과 공유/평가 단계
사후 관리 단계
각 단계에서 소셜 네트워크 분석(SNA), 그래프 머신러닝, 그리고 텍스트 네트워크 분석을 활용하면 효율성과 효과를 높일 수 있습니다. 아래에서 각 단계별로 그래프 분석방법을 활용한 분석주제와 필요한 데이터, 분석 방법을 설명하였습니다.
※ 아래 내용 중 소셜 네트워크 분석과 텍스트 네트워크 분석 기능은 NetMiner4에서 지원하며, 그래프 머신러닝 기능의 대부분은 NetMiner365에서 지원합니다.
1. 과제 기획(연구 설계) 단계
연구개발(R&D) 업무의 과제 기획 단계에서는 연구 주제를 선정하고, 전략적 연구 방향을 설정하는데 그래프 분석 방법을 활용할 수 있습니다.
소셜 네트워크 분석(SNA)
분석 주제 : 연구자 협업 네트워크 분석을 통한 핵심 연구자 및 연구 그룹 식별
필요 데이터 : 공동 저자(Co-authorship) 관계 데이터, 연구자 간의 협업 기록
분석 방법 :
연구자 간의 공동 저자 관계를 네트워크로 모델링합니다.
네트워크 중심성 지표(연결 중심성, 매개 중심성 등)와 응집그룹 분석(커뮤니티 분석 등)를 활용하여 영향력 있는 연구자와 연구 그룹을 식별합니다.
이를 통해 잠재적인 협업 파트너를 파악하고, 최적화된 연구팀을 구성할 수 있습니다.
텍스트 네트워크 분석
분석 주제 : 학술 문헌의 키워드 네트워크 분석을 통한 연구 동향 파악
필요 데이터 : 관련 분야의 학술 논문, 특허 문서, 기술 보고서 등의 텍스트 데이터
분석 방법 :
문헌에서 주요 키워드와 주제어를 추출합니다(자연어 처리기법 활용).
키워드 간의 공출현(co-occurrence) 관계를 기반으로 네트워크를 구성합니다.
네트워크 분석과 토픽 모델링을 통해 연구 주제 간의 연관성과 클러스터를 파악하여 현재 연구 분야의 주요 주제 비중과 구조적 공백을 통해 새로운 연구 기회를 식별합니다.
그래프 머신러닝 분석
분석 주제 : 논문 인용 네트워크를 활용한 유망 연구 주제 예측
필요 데이터 : 논문 인용 관계 데이터
분석 방법 :
논문 간의 인용 관계를 그래프로 모델링합니다.
그래프 신경망(GNN) 등의 머신러닝 기법을 적용하여 노드(논문)를 저차원 공간에 임베딩(embedding)합니다.
링크 예측(Link Prediction) 방법을 활용하여 향후 인용될 가능성이 높은 논문을 식별하고, 이를 기반으로 유망한 연구 주제를 예측합니다.
활용사례
네트워크 분석 기반 ICT 정책 트렌드 연구
고객 : ICT R&D 분야 공공기관
주요 목표 : 국가 정보통신기술(ICT) 연구개발(R&D)의 전략 보고서를 분석하여 각각 다른 시기(2013년/2018년)의 ICT R&D 정책의 방향이나 전략에 대한 변화, 차이점 파악
주요 내용
데이터 : 2013년, 2018년 두 시기에 작성된 ICT R&D 전략 보고서
데이터 전처리 : 주제와 무관한 데이터 제외, 유의어/지정어 처리, 형태소 분석
데이터 분석
단어 간 네트워크 생성 : 단어 간 동시출연 빈도 측정
네트워크 특성 분석 : 두 시기간 차이점 파악
네트워크 지도(시각화)
핵심어 분석 : 연결중심성(Degree Centrality), 매개중심성(Betweenness Centrality) 적용
토픽 모델링 : 문서 내 주제 파악
결과 활용
각기 다른 두 개의 시기에 작성된 보고서의 ICT R&D 방향성 비교 및 세부 추진 방안에 대한 변화 비교
두 시기 간의 트렌드 및 트렌드 변화 파악
2. 연구 수행 단계
연구개발(R&D) 업무의 연구 수행 단계에서는 그래프 분석 방법을 활용하여 연구팀의 협업 효율성을 높이고, 연구 진행상황을 효과적으로 모니터링하며, 실험 결과의 정확도를 향상시킬 수 있습니다.
소셜 네트워크 분석(SNA)
분석 주제 : 연구팀 내 협업 구조 분석을 통한 의사소통 효율성 향상
필요 데이터 : 연구팀 구성원 간의 이메일, 회의록, 협업 도구 사용 기록 또는 설문조사 등
분석 방법 :
연구팀 구성원 간의 커뮤니케이션 데이터를 수집하여 네트워크를 구성합니다.
네트워크의 중심성 지표(연결 중심성, 근접 중심성, 매개 중심성 등)를 분석하여 정보 흐름의 핵심 인물(허브, 중개자 등)과 잠재적 문제 지점을 파악합니다.
이를 통해 의사소통의 병목 현상을 식별하고, 협업 구조를 개선하여 연구팀 업무의 소통 효율성과 생산성을 높일 수 있습니다.
텍스트 네트워크 분석
분석 주제 : 연구 노트 및 실험 기록의 주요 개념 네트워크 분석을 통한 연구 진행 상황 모니터링
필요 데이터 : 연구 노트, 실험 보고서, 중간 발표 자료 등의 텍스트 데이터
분석 방법 :
연구 과정에서 생성된 문서에서 자연어 처리기법을 활용하여 주요 개념과 키워드를 추출합니다.
키워드 간의 공출현(co-occurrence) 관계를 기반으로 네트워크를 구성합니다.
네트워크 분석을 통해 단계별 연구 진행 상황을 시각화하고, 연구의 내용적 방향을 조정하는 데 활용합니다.
그래프 머신러닝 분석
분석 주제 : 실험 데이터 간의 복잡한 상호작용 모델링을 통한 결과 예측
필요 데이터: 실험 변수와 결과 간의 관계 데이터
분석 방법 :
실험 변수와 결과를 노드로, 변수 간의 관계를 링크로 하는 그래프를 구성합니다.
그래프 신경망(GNN) 등의 머신러닝 기법을 적용하여 노드를 저차원 공간에 임베딩합니다.
학습된 모델을 통해 새로운 실험 조건에서의 결과를 예측하고, 실험 설계를 최적화하는 데 활용합니다.
활용사례
소셜 네트워크 분석(SNA) 기반 조직 협업 및 소통 네트워크 분석
고객 : 자동차 제조 기업
주요 목표 :
정보공유, 협조, 지시/보고 등 조직 내 협업 및 소통 네트워크 현황 파악
조직 내 협업 문제 지점 발굴 및 개선
주요 내용
부서별 소통 네트워크 가시화, 네트워크 지수 측정을 통한 소통 구조 이해
소통 영향력 분석을 통한 영향력자/소외자 파악
활용/기대효과
협업 및 소통 구조 파악 및 조정을 위한 시사점 획득
정량적인 측정을 통한 조직 간 비교 가능
정기적 측정을 통한 협업 및 소통 관리 기능
3. 연구 성과 공유/평가 단계
연구개발(R&D) 업무의 성과 공유 및 평가 단계에서는 연구 성과의 확산 경로와 영향력을 파악하고, 핵심 내용을 효과적으로 전달하며, 객관적인 성과 평가를 통해 향후 연구 방향을 전략적으로 설정하는데 그래프 분석을 이용할 수 있습니다.
소셜 네트워크 분석(SNA)
분석 주제 : 연구 성과의 확산 경로 분석을 통한 영향력 평가
필요 데이터 : 연구 결과에 대한 인용 데이터, 소셜 미디어에서의 언급 데이터, 협업 네트워크 데이터
분석 방법 :
연구 결과가 학술 논문, 특허, 소셜 미디어 등에서 언제, 어떻게 인용되고 언급되는지 데이터를 수집합니다.
이러한 인용 및 언급 관계를 기반으로 네트워크를 구성하고, 연결성 및 중심성 지표(네트워크 지름, 경로거리, 위세 중심성 등)를 분석하여 연구 성과의 확산 경로와 영향력을 평가합니다.
이를 통해 연구 성과의 파급 효과(규모, 속도 등)를 파악하고, 향후 연구 방향 설정에 활용할 수 있습니다.
텍스트 네트워크 분석
분석 주제 : 연구 성과 문서의 주요 개념 네트워크 분석을 통한 핵심 내용(주제) 도출
필요 데이터 : 연구 보고서, 논문, 발표 자료 등의 텍스트 데이터
분석 방법 :
연구 성과 문서에서 자연어 처리기법을 통해 주요 키워드를 추출합니다.
키워드 간의 공출현(co-occurrence) 관계를 기반으로 네트워크를 구성합니다.
네트워크 분석(중심성 분석, 응집그룹 분석 등)을 통해 연구 성과의 핵심 주제 키워드를 파악하고, 효과적인 커뮤니케이션 전략을 수립합니다.
그래프 머신러닝 분석
분석 주제 : 연구 성과 평가 지표 간의 연관성 분석을 통한 성과 예측 모델 개발
필요 데이터 : 연구 성과 평가 지표 데이터(예: 논문 수, 인용 수, 특허 수, 기술 이전 실적 등)
분석 방법 :
연구 성과 평가 지표 간의 관계를 그래프로 모델링합니다.
그래프 신경망(GCN) 등의 머신러닝 기법을 적용하여 노드(평가 지표)를 임베딩합니다.
학습된 모델을 통해 특정 평가 지표의 변화가 다른 지표에 미치는 영향을 예측하고, 종합적인 연구 성과를 평가하는 데 활용합니다.
활용사례
기초∙원천 연구성과 정보제공시스템 기획 및 구축
고객 : 국가 R&D 과제 정보 관리 기관
주요 목표 :
기초∙원천 분야 연구 과제의 수행으로 산출된 주요 성과정보를 정보 수요자인 기업가(일반인), 연구자, 정책담당자가 원하는 정보를 쉽고, 효과적/효율적으로 검색∙활용할 수 있도록 지식지도* 구축(지식지도 : 정보 안에 숨겨져 있는 혹은 잠재되어 있는 유용한 정보를 효과적으로 분석 및 가공하여 지식정보 간의 관계를 시각적 네트워크로 표현한 것)
주요 내용:
데이터
과제정보
수행기관정보
수행인력정보
성과정보(성과소개서)
지식지도 모델링
기대효과
검색 결과로 산출된 성과물 간의 연결 구조를 파악하게 됨으로써, 추가 검색을 위한 우선 순위를 결정하는데 활용되어 지식 탐색을 효과적으로 지원
과학기술 연구기획, 평가, 투자 및 정책수립에 적합한 정보와 지표 제공
4. 사후 관리 단계
연구개발(R&D) 업무의 사후 관리 단계에서는 연구 성과의 지속적인 활용과 개선방향을 제시하고, 연구의 영향력을 극대화할 수 있습니다.
소셜 네트워크 분석(SNA)
분석 주제 : 연구 성과의 확산 및 협업 네트워크 분석
필요 데이터 : 연구 성과의 인용 데이터, 연구자 간 협업 데이터, 학회 및 세미나 참석 기록 등
분석 방법 :
연구 성과가 학계 및 산업계에서 어떻게 인용되고 활용되는지 데이터를 수집합니다.
연구자 간의 협업 네트워크를 구성하여 중심성 및 응집 및 역할그룹 지표를 분석합니다.
이를 통해 연구 성과의 영향력과 협업 구조를 파악하고, 향후 협업 전략을 수립하는 데 활용합니다.
텍스트 네트워크 분석
분석 주제 : 연구 성과 관련 피드백 및 리뷰 분석
필요 데이터 : 연구 성과에 대한 피드백 문서, 리뷰 논문, 언론 기사 등의 텍스트 데이터
분석 방법 :
피드백 및 리뷰 문서에서 주요 키워드와 주제어를 추출합니다.
키워드 간의 공출현 관계를 기반으로 네트워크를 구성합니다.
네트워크 분석을 통해 연구 성과에 대한 주요 의견과 개선점을 파악하고, 향후 연구 방향 설정에 활용합니다.
그래프 머신러닝 분석
분석 주제 : 연구 성과의 사업화 및 기술 이전 가능성 예측
필요 데이터 : 연구 성과 관련 특허 데이터, 시장 동향 데이터, 기술 이전 사례 데이터 등
분석 방법 :
연구 성과와 관련된 특허 및 시장 데이터를 그래프로 모델링합니다.
그래프 신경망(GraphSAGE) 등의 머신러닝 기법을 적용하여 노드(특허, 기술)을 임베딩합니다.
학습된 모델을 통해 연구 성과의 사업화 가능성과 기술 이전 가능성을 예측하고, 전략적 의사 결정에 활용합니다.
활용사례
소셜 네트워크 분석을 이용한 성과정보 분석
고객 : 중앙행정기관
주요 목표 :
R&D 성과정보를 R&D 사업의 평가에 대응하기 위한 소셜 네트워크 분석(SNA) 기법 도입
향후 성과정보의 확산 전략 및 서비스 체계 구축
정책담당자 및 연구자 성과정보의 효과적 활용
주요 내용 :
데이터
과제정보
성과정보(논문, 산업재산권, 기술료, 사업화 등)
데이터 모델링
결과 활용
R&D 과제 및 성과를 통해 형성된 연구자와 연구 분야 간의 숨은 관계를 가시화하여, 향후 연구자들이 잠재적 공동 연구자와의 협업을 용이하게 하며 또한 연구 분야 간 동향을 파악
이를 통해 정책 담당자가 연구 분야 간 트렌드를 확인하고, 연구 분야의 기술 연계 현황을 분석할 수 있도록 하며, 연구자가 연구자 간의 중요 인물을 파악 → 연구 성과의 파급 효과를 파악하고, 향후 연구 방향 설정에 활용