2회 리포트 주석
- 1 종합일간지 , 경제지 , 지역일간지 , 방송사 등을 포함한 국내 최대의 기사DB에 빅데이터 분석 기술을 접목한 새로운 뉴스 분석 서비스입니다.
- 2 공공데이터포털은 공공기관이 생성 또는 취득하여 관리하고 있는 공공데이터를 한 곳에서 제공하는 통합 창구입니다. 국민이 쉽고 편리하게 공공데이터를 이용할 수 있도록 파일데이터, 오픈API, 시각화 등 다양한 형태의 자료를 제공하고 있습니다.
- 3 코로나19 전파단계 구분 정보는 질병관리청에서 운영하는 ‘코로나바이러스감염증-19 공식 홈페이지(http://ncov.mohw.go.kr)’ 의 ‘홈 > 뉴스 & 이슈 > 일별 브리핑 이슈 모아보기’ 메뉴에서 참고 하였습니다. 3단계(국내 초기발생 단계, 대규모 집단감염 발생 단계, 생활방역 전환단계(사회적거리두기 1단계))로 구분되어 있습니다.
- 4 코로나19 발생 초기에는 국내 언론에서 ‘우한 폐렴’이라는 명칭으로 보도되었습니다.
- 5 ‘확진자’ 검색어와 ‘코로나19 키워드’ 조합으로 검색. ‘(확진자) AND ((코로나19) OR (코로나-19) OR (코로나) OR (코로나 바이러스) OR (코로나바이러스) OR (신종 코로나바이러스) OR (신종코로나바이러스) OR (COVID-19) OR (COVID19) OR (코비드19) OR (코비드-19) OR (코비드) OR (우한 폐렴) OR (우한폐렴) OR (우한 코로나) OR (우한코로나))’로 검색
- 6 키워드의 검색어 처리 방식 으로 키워드를 문장의 최소 단위인 형태소 단위로 검색
- 7 키워드의 검색어 범위를 뉴스의 제목과 본문에서 검색
- 8 공공데이터포털의 ‘보건복지부_코로나19 감염_현황’ 오픈 API 제공 데이터
- 9 연합뉴스 2020년 2월 12일자 ‘[그래픽] 코로나19 국내 확진자 현황’ 기사
(https://www.yna.co.kr/view/GYH20200212001500044) - 10 2020년 10월 31일자 확진자 데이터는 2020년 11월 1일 자정 기준 확진자 현황 자료 적용
- 11 공공데이터포털에서 제공하는 코로나19 감염 현황 자료(일간 누적 확진자수 데이터 형태 제공)를 기초로 일별확진자 수를 계산한 후, 빅카인즈의 주간 뉴스 건수 집계기준에 맞게 주간 확진자 수를 계산
- 12 연합뉴스 2020년 1월 19일자 ‘[그래픽] 신종 코로나바이러스 감염환자 현황’ 기사 (https://www.yna.co.kr/view/GYH20200119001300044)
- 13 검색 결과 중 정확도순 상위 100 건의 뉴스에서 추출한 개체명(인물 , 장소 , 기관 , 키워드)과 검색어 관계를 보여줌. 개체명은 검색어 및 동일한 뉴스에서 추출된 다른 개체명과 연결되며, 본 문서에서는 가중치(관련기사 건수)가 3이상인 개체명을 추출하여 분석하였습니다.
- 14 검색 결과 중 분석 뉴스와 연관성(가중치, 키워드 빈도수)이 높은 키워드를 시각화 하여 보여줌. 가중치는 분석 뉴스 내에서 의미적 유사도가 높은 키워드 순으로 토픽랭크 알고리즘을 기반으로 합니다. 키워드 빈도수는 가중치 순으로 선정된 연관어를 해당 연관어가 등장한 횟수 기준으로 재정렬한 결과이며, 문서에서는 검색결과 중 최대 1,000건의 뉴스를 분석하였습니다.
- 15 주간 확진자 수와 코로나19 관련 키워드들의 주간 뉴스건수 간의 상관관계의 정도를 나타내는 수치(계수)이며, 상속성들 간의 상관관계를 확인할 수 있습니다. 상관계수는 +1과 -1 사이의 값을 가지며, +1에 가까울수록 높은 양의 상관관계를, 0에 가까울수록 상관관계가 없음을, -1에 가까울수록 높은 음의 상관관계를 의미합니다.
사용자 가이드
○ 본 가이드를 따라하시면 리포트에서 인용한 빅카인즈 검색 및 분석을 쉽게 확인할 수 있습니다.
○ 갈색 글꼴은 입력항목으로 내용을 ‘복사하기’ 하여 해당 항목 입력창에 ‘붙여넣기’ 하시기 바랍니다.
○ 녹색 글꼴은 지정항목으로 빅카인즈 화면에서 해당 항목을 선택하시기 바랍니다.
○ 파랑 글꼴은 버튼항목으로 해당 버튼을 클릭하시기 바랍니다.
1. 회원가입
가. 빅카인즈(https://www.bigkinds.or.kr)의 뉴스 검색 및 분석 서비스를 이용하기 위해서는 회원가입이 필요합니다.
나. 회원가입은 이메일 주소, 카카오 계정, 네이버 계정, 구글 계정으로 가능합니다.
다. 회원가입 후 로그인하시면 다양한 서비스를 이용하실 수 있습니다.
[1페이지]
2. 뉴스 검색·분석
가. ‘뉴스 검색·분석’ 화면(https://www.bigkinds.or.kr/v2/news/index.do)으로 이동
나. ‘Step 01. 뉴스검색’ 실행
☞ 기본 검색어 입력 : (확진자) AND ((코로나19) OR (코로나-19) OR (코로나) OR (코로나 바이러스) OR (코로나바이러스) OR (신종 코로나바이러스) OR (신종코로나바이러스) OR (COVID-19) OR (COVID19) OR (코비드19) OR (코비드-19) OR (코비드) OR (우한 폐렴) OR (우한폐렴) OR (우한 코로나) OR (우한코로나))
☞ 검색조건(기간) 입력 : 시작일(2019-12-31) ~ 종료일(2020-10-31) 선택 (또는 입력) ⇒ ‘적용’ 버튼 클릭
☞ 검색 실행 : ‘검색’ 버튼 클릭
다. ‘Step 02. 검색결과’ 확인
☞ 검색 결과 건수, 분석 기사 건수, 분석 제외 건수 등 검색결과를 확인합니다.
[활용Tip] ‘검색식 저장’ 기능을 활용하면 검색조건이 마이페이지에 저장되며, 현재 설정값을 불러올 수 있습니다.
라. ‘Step 03. 분석 결과 및 시각화’ 확인
☞ 데이터 다운로드, 관계도 분석, 키워드 트렌드, 연관어 분석, 정보 추출 등 기능이 제공됩니다.
[2페이지]
3. 키워드 트렌드
가. ‘Step 03. 분석 결과 및 시각화’에서 ‘키워드 트렌드’ 탭을 클릭합니다.
☞ 기간 선택 : ‘주간’ 버튼을 클릭합니다.
☞ 차트 선택 : ‘선형’ 버튼을 클릭합니다.
☞ 데이터 유형 : ‘기사 건수’ 버튼(Default)을 클릭합니다.
☞ 추가 기능 : ‘Download as…’, ‘Save as…’ 버튼을 이용하면 현재 분석된 차트 이미지 및 차트 원본 데이터를 원하는 파일 포맷으로 다운로드 및 저장이 가능합니다.
[활용Tip] ‘분석결과 저장’ 기능을 활용하면 검색조건이 마이페이지에 저장되며, 현재 분석결과를 불러올 수 있습니다.
[3페이지]
4. 연관 키워드 비교 분석
가. 확진자 수 데이터는 공공데이터포털(https://www.data.go.kr)에서 제공하는 ‘보건복지부_코로나19 감염_현황’ 오픈 API를 통해 제공 받을 수 있습니다.
나. 해당 오픈 API를 이용하기 위해서는
① 공공데이터포털에 회원가입을 해야합니다.
② ‘보건복지부_코로나19 감염_현황’ 오픈 API에 대한 활용신청을 통해 인증키를 발급받아야 합니다.
③ 발급받은 인증키를 이용하여 코로나19 감염 현황 데이터를 제공받을 수 있습니다.
다. 자세한 사항은 공공데이터포털 사이트를 참고하세요.
[4페이지]
5. 확진자 키워드와 확진자 수 비교 분석
가. [2페이지]의 키워드 트렌드 분석 자료와 [3페이지]의 확진자 수 분석 자료를 기초로 비교분석 합니다.
6. 관계도 분석
가. ‘Step 03. 분석 결과 및 시각화’에서 ‘관계도 분석’ 탭을 선택합니다.
☞ 그래프 구조 타입 : ‘기본’ 버튼을 선택합니다.
☞ 가중치(관련기사 건수) : ‘3’을 입력하거나, ‘-’, ‘+’ 버튼을 이용하여 3으로 바꾼 후, ‘적용‘ 버튼을 클릭합니다.
☞ 다운로드 : 분석결과 데이터 및 관계도 이미지를 다운로드 할 수 있습니다.
[활용Tip] ‘분석결과 저장’ 기능을 활용하면 현재 분석된 결과가 마이페이지에 저장되며, 향후 재활용이 가능합니다.
[5페이지]
7. 연관어 분석
가. ‘Step 03. 분석 결과 및 시각화’에서 ‘연관어 분석’ 탭을 선택합니다.
☞ 분석 뉴스 건수 : ‘1,000’ 버튼을 선택합니다.
☞ 차트 선택 : ‘워드클라우드‘ 버튼을 선택합니다.
☞ 데이터 유형 : ‘가중치’또는‘키워드 빈도수’ 버튼을 선택합니다.
☞ 워드클라우드 다운로드 : 워드클라우드 이미지를 다운로드 할 수 있습니다.
[활용Tip] ‘분석결과 저장’ 기능을 활용하면 현재 분석된 결과가 마이페이지에 저장되며, 향후 재활용이 가능합니다.
8. 상관관계 분석
가. 연관 키워드별 주간 뉴스 건수는 ‘코로나19 10개월 간의 기록 (1)‘ 에서의 분석 결과를 활용합나다.
나. 확진자 수 데이터는 [3페이지]의 확진자 수 분석 자료를 활용합니다.
다. 상관계수는 엑셀이나 통계 프로그램 등을 이용하여 계산합니다.
비밀번호 찾기
으로 임시 비밀번호를 전달하였습니다.
로그인 후 개인정보설정에서 비밀번호를 변경하시기 바랍니다.
아이디(E-mail) 찾기
회원가입
메일 인증 후 회원가입이 완료됩니다.
이메일 인증 후 빅카인즈 서비스를 이용하실 수 있습니다.
발송된 이메일은 사용하고 계신 메일 환경에 따라
1~5분 가량 수신이 지연될 수 있습니다.
메일을 재발송하려면 아래 버튼을 클릭해주세요.
카카오 계정으로 회원가입
개인정보 취급 재동의 안내
안녕하세요, 빅카인즈를 이용하고 계신 회원님께
진심으로 감사드립니다.
빅카인즈는 표준개인정보보호지침에 따라 개인정보를 보호하기 위해
2년 주기로 개인정보 재동의 절차를 거치고 있습니다.
회원님께서는 개인정보 재동의가 필요한 이용자에 해당합니다.
재동의하지 않을 경우, 자동탈퇴 처리되며,
자동탈퇴 후 빅카인즈를 이용하기 위해서는
다시 회원가입 절차를 밟아야 합니다.
아래 ‘재동의 안내페이지로 이동하기’ 버튼을 클릭하여
재동의해주시기 바랍니다.
용어설명
표제어
시소러스를 구성하는 용어 중 하나의 개념을 표현하는데 있어 우선으로 사용 하도록 채택한 용어입니다.
표제어는 동일하거나 유사한 개념을 표현한 용어(유의어) 그룹을 대표하며 유의어 없이 단독으로 존재할 수 있습니다.
ex) ‘달걀’의 표제어(대표어)는 ‘계란[鷄卵]’
유의어
대표어와 동등관계에 있는 용어 중 비대표어인 것을 가리킵니다. (표제어와 의미가 비슷한 키워드) ex) ‘계란[鷄卵]’의 유의어는 ‘달걀’
관련어
유의어 혹은 계층관계는 아니나 관련이 있는 용어를 가리킵니다. (표제어와 관계있는 키워드) ex) ‘계란[鷄卵]’의 관련어는 닭[鷄]