반응형

통계·데이터과학 4

[통계.데이터 과학] '빅 데이터의 확산'으로 인한 '데이터 과학자'의 수요가 늘고있다.

데이터란 무엇일까? 데이터의 사전적 정의는 재료, 자료, 논거라는 뜻인 datum의 복수형이라고 정의 할 수 있다. 데이터란 모든 분석 혹은 활용가능한 디지털화된 자료이자 정보로 정의할 수 있다. 데이터는 의미 있는 모든 값을 정보로 하며 사람이나 기계가 생성하고 처리하는 형태로 표시된 것이다. 데이터는 세 가지로 분류되는데, 정형, 반정형, 비정형 데이터가 있다. 정형 데이터는 구조화된 데이터, 비정형 데이터는 음성, 동영상, 텍스트 데이터가 속한다, 데이터는 과거에부터 어떤 식으로든 존재했다. 그런데 왜 현재에 이렇게 급속도로 발전한 데에는 이유가 있을 것이다.  첫째, 다양한 데이터를 측정할 수 있는 모바일 스마트 기기와 센서의 확산이다. 휴대폰의 발전하면서 스마트폰으로 전환되었다. 스마트폰을 이용..

[통계.데이터과학] '데이터 과학'의 정의와 '데이터 과학자'를 준비의 필요성

데이터 과학이란 데이터로부터 의미 있는 정보를 추출하는 학문이다. 통계학이 정형화된 실험데이터를 분석 대상으로 하는 것에 비해 데이터 과학은 기업의 실무 현장에서 쌓이는 빅데이터를 대상으로 한다. 데이터 과학은 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 한다. 데이터 과학은 수학, 통계, 해킹 기술(코딩 기술)과 해당 분야 전문지식이 종합된 분야이다. 데이터 과학은 데이터를 처리하고 분석하는 것뿐만 아니라 데이터 시각화 등 분석 결과를 이해하기 쉽게 표현하는 것 또한 강조하고 있다, 대량의 데이터로부터 가치를 창출해 효과적으로 이용할 것인지를 목적으로 하고 있다. 빅데이터를 이해하고 기술적으로 처리하여 통찰을 구할 수 있는 인력 데이터 ..

[통계.데이터과학] COVID-19 전/후의 ‘재택’, ‘자가격리’라는 주제어를 통한 우리나라의 변화를 파악하기

COVID-19 전/후의 우리나라의 변화를 파악하기 위한 검색 주제어 2개로 ‘재택’, ‘자가격리’라는 주제어를 찾았고, 재택의 키워드에는 재택, 원격근무를 사용하였고 자가격리의 키워드에는 격리, 자가격리를 키워드로 사용하였다. 각 주제를 성별로 분류하여 그래프로 비교한 후, 의미 있는 결론을 도출하였다. COVID-19에 대해 알 필요가 있다. 2020년 1월 본격적으로 중국을 넘어 아시아권부터 퍼지기 시작해 2월 중순부터 전 세계로 퍼지기 시작했고 3월 말까지 전 세계의 모든 국가로 퍼져 수많은 사망자를 기록하였다. 2020년 1월 20일 첫 환자 발생 이후 자가격리는 최초 2주로 시작하였다가 2021년 12월 28일 10일로 단축 시행되었다. 2023년 6월 자가격리가 해제되었다. ①재택을 아래와..

[통계.데이터과학] 금,달러,위안화를 구글 트렌드로 분석 미래의 기축통화 패권

화폐의 단위는 인류역사에 중요한 가치의 수단이다. 초기에는 금을 가치교환의 기본 기준 수단으로 사용했으며 각 나라에는 그나라에 맞는 가치교화의 수단인 화폐가 존재 한다. 금은 전세계를 아우르는 중요한 가치교환 수단이다. 미국의 달러가 기축통화가 된 배경에는 미국은 금 1온스(oz)를 35달러에 연동시키는 ‘브레튼 우즈 체제’(금본위제)를 1925년 구축함으로써 세계 유일 기축통화의 패권을 거머쥐게 되었다. 최근 기축통화의 패권을 중국의 위안화가 넘보려고 시도하고 있다. 따라서, 금, 달러, 위안의 키워드를 정리하여 본다.① 골드는 과거 1935년을 정점으로 키워드가 감소하게 되는데, 이는 미국의 금본위제 정책의 시행으로 달러가 기축통화 패권을 갖게 되면서, 달러의 키워드 증가하는 결과를 통해서 볼 수 있..

반응형