목차
-서론
1. 빅데이터의 개념
2. 빅데이터 종류와 특징분석
- 본론
1. 빅데이터 활용사례연구
1.1 해외사례연구
1) 구글
① 독감트랜드 예측
② 구글 번역기
2) 오바마 선거전략 사례연구
1.2 국내 활용사례연구
1) 삼성전자
2) 영화추천앱 ‘왓챠’
1.3 공공기관 사례
1) 서울시 올빼미 버스 (심야버스)
2) 서울시와 SKT의 ‘택시 매치메이킹’
- 결론 (빅데이터 활용 개선방안 및 향후전망)
- 느낀점
- 참고문헌
1. 빅데이터의 개념
2. 빅데이터 종류와 특징분석
- 본론
1. 빅데이터 활용사례연구
1.1 해외사례연구
1) 구글
① 독감트랜드 예측
② 구글 번역기
2) 오바마 선거전략 사례연구
1.2 국내 활용사례연구
1) 삼성전자
2) 영화추천앱 ‘왓챠’
1.3 공공기관 사례
1) 서울시 올빼미 버스 (심야버스)
2) 서울시와 SKT의 ‘택시 매치메이킹’
- 결론 (빅데이터 활용 개선방안 및 향후전망)
- 느낀점
- 참고문헌
본문내용
데이터량으로 정의되거나 데이터 수집 및 분석에 장기적인 시간을 요하므로, 데이터양의 증가를 그 특징으로 하는 것이 명확해 보인다. 그러나 단순한 데이터 양의 증가를 넘어서서, 빅 데이터는 크게 데이터 양(volume), 데이터 속도(velocity), 그리고 데이터 다양성(variety) 등 세 가지 요소의 복합적인 변화를 그 특징으로 한다.
첫째, 데이터 양(volume)은 단순 저장되는 물리적 데이터 양의 증가 뿐만이 아닌, 이를 분석 및 처리하는 데 어려움이 따르는 네트워크 데이터의 급속한 증가는 빅데이터의 가장 기본적인 특징이다.
둘째, 데이터 속도(velocity)에서 빅데이터는 데이터의 실시간 처리 및 장기적 접근을 요구한다. 데이터 생산 및 유통, 수집 및 분석 속도의 증가와 이에 대한 실시간 처리 및 장기간에 걸쳐 데이터를 수집·분석 하는 장기적 접근이 빅데이터의 속도적 특성이다.
셋째, 데이터 다양성(variety)에서 기존 예측 분석에서 데이터 분석은 기업 내부에서 발생하는 운영 데이터인 ERP(전사적 자원 관리), SCM(공급망 관리), MES(Manufacturing execution system), CRM(고객 관계 관리) 등의 시스템에 저장되어 있으며, 잘 정제되어 있고, 의미도 명확한 RDBMS(관계형 데이터베이스) 기반의 정형 데이터를 통해 이뤄졌다. 최근 빅 데이터를 이용한 데이터 분석은 고정된 시스템에 저장되어 잇지 않은 XML, HTML 등과 같이 데이터베이스 스키마를 포함하는 반정형 데이터를 이용한 분석뿐만이 아닌, 사진·오디오·비디오 형식의 소셜 미디어 데이터나 로그파일(Database log)같이 비정형 데이터도 처리할 수 있는 능력을 요구한다. 즉 빅 데이터의 성장이란 단순히 데이터의 양의 증가하는 것을 넘어서서, 다양한 형태의 데이터 양이 증가하는 것을 의미하는 것이다.
빅데이터에 대한 정의는 보는 관점에 따라 다양하지만, 결론적으로 모두가 말하고자 하는 것은 빅데이터란 현재 시스템의 처리 범위를 넘어서는 데이터이며, 기존의 방식과 다른 새로운 처리 및 분석방법이 필요하다는 것이다.
그리고 빅데이터는 [표 2]와 같이 데이터의 정형화 정도에 따라 정형(Structured), 반정형(Semi-Structured), 비정형(UnStructured)데이터로 분류된다. 이중 기업 내부에 축적된 비정형 데이터의 비중이 2006년 36%에서 2015년에는 77%로 2배 이상 급증할 것으로 전망하고 있으며, 비교적 선형적으로 증가하던 정형 데이터조차 연간 40~60%에 이르는 증가세를 보이고 있다.
[표 1] 기관별 빅데이터에 대한 정의
기관
정의
참고
맥킨지(2011)
● 기존의 방식의 저장, 관리 분석할 수 있는 범위를 초과 하는 규모의 데이터로 정의
데이터 규모에 초점
IDC(2011)
● 다양한 종류의 데이터로부터 낮은 비용으로 가치를 추출하고 데이터 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처로 정의
업무수행에 초점
가트너(2011)
● 빅데이터는 21세기의 원유로 다양한 종류의 데이터가 기업이 감당할 수 없을 정도로 빠르게 생성되는 현상으로 정의
데이터 활용에 초점
[표 2] 빅데이터 종류
정의
설명
정형(Structured)
● 고정된 필드에 저장된 데이터
(ex) 관계형 데이터베이스, 그프레트시트
반정형(Semi-Structured)
● 공정된 필드에 저장되어 있지는 않지만 메타데이터나 스키마 등을 포함하느 ㄴ데이터 (ex) XML이나 HTML 텍스트
비정형(UnStructured)
● 고정된 필드에 저장되어 있지 않은 데이터 (ex) 텍스트 분석이 가능한 텍스트 문서 및 이미지/동영상/음성 데이터
정보통신기술의 발달과 함께 가속화된 디지털 혁신으로 인해 현대 사회는 무수히 많은 데이터가 실시간으로 발생하고 있다. 특히 스마트 기기 및 소셜미디어 등으로 대표되는 다양한 정보채널의 등장과 이로 인한 정보의 생산, 유통, 보유량의 증가는 데이터의 기하급수적인 증가를 이끌고 있다. ICT 시장조사기관 IDC는 2011년도 전 세계의 디지털 정보량이 약 1.8제타 바이트에 달할 것이며 디지털 정보의 75%가 개인에 의해 생성되고 매 2년마다 2배씩 증가할 것으로 전망했다.
결국 이렇게 급증해가는 디지털 정보량을 아우를 수 있는 개념과 용어가 필요하게 되었고 빅데이터가 그 역할을 맡게 되었다. 원래 빅데이터의 전통적 개념은 구글과 같은 대기업이나 NASA의 연구과학 프로젝트에서 분석하는 대용량의 데이터를 일컫는 것이었다. 그러나 점차 그 개념이 확장되어 Manovich(2011)는 빅데이터를 시간 흐름상 데이터를 수집하고 처리한던 소프트웨어 도구의 능력을 넘어서는 데이터들의 모임으로 정의하고 이런 데이터의 크기는 앞으로 꾸준하게 그 범위가 변화할 것이라고 하였다. Madden(2012)은 빅데이터를 기존의 툴이나 프로세스로 처리하기에는 너무 크고 빠르고 어려운 데이터를 의미한다고 하였다. 맥킨지는 2011년 발표한 보고서에서 수집·저장·소통·집단화·분석이 가능한 거대한 데이터 풀(Pool)을 빅데이터로 정의하고 이제는 글로벌 경제의 모든 영역과 기능의 일부가 되었다고 하였다.
이와 같이 빅데이터는 당초 수십에서 수천 TB에 달하는 거대한 데이터 집합 자체만을 지칭하던 말이었으나 기존의 관리 및 분석 체계로는 감당하기 어려운 정도의
막대한 데이터를 빅데이터로 지칭하기 시작했고 점차 관련 도구·플랫폼·분석기법까지 포괄하는 용어로 변화학고 있다. 더 나아가 김상락 외(2012)는 빅데이터를 대용량의 데이터를 저장·수집·발굴·분석·비즈니스화 하는 일련의 과정으로 정의하며 빅데이터의 핵심은 데이터의 비즈니스화에 있음을 강조하였다.
이러한 빅데이터는 2012년 들어 단순한 IT트렌드를 넘어 경제 사회 현안 해결의 실마리로 주목 받으며 빅데이터 시대가 개막되었음을 예고했다. 2012년 1월에 열린 세계경제포럼(다보스포럼)에서는 빅데이터 기술을 국제 개발의 새로운 가능성을 여는 2012년의 가장 중요한 기술로 지목했고, 같은 해 3월 미국은 빅데이터 주도권 확립을 위해 백악관 과학기술정책실(OSTP)이 주
첫째, 데이터 양(volume)은 단순 저장되는 물리적 데이터 양의 증가 뿐만이 아닌, 이를 분석 및 처리하는 데 어려움이 따르는 네트워크 데이터의 급속한 증가는 빅데이터의 가장 기본적인 특징이다.
둘째, 데이터 속도(velocity)에서 빅데이터는 데이터의 실시간 처리 및 장기적 접근을 요구한다. 데이터 생산 및 유통, 수집 및 분석 속도의 증가와 이에 대한 실시간 처리 및 장기간에 걸쳐 데이터를 수집·분석 하는 장기적 접근이 빅데이터의 속도적 특성이다.
셋째, 데이터 다양성(variety)에서 기존 예측 분석에서 데이터 분석은 기업 내부에서 발생하는 운영 데이터인 ERP(전사적 자원 관리), SCM(공급망 관리), MES(Manufacturing execution system), CRM(고객 관계 관리) 등의 시스템에 저장되어 있으며, 잘 정제되어 있고, 의미도 명확한 RDBMS(관계형 데이터베이스) 기반의 정형 데이터를 통해 이뤄졌다. 최근 빅 데이터를 이용한 데이터 분석은 고정된 시스템에 저장되어 잇지 않은 XML, HTML 등과 같이 데이터베이스 스키마를 포함하는 반정형 데이터를 이용한 분석뿐만이 아닌, 사진·오디오·비디오 형식의 소셜 미디어 데이터나 로그파일(Database log)같이 비정형 데이터도 처리할 수 있는 능력을 요구한다. 즉 빅 데이터의 성장이란 단순히 데이터의 양의 증가하는 것을 넘어서서, 다양한 형태의 데이터 양이 증가하는 것을 의미하는 것이다.
빅데이터에 대한 정의는 보는 관점에 따라 다양하지만, 결론적으로 모두가 말하고자 하는 것은 빅데이터란 현재 시스템의 처리 범위를 넘어서는 데이터이며, 기존의 방식과 다른 새로운 처리 및 분석방법이 필요하다는 것이다.
그리고 빅데이터는 [표 2]와 같이 데이터의 정형화 정도에 따라 정형(Structured), 반정형(Semi-Structured), 비정형(UnStructured)데이터로 분류된다. 이중 기업 내부에 축적된 비정형 데이터의 비중이 2006년 36%에서 2015년에는 77%로 2배 이상 급증할 것으로 전망하고 있으며, 비교적 선형적으로 증가하던 정형 데이터조차 연간 40~60%에 이르는 증가세를 보이고 있다.
[표 1] 기관별 빅데이터에 대한 정의
기관
정의
참고
맥킨지(2011)
● 기존의 방식의 저장, 관리 분석할 수 있는 범위를 초과 하는 규모의 데이터로 정의
데이터 규모에 초점
IDC(2011)
● 다양한 종류의 데이터로부터 낮은 비용으로 가치를 추출하고 데이터 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처로 정의
업무수행에 초점
가트너(2011)
● 빅데이터는 21세기의 원유로 다양한 종류의 데이터가 기업이 감당할 수 없을 정도로 빠르게 생성되는 현상으로 정의
데이터 활용에 초점
[표 2] 빅데이터 종류
정의
설명
정형(Structured)
● 고정된 필드에 저장된 데이터
(ex) 관계형 데이터베이스, 그프레트시트
반정형(Semi-Structured)
● 공정된 필드에 저장되어 있지는 않지만 메타데이터나 스키마 등을 포함하느 ㄴ데이터 (ex) XML이나 HTML 텍스트
비정형(UnStructured)
● 고정된 필드에 저장되어 있지 않은 데이터 (ex) 텍스트 분석이 가능한 텍스트 문서 및 이미지/동영상/음성 데이터
정보통신기술의 발달과 함께 가속화된 디지털 혁신으로 인해 현대 사회는 무수히 많은 데이터가 실시간으로 발생하고 있다. 특히 스마트 기기 및 소셜미디어 등으로 대표되는 다양한 정보채널의 등장과 이로 인한 정보의 생산, 유통, 보유량의 증가는 데이터의 기하급수적인 증가를 이끌고 있다. ICT 시장조사기관 IDC는 2011년도 전 세계의 디지털 정보량이 약 1.8제타 바이트에 달할 것이며 디지털 정보의 75%가 개인에 의해 생성되고 매 2년마다 2배씩 증가할 것으로 전망했다.
결국 이렇게 급증해가는 디지털 정보량을 아우를 수 있는 개념과 용어가 필요하게 되었고 빅데이터가 그 역할을 맡게 되었다. 원래 빅데이터의 전통적 개념은 구글과 같은 대기업이나 NASA의 연구과학 프로젝트에서 분석하는 대용량의 데이터를 일컫는 것이었다. 그러나 점차 그 개념이 확장되어 Manovich(2011)는 빅데이터를 시간 흐름상 데이터를 수집하고 처리한던 소프트웨어 도구의 능력을 넘어서는 데이터들의 모임으로 정의하고 이런 데이터의 크기는 앞으로 꾸준하게 그 범위가 변화할 것이라고 하였다. Madden(2012)은 빅데이터를 기존의 툴이나 프로세스로 처리하기에는 너무 크고 빠르고 어려운 데이터를 의미한다고 하였다. 맥킨지는 2011년 발표한 보고서에서 수집·저장·소통·집단화·분석이 가능한 거대한 데이터 풀(Pool)을 빅데이터로 정의하고 이제는 글로벌 경제의 모든 영역과 기능의 일부가 되었다고 하였다.
이와 같이 빅데이터는 당초 수십에서 수천 TB에 달하는 거대한 데이터 집합 자체만을 지칭하던 말이었으나 기존의 관리 및 분석 체계로는 감당하기 어려운 정도의
막대한 데이터를 빅데이터로 지칭하기 시작했고 점차 관련 도구·플랫폼·분석기법까지 포괄하는 용어로 변화학고 있다. 더 나아가 김상락 외(2012)는 빅데이터를 대용량의 데이터를 저장·수집·발굴·분석·비즈니스화 하는 일련의 과정으로 정의하며 빅데이터의 핵심은 데이터의 비즈니스화에 있음을 강조하였다.
이러한 빅데이터는 2012년 들어 단순한 IT트렌드를 넘어 경제 사회 현안 해결의 실마리로 주목 받으며 빅데이터 시대가 개막되었음을 예고했다. 2012년 1월에 열린 세계경제포럼(다보스포럼)에서는 빅데이터 기술을 국제 개발의 새로운 가능성을 여는 2012년의 가장 중요한 기술로 지목했고, 같은 해 3월 미국은 빅데이터 주도권 확립을 위해 백악관 과학기술정책실(OSTP)이 주
추천자료
CRM을 위한 Data Mining Applications
데이터 베이스에 대하여
빅 씽크 전략을 읽고 - 비즈니스와 통찰력의 상관관계
[데이터베이스산업][DB산업]데이터베이스(DB)의 정의와 특성, 데이터베이스(DB) 시스템, 데이...
컴퓨터 Data & 연산의 이해
[데이터마이닝][데이터마이닝기술][데이터마이닝기법]데이터마이닝의 개념, 데이터마이닝의 ...
[메타데이터][개념][식별기호][IMS & IEEE LOM][EELS][ANSI X3.285][RDF]메타데이터의 개...
[메타데이터][메타데이터제작도구][FGDC][RDF][DC][EEVL][MARC][ISO.IEC 11179]메타데이터의 ...
[메타데이터][메타데이터 역할][메타데이터 형식][INDECS][RFC 1807][GILS][RDF][PICS]메타데...
[데이터웨어하우스][DW][데이터웨어하우스(DW) 기술동향]데이터웨어하우스(DW) 특징, 데이터...
OLAP과 Data Mining에 대해서
[데이터통신][패킷교환]데이터통신(데이터커뮤니케이션)의 정의, 데이터통신(데이터커뮤니케...
[메타데이터][EEVL][EELS][RFC1807][메타데이터포맷 통합모델]메타데이터의 개념, EEVL, EELS...
[독서감상문]빅숏
소개글