"나에게는 단순하지만 강한 믿음이 있다. 정보를 어떻게 수집하고 관리하며, 활용하는가에 따라 사업의 성패가 좌우될 것이다."  - 빌게이츠 

빅데이터란 무엇인가?


빅데이터가 다양한 가치를 만들어내기 시작하면서 사람들은 빅데이터를 ‘원유’에 비유하기 시작했다. 기름이 없으면 기기가 돌아가지 않듯, 빅데이터 없이 정보시대를 보낼 수 없다는 의미에서다. 미국의 시장조사기관 가트너는 “데이터는 미래 경쟁력을 좌우하는 21세기 원유”라며 “기업들은 다가오는 데이터 경제시대를 이해하고 이에 대비해야 한다”라고 강조했다. 21세기 기업에게 가장 중요한 자산은 ‘데이터’이며 이를 관리하고 여기서 가치를 이끌어내지 못하면 경쟁에서 살아남을 수 없다는 뜻이다.


빅데이터는 ‘빅(Big)+데이터(Data)’식의 단순 합성어가 아니다. 빅데이터를 ‘어마어마하게 많은 데이터’라는 식으로 받아들이면 본질적인 의미와 가치를 놓치게 된다.


기존의 기업 환경에서 사용되는 ‘정형화된 데이터’는 물론 메타정보센서 데이터, 공정 제어 데이터 등 미처 활용하지 못하고 있는 ‘반정형화된 데이터’, 여기에 사진, 이미지처럼 지금까지 기업에서 활용하기 어려웠던 멀티미디어 데이터인 ‘비정형 데이터’를 모두 포함하는 것이 빅데이터다.


가트너는 빅데이터의 주된 특징으로 크기, 다양성, 속도 등을 꼽았다. 단순히 데이터 양이 많다고 해서 빅데이터라고 부를 수 있는 건 아니란 얘기다.


여기에서 크기(Volume)는 데이터의 물리적 크기를 말한다. 크기는 기업 데이터, 웹 데이터, 센서 데이터 등 페타바이트(PB) 규모로 확장된 데이터를 말한다. 다양성(Variety)은 데이터의 형태를 말한다. 기존 기업 데이터 환경에서 사용하는 관계형 데이터베이스(RDB)에 저장된 데이터인지, 웹 로그(Web log: 웹 서버에 남은 사용자 데이터)나 기기 데이터와 같은 데이터인지, 비디오나 이미지 같은 비정형 데이터인지 등 데이터의 형태에 따라 그 종류가 나뉜다. 빅데이터는 이 모든 데이터를 포함하기 때문에 이를 다룰 수 있는 기술이 필요하다. 마지막으로 속도(Velocity)다. 빅데이터의 중요한 특징으로도 꼽히는 '속도'는 곧 데이터 처리 능력을 말한다. 데이터를 수집 · 가공 · 분석하는 일련의 과정을 실시간 또는 일정 주기에 맞춰 처리할 수 있어야 한다.






철갤에서 발견할 수 있는 데이터의 형태
 네임드 - 유동/고닉, 
이를 캐릭터로 파악.
희곡적 형식으로 분석가능
- 대화 내용 (문자 형태) (여기엔 글을 작성했다는 행동이 있음 곧 행동 데이터로도 바라볼 수 있음)
- 짤 (이미지 형태) (철갤에서 보기 드뭄)
- 동영상 (애니메이션 형태) (철갤에서 보기 드뭄

예)

등장인물

1
한자맨
루즈베리

각각의 캐릭터 정보
(세계관/인생관/가치관),
(교육 수준 - 교육과정 평가원의 기준에 기초/다중지능 이론에 기초/심리학에서의 표준기준에 기초)
(사회 경제적 지위 수준 - 추측 불가능, 그러나 아이피 앞자리 따서 어디 지역구인지 추적해봄)
(감정 지능 수준 - 상황에 대해 어떤 감정적 반응을 보이는가? 절제력은 어떠한가?)

대화 예시)
인물 / 대화 내용

한자맨 : "논리교 ㅋㅋ"
1 : "논리 구조에서 말하면서 논리가 없다니 ㅋㅋㅋ"
루즈베리 : "주장은 의미가 없다니깐요."



이들 각각을 행동/기호 데이터로 수집하고, 데이터 분석 가능. 
별도로 조작적 정의에 입각하여 항목을 바꾸는 것은 목적에 맞게 하면 됨.
각각의 개별적 데이터를 토대로 '캐릭터(또는 역할)에 대한 유형화 가능. '용기에 넣는다는 은유를 써도 됨)
이를 '캐릭터'로 잡고 성질을 안에 부여해도 무방함.



용도
-> 현실에서 이런 유형의 사람을 만나는 순간, 이미 얻어낸 데이터에 입각하여 더 큰 차원에서 정보를 찾아볼 수 있음. 
따라서 그 사람에 대한 탐색은 오래할 필요가 없고, 어떤 유형에 해당하는지를 유사인지로 알아낸 다음, 적절한 대응책을 생각해볼 수 있음.
안봐도 비디오라는 말을 생각해보면 이해가 빨리 올 것임. 탐색전이 줄어드는 장점 (장점)

1같은 사람을 만날 경우 어떻게 할 것인가?
한자맨 같은 사람을 만날 경우 어떻게 대응할 것인가? 

이 캐릭터성에 맞게, 자기 자신을 아바타화시키는 것을 미리 준비해둘 수 있다. (장점)
물론 매번 마주치는 사람은 개별적인 차이를 갖고 있을 것이므로 그에 맞는 차이는 열어두는 것이 필요. (요구되는 사항)

단점
노가다를 뛰어야함

그러나
이 노가다가 가끔 재밌기도 함. (병림픽 보는 기분)