어떻게 데이터를 모을 것인가? ②
상태바
어떻게 데이터를 모을 것인가? ②
  • 허인성 교도
  • 승인 2021.07.18 23:09
  • 호수 1224
  • 댓글 0
이 기사를 공유합니다

 

데이터의 중요성은 누구나 알고 있다. 그러나 어떤 목적으로 누가 언제 어디서 무엇을 어떻게 모아야 하는지 구체적으로 들어가면 어려워한다. 여기까지 알고 있다고 해도 그 데이터가 어떻게 생겨야 하는지, 누가 언제 어디서 그것을 어떻게 써야 하는지는 또 다른 문제이다. 즉, 데이터 수집과 활용은 서로 염두에 두고 실행할 부분이지만 서로 다른 분야임을 알아야 한다.

데이터를 수집하는 측면에서 살펴보자. 무엇보다 의미 있는 데이터를 확보해야 한다. 데이터가 중요하다고 무턱대고 모으기만 하면 쓰레기가 쌓인다. 어떤 조사의 목적을 정했다면 그 목적을 달성하기 위한 목표가 있어야 하겠고, 그 목표를 달성하기 위한 기초 데이터가 조사돼야 한다.

그 데이터는 ①완전해야 한다. 듬성듬성 빠진 값이 있으면 그 데이터를 활용하기가 어려워진다. ②값은 유효해야 한다. 숫자가 들어갈 부분에 문자가 들어있거나, 숫자가 들어갈 부분이라 하더라도 범위를 벗어나면 데이터로써 활용하기가 어렵다. ③중복되지 않아야 한다. 같은 데이터가 여러 번 중복해서 존재하면 분석결과에 왜곡이 발생한다. ④조작되지 않아야 한다. 원본 데이터가 수정되어서도 안 되지만 삭제도 문제가 될 수 있다. ⑤적시에 제공되어야 한다. 없는 것도 데이터라서 지금 없는 것 자체도 문제가 되므로 필요할 때 제공되어야 한다.

이것은 데이터의 품질에 대한 설명이다. 활용할 수 있는 데이터라야 좋은 데이터가 된다. 그러나 사실 위 원칙을 지켜가며 데이터를 모으는 일은 쉽지 않다. 따라서 완벽하게 준비가 된 상태에서 시작하려면 시기를 놓치게 된다. 그러므로 우리는 평상시에 데이터에 대한 생각을 가지며, 꾸준히 의미 있는 데이터를 모으기 위한 습관을 들여야 한다.

그 습관 중에 쉽게 실천하는 방법은 업무에 엑셀을 활용하는 것이다. 엑셀은 표와 수식을 처리하기 위한 강력한 기능이 있다. 표라는 것은 행과 열로 되어 있고, 열의 각 항목에 이름을 붙여가며 속성을 정의한다. 그런 형태로 데이터를 하나씩 입력하면 행이 쌓이게 되는 것이다. 이것만 잘 활용해도 좋은 데이터를 확보할 수 있다.

그렇게 확보한 데이터는 관리를 잘 해야 한다. 시트마다 이름을 붙이고, 제일 앞 시트에 각 시트에 대한 설명을 기술한다. 그래야 나중에 데이터가 어떤 목적으로 누가 언제 어떻게 모았는지를 확인할 수가 있다.

여기서 한 가지 주의할 점이 있다. 우리는 보통 어떤 일을 할 때 자료조사를 하고, 그 자료를 수치화해서 집계하고, 정리하여 보고서를 만든다. 그 후부터는 그 보고서만 본다. 여기에 사용된 데이터는 휴지통에 버려진다. 이런 접근법이면 다음 보고서를 작성할 때 자료조사를 위해 같은 노력을 들여야 한다. 보고서의 양식에 따라 기존 자료를 활용하기 어려울 수도 있다. 이것은 데이터를 활용할 줄 모르는 것이다.

전산실이 아닌 곳에서 데이터 관점으로 일하는 것은 어려운 일이지만 생각을 바꿔보자. 우리가 일하고 있는 과정에서 조금의 노력만 들여 의미 있는 데이터를 모아둔다면, 갑자기 보고서를 작성할 필요가 있을 때도 그 데이터를 활용해서 쉽게 완성할 수 있다. 물론 모아둔 데이터가 없다면 처음부터 시작해야 하는 것은 당연한 일이다. 데이터 관점에서 일해보자.

7월 23일자


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.