독후감

데이터 문해력 - 저자 카시와기 요시키

치타뱅뱅 2024. 2. 14. 17:11
728x90

안녕하세요.

 

고객의 백데이터를 통계화하여 서비스 개선을 하기전에, 데이터를 정말 잘 읽고 있는가?

에 대한 의문이 생겼습니다.

 

그래서 책을 찾던 중 카시와기 요시키의 "데이터 문해력"이라는 책을 알게되었습니다.

데이터 문해력 책 표지

일단 책을 읽으면서 느낀 첫 인상은 쉬운데, 간과할 수 있는 부분들을 이해하기 쉽게 설명해 놓았습니다.

책 내용내 도표 예시를 보면 데이터 분석 방법을 체계적으로 정리해 보았습니다.

데이터 문해력 책 내의 도표 예시1

대부분 오류를 범할 수 있는 부분중 하나로 데이터를 분석해보고 문제를 정의하는 경우가 종종 있습니다.

그전에 목적 및 문제를 정의하고 해당 목적에 맞는 데이터를 찾고 분석을 해야합니다. 가설A를 예를들면 "남성중 40대가 흡연율이 높은 이유는 스트레스가 높기 때문이야."라는 문제를 정의하였다고 가정해 보겠습니다.

다만 해당 가설A를 설정하여 데이터 분석을 할 경우 여러가지 난관이 있습니다.

 

첫번째, 남성 40대가 스트레스 받는 비율을 정할 수 있는가?

두번째, 스트레스의 정도를 정량화 할 수 있는가?

세번째, 스트레스가 높다라는 것의 정량적 기준은 무엇인가?

네번째, 만약 세번째까지 지표 및 평가의 기준을 명확화 할 수 있다면 인과관계가 맞다고 볼 수 있을까?

 

등 여러 난관이 있습니다.

1~3번째 사항이 만약 합리적인 추정이 가능하다고 한다면, 데이터 평가를 하던 중 네번째 사항인 20대는 스트레스랑 상관없이 흡연율이 스트레스 단계별로 동등한 결과가 나왔을때 과연 40대의 결과로 스트레스가 높기때문이라고 할 수 있을까요? 정답은 맞을 수도있고 아닐수도 있습니다.

 

데이터 분석시에는 가설과 평가 그리고 해결방안을 모색(스트레스를 낮추기) 후 최종 검증까지 하는게 필요하다고 봅니다.

이런 분석할 때 편견이 생기지 않고 정말 그 문제를 치열하게 고민하고 해결하려고 하는지에 대해 자신에게 자주 되묻는게 필요하다고 봅니다.

 

그런 의미에서 이 책은 내가 과연 잘 분석하고 있는게 맞을까? 평균의 오류 이지 않을까? 결측치때문에 평균치가 변동된 거 아닐까? 등의 질문을 계속 하면서 마음속에 정해둔 편향적 결론으로 분석하는 것을 지향하게 해주는 나침반과 같은 예시를 많이 제시해주고 있습니다.

 

데이터마케터, 데이터분석가 분들께 이 책을 추천드립니다.

 

감사합니다.