본문 바로가기
IT 기록/데이터 사이언스

[강의정리] The RED : 데이터 사이언티스트 하용호 Ch.01 진짜 필요한 데이터가 제대로 남겨지게 만들기(01)가장 처음에 봐야 하는 데이터들은 무엇인가, 정말 데이터인가?

by Lazy Quant 2022. 2. 18.
반응형
이 포스팅은 패스트캠퍼스의 강의 'The RED : 데이터 사이언티스트 하용호'를 수강하며, 공부를 위해 정리한 것과 개인적인 생각을 덧붙인 내용입니다. 자세한 내용이 궁금하신 분들은 강의를 수강하시기 바랍니다 : )

많은 회사의 대표님을 만나면, 처음부터 데이터 기반으로 의사결정을 하고 싶어 하신다.

기업의 데이터는 2가지 형태로 존재한다. 없거나 or 존재하지 않거나.

 

대부분 처음 단계에서 하는 일

-데이터를 수집하는 것. 어떤 데이터를?

회사에서 제일 중요한 것 / 돈을 버는 것 / 돈을 벌기 위해서는 고객이 필요 / 고객에 대한 정보, 특히 돈을 내는 고객에 대한 정보가 제일 중요

 

사실 이 데이터들은 보통 이미 갖추어져 있음

-결제 데이터는 기업이 운영을 위해서 필수적이라, DB에 잘 보관하고 있다. 단지 잘 활용하지 안않는다.

 

왜 활용되고 있지 않은가?

-보통 그걸 할 데이터 분석가가 없었던 경우가 대부분

-그리고 결제와 연결할 정보가 없었던 것이 대부분이다.

ex) 8월 17일에 3만원이 기록이 있긴 한데, 이게 전에 왔던 고객이 쓴 3만원인지, 새로 온 고객의 3만원인지, 새로온 고객이라면 이 고객이 우리가 야심차게 한 이벤트로 벌게 된 3만원인지 알 수 없다. 그래서 혼란에 빠진다.

 

대부분 회사에 들어가서 해야 하는 첫 번째

-회사의 수없이 많은 데이터를 관통할 ID키 값을 만드는 일입니다.

-우리가 흔히 AARRR이라고 부르는 퍼널을 관통하는 키

-결국은 회사를 전체를 관통하고 분석 전체를 관통할 고객 ID를 만드는 일이다.

-보통은 우리 사이트를 방문만 해도 생기는 ID와, 진짜 가입했을때 생기는 ID

 

참고) AARRR퍼널이란?

퍼널 분석이란 '최종 목표'까지 고객을 전환시키기까지의 과정을 퍼널로 표현한 분석방법. 고객을 분류하는 방법은 다양하지만, AARRR 프레임워크에서의 고객은 아래와 같이 나뉜다.

Acquisition(획득) : 사용자의 유입

Activation(활성화) : 사용자의 서비스 이용

Retention(유지) : 사용자의 서비스 재이용

Revenue(매출) : 사용자의 서비스 내 구매 액션

Refrerral(추천) : 사용자의 공유

 

이러한 과정을 직접 다 만들지 않아도 되기도 하다.

-전통적으로는 Google Analytics를 사용

-최신의 트렌드는 앰플리튜드를 사용

-GA는 웹페이지를 기준으로 만들어졌고, PageView를 기반으로 되어있다.

-GA/앰플리튜드/segment.io

-자체 클라우드 데이터 수집 플랫폼으로는 snowplow + aws or gcp

→ 개인적인 추천은 앰플리튜드 -> snowplow + aws or gcp 순으로 사용 권장

 

어디에게 트래커를 달아야 하나

-우리 회사의 핵심비즈니스 코스

-개인적으로 크리티컬 패스라고 부른다.

-AARRR퍼널까지의 패스까지를 달아야 한다.

-그 외에 하나 더 풍부하게 달아야 한다. 바로 첫화면이다.

 

T자로 모아라! T의 윗부분은 좌우로 넓다. 유저가 처음 만나서 접하는 화면. 첫 화면은 모든 정보를 수집하고, T의 아랫부분은 우리에게 돈을 주는 크리티컬 패스.

 

ex) 세탁기에는 엄청나게 버튼이 많다.

뭐를 누르나? 전원과 세탁 버튼만 누른다.

대부분의 서비스도 마찬가지.

우리 서비스도 전원과 세탁 버튼이 있다.

우리 서비스의 전원 버튼과 세탁 버튼은 무엇인가?

만든 사람들은 잘 모른다. 왜냐하면 만든 사람들은 이미 서비스와 사랑에 빠져있다.

 

20대가 사용할 서비스를 30대가 만들고 40대가 결정한다…

 

데이터를 꼭 디지털로 부터 얻으려는 편견을 버려라.

-서비스 초기라면 데이터는 편중되어 있으며, 이것을 통해서는 그런가 아닌가의 '닫힌' 의문밖에 해결할 수 없다. ex)유저는 A버튼과 B버튼 중 어떤 것을 더 많이 누르는가? 하지만 왜 A를 눌렀는지, 왜 D는 안누르는지에 대해서는 말해주지 않는다.

-어떤 것이 좋은가? 또 어떤 것이 있으면 좋겠는가? 같은 열린 질문에 대해서는 대답하지 않는다.

 

처음에는 NUX(New User eXperience)에 집중할 것.

-방문/재방문을 확인할 수 있는 ID체계와

-처음에 유저가 만나는 첫 N개의 화면들과 우리에게 이익을 만들어주는 끝판까지의 크리티컬 패스

반응형

댓글