sailorCat
카테고리
작성일
2022. 2. 24. 22:47
작성자
sailorCat
728x90

 

 

 

 

 

가장 많이 사용된 채널을 찾는다.

raw_data 스키마에서

user_session_channel 테이블 안에 

가장 많이 사용된 채널을 찾는다.

 

여기서 많이 사용되었다는 기준은 세션이 만들어진 수, 유저의 아이디 수 두가지로 찾을 수 있다.

모호한 기준이 주어지면 정확히 하기 위한 질문을 해야 한다.

유저 아이디 순
세션 아이디 순

 

 

 

 

 

 

 

 

AS count라는 새로운 Column을 만들어낸다.

유저 아이디는 기본키가 아니기 때문에 여러개 있을 수 있다.

세션을 많이 만들었다면 수를 세었을 때 가장 많은 수의 Record가 있을 것이다.

 

 

 

 

 

 

월별 사용자 수를 위해 join을 사용하여 두개의 테이블을 inner join 한다.

session_timestamp 는 A, user_session_channel은 B

세션 아이디를 기준으로 두 개의 테이블을 합친다.

유니크한 사용자의 수는 아이디를 기준으로, 한달에 같은 아이디의 유저가 몇번 들어왔는지 상관없이 한번으로 카운트 한다.

 

TO_CHAR를 통해서 연도와 월을 month라는 새로운 column으로 만들었다.

여기서 Monthly Active User 라는 mau라는 column으로 유니크한 ID 수를 세었다.

 

 

 

 

 

 

cnt 라는 column으로 중복되는 아이디도 세어 보았다.

 

 

 

 

 

728x90