sailorCat
카테고리
작성일
2022. 2. 24. 23:23
작성자
sailorCat
728x90

adhoc 이라는 폴더는 DB 사용자가 실험을 하거나 새로운 테이블을 만들어 보거나 하는 폴더이다.

temp 폴더와 쓰임새가 비슷하다.

이 adhoc이라는 폴더에 새로운 테이블을 만들어서 데이터 레코드를 카피해 보겠다.

 

만약 테이블이 이미 존재한다면 DROP 하는 명령어를 사용한다.

그리고 새롭게 테이블을 만든다.

FROM은 이미 존재하는 테이블 뿐만 아니라 동적인 범위를 정할 수 있다.

session_timestamp A, user_session_channel B를 조인한 테이블에서

B의 모든 내용과 A의 ts를 합쳐서 seoann_session_summary로 만들었다.

 

 

adhoc.seoann_session_summary 에서 ts와 userid가 함께 존재하기 때문에 간단히 mau를 찾을 수 있다.

 

 

 

 

 

데이터를 관리하는 방법에는 중복된 레코드가 있는지, 빈 값 NaN값이 있는지 체크를 해야 한다.

 

전체 column에 대해서 중복된 레코드가 있는지 수를 세서 알아본다.

With ds AS라고 테이블을 임시로 만들어 줄 수도 있다.

 

 

 

 

 

타임 스탬프의 최소 최대값을 통해 데이터의 현재 상태를 체크할 수 있다.

언제 업데이트 되었는지, 데이터가 변하지는 않았는지 알 수 있다.

 

 

 

 

 

primary key인 sessionId를 체크한다.

가장 많이 있는 sessionId를 센 다음, 가장 많은 수를 내림차순으로 정렬시킨다.

 

 

 

NULL값이 있는 column은 1을 출력하도록 해서 값이 없는것이 있는지 알아봤다.

모두 값이 들어있는 모습이다.

 

 

 

728x90

'SQL > AWS Redshift' 카테고리의 다른 글

Redshift AWS DB SQL Boolean  (0) 2022.02.27
AWS Redshift 쿼리 db sql JOIN 실습  (0) 2022.02.26
Join의 종류 DB SQL 쿼리  (0) 2022.02.25
AWS Redshift colab sql 쿼리 실습 Select  (0) 2022.02.24
Redshift 실습 Select AWS DB 연결  (0) 2022.02.23