adhoc 이라는 폴더는 DB 사용자가 실험을 하거나 새로운 테이블을 만들어 보거나 하는 폴더이다.
temp 폴더와 쓰임새가 비슷하다.
이 adhoc이라는 폴더에 새로운 테이블을 만들어서 데이터 레코드를 카피해 보겠다.
만약 테이블이 이미 존재한다면 DROP 하는 명령어를 사용한다.
그리고 새롭게 테이블을 만든다.
FROM은 이미 존재하는 테이블 뿐만 아니라 동적인 범위를 정할 수 있다.
session_timestamp A, user_session_channel B를 조인한 테이블에서
B의 모든 내용과 A의 ts를 합쳐서 seoann_session_summary로 만들었다.
adhoc.seoann_session_summary 에서 ts와 userid가 함께 존재하기 때문에 간단히 mau를 찾을 수 있다.
데이터를 관리하는 방법에는 중복된 레코드가 있는지, 빈 값 NaN값이 있는지 체크를 해야 한다.
전체 column에 대해서 중복된 레코드가 있는지 수를 세서 알아본다.
With ds AS라고 테이블을 임시로 만들어 줄 수도 있다.
타임 스탬프의 최소 최대값을 통해 데이터의 현재 상태를 체크할 수 있다.
언제 업데이트 되었는지, 데이터가 변하지는 않았는지 알 수 있다.
primary key인 sessionId를 체크한다.
가장 많이 있는 sessionId를 센 다음, 가장 많은 수를 내림차순으로 정렬시킨다.
NULL값이 있는 column은 1을 출력하도록 해서 값이 없는것이 있는지 알아봤다.
모두 값이 들어있는 모습이다.
'SQL > AWS Redshift' 카테고리의 다른 글
Redshift AWS DB SQL Boolean (0) | 2022.02.27 |
---|---|
AWS Redshift 쿼리 db sql JOIN 실습 (0) | 2022.02.26 |
Join의 종류 DB SQL 쿼리 (0) | 2022.02.25 |
AWS Redshift colab sql 쿼리 실습 Select (0) | 2022.02.24 |
Redshift 실습 Select AWS DB 연결 (0) | 2022.02.23 |