인공지능 AI/EDA

Titanic CSV를 활용한 EDA 1. 데이터 살펴보기

sailorCat 2021. 12. 30. 05:29
728x90

타이타닉 배에 탑승객들의 상태와 특징을 기록한 데이터셋을 가져왔다.

이 데이터에 EDA를 통해 살아남은 사람들의 공통점을 발견할 수 있을까?

 

전체적인 데이터를 알아본다.

승객의 ID는 그냥 인덱스이기 때문에 상관없는 자료이다.

Survived에는 살아남았는지 죽었는지 1, 0으로 표시된 자료이다.

Pclass는 1등석 2등석 3등석을 구분해준다.

성별 나이 이름

SibSp는 혈육이나 배우자가 함께 배에 탔는지 알려주는 요소이다.

Parch는 부모 자식간의 관계가 함께 배에 탔는지 알려준다.

Fare는 티켓의 요금이다.

 

 

 

데이터를 전체적으로 보기 위해 상관계수와 결측치 NaN을 확인한다.

728x90