csv 10
-
https://www.kaggle.com/neuromusic/avocado-prices Avocado Prices Historical data on avocado prices and sales volume in multiple US markets www.kaggle.com 아보카도 가격 변화를 기록한 데이터셋으로 EDA를 해보았다. 먼저 데이터를 불러오고, 전체적으로 살펴본다. 아보카도 가격의 변동은 어떤 요소에 의해 생기는 것인지 알아본다. 데이터 하나하나의 타입과 결측치 NaN이 있는지 확인한다. 데이터의 상세 설명을 살펴보고 상관계수도 알아본다. 이제 데이터를 시각화 하면서 속성을 파악해본다.
-
-
타이타닉 배에 탑승객들의 상태와 특징을 기록한 데이터셋을 가져왔다. 이 데이터에 EDA를 통해 살아남은 사람들의 공통점을 발견할 수 있을까? 전체적인 데이터를 알아본다. 승객의 ID는 그냥 인덱스이기 때문에 상관없는 자료이다. Survived에는 살아남았는지 죽었는지 1, 0으로 표시된 자료이다. Pclass는 1등석 2등석 3등석을 구분해준다. 성별 나이 이름 SibSp는 혈육이나 배우자가 함께 배에 탔는지 알려주는 요소이다. Parch는 부모 자식간의 관계가 함께 배에 탔는지 알려준다. Fare는 티켓의 요금이다. 데이터를 전체적으로 보기 위해 상관계수와 결측치 NaN을 확인한다.
-
-
-
-
-
seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리 seaborn은 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 사용 https://seaborn.pydata.org/introduction.html An introduction to seaborn — seaborn 0.11.2 documentation Seaborn is a library for making statistical graphics in Python. It builds on top of matplotlib and integrates closely with pandas data structures. Seaborn helps you explore and understan..
-
-