PANDAS 13
-
https://www.kaggle.com/neuromusic/avocado-prices Avocado Prices Historical data on avocado prices and sales volume in multiple US markets www.kaggle.com 아보카도 가격 변화를 기록한 데이터셋으로 EDA를 해보았다. 먼저 데이터를 불러오고, 전체적으로 살펴본다. 아보카도 가격의 변동은 어떤 요소에 의해 생기는 것인지 알아본다. 데이터 하나하나의 타입과 결측치 NaN이 있는지 확인한다. 데이터의 상세 설명을 살펴보고 상관계수도 알아본다. 이제 데이터를 시각화 하면서 속성을 파악해본다.
-
-
-
타이타닉 배에 탑승객들의 상태와 특징을 기록한 데이터셋을 가져왔다. 이 데이터에 EDA를 통해 살아남은 사람들의 공통점을 발견할 수 있을까? 전체적인 데이터를 알아본다. 승객의 ID는 그냥 인덱스이기 때문에 상관없는 자료이다. Survived에는 살아남았는지 죽었는지 1, 0으로 표시된 자료이다. Pclass는 1등석 2등석 3등석을 구분해준다. 성별 나이 이름 SibSp는 혈육이나 배우자가 함께 배에 탔는지 알려주는 요소이다. Parch는 부모 자식간의 관계가 함께 배에 탔는지 알려준다. Fare는 티켓의 요금이다. 데이터를 전체적으로 보기 위해 상관계수와 결측치 NaN을 확인한다.
-
-
Avocado Prices | Kaggle Avocado Prices Historical data on avocado prices and sales volume in multiple US markets www.kaggle.com 아보카도 데이터를 가져와서 데이터를 활용한다. Avocados_by_region = Avocados['AveragePrice'].groupby(by=Avocados['region']) groupby를 통해 같은 region들의 평균 가격을 모았다. Avocados_by_region.max() 지역별 아보카도의 평균 가격의 최댓값만 출력한다.
-
-
-
-