sailorCat

Python/Pandas 9

카테고리 설명
  • Netflix Movies and TV Shows | Kaggle Netflix Movies and TV Shows Listings of movies and tv shows on Netflix - Regularly Updated www.kaggle.com 케글 데이터 CSV 파일을 다운로드 받는다. data.idxmax() 최댓값의 인덱스인 국가를 가져온다. data.max() 자료의 최댓값을 찾는다.

  • Avocado Prices | Kaggle Avocado Prices Historical data on avocado prices and sales volume in multiple US markets www.kaggle.com 아보카도 데이터를 가져와서 데이터를 활용한다. Avocados_by_region = Avocados['AveragePrice'].groupby(by=Avocados['region']) groupby를 통해 같은 region들의 평균 가격을 모았다. Avocados_by_region.max() 지역별 아보카도의 평균 가격의 최댓값만 출력한다.

  • .max() .sum() .median() .mean() 등의 통계함수를 적용할 수 있다.

  • 새로운 dataframe을 인덱스를 책 이름으로 지정하여 생성했다. pd.DataFrame(dict 데이터, index = {인덱스}) data.loc[ row, col ] data.iloc[ row_idx, col_idx ]

  • 관계연산자를 통해 조건에 맞는 데이터만 가져올 수 있다. 한 column에서 몇개의 지표가 있는지 예를들면 WHO Region 에는 Europe, Asia.. 등이 있지만 눈으로 확인하기 쉽지 않다. covid['WHO Rigion'].unique() 전체 지표가 출력된다.

  • data.head(N) data.tail(N) data['column'] data.column dataframe의 각 column과 row는 Series의 병렬 연결이다. 따라서 인덱싱과 슬라이싱이 가능하다.

  • pd.DataFrame() 2차원 데이터부터는 CSV를 다룰 수 있게 된다. CSV - Comma Seperated Value 쉼표로 이루어진 데이터의 형식이다. 맨 윗줄에는 Column Name이 나와있다. 밑줄부터는 쉼표로 구분한 값이 나와있다. CSV 지정형식이기 때문에 파이썬 Pandas에 이미 이 데이터를 DataFrame형식의 표로 만드는 함수가 간단히 나와있다. pd.read_csv("경로") 모든 데이터가 표로 정리되어 나온다.

  • pandas의 Series를 통해 1차원과 2차원 데이터를 다룰 수 있다. 행과 열울 통해 데이터를 저장하고 관리하는 자료구조인 Table 형식을 이용한다. ndarray와 Dictionary와 비슷한 점이 있다. 두가지 형태로 1차원 Series를 만들었다. 인덱스를 통해 접근할 수 있고, 슬라이싱도 가능하다. 관계연산자를 활용해 원하는 데이터만 뽑아낼 수도 있다. S[[3, 1, 4]] 인덱스의 요소를 가져온다. Numpy함수에 지수적으로 표현하는 것으로 전체 Series를 한번에 연산하여 출력할 수도 있다. 시리즈가 어떤 타입으로 되어있는지 알 수 있다. 딕셔너리 형태로 Series를 활용하면 키를 통해 밸류에 접근할 수도 있고, bool 타입으로 요소가 Series에 있는지 확인 가능하다. Ser..

  • Pandas Python Data Analysis Library 파이썬 데이터분석 라이브러리 R의 dataframe 데이터 타입을 참고하여 만들어짐 Pandas DataFrame은 테이블 형식으로 데이터를 다룬다. column, data(raw), index CSV 데이터를 다루기 위해 만들어졌다. comma-separated values 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 대량의 데이터를 DataFrame으로 만들어 자료에 접근하기 쉽다.

    Python/Pandas

    Pandas 소개 NEW

    2021.12.22
    댓글