sailorCat

Python 45

카테고리 설명
  • 관계연산자를 통해 조건에 맞는 데이터만 가져올 수 있다. 한 column에서 몇개의 지표가 있는지 예를들면 WHO Region 에는 Europe, Asia.. 등이 있지만 눈으로 확인하기 쉽지 않다. covid['WHO Rigion'].unique() 전체 지표가 출력된다.

  • data.head(N) data.tail(N) data['column'] data.column dataframe의 각 column과 row는 Series의 병렬 연결이다. 따라서 인덱싱과 슬라이싱이 가능하다.

  • pd.DataFrame() 2차원 데이터부터는 CSV를 다룰 수 있게 된다. CSV - Comma Seperated Value 쉼표로 이루어진 데이터의 형식이다. 맨 윗줄에는 Column Name이 나와있다. 밑줄부터는 쉼표로 구분한 값이 나와있다. CSV 지정형식이기 때문에 파이썬 Pandas에 이미 이 데이터를 DataFrame형식의 표로 만드는 함수가 간단히 나와있다. pd.read_csv("경로") 모든 데이터가 표로 정리되어 나온다.

  • pandas의 Series를 통해 1차원과 2차원 데이터를 다룰 수 있다. 행과 열울 통해 데이터를 저장하고 관리하는 자료구조인 Table 형식을 이용한다. ndarray와 Dictionary와 비슷한 점이 있다. 두가지 형태로 1차원 Series를 만들었다. 인덱스를 통해 접근할 수 있고, 슬라이싱도 가능하다. 관계연산자를 활용해 원하는 데이터만 뽑아낼 수도 있다. S[[3, 1, 4]] 인덱스의 요소를 가져온다. Numpy함수에 지수적으로 표현하는 것으로 전체 Series를 한번에 연산하여 출력할 수도 있다. 시리즈가 어떤 타입으로 되어있는지 알 수 있다. 딕셔너리 형태로 Series를 활용하면 키를 통해 밸류에 접근할 수도 있고, bool 타입으로 요소가 Series에 있는지 확인 가능하다. Ser..

  • Pandas Python Data Analysis Library 파이썬 데이터분석 라이브러리 R의 dataframe 데이터 타입을 참고하여 만들어짐 Pandas DataFrame은 테이블 형식으로 데이터를 다룬다. column, data(raw), index CSV 데이터를 다루기 위해 만들어졌다. comma-separated values 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 대량의 데이터를 DataFrame으로 만들어 자료에 접근하기 쉽다.

    Python/Pandas

    Pandas 소개 NEW

    2021.12.22
    댓글
  • 출력을 사용할 때 {} 브리켓 안에 변수를 넣고 싶다면 .format(변수)를 넣으면 가능하다.

  • 리턴값은 (람다, 고유벡터) 열을 기준으로 본 것이 고유벡터가 된다.

  • 대각선에 들어가는 숫자를 튜플 형태로 인자로 받아 대각행렬을 만든다. np.diag((tuple)) 항등행렬은 0과 1로 이루어져 있고, 행렬곱 해도 결과가 바뀌지 않는 행렬이다. NxN 항등행렬을 만들면 np.eye(N) MxM 항등행렬에 int 값으로 채우고 싶다면 np.eye(M, dtype=int) 기본형이 float이기 때문에 타입을 다르게 쓰고 싶다면 바꿔줘야 한다.

  • import numpy as np def solution(img): answer = np.empty((0,np.shape(img)[1]),float) for i in img: tmp = np.array([]) for j in range(len(i)): tmp = np.append(tmp,np.round(i[j][0]*0.3+i[j][1]*0.5+i[j][2]*0.2,1)) answer = np.append(answer,[tmp],axis=0) return answer 이 문제는 차원이 정해져 있는 줄 알아서 np.empty((0, 2), float) 이렇게 두고 코드를 짜서 계속 오류가 생겼다. 브로드캐스팅을 하기 위해 0과 배열의 1차원의 행으로 answer를 초기화 해주었다. 그리고 배열에 appen..

  • import numpy as np def solution(arr_list): answer = np.array([]) A = np.array([[0]]) for i in arr_list: if len(np.shape(A))==len(np.shape(i)) and np.shape(A)[1]==np.shape(i)[0]: A = (A+1).dot(i*2) return A