새벽을 밝히는 붉은 달

2021.03.22 오늘의 기록 본문

Developer/Record

2021.03.22 오늘의 기록

자윰 2021. 3. 22. 23:55

<파이썬 라이브러리를 활용한 데이터 분석>

  • np.meshgrid 함수: 2개의 1차원 배열을 받아 가능한 한 모든 (x, y) 짝을 만들 수 있는 2차원 배열 2개를 반환한다.
  • np.where 함수: x if 조건 else y 같은 삼항식의 벡터화된 버전

순수 파이썬으로 수행하기 때문에 느리다
where 함수로 사용하면 간결하게 사용이 가능하다

  • np.array 함수는 두 번째 와 세 번째 인자는 배열이 아니어도 괜찮다. 둘 중 하나 혹은 둘 다 스칼라값이라도 동작한다.
  • np.array함수는 데이터 분석에서 다른 배열에 기반한 새로운 배열을 생성하는 식으로 자주 사용한다.

 

sum 배열 전체 혹은 특정축에 대한 모든 원소의 합을 계산한다. 크기가 0인 배열에 대한 sum 결과는 0이다.
mean 산술평균을 구한다. 크기가 0인 배열에 대한 mean 결과는 NaN이다.
std, var 각각 표준편차(std)와 분산(var)을 구한다. 선택적으로 자유도를 줄 수 있으며 분모의 기본 값은 n이다.
min, max 최소 값, 최대 값
argmin, argmax 최소 원소의색인 값, 최대 원소의 색인 값
cumsum 각 원소의 누적 합
cumprod 각 원소의 누적 곱
  • boolean 배열에 대한 sum 메서드를 실행하면 True인 원소의 개수를 반환한다
unique(x) 배열 x에서 중복된 원소를 제거한 후 정렬하여 반환한다.
intersect1d(x, y) 배열 x와 y에 공통적으로 존재하는 원소를 정렬하여 반환한다.
union1d(x, y) 두 배열의 합집합을 반환한다.
in1d(x, y) x의 원소 중 y의 원소를 포하하는지를 나타내는 불리언 배열을 반환한다.
setdiff1d(x, y) x와 y의 차집합을 반환한다.
setxor1d(x, y) 한 배열에는 포함되지만 두 배열 모두에는 포함되지 않는 원소들의 집합인 대칭차집합을 반환한다.
  • np.save와 np.load는 배열 데이터를 효과적으로 디스크에 저장하고 불러오는 함수다.
  • np.savez 함수를 이용하면 여러 개의 배열을 압축된 형식으로 저장할 수 있으며, 저장하려는 배열은 키워드 인자형태로 전달된다.

'Developer > Record' 카테고리의 다른 글

2021.04.05 오늘의 기록  (0) 2021.04.05
2021.04.01 오늘의 기록  (0) 2021.04.02
2021.03.15 오늘의 기록  (0) 2021.03.15
2021.03.09 오늘의 기록  (0) 2021.03.10
2021.03.08 오늘의 기록  (0) 2021.03.09
Comments