새벽을 밝히는 붉은 달
2021.03.22 오늘의 기록 본문
<파이썬 라이브러리를 활용한 데이터 분석>
- np.meshgrid 함수: 2개의 1차원 배열을 받아 가능한 한 모든 (x, y) 짝을 만들 수 있는 2차원 배열 2개를 반환한다.
- np.where 함수: x if 조건 else y 같은 삼항식의 벡터화된 버전
- np.array 함수는 두 번째 와 세 번째 인자는 배열이 아니어도 괜찮다. 둘 중 하나 혹은 둘 다 스칼라값이라도 동작한다.
- np.array함수는 데이터 분석에서 다른 배열에 기반한 새로운 배열을 생성하는 식으로 자주 사용한다.
sum | 배열 전체 혹은 특정축에 대한 모든 원소의 합을 계산한다. 크기가 0인 배열에 대한 sum 결과는 0이다. |
mean | 산술평균을 구한다. 크기가 0인 배열에 대한 mean 결과는 NaN이다. |
std, var | 각각 표준편차(std)와 분산(var)을 구한다. 선택적으로 자유도를 줄 수 있으며 분모의 기본 값은 n이다. |
min, max | 최소 값, 최대 값 |
argmin, argmax | 최소 원소의색인 값, 최대 원소의 색인 값 |
cumsum | 각 원소의 누적 합 |
cumprod | 각 원소의 누적 곱 |
- boolean 배열에 대한 sum 메서드를 실행하면 True인 원소의 개수를 반환한다
unique(x) | 배열 x에서 중복된 원소를 제거한 후 정렬하여 반환한다. |
intersect1d(x, y) | 배열 x와 y에 공통적으로 존재하는 원소를 정렬하여 반환한다. |
union1d(x, y) | 두 배열의 합집합을 반환한다. |
in1d(x, y) | x의 원소 중 y의 원소를 포하하는지를 나타내는 불리언 배열을 반환한다. |
setdiff1d(x, y) | x와 y의 차집합을 반환한다. |
setxor1d(x, y) | 한 배열에는 포함되지만 두 배열 모두에는 포함되지 않는 원소들의 집합인 대칭차집합을 반환한다. |
- np.save와 np.load는 배열 데이터를 효과적으로 디스크에 저장하고 불러오는 함수다.
- np.savez 함수를 이용하면 여러 개의 배열을 압축된 형식으로 저장할 수 있으며, 저장하려는 배열은 키워드 인자형태로 전달된다.
'Developer > Record' 카테고리의 다른 글
2021.04.05 오늘의 기록 (0) | 2021.04.05 |
---|---|
2021.04.01 오늘의 기록 (0) | 2021.04.02 |
2021.03.15 오늘의 기록 (0) | 2021.03.15 |
2021.03.09 오늘의 기록 (0) | 2021.03.10 |
2021.03.08 오늘의 기록 (0) | 2021.03.09 |
Comments