728x90
반응형
random 서브 패키지
seed | rand() | shuffle() | choice() | randa() | randint() | unique() |
1. seed
- 어떤 특정하 시작 숫자를 정해 주면 컴퓨터가 정해진 알고리즘에 의해 마치 난수처럼 보이는 수열을 생성한다
- 이런 시작 숫자를 시드(seed)라고한다.
- seed는 보통 0이나 양의 정수를 사용한다.
np.random.seed(0)
2. rand()
- 0부터 1사이에서 균일한 확률 분포로 실수 난수를 파라미터(인수)만큼 발생시킨 후 리스트 형식으로 변환한다.
3. shuffle()
- 데이터를 순서를 바꾸는 기능을 수행한다.
4. choice()
- 이미 있는 데이터 집합에서 일부를 무작위로 선택하는 것을 샘플링(sampling)이라고 하며 이를 위해 choice()를 사용한다.
- 형식) choice(a, size=None, replace=True, p=None)
– a : 배열이면 원래의 데이터, 정수이면 arange(a) 명령으로 데이터 생성
– size : 정수. 샘플 숫자
– replace : Boolean. True이면 한번 선택한 데이터를 다시 선택 가능(default:True)
– p : 배열. 각 데이터가 선택될 수 잇는 확률
5. randn()
- 기대값이 0이고 표준편차가 1인 가우시안 표준 정규 분포를 따르는 난수를 생성한다.
6. randint()
- 형식) randint(low, high=None, size=None)
- high를 입력하지 않으면 0과 low사이의 숫자를,
- high를 입력하면 low와 high 사이의 숫자를 출력한다.
- size는 난수의 개수
7. unique()
- 데이터에서 중복된 값을 제거하고 중복되지 않는 값의 리스트를 출력한다
- 형식) unique(a, return_counts=True)
- a : 데이터 값
- return_counts : True로 설정하면 각 값을 가진 데이터 개수도 추가로 출력
- 아래 코드의 x는 중복제거한 값, cnt는 중복된 값의 개수
728x90
반응형
'인공지능, 데이터분석 > [Numpy, Pandas] EDA, 문법' 카테고리의 다른 글
[Pandas] Series()와 DataFrame(), DataFrame 관련 메서드 (0) | 2023.05.12 |
---|---|
[Pandas] 시리즈(Series) / unique() / isnull().. 함수 사용 (0) | 2023.05.12 |
[Numpy] 집계함수 max(), sum().. (0) | 2023.05.11 |
[Numpy] 넘파이 자료형의 다양한 데이터 타입 (0) | 2023.05.11 |
[빅분기] T1-3. 결측치 처리, 결측치 비율확인(map, drop 활용) (0) | 2023.01.06 |