인공지능, 데이터분석/[Numpy, Pandas] EDA, 문법

[Numpy] random 서브패키지 - rand(), shuffle(), choice() ...

마법사 코딩공주 2023. 5. 11. 21:46
728x90
반응형

random 서브 패키지

seed rand() shuffle() choice() randa() randint() unique()

1. seed

  • 어떤 특정하 시작 숫자를 정해 주면 컴퓨터가 정해진 알고리즘에 의해 마치 난수처럼 보이는 수열을 생성한다
  • 이런 시작 숫자를 시드(seed)라고한다.
  • seed는 보통 0이나 양의 정수를 사용한다.
np.random.seed(0)

2. rand()

  • 0부터 1사이에서 균일한 확률 분포로 실수 난수를 파라미터(인수)만큼 발생시킨 후 리스트 형식으로 변환한다.

3. shuffle()

  • 데이터를 순서를 바꾸는 기능을 수행한다.

4. choice()

  • 이미 있는 데이터 집합에서 일부를 무작위로 선택하는 것을 샘플링(sampling)이라고 하며 이를 위해 choice()를 사용한다.
  • 형식) choice(a, size=None, replace=True, p=None)
– a           : 배열이면 원래의 데이터, 정수이면 arange(a) 명령으로 데이터 생성
– size       : 정수. 샘플 숫자
– replace : Boolean. True이면 한번 선택한 데이터를 다시 선택 가능(default:True)
– p           : 배열. 각 데이터가 선택될 수 잇는 확률

5. randn()

  • 기대값이 0이고 표준편차가 1인 가우시안 표준 정규 분포를 따르는 난수를 생성한다.

6. randint()

  • 형식) randint(low, high=None, size=None)
- high를 입력하지 않으면 0과 low사이의 숫자를,
- high를 입력하면 low와 high 사이의 숫자를 출력한다.
- size는 난수의 개수

7. unique()

  • 데이터에서 중복된 값을 제거하고 중복되지 않는 값의 리스트를 출력한다
  • 형식) unique(a, return_counts=True)
- a : 데이터 값
- return_counts : True로 설정하면 각 값을 가진 데이터 개수도 추가로 출력
-  아래 코드의 x는 중복제거한 값, cnt는 중복된 값의 개수

728x90
반응형