인공지능, 데이터분석/[Numpy, Pandas] EDA, 문법

[Pandas] 시리즈(Series) / unique() / isnull().. 함수 사용

마법사 코딩공주 2023. 5. 12. 11:48
728x90
반응형

코드 자세히 보기 링크 : https://github.com/Jungddaseul/AI_study/blob/main/01_Pandas/01_pandas(Series).ipynb 

 

GitHub - Jungddaseul/AI_study

Contribute to Jungddaseul/AI_study development by creating an account on GitHub.

github.com

 

✏️ 1. 시리즈(Series)

- 시리즈는 배열과 유사한 판다스의 데이터 구조
- 각 데이터를 의미를 표시하는 인덱스(indax)를 붙일 수 있다.
- 하나의 Series 내에서는 하나의 자료형만 가질 수 있는 homogeneous 타입의 container이다.
- 시리즈의 인덱스는 index 속성으로 접근할 수 있으며 시리즈의 값은 1차원 배열이며 values 속성으로 접근할 수 있다.
- name 속성을 이용하여 시리즈 데이터에 이름을 붙일 수 있다.
- index.name 속성으로 시리즈의 인덱스에도 이름을 붙일 수 있다.

 

✏️ 2. unique() 함수와 value_couts() 함수

- Series에 포함된 모든 값을 알기 위해서는 unique() 함수를 사용
- unique() 함수와 유사한 value_conts() 함수는 고유한 값과 개수를 반환

✏️ 3. isnull(), notnull() 함수

- Series에 포함된 모든 값을 알기 위해서는 unique() 함수를 사용
- unique() 함수와 유사한 value_conts() 함수는 고유한 값과 개수를 반환

✏️ 4. 딕셔너리dict 자료 

- 시리즈 객체는 라벨 값에 의해 인덱싱이 가능하므로 실질적으로 라벨 값을 키(Key)로 가지는 딕셔너리 자료형과 같은 형태이다.
- 딕셔너리 자료형에서 제공하는 in 연산을 사용가능하며, items 메서드를 사용하면 for 루프를 통해 각 원소의 키(Key)와 값(Value)을 접근할 수 있다.
- 딕셔너리의 원소는 순서를 가지지 않으므로 시리즈의 데이터도 순서가 보장되지 않는다.
- 만약 순서를 정하고 싶다면 인덱스를 리스트로 지정해야한다.

728x90
반응형