코드 자세히 보기 링크 : https://github.com/Jungddaseul/AI_study/blob/main/01_Pandas/01_pandas(Series).ipynb
✏️ 1. 시리즈(Series)
- 시리즈는 배열과 유사한 판다스의 데이터 구조
- 각 데이터를 의미를 표시하는 인덱스(indax)를 붙일 수 있다.
- 하나의 Series 내에서는 하나의 자료형만 가질 수 있는 homogeneous 타입의 container이다.
- 시리즈의 인덱스는 index 속성으로 접근할 수 있으며 시리즈의 값은 1차원 배열이며 values 속성으로 접근할 수 있다.
- name 속성을 이용하여 시리즈 데이터에 이름을 붙일 수 있다.
- index.name 속성으로 시리즈의 인덱스에도 이름을 붙일 수 있다.
✏️ 2. unique() 함수와 value_couts() 함수
- Series에 포함된 모든 값을 알기 위해서는 unique() 함수를 사용
- unique() 함수와 유사한 value_conts() 함수는 고유한 값과 개수를 반환
✏️ 3. isnull(), notnull() 함수
- Series에 포함된 모든 값을 알기 위해서는 unique() 함수를 사용
- unique() 함수와 유사한 value_conts() 함수는 고유한 값과 개수를 반환
✏️ 4. 딕셔너리dict 자료
- 시리즈 객체는 라벨 값에 의해 인덱싱이 가능하므로 실질적으로 라벨 값을 키(Key)로 가지는 딕셔너리 자료형과 같은 형태이다.
- 딕셔너리 자료형에서 제공하는 in 연산을 사용가능하며, items 메서드를 사용하면 for 루프를 통해 각 원소의 키(Key)와 값(Value)을 접근할 수 있다.
- 딕셔너리의 원소는 순서를 가지지 않으므로 시리즈의 데이터도 순서가 보장되지 않는다.
- 만약 순서를 정하고 싶다면 인덱스를 리스트로 지정해야한다.
'인공지능, 데이터분석 > [Numpy, Pandas] EDA, 문법' 카테고리의 다른 글
[Pandas] reset_index(drop=True)란? (0) | 2023.05.16 |
---|---|
[Pandas] Series()와 DataFrame(), DataFrame 관련 메서드 (0) | 2023.05.12 |
[Numpy] random 서브패키지 - rand(), shuffle(), choice() ... (0) | 2023.05.11 |
[Numpy] 집계함수 max(), sum().. (0) | 2023.05.11 |
[Numpy] 넘파이 자료형의 다양한 데이터 타입 (0) | 2023.05.11 |