728x90
반응형
📌 1. drop_duplicates('컬럼명')?
'drop_duplicates' 는 중복된 값을 확인하고 제거하는 기능을 수행하는 메서드
컬럼명은 중복을 확인하고 제거할 기준이 되는 열을 나타낸다.
예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보자.

'item_name' 열을 기준으로 중복된 행들을 제거하고, 제거된 중복 행이 없는 새로운 데이터프레임을 반환하게 된다.

📌 2. 중복행 제거(drop_duplicates)
형태 : DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
사용법
- subset : 중복값을 검사할 열, 기분적으로 모든 열을 검사한다.
- keep : {first / last} 중복제거를 할 때 남길 행입니다. first면 첫 값을 남기고 last면 마지막 값을 남깁니다.
- inplace : 원본을 변경할지의 여부
- ignore_index : 원래 index를 무시할지 여부 True일 경우 0,1, 2,..., n으로 부여됩니다.
참고링크 : https://wikidocs.net/154060
09-07. 중복행 제거 (drop_duplicates)
####DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) ##개요 `d…
wikidocs.net
728x90
반응형
'인공지능, 데이터분석 > [Numpy, Pandas] EDA, 문법' 카테고리의 다른 글
[Pandas] 그룹화 계산(groupby) 메서드란? (0) | 2023.05.23 |
---|---|
[Pandas] .isin() 메서드란? (0) | 2023.05.16 |
[Pandas] reset_index(drop=True)란? (0) | 2023.05.16 |
[Pandas] Series()와 DataFrame(), DataFrame 관련 메서드 (0) | 2023.05.12 |
[Pandas] 시리즈(Series) / unique() / isnull().. 함수 사용 (0) | 2023.05.12 |