인공지능, 데이터분석/[Numpy, Pandas] EDA, 문법

[Pandas] drop_duplicates('컬럼명') 이란?

마법사 코딩공주 2023. 5. 16. 22:17
728x90
반응형

📌 1. drop_duplicates('컬럼명')?

'drop_duplicates' 는 중복된 값을 확인하고 제거하는 기능을 수행하는 메서드

컬럼명은 중복을 확인하고 제거할 기준이 되는 열을 나타낸다.

 

예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보자.

'item_name' 열을 기준으로 중복된 행들을 제거하고, 제거된 중복 행이 없는 새로운 데이터프레임을 반환하게 된다.


📌 2. 중복행 제거(drop_duplicates)

형태 : DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

 

사용법

  • subset : 중복값을 검사할 열, 기분적으로 모든 열을 검사한다.
  • keep : {first / last} 중복제거를 할 때 남길 행입니다. first면 첫 값을 남기고 last면 마지막 값을 남깁니다.
  • inplace : 원본을 변경할지의 여부
  • ignore_index : 원래 index를 무시할지 여부 True일 경우 0,1, 2,..., n으로 부여됩니다.

참고링크 : https://wikidocs.net/154060

 

09-07. 중복행 제거 (drop_duplicates)

####DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) ##개요 `d…

wikidocs.net

 

728x90
반응형