728x90
반응형
<문제>
주어진 데이터에서 이상치(소수점 나이)를 찾고 올림, 내림, 버림(절사)했을때 3가지 모두 이상치 'age' 평균을 구한 다음 모두 더하여 출력하시오.
<풀이>
1. 라이브러리 및 데이터 불러오기
2. 소수점 데이터 찾기
3. 올림, 내림, 버림 값의 평균값 구하기
4. 올림, 내림, 버림 평균 합계구하기
1. 라이브러리 및 데이터 불러오기
import numpy as np
import pandas as pd
df = pd.read_csv('/kaggle/input/bigdatacertificationkr/basic1.csv')
df
2. 소수점 데이터 찾기
df = df[df['age'] - np.floor(df['age']) != 0]
df
# 예를 들어 1.0 - 1.0 = 0 이라서 소수점 데이터가 아님
# 1.1- 1.0 = 0.1 이라서 소수점 데이터임
3~4. 이상치를 포함한 데이터 올림, 내림, 버림의 평균값의 합 구하기
m_ceil = np.ceil(df['age']).mean()
m_floor = np.floor(df['age']).mean()
m_trunc = np.trunc(df['age']).mean()
print(m_celi + m_floor + m_trunc)
# 69.5
728x90
반응형
'인공지능, 데이터분석 > [Numpy, Pandas] EDA, 문법' 카테고리의 다른 글
[Numpy] 집계함수 max(), sum().. (0) | 2023.05.11 |
---|---|
[Numpy] 넘파이 자료형의 다양한 데이터 타입 (0) | 2023.05.11 |
[빅분기] T1-3. 결측치 처리, 결측치 비율확인(map, drop 활용) (0) | 2023.01.06 |
[빅분기] T1-1. 이상치를 찾아라(IQR)활용하기 (0) | 2023.01.02 |
[pandas] 06-02. 결측값 제거(dropna) (0) | 2022.11.21 |