인공지능, 데이터분석/[Numpy, Pandas] EDA, 문법

[빅분기] T1-2. 이상치를 찾아라(소수점 나이)

마법사 코딩공주 2023. 1. 2. 16:32
728x90
반응형

<문제>
주어진 데이터에서 이상치(소수점 나이)를 찾고 올림, 내림, 버림(절사)했을때 3가지 모두 이상치 'age' 평균을 구한 다음 모두 더하여 출력하시오.

<풀이>

1. 라이브러리 및 데이터 불러오기

2. 소수점 데이터 찾기

3. 올림, 내림, 버림 값의 평균값 구하기

4. 올림, 내림, 버림  평균 합계구하기


1. 라이브러리 및 데이터 불러오기

import numpy as np
import pandas as pd

df = pd.read_csv('/kaggle/input/bigdatacertificationkr/basic1.csv')
df

2. 소수점 데이터 찾기

df = df[df['age'] - np.floor(df['age']) != 0]
df
# 예를 들어 1.0 - 1.0 = 0 이라서 소수점 데이터가 아님
# 1.1- 1.0 = 0.1 이라서 소수점 데이터임

3~4. 이상치를 포함한 데이터 올림, 내림, 버림의 평균값의 합 구하기

m_ceil = np.ceil(df['age']).mean()
m_floor = np.floor(df['age']).mean()
m_trunc = np.trunc(df['age']).mean()

print(m_celi + m_floor + m_trunc)
# 69.5

 

728x90
반응형