728x90

인공지능, 데이터분석 45

[머신러닝] 선형회귀모델(개요, 모델가정, 파라미터 추정, 최소제곱법)

📝 수치예측, 범주예측 🔵 수치예측(예측) X, Y를 설명하는 데이터가 주어졌을 때 관계를 잘 설명할 수 있는 함수식 🔵 범주예측(분류) - 실제 숫자를 예측하는게 아니라, 새로운 데이터가 발생했을 때 두 범주사이에서 어떤 범주에 속하는지 예측하는 것 변수 사이의 관계 - x변수(원인)과 y변수(결과) 사이의 관계 확정적 관계 : X변수만으로 Y를 100% 표현(오차항 없음) 예) 힘 = f(질량, 가속도), 주행거리 = f(속도, 시간) 확률적 관계 : X변수와 오차항이 Y를 표현(오차항 있음) 예) 반도체 수율 = f(설비 파라미터들의 상태, 온도, 습도) + ε 포도주 가격 = f(강우량, 온도, 포도품종) + ε 위조카드 여부 = f(사용시간, 사용액, 사용장소) + ε 📝 선형회귀 모델 입력변수..

[Python] 소수구하기 - 에라토스테네스의 체

소수 : 1과 그 수 자신 이외의 자연수로는 나눌 수 없는 자연수를 의미 📝 1부터 100사이의 소수구하기 코드구현 📝 에라토스테네스의 체 범위에서 합성수를 지우는 방식으로 소수를 찾는 방법 1. 1은 제거 2. 지워지지 않은 수 중 제일 작은 2를 소수로 채택하고, 나머지 2의 배수를 모두 지운다. 3. 지워지지않은 수 중 제일 작은 3을 소수로 채택하고, 나머지 3의 배소룰 모두 지운다. 4. 지워지지 않은 수 중 제일 작은 5를 소수로 채택하고, 나머지 5의 배수를 모두 지운다. n = 100 a = [False, False] + [True]*(n-1) primes=[] for i in range(2, n+1): if a[i]: primes.append(i) for j in range(i*2, n+..

머신러닝을 위한 선형대수, 벡터, 행렬 연산

🟫 선형대수 ◾ 선형 대수학은 데이터의 수학이다. ◾ 선형 대수학은 통계 분야에 많은 영향을 끼쳤다. ◾ 선형 대수학은 푸리에 급수 및 컴퓨터 그래픽과 같은 여러 분야에서 수학적인 도구의 기초가 된다. ◾ 스칼라는 어떤 것을 표현하는 값이다. 🟫 벡터(Vectors) ◾ 컴퓨터 과학자들은 벡터를 무언가는 나타내는 숫자 목록으로 해석할 수 있다. ◾ 물리학자들은 벡터를 방향이 있는 스칼라로 간주하며 평면과 무관하다고 간주한다. ◾ 수학자들은 벡터를 두 가지의 조합으로 간주하고 이를 일반화 시키려고 노력한다. ◾ 선형 대수는 벡터 연산이 많은 부분을 차지하고 있으며 벡터는 스칼라라고 하는 하나 이상의 값으로 구성된 튜플이다. 🟤 벡터 연산 ◾ 벡터 덧셈(vector addition)과 뺄셈(vector su..

[데이터 속성] 데이터 속성이란?(구조, 형상, 데이터 타입)

🔵 정형데이터 : CVS, 데이터베이스 테이블 거의 모든 트랜잭션 시스템이 백 엔드로 관계형 데이터베이스와 같은 구조적 데이터 저장소를 사용 전체 데이터 세트를 스키마/데이터 모델 사용하기 때문에 상대적으로 작업하기 쉽다. 🔵 반정형데이터 : JSON, XML, HTML JSON 및 XML은 데이터 교환 또는 모듈 간/시스템 통합을 위해 API에서 사용되는 데이터 교환 형식 JSON은 키-값 쌍 접근 방식을 따르며, XML 태그 기반 구조를 갖는다. 데이터 구조 측면에서는 유연하지만, 작업은 상대적으로 어렵다. HTML(Hyper Text Markup Language)은 웹 개발에 사용되는 언어이며, 웹서버에 이 문서를 저장하고 클라이언트가 특정 HTML 페이지를 요청하면 해당 HTML문서를 클라이언트로..

[Python] dir(), hepl() 함수 사용법

📌 dir() 함수란? 파이썬 내장함수로, 어떤 객체의 유효한 속성 및 메서드 목록을 반환 사용법 object는 생략 가능한 매개변수로, 객체의 속성 및 메서드를 확인하려는 객체를 지정 생략하면 현재 범위의 모듈의 속성과 메서드를 보여준다. dir([object]) [예시] my_list = [1, 2, 3] print(dir(my_list)) 📌 help() 함수란? - 파이썬 내장함수로, 함수 객체애 대한 도움말 정보를 제공 - 주로 모듈, 함수, 클래스 등의 객체애 대한 사용 방법과 설명을 제공합니다. 사용법 object는 생략 가능한 매개변수로, 객체의 속성 및 메서드를 확인하려는 객체를 지정 생략하면 현재 범위의 모듈의 속성과 메서드를 보여준다. help([object]) 참고 : https:/..

[Pandas] str_cantains() 문자열을 포함하는지 여부확인

📌 str.contains() 판다스 문자열 메서드란? 문자열을 포함하는지 여부를 확인하는 문자열 메서드입니다. 이 메서드는 주어진 문자열 시리즈 또는 데이터프레임 열에 대해 각 요소를 검사하여 지정된 문자열이 포함되어 있는지 여부를 확인합니다. 기본 형태 : series.str.contains(pat, case=True, regex=True, na=None, flags=0) 사용법 pat : 포함 여부를 확인할 문자열 또는 패턴 case : 대소문자 구분 여부 regex : 정규식을 사용하여 패턴 매칭 여부를 설정하며, 문자열을 정규식으로 해석합니다. na : 결측값(NaN)을 처리하는 방법을 설정. 기본값은 None이며, 결측값을 처리하지 않습니다. flags : 정규식 플래그를 설정합니다. : 'a..

[Python] import collections 모듈이란?

📌 collections 모듈이란? 파이썬 내장 모듈 중 하나로, 다양한 컨테이너 데이터 타입을 제공하는 모듈이다. 이 모듈은 기본적으로 'list', 'tuple', 'set', 'dict' 등과 같은 데이터 구조를 보다 효율적으로 다룰 수 있다. ○ Counter : 요소의 개수를 셀 수 있는 컨테이너 객체를 생성 ○ dafaultdict : 딕셔너리의 기본값을 설정할 수 있는 딕셔너리 객체를 생성 ○ deque : 양쪽 끝에서 빠른 삽입과 삭제를 지원하는 큐(Deque) 객체를 생성 ○ namedtuple : 필드 이름으로 접근할 수 있는 튜플 객체를 생성 ○ OrderedDict : 삽입 순서를 기억하는 딕셔너리 객체를 생성 참고 : https://docs.python.org/ko/3/librar..

[Pandas] dt.to_period() 메서드

📌 to_period() 메서드 Pandas Series의 날짜 또는 시간 정보를 Period 형식으로 변환하는 메서드입니다. 'dt'는 Series에 접근하여 시계열 데이터를 다룰 수 있는 DateTime 속성입니다. 이 속성을 사용하여 날짜 또는 시간 정보를 다양한 형식으로 변환하고 조작할 수 있습니다. 'dt.to_period(freq)'는 Series의 날짜 또는 시간 정보를 주어진 'freq'로 변환하여 Period 형식으로 반환합니다. 'req'는 변환하려는 기간의 주기를 지정하는 매개변수로, 예를 들어 'M'은 월단위 / 'Q'는 분기단위 / 'A'는 연도단위 등으로 사용될 수 있음 'to_period()' 메서드를 사용하여 날짜 또는 시간 정보를 기간 단위로 변환하면, 해당 기간의 첫 번째..

[Pandas] datetime 모듈에 대해 알기 !

📌 datetime 모듈은 날짜와 시간 정보를 다루는데 사용 datetime 모듈을 import하면, datetime 객체를 사용할 수 있습니다. datetime 객체는 현재 날짜와 시간 정보를 가져오는 now() 메서드와 특정 날짜와 시간 정보를 가지는 객체를 생성하는 등 다양한 메서드와 속성이 있습니다. ● datetime: 날짜와 시간을 동시에 포함하는 객체를 생성하고 조작하는 클래스입니다. - year, month, day, hour, minute, second 등의 속성을 사용하여 날짜 및 시간 구성요소에 접근할 수 있습니다. ● date : 날짜 정보만을 포함하는 객체를 생성하고 조작하는 클래스입니다. - year, month, day 등의 속성을 사용하여 날짜 구성요소에 접근할 수 있습니다...

[Pandas] map(), apply() 메서드

📌 map() 메서드 Serise의 각 원소에 대해 함수를 적용하여 변환한다. 일반적으로 값 간의 일대일 매핑을 수행하는데 사용됩니다. 예를 들어, 특정 열의 값들을 다른 값으로 매핑하거나, 문자열을 숫자로 변환하는 등의 작업에 활용할 수 있습니다. 형태 : map_func: 각 원소에 적용할 함수 또는 변환식을 정의합니다. series: 변환을 적용할 Series 객체입니다. map_func = lambda x: 변환식 series.map(map_func) 기본 사용법 : # 정수를 제곱하여 변환하는 예시 series = pd.Series([1, 2, 3, 4, 5]) map_func = lambda x: x**2 result = series.map(map_func) print(result) 출력 : ..

728x90
반응형