일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- modern c++
- regression
- 스포티파이
- 회원가입
- 비트겟
- java
- SWEA
- MYSQL
- C++
- Spotify Api
- Gem
- Baekjoon
- SW Expert Academy
- python
- Spring JPA
- 파이썬
- 프로그래머스
- 회귀
- 백준
- CS
- Spring
- SECS-II
- SECS
- Computer Science
- spotify
- 자바
- programmers
- SECS/GEM
- spring boot
- c
Archives
- Today
- Total
비버놀로지
[회귀(Regression)] 회귀 알고리즘 평가 지표- R_squared 본문
728x90
회귀 알고리즘 평가 지표- R_squared
이번 실습에서는 R2 에 대해 알아보겠습니다.
R2 또한 사이킷런 모듈 안에 존재하여 쉽게 불러오기 만으로도 회귀 모델 평가 지표를 계산할 수 있습니다.
특히 이전 실습들에서 살펴본 RSS, MSE, MAE 지표들은 “오차” 에 기반한 지표들이기 때문에 해당 값들이 작을수록 더 높은 성능의 모델을 의미하지만, R2 지표의 경우 데이터에 대한 모델의 설명력을 의미하기 때문에 1에 가까울수록 즉, 더 클수록 높은 성능의 모델임을 의미합니다.
R2R^2 평가 지표를 계산하기 위한 사이킷런 함수/라이브러리
- from sklearn.metrics import r2_score : R2 평가 지표 계산 기능 불러오기
- r2_score(y_true, y_pred) : R2 값 계산하기
실습
- 모델 평가 지표인 R2R^2 값을 반환하는 main() 함수를 순서에 맞게 완성합니다.
- R_squared 변수에는 해당 회귀 알고리즘의 R2값을 저장합니다.
- 실행 버튼을 눌러 오차와 다른 R2 값을 확인합니다.
from elice_utils import EliceUtils
elice_utils = EliceUtils()
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
# 데이터 X와 y를 생성하고, 학습용 데이터와 테스트용 데이터로 분리하여 반환하는 함수입니다.
def load_data():
np.random.seed(0)
X = 5*np.random.rand(100,1)
y = 3*X + 5*np.random.rand(100,1)
train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3, random_state=0)
return train_X, train_y, test_X, test_y
# 회귀 모델을 불러오고, 불러온 모델을 학습용 데이터에 맞춰 학습시켜 반환하는 함수입니다.
def Linear_Regression(train_X, train_y):
lr = LinearRegression()
lr.fit(train_X,train_y)
return lr
# 그래프로 시각화합니다.
def plotting_graph(test_X, test_y, predicted):
plt.scatter(test_X,test_y)
plt.plot(test_X, predicted, color='r')
plt.savefig("result.png")
elice_utils.send_image("result.png")
"""
1. 정의한 함수들을 이용하여 main() 함수를 완성합니다.
Step01. 생성한 데이터를
학습용 데이터와 테스트 데이터로
분리하여 반환하는 함수를 호출합니다.
Step02. 학습용 데이터를 바탕으로 학습한 선형 회귀
모델을 반환하는 함수를 호출합니다.
Step03. 학습된 모델을 바탕으로 계산된
테스트 데이터의 예측값을 predicted에
저장합니다.
Step04. 회귀 알고리즘을 평가하기 위한 r2_score값을
R_squared에 저장합니다.
"""
def main():
train_X, train_y, test_X, test_y = load_data()
lr = Linear_Regression(train_X, train_y)
predicted = lr.predict(test_X)
R_squared = r2_score(test_y, predicted)
print("> R_squared :",R_squared)
plotting_graph(test_X, test_y, predicted)
return R_squared
if __name__=="__main__":
main()
728x90
'인공지능 머신러닝' 카테고리의 다른 글
[회귀(Regression)] 당뇨 진행상황을 선형 회귀로 예측 해보기 (0) | 2022.11.06 |
---|---|
[회귀(Regression)] 회귀 알고리즘 평가 지표- MSE, MAE (0) | 2022.11.06 |
[회귀(Regression)] 회귀 알고리즘 평가 지표- RSS (0) | 2022.11.06 |
[회귀(Regression)] 엘라스틱넷(ElasticNet) 회귀 (0) | 2022.11.06 |
[회귀(Regression)] 릿지(Ridge), 라쏘(Lasso) 회귀 (0) | 2022.11.06 |
Comments