Introduction

Regression(회귀분석)

<aside> 💡 Regression은 input과 output의 relationship을 추론하는 것이다.

</aside>

Regression은 machine learning의 기본이 되는 아주 중요한 개념이다.

Regression은 두가지로 나뉠 수 있다. 이 수업에서는 Linear Regression을 주로 다룬다.

Linear Regression

'집값'을 구하는 경우에서 주된 parameter가 집의 크기라고 생각해보자.

이를 바탕으로 input과 output의 관계를 추정해야한다. 광진구의 집들을 대상으로 데이터를 얻는 다고 생각해보자. 많은 data를 바탕으로 아래와 같은 선형 관계를 얻을 수 있다.

여기서 보이는 선이 estimated relationship이다. 이렇게 sample마다 답이 존재하는 학습 방식을 Supervised learning(regression)(감독 학습)이라고 한다.

이제 얻어진 Linera formulation $y = ax+b$ 를 통해 size에 따른 가격을 "추정"할 수 있다.

Model Represenatation

어떻게 input과 output의 관계를 찾는지 전체적인 과정을 알아보자. 우리가 알아내려는 이 관계는 hypothesis이다. 우리의 목적은 hypothesis를 구하는 것이다.