[[TableOfContents]] * 수식 정리를 어떻게 해야할지 모르겠음.. 첫 장부터 포기해야하는가.. === Linear Regression === * 우리나라 말로 선형 회귀 * 변수 하나만 쓰이면 단순 선형 회귀, 둘 이상의 변수가 쓰이면 다중 선형 회귀라고 함. * 만약 목표가 예측일 경우, 선형 회귀를 통해 y와 x로 이루어진 집합을 만들기 위한 예측 모델을 개발한다. 개발된 모델은 차후 y가 없는 x값이 입력되었을 때, 해당 x에 대한 y를 예측하기 위해 사용한다. * 여러 x가 존재할 경우, y와 x 간의 관계를 수량화하여 어느 x가 y와 별로 관계가 없는지 알아낸다. * attachment:LinearRegressionExp.png * [http://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80 출처] === Model Representation === attachment:HousePriceExample.PNG * 예: 집 평수에 따른 가격 attachment:Model_Representation.PNG * Training Set : 위의 기본 데이터 셋과 같음. 머신은 이런 데이터 셋을 기반으로 판단을 하게 됨. * Learning Algorithm : Hypothesis(추정)를 만들어 냄. * Hypothesis : 주어진 입력에 대한 출력을 추정해내는 함수를 말한다. h라고 많이 씀. 데이터 모델이 h와 같다고 추정하게 되면, 우리는 Training Set에 존재하지 않는 데이터에 대해서도 h를 통해서 값을 추정해낼 수 있다. * 위의 예제는 변수가 하나만 쓰인 단순 선형 회귀임. attachment:hypothesis_house_price.png * θ를 Hypothesis의 Parameter라고 함. * 중요한 것 : θ를 어떻게 결정할 것인가? -> Cost Function을 통해서 결정함. === Cost Function === * 구해낸 Hypothesis가 데이터 모델을 잘 표현하고 있는지 평가하는 함수. attachment:Cost_Function.PNG * Cost Function에 의해서 가장 데이터 모델을 잘 표현하고 있다고 평가받는 Hypothesis를 구하는게 목표. attachment:Goal_.PNG * Cost Function을 시각화 했을 경우. attachment:CostFunctionGraph1.PNG * 가장 아래에 있는 지점이 데이터 모델을 잘 표현하는 Parameter임.(Cost가 가장 작음) attachment:ContourPlot.PNG * 같은 색으로 연결된 선은 같은 Cost를 가지고 있다는 의미임. === Gradient descent ===