1. Regression 이란?
: 학습데이터를 기반으로 넓은 범위의 데이터 중 하나를 추정하는 방식이다. 머신러닝의 Supervised-learning
유형 중 하나이다.
위 예시는 Predicting exam score
문제이고 Regression
의 대표적인 예시이다.
그리고 테이블의 데이터는 학습데이터이고, 그 중 y컬럼의 데이터는 x컬럼 데이터에 대한 추정치로 출력되는 label
데이터이다.
2. Linear Regression
: 입력데이터에 따라 출력데이터가 선형적으로 출력되는 Regression
공부한시간에 비례하여 시험성적이 높게 나오는 Predicting exam score
예시처럼
인풋값에 따라 어느정도 규칙성을 가지고 선형적으로 변하는 학습데이터 training-sets
을 갖는다.
그리고 training-sets
를 인풋값 x, 출력값 y로 설정하여 Hypothesis
를 사진 속 H(x)
와 같이 추정할 수 있다.
인풋값에 따라 출력값을 최대한 유사하게 추정하려면, 주어진 training-sets
에 따른 정확한 Hypothesis
가 정해져야 한다.
3. Cost function
cost function
은 training-sets
과 Hypothesis
의 유사도를 측정하기 위해 활용되는 함수이다.
(H(x) : Hypothesis
에 대한 출력값, y : 실제 출력값)
해당 함수를 통해 주어진 training-sets
에 대한 정확한 Hypothesis
를 구할 수 있다.
계산 방법은 위 사진처럼 임의의 Hypothesis
를 정해놓고, 각 training-sets
과의 차이를 계산하면 된다.
그리고 계산된 차이가 가장 적은 Hypothesis
가 최적의 Hypothesis
가 되는 원리이다.
이 때, 각 training-sets
에 대해 계산된 차이는 음수가 되면 안된다.
이를 방지하기 위해 각 training-sets
에 대해 계산된 차이를 제곱하여 차곡차곡 더한다.
위 사진은 임의의 Hypothesis
에 대한 cost를 구하기 위한 수식을 나타낸다.
그리고 training-sets
데이터이 갯수가 3개라고 가정하였다.
각 데이터에 대해 계산된 차이를 제곱하고 더하여 데이터의 갯수인 3만큼 나누면 cost가 구해진다.
결론적으로 cost function
은 위 사진의 수식처럼 W
, b
에 대한 수식처럼 나타낼 수 있다.
그리고 위 수식대로 계산된 cost값 중 최소 cost값을 찾는 과정이 Linear Regression에서의 학습
이다.
이어서
TensorFlow
에서의 Linear Regression
구현에 대해 알아볼 것이다.
그리고 이전에 TensorFlow
활용법에 대해 간단하게 살펴볼 것이다.
'개발 > AI' 카테고리의 다른 글
[AI] Softmax Regression (0) | 2023.10.01 |
---|---|
[NLP] Embedding (0) | 2023.09.23 |
[AI] Logistic Regression (0) | 2023.09.10 |
[AI] Machine Learning (머신러닝) - 개념 (0) | 2023.01.18 |
[AI] 서론 (2) | 2023.01.18 |