728x90
반응형

1. Regression 이란?

: 학습데이터를 기반으로 넓은 범위의 데이터 중 하나를 추정하는 방식이다. 머신러닝의 Supervised-learning 유형 중 하나이다.

위 예시는 Predicting exam score 문제이고 Regression의 대표적인 예시이다.
그리고 테이블의 데이터는 학습데이터이고, 그 중 y컬럼의 데이터는 x컬럼 데이터에 대한 추정치로 출력되는 label데이터이다.

2. Linear Regression

: 입력데이터에 따라 출력데이터가 선형적으로 출력되는 Regression

null

공부한시간에 비례하여 시험성적이 높게 나오는 Predicting exam score 예시처럼
인풋값에 따라 어느정도 규칙성을 가지고 선형적으로 변하는 학습데이터 training-sets을 갖는다.
그리고 training-sets를 인풋값 x, 출력값 y로 설정하여 Hypothesis를 사진 속 H(x)와 같이 추정할 수 있다.

인풋값에 따라 출력값을 최대한 유사하게 추정하려면, 주어진 training-sets에 따른 정확한 Hypothesis가 정해져야 한다.

3. Cost function

null

cost functiontraining-setsHypothesis의 유사도를 측정하기 위해 활용되는 함수이다.
(H(x) : Hypothesis에 대한 출력값, y : 실제 출력값)
해당 함수를 통해 주어진 training-sets에 대한 정확한 Hypothesis를 구할 수 있다.

계산 방법은 위 사진처럼 임의의 Hypothesis를 정해놓고, 각 training-sets과의 차이를 계산하면 된다.
그리고 계산된 차이가 가장 적은 Hypothesis가 최적의 Hypothesis가 되는 원리이다.

이 때, 각 training-sets에 대해 계산된 차이는 음수가 되면 안된다.
이를 방지하기 위해 각 training-sets에 대해 계산된 차이를 제곱하여 차곡차곡 더한다.

null

위 사진은 임의의 Hypothesis에 대한 cost를 구하기 위한 수식을 나타낸다.
그리고 training-sets 데이터이 갯수가 3개라고 가정하였다.
각 데이터에 대해 계산된 차이를 제곱하고 더하여 데이터의 갯수인 3만큼 나누면 cost가 구해진다.

null

결론적으로 cost function은 위 사진의 수식처럼 W, b에 대한 수식처럼 나타낼 수 있다.
그리고 위 수식대로 계산된 cost값 중 최소 cost값을 찾는 과정이 Linear Regression에서의 학습이다.

이어서

TensorFlow에서의 Linear Regression구현에 대해 알아볼 것이다.
그리고 이전에 TensorFlow활용법에 대해 간단하게 살펴볼 것이다.

반응형

'개발 > AI' 카테고리의 다른 글

[AI] Softmax Regression  (0) 2023.10.01
[NLP] Embedding  (0) 2023.09.23
[AI] Logistic Regression  (0) 2023.09.10
[AI] Machine Learning (머신러닝) - 개념  (0) 2023.01.18
[AI] 서론  (2) 2023.01.18
728x90
반응형

https://youtu.be/qPMeuL2LIqY
위 링크의 유튜브 강의를 수강하여 정리하였다.

1. 머신러닝이란?

  • 머신러닝은 기계가 특정 데이터를 입력으로 받아 학습하고, 학습된 데이터를 기반으로 판단하는 기술이다.

머신러닝은 training-sets(학습데이터)에 따라 다음과 같은 두 부류로 나뉜다.

  1. Supervised learning : 특정 label을 가리키고 있는 데이터들을 학습시키는 머신러닝

    (ex. Image labeling, Email spam filter, Predicting exam score etc.)
  2. Unsupervised learning : 특정 label을 가리키지 않지만, 유사한 데이터들끼리 그룹핑시켜주는 머신러닝

나는 강의를 따라서 Supervised learning만 다룰 것이다.

2. Supervised learning



머신러닝의 기본 컨셉은 위 사진과 같다.
ML으로 명명되어 있는 시스템 옆의 trainig-sets 데이터를 학습시킨다.
Supervised learning의 경우, trainig-sets 데이터는 일반적으로 x, y 형태로 labeling이 되어있다.(y : label)
그리고 학습이 완료되어 학습된 머신러닝에 training-sets x 데이터 형태로 입력할 경우,
머신러닝은 학습된 데이터를 기반으로 라벨(y)를 추정하여 출력시켜준다.

이에 대한 예시가 알파고이다.
알파고는 training-sets인 대량의 바둑경기 데이터를 학습받았고, 학습받은 바둑경기 데이터를 토대로하여 그 다음 최적의 수(y)를 판단하여 놓을 수 있다.

3. Types of supervised learning

A. Regression

: 학습 데이터를 기반으로 넓은 범위의 데이터중 하나를 추정하여 출력하는 방식이다. (ex. Predicting final exam score(범위 : 0~100))

B. Binary classification

: 두 가지 케이스로 나누어서 학습 데이터를 기반으로 입력데이터가 두 가지 케이스중 어떤 케이스인지 추정하는 방식이다.

C. Multi-label classification

: 세 가지 이상의 케이스로 나누어서 학습 데이터를 기반으로 입력데이터가 많은 케이스중 어떤 케이스인지 추정하는 방식이다.

앞으로 위 세 가지 유형을 하나씩 살펴볼 것이다.

반응형

'개발 > AI' 카테고리의 다른 글

[AI] Softmax Regression  (0) 2023.10.01
[NLP] Embedding  (0) 2023.09.23
[AI] Logistic Regression  (0) 2023.09.10
[AI] Regression  (0) 2023.01.22
[AI] 서론  (2) 2023.01.18
728x90
반응형

최근에 우리회사 팀 내에서 오프라인으로 워크샵을 진행했다.
팀장님은 팀내 현황을 브리핑하였고, 오픈사업을 더 추진해야한다고 하여 신사업분야에 대한 브레인스토밍을 위해 워크샵을 진행했다고 한다.
우리 팀은 세 개조로 나뉘었고, 각 조에서 우리팀에서 어떤 새로운 사업을 하면 좋을지에 대해 아이디어 회의를 진행했다.

아무리 짱구를 굴려봐도... 마땅한 아이템이 생각나지 않았다.
처음은 SWOT분석으로 시작해봤다.
우리 팀의 강점이 뭐고, 위협요소는 무엇인지, 유망한 분야는 어떤 것이 있는지...
우리 팀은 kt에 종속된 시스템을 개발하고 운영하는 부서이기 때문에 강점을 살릴만한 분야를 찾기가 쉽지 않았다.
SWOT분석을 배제한다해도 순수 아이디어를 생각해내기가 쉽지 않았다.
시장에 나온 아이디어들이 너무나도 많았다. 평범하게 생각해서는... 새로운 사업분야를 찾기가 쉽지 않다는 것을 깨달았다.
새로운 블루오션을 찾아야한다고 느꼈다.

패러다임이 바뀌었다.
단순히 개발언어와 프레임워크만 가지고 플랫폼 사업을 기획하는 시대는 지났다. 너무 레드오션이다.
시장에 나온 플랫폼들이 너무 많다. 붕어빵 가게와 같은 노점위치를 공유하는 앱도 있더라...

가트너


이제는 신기술을 적용해야 한다.
신기술이라함은 CES와 같은 전시회에서 쉽게 찾아볼 수 있고, 가트너가 당해 주목하고 있는 기술들 AI, 메타버스 등등
이런 신기술들을 활용한다면 고려할 수 있는 신사업영역이 다양해질 것이라고 생각하고, 숨은 블루오션을 찾을 수 있을 것이라 생각한다.
나는 하나씩 살펴보기로 했다.

나는 첫번째로 AI에 초점을 두기로 했다.
AI 입문이라는 검색어로 구글링을 통해 들어가게된 블로그
https://velog.io/@djm0727/AI-introduction
위 블로그를 통해 AI 공부를 위해서는 다양한 정보를 접하는 것이 중요하다는 것을 알게되었고,
추천해준 링크 하나씩 참고하여 AI공부를 시작하고자 한다.
그리고 나는 먼저 유튜브 강의 하나를 수강하기 시작했다.
강의 제목은 '모두를 위한 딥러닝 강좌'

거두절미하고 일단 시작해보자

반응형

'개발 > AI' 카테고리의 다른 글

[AI] Softmax Regression  (0) 2023.10.01
[NLP] Embedding  (0) 2023.09.23
[AI] Logistic Regression  (0) 2023.09.10
[AI] Regression  (0) 2023.01.22
[AI] Machine Learning (머신러닝) - 개념  (0) 2023.01.18

+ Recent posts