Introduction
머신러닝이란?
간단하게 설명하면, 머신러닝은 인공지능의 한 분야로, 컴퓨터가 입력된 데이터에서 패턴을 학습하여 작업을 수행하는 기술입니다.
어떻게 학습할까?
머신러닝에서 학습은 모델이 입력된 데이터로부터 패턴을 찾아내는 과정입니다.(=모델의 파라미터 최적화)
통계적인 방법이나 경사하강법 등 다양한 방법을 사용합니다.
머신러닝의 종류
머신러닝은 데이터의 형태에 따라 세 가지로 나뉩니다: 비지도 학습, 지도 학습, 강화 학습.
본 강의에서는 비지도 학습과 지도 학습을 다룰 예정입니다.

지도 학습과 비지도 학습
- 비지도 학습(Unsupervised Learning): 데이터에 명확한 레이블이 없는 경우 사용됩니다. 데이터의 숨겨진 구조나 패턴을 발견하는 데 유용합니다. (예: 군집화)
- 지도 학습(Supervised Learning): 데이터에 명확한 레이블이 있는 경우 사용됩니다. 입력 데이터와 레이블을 사용하여 모델을 학습합니다. (예: 회귀, 분류)
회귀 vs. 분류
- 회귀(Regression): 입력값과 출력값 사이의 관계를 모델링합니다. 출력값은 연속값입니다. (예: 집 가격 예측)
- 분류(Classification): 입력값을 여러 범주 중 하나로 분류합니다. 출력값은 이산값입니다. (예: 이메일 스팸 여부 판별)

데이터의 구성과 주요 용어
- 데이터는 피처(feature)와 라벨(label)로 구성됩니다.
- Feature(피처, attribute): 데이터의 특징이나 항목을 의미합니다. 주로 𝐗로 표기되며, 데이터 샘플의 수(𝐍) x 피처의 수(𝐃) 행렬로 표현됩니다.
- Label(라벨): 데이터의 출력값을 의미하며, 종속변수로도 불립니다. 라벨의 유무로 지도학습, 비지도학습 구분됩니다.

- Parameter(파라미터, 가중치, weight): 모델이 가지고 있는 학습 가능한 변수입니다.
- Hyperparameter(하이퍼 파라미터): 모델 학습에 있어 사람이 정해야 하는 변수입니다. (예: 학습률, 배치 크기 등)
선형모델 vs. 비선형모델
- 선형 회귀(Linear Regression): 파라미터를 선형 결합식으로 표현 가능한 모델입니다.
- 비선형 회귀(Nonlinear Regression): 선형 결합식으로 표현 불가능한 모델입니다.
Basic Math for ML
순간 변화율:
- 𝐱의 값이 미세하게 변화했을 때, 𝐲의 변화율을 나타냅니다.
- 어떤 𝐱값(=a)에서의 그래프와 맞닿는 접선의 기울기를 의미합니다.
미분:
- 함수 f(x)를 미분하는 것은 함수의 순간 변화율을 구하는 것입니다.
- 미분의 중요성: 미분은 실제값과 모델의 예측값의 차이, 즉 오차(손실)를 최소화하기(목적) 위해 사용됩니다. 함수의 최솟값에서의 미분값(순간 변화율)이 항상 0인 특성을 이용하여, 최적의 모델 파라미터를 구할 수 있습니다.

본 글은 메타코드 서포터즈 활동을 위해서 강의를 제공받아 작성하였습니다.
위 개념은 아래 링크를 통해 수강 가능합니다.
