비용함수,cost_function


가중값,weight편향,bias으로 이루어져 있으며 - 정확히 rewrite
일반적으로 평균제곱오차,mean_square_error,MSE를 많이 사용
값이 작을수록 좋은 것.
그래서 다음↓ 이게 목표.

cost function minimization

cost function minimization을 위해 여러 방법을 쓴다.
gradient descent method: 기울기하강,gradient_descent방법
단점: only good for convex_functions.

(Etc) 경제학의 비용함수

(여기선 ML의 비용함수를 다루지만)
경제학,economics에서도 '비용함수' 개념이 있는데
WpKo:비용함수
corresp. interwiki:
WpEn:Cost_curve
... 영어로는 function을 잘 안쓰는건지? 찾아보니 그건 아니고
WpEn:Cost_function (disambiguation page)

Excerpt

한 회사가 어떤 상품을 $x$ 단위 생산,production할 때 소요되는 총비용을 $C(x)$ 라고 하자.
함수 $C$비용함수(cost function)라고 한다.
이 상품의 생산 단위 수가 $x_1$ 에서 $x_2$ 로 증가하면 추가 비용은
$\Delta C = C(x_2)-C(x_1)$
이고, 비용의 평균변화율은 다음과 같다.
$\frac{\Delta C}{\Delta x} = \frac{C(x_2)-C(x_1)}{x_2-x_1} = \frac{C(x_1+\Delta x)-C(x_1)}{\Delta x}$
$\Delta x\to 0$ 일 때 이 비율의 극한, 즉 생산한 단위 수에 대한 비용의 순간변화율을 경제학자들은 한계비용,marginal_cost이라고 한다.
$\text{marginal cost} = \lim_{\Delta x\to 0}\frac{\Delta C}{\Delta x}=\frac{dC}{dx}$
(x는 항상 정수이므로 Δx가 0에 접근한다는 것은 그대로는 아무 의미가 없다. 그러나 매끄러운 근사 곡선으로 C(x)를 대치할 수 있다.)
$\Delta x=1$ 로 잡고 $n$ 을 충분히 크게 (따라서 $\Delta x$$n$ 에 비해 작게) 잡으면 다음과 같다.
$C'(n)\approx C(n+1)-C(n)$
따라서 상품 $n$ 단위를 생산하는 데 소요되는 한계비용은 [(n+1)번째 단위인] 한 단위를 생산하는 비용과 거의 같다.

(Stewart 8e ko p151)

비용함수(cost function) $C(x)$ 가 어떤 상품 $x$ 단위를 생산하는 데 드는 비용이라면,
한계비용(marginal cost)은 $x$ 에 대한 $C$ 의 변화율이다.
i.e. 한계비용함수는 비용함수의 도함수 $C'(x)$ 이다.

이제 마케팅을 생각하자. $p(x)$$x$ 단위 판매할 때 회사가 매길 수 있는 단위당 가격이라 하자.
이때 $p$ 를 수요함수(demand function)[또는 가격함수(price function)]라 하고, $p$$x$ 에 대해 감소함수로 예상된다. (더 많은 상품을 판매한다는 것은 상품의 단위가격이 저렴한 것과 대응된다.)
$x$ 단위가 판매되고 단위당 가격이 $p(x)$ 라면 총 수익은 다음과 같다.
$R(x)=$ 수량 × 가격 $=xp(x)$
$R$ 을 수입함수(revenue function)라 한다.
수입함수의 도함수 $R'$ 을 한계수입함수(marginal revenue function)라 하고 이것은 판매된 단위 수에 대한 수입의 변화율이다.
$x$ 단위를 판매하면 총 이윤은 다음과 같다.
$P(x)=R(x)-C(x)$
$P$ 를 이윤함수(profit function)라 한다.
한계이윤함수(marginal profit function)는 이윤함수의 도함수인 $P'$ 이 된다.

(Stewart 8e ko p225)

MKLINK
비용,cost
이윤,profit
가격,price
수익,revenue - 위에 수입이라 한 건 보통 수익이라 함