오차,error

같은 영단어 'error'지만, 정보통신이론(+통계에선 type I, II)의 '오류'와 측정/통계(자료에 대해)/수치해석에서의 '오차'를 구분해야 할 듯. 뉘앙스가 아마....
* 오차는 연속적 수치적 값,value에 (참값과의 차이,difference가 발생해서) 약간 빗나간/어긋난 것이고, 값의 뉘앙스이고, (관련 표현: statistical error, disturbance) (보통 측정,measurement 회귀,regression분석 등에서, 연속적인 것에 대해)
* 오류는 옳거나 그르거나 (true or false? boolean?) 해서 뭔가 완전히 어긋난/틀린 그런 느낌? 값보다는 ('실패'와 '성공'으로 양분된) boolean flag의 뉘앙스? 관련: 잘못, 실패, (PL의)exception, 등등. (보통 신호,signal 통신,communication 등에서, 이산적인 것에 대해)

둘 다 참값과는 다르다/틀리다, ... 는 뜻은 공유.
noise 등의 어떤 요인에 의해 교란되었다/corrupted/... 는 성질도 공유.

오류,error 페이지 분리함. (2021-05-05)

2021-06-21: PL... 에서의 error(cf. 예외,exception)에 해당되는 것의 pagename은 에러,error로 할까? 말까? (rel. 프로그램,program, runtime, 실행,execution, control_flow, ...)




1. 이하 오차,error에 대해

측정에서 얻은 측정값과 참값의 차이
계산에서 사용한 근사값,approximate_value과 참값의 차이,difference
참값 또는 가장 적합한 값과 측정값 사이의 차이

측정,measurement을 할 때 (피할 수 있었음에도 실수나 오류 등으로 or 시스템적 문제로 인해 불가피하게) 발생하며, 작을수록 좋은, 최소화,minimization하고자 하는 그런 것?
오차가 영,zero인 것이 최선이지만 대개의 경우 이상일 뿐?

그렇다면 오차(error)의 부호,sign는 상관 없는건가? 참값-측정값 or 측정값-참값 둘 다 되는건가?
확실한 건, 오차의 절대값,absolute_value절대오차,absolute_error가 더 정의가 명확한 듯.
근데 보다보면 이렇게 측정값-참값 이라는 설명도 많이 보임...

(오차)=(근사값)-(참값)

오차의 한계, 오차한계
: 오차가 어떤 값 이하라고 판단될 때 그 어떤 값
(오차의 한계)=(반올림한 자리값)×(5)
(오차의 한계)=(측정기기의 최소 눈금)×(0.5)
(2022-03-14) and [https]수학백과: 오차한계 ...저기에선 "통계학에서 오차한계란, 모수,parameter에 대한 구간추정,interval_estimation(writing)을 할 때, 신뢰구간,confidence_interval의 끝(한계)와 모수 사이의 최대 차이,difference를 말한다."

참값의 범위 (참값이 될 수 있는 범위)
: (근사값)-(오차의 한계) ≤ (참값) ≤ (근사값)+(오차의 한계)


정의

절대오차 absolute error
= |true value - approximation|

상대오차 relative error
= (absolute error) / |true value|

percentage relative error
= (absolute error) / |true value| × 100

(Zill 6e 2.6 A Numerical Method)


측정,measurement - local에 작성중인것 있음, merge
{
측정한 값,value근사값,approximate_value이며 참값과의 차이인 오차,error가 있다.

눈금이 있는 것으로 측정할 때는 측정기기 최소 눈금의 1/10까지 읽는다. - 이유?

측정값을 250.0으로 표시:
참값이 249.95 ≤ x < 250.05

관련:
정량적인 관측,observation의 일종?
//tmp from WpKo:양자_얽힘, chk
{
양자역학,quantum_mechanics에선, 측정하기 전까지는 두 입자,particle상태,state(양자상태,quantum_state; curr see WpEn:Quantum_state)를 알 수 없는데, 측정과 동시에 한 계,system의 상태가 결정되고 그 계와 얽혀있는(see 양자얽힘,quantum_entanglement) 다른 계의 상태까지 결정된다. 이것은 마치 정보,information가 순식간에 한 계에서 다른 계로 이동한 것처럼 보인다. - 이것은 국소성원리 locality_principle WpKo:국소성의_원리(principle of locality, [https]물리학백과: 국소성 Locality, Locality principle)와 모순
}

}

표본추출오차(sampling error) : see 표본추출,sampling

신경망 학습에서 사용하는 지표는 손실함수,loss_function or 비용함수,cost_function라고 하는데, 일반적으로 MSECEE를 쓴다.
Deep Learning from Scratch, page 112

chk: 이때는 오차(=편차,deviation)가 보통 여러 개(복수) 있으며, 각각을 종합하여 ...tbw

Sub:
{
mklink: LOOCV (leave-out-out cross-validation) // 교차검증 cross_validation or cross-validation


MSE:
$\frac1n \sum_{i=1}^n (y_i - t_i)^2$
CEE:
$-\sum_{i=1}^n \ln(y_i) \cdot t_i$

error의 허용 범위: tolerance. 보통 ±n% 기호를 많이 쓰는 듯


LinkThese
{
측정,measurement에는 이런 게 있다. '실험적 불확실성'(see 불확실성,uncertainty)과 관련.
정확도,accuracy
an indication of the range of error in a measurement
측정에서 오차,error 범위
오차가 작으면 측정이 정확하다고 말할 수 있다.
정밀도,precision
a measure of the repeatability (or consistency) of a measurement
반복성(일관성)에 관한 척도
}



부동소수점,floating_point의 실수 표현은 (대부분?) 오차가 있음
QQQ TBW 그렇다면 * type/format에 따른 오차의 한계/범위/값 신뢰성/...는? * 복수의 floating point calculation algorithm들과 오차에 대해 서술
유효숫자,significant_digit
{
A digit known to be correct in a number.
AKA significant figure

Ex. 측정값 4300을 유효숫자 2개, 3개, 4개로 표현하면 각각
  • 4.3 × 103
  • 4.30 × 103
  • 4.300 × 103

연산을 할 때, 계산 결과의 유효숫자 개수는 원본 측정값의 유효숫자 개수를 초과할 수 없다. 예를 들어 1.0 V를 3.0 Ω으로 나누면 유효숫자는 두 개이므로 0.3333333…이 아닌 0.33 A가 된다.

반올림(round off/rounding)관련. 특정 유효숫자 개수로 만들기 위해 반올림하는 경우가 있음.
반올림에도 종류가 여러가지.. TBW





2. 오차의 법칙

// tmp from [https]https://bookdown.org/mathemedicine/Stat_book/normal-distribution.html#-------.
Gauss는 (보통 자주 언급되는 이항분포,binomial_distribution에서 유추/유도하는 방법과는 별개로) 오차에 대한 고찰을 통해 정규분포,normal_distribution를 유도함.
  • 측정의 평균을 실제 값으로 여기는 직관이 옳다면, 오차는 정규분포를 따른다.
  • +오차와 -오차가 나올 가능성은 같다. 즉 오차 분포의 확률밀도함수는 좌우대칭형이다.
  • (작은 오차가 나올 가능성) > (큰 오차가 나올 가능성).
  • etc.
CHK

tmp link ko: 정규분포,normal_distribution 설명 도중에 나오는 [[https]오차의 법칙]
가우스의 업적.
세가지.

3. error correction


보이는/가능한 번역들: 오차 정정, 오차 수정, ... 오류|오차 정정|수정

rel.
같은 영어 error correction이지만, 오차수정 말고 오류수정 (오류,error > 오류수정 오류정정 error_correction)
저거는 통신,communication쪽에 더 어울리는 그 번역 및 개념.

rel. (ML에서, ANN에서.) 오차 정정 학습법 = 역전파 backpropagation ? chk

4. links ko

여러 가지 error에 대한 설명 표. (인공지능,artificial_intelligence 관점)
http://www.aistudy.com/expert/errors.htm

수치해석,numerical_analysis에서는 근사,approximation를 하다 보니 오차가 생기는데, 크게 다음 두 오차가 있음
  • 반올림 오차(round-off error)
  • 절단 오차(truncation error)
see:
https://blog.naver.com/mykepzzang/220061309981 수치해석 2. 오차해석(analysis of error)
https://blog.naver.com/mykepzzang/220063869581 수치해석 3. 오차의 정량화(quantification of error)
2021-12-29 이것은 정수화함수/정수화 관련. (curr see 함수,function#s-23)
tmp delme
{
https://everything2.com/title/truncation error
https://everything2.com/title/Rounding error
}
mklink; 작성중.
{
절단오차,truncation_error
,numerical_error
반올림오차,rounding_error
}



2022-03-17
via https://horizon.kias.re.kr/20376/ 30%쯤
오차는 크게 두 종류:
나눌 수 있다.

2023-10-19
[https]수학백과: 계통오차와 우연오차
"오차는 관측값observed_value?과 참값Ndict:참값과의 차이,difference로서 계통적 부분(체계적 부분)과 우연적 부분으로 나눌 수 있다.
WpKo:관측_오차 = WpEn:Observational_error = measurement error (measurement_error)는 무작위오차와 체계적오차(random and systematic errors) 둘로 나누어진다. (wpko, wpsp)
(writing at local: 측정오차,measurement_error and 관측오차,observational_error - 측정,measurement밑에)


5. TBW

이건 분명 noise 외에도 왜곡,distortion { 비슷: 변형, 변경, ...}, ...과도 관련있는데 관계 mk

관련표현 (del ok)
accuracy - (curr. 정확도,accuracy - ML얘기만)
에 대비되는 inaccuracy 가 오차,error관련.
precision - (curr. 정밀도,precision - ML얘기만)
에 대비되는 imprecision 이 오차,error관련.