표준화: 무엇이고 왜 사용되는가?

표준화: 무엇이고 왜 사용되는가?

정규 분포 N(, σ2)는 다음에 의해 결정된 정규 분포 곡선과 일대일 계약입니다. 그리고 σ 위치와 모양을 결정하는 값.

126-14

126-15

경우에도 그리고 σ 둘 다 다릅니다. 예를 들어 하나2그리고 σ하나σ2 일대일 대응이 남아 있습니다.

126-16

이와 같이 아니지만 또는 σ값이 다르면 정규 분포 곡선이 겹치지 않습니다.

그러나 표준 정규 분포라는 것이 있습니다. “표준”이라는 단어는 정규 분포에 어떤 영향을 줍니까? 아래 이미지는 “기본”의 의미를 보여줍니다.

127-1

군대에 가는 것과 같습니다.

입대 전 서로 다른 성격과 스타일로 살아온 사람들이 군복무 스타일로 표준화된다.

127-2

그렇다면 정규분포를 표준정규분포로 만드는 이유는 무엇일까요?

첫 번째 이유는 서로 다른 데이터를 비교하고 분석할 수 있기 때문입니다.

한국인 친구와 일본인 친구가 서울에서 만났다고 합시다.

둘 다 회사에서 근무하며 대리와 같은 직위를 가지고 있습니다.

예를 들어 한국인 A는 월급 250만원, 일본인 B는 30만원을 받는다고 하자. 자국에서 누가 더 높은 급여를 받습니까?

128-1
128-2

국적도 다르고 통화도 다르지만 표준정규분포곡선으로 비교는 가능하다.

두 번째 이유는 확률 계산 단순화.

예를 들어, 학생의 한국어 점수가 85점이라고 가정합니다. 국어점수의 전국 평균은 70점이며 표준편차는 5입니다. 해당 학생보다 높은 점수를 받은 학생의 비율을 확인하려면 정규분포 곡선에서 85의 오른쪽 영역을 계산해야 합니다. N(70, 52).

129-1

정규분포곡선 아래의 총면적은 1이며 음영부분의 면적을 계산하여 85점의 정확한 위치를 결정해야 합니다. 이를 수학적으로 풀려면 다음 공식을 계산해야 합니다.

먼저 정규 분포 곡선에 대한 다음 공식을 알고 있습니다.

129-2

= 70; σ= 5이므로

129-3

130-1

적분의 값을 계산하기 위해서는 “계산”을 공부해야 하고 자연상수 e는 “계산”에서 다룹니다. 요컨대 계산하기가 매우 어렵습니다.

따라서 계산을 단순화하는 표준화된 방정식이 필요하다. 이 문제를 해결하기 위해 표준화된 정규 분포를 사용합니다.N(0, 12). 변수가 “표준화” 과정을 거친 후에는 교과서 말미에 있는 “표준정규분포표”를 보면 대략적인 값을 찾기가 훨씬 쉽습니다. 즉, 어렵게 계산하지 말고 “표준화”를 거쳐 표에서 값을 찾으십시오.

130-2

표준정규분포에 적용했을 때 N(0, 12)는 85점 이상을 득점한 학생의 비율이 0.0013이라는 것을 발견했으며, 이는 이 학생의 위치가 0.13% 백분위수에 있음을 나타냅니다.

위 공식으로 표준화하면 표준정규분포에서 표준화된 수치를 찾아볼 수 있기 때문에 계산이 훨씬 쉽고 빨라집니다.

이제 “표준화”에 대해 이야기해 봅시다. 표준화 공식은 다음과 같습니다.

131-1

“편차”와 “표준편차”의 정의를 상기해 봅시다. 편차=(변수-평균)= 엑스. “표준”과 “편차”의 합성어인 “표준편차”라는 용어에서 알 수 있듯이 모든 편차를 기준으로 삼는 하나의 숫자입니다. 즉, 편차를 평균화하여 형성한 값이다. 먼저 분산은 다음과 같이 계산됩니다.

131-2

분산의 제곱근은 “표준 편차”입니다.

131-3

표준화의 기본 아이디어는 아래 그림과 같이 분산을 평균화하는 것입니다. 표준 편차를 결정하는 과정에서 “분산”이라는 개념이 등장합니다.

131-4

표준화는 ‘편차’와 ‘표준 편차’의 두 값을 비교하는 것입니다.

132-1

분산은 평균에서 얼마나 떨어져 있는지를 나타내는 척도이므로 ‘분산’과 ‘표준편차’의 비율을 알면 분산이 어디에 있는지 알 수 있습니다.

132-2

표준 정규 분포 곡선을 고려하십시오.N (0, 12), 평균이 0이고 표준편차가 1일 때, 표준화된 변수의 위치 예를 들어가로축의 편차 비율 ( 엑스) 표준 편차σ. 에서

132-3

,

132-4

, σ 는 표준정규분포의 표준편차가 아니라 정규분포의 표준편차이다.

132-5

만약에엑스=σ(편차 = 표준편차)

133-1

표준 정규 분포 곡선 아래에 있습니다.

133-2