평균, 표준편차, 분산, 그리고 Mahalanobis 거리

수학 이야기 2013. 2. 18. 23:28

얼마전 동생이 전화로 표준편차에 대해서 물어봤다.


"형, 표준편차가 3이라는게 무슨 뜻이야?"


"먼 소리야, 무슨 표준편차? 단위가 먼데?"


"아니, 일일 교통량을 측정하는데, 예를 들어서 평균이 20이고 표준편차가 3인거랑 평균이 80이고 표준편차가 3인거랑 어떻게 다른거야? 표준편차도 에러의 일종이잖아. 근데 평균이 커지면 에러도 커지는건가?"


"......"


동생의 질문 요지는, 여러 통계자료를 보고 교통정책을 세워야 하는데 통계적 수치들을 어떻게 해석해야 하고 좋고 나쁘고를 어떻게 판단해야 할 지에 관한 것이었다.


전화로 열심히 설명해 주기는 했지만, 공대출신에 대학원까지 나온 녀석의 질문 치고는 좀 너무한다 싶다.



일일 교통량의 평균이 20이라는 것은 어떤 날은 교통량이 18대, 또 어떤 날은 19대, ..., 20대, 24대, 21대, 20대, ... 이런 식으로 날마다 조금씩 다를 수는 있지만 평균적으로 20대라는 의미이다.


일일 교통량의 표준편차가 3이라는 것은 편차가 평균적으로 3대 정도 된다는 의미이다.


먼저 편차라는 것을 살펴보면, 편차는 평균과의 차이다. (편차 = 데이터 값 - 평균값)

위 예에서 보면, 편차는 -2대, -1대, ..., 0대, 4대, 1대, 0대, ... 이런 식이다.

얘네들(편차들)을 곧이 곧대로 평균을 해 버리면 +와 -가 상쇄되어 버리기 때문에 항상 0이 나온다.


그래서 제곱을 해서 평균을 취한 것이 분산이다.


즉, -2*-2대, -1*-1대, ..., 0*0대, 4*4대, 1*1대, 0*0대,... 이렇게 편차들을 제곱한 후에 얘네들의 평균을 취한 것이 분산이다.

그리고, 이렇게 구한 분산에다가 다시 루트(root)를 취한 것이 표준편차이다.


편차들을 제곱해서 평균을 취한 다음에 다시 루트를 씌운다 => 표준편차


그렇기 때문에 '표준편차'를 대충 '평균적인 편차'라고 생각해도 무리가 없다.


위 예로 다시 돌아가 보자.


일일 교통량의 평균이 20이고 표준편차가 3이라는 것은,

평균적으로 하루에 20대 정도 차가 지나가는데 들쑥 날쑥한 정도가 평균적으로 3대 정도라는 의미이다. 

즉, 17대가 지나갈 때도 있고 23대가 지나갈 때도 있다는 것이다.


또한, 일일 교통량의 평균이 80이고 표준편차가 3이라는 것은,

평균적으로 하루에 80대 정도 차가 지나가는데 들쑥 날쑥한 정도가 평균적으로 3대 정도라는 의미이다.

즉, 77대가 지나갈 때도 있고 83대가 지나갈 때도 있다는 것이다.


즉, 결론적으로 말하면 평균이 작고 크고는 표준편차와는 아무런 관계가 없다.

단지 데이터들이 평균을 중심으로 얼마나 잘 밀집되어 있느냐 또는 들쭉날쭉한 정도가 얼마나 심하냐를 나타낼 뿐이다.


마지막으로 마할라노비스 거리(Mahalanobis distance)는 평균과의 거리가 표준편차의 몇 배인지를 나타내는 값이다. 위 예에서(하루 교통량 평균이 20대이고 표준편차가 3대) 어느 날 차가 26대가 지나갔다고 하자. 자로 잰 평균과의 거리는 6이다. 그런데, Mahalanobis distance로는 (26 - 20)/3 = 2이다. 즉, 표준적인 편차의 2배 정도의 오차가 있는 값이라는 것이다.


Mahalanobis distance는 어떤 값이 얼마나 일어나기 힘든 값인지, 또는 얼마나 이상한 값인지를 수치화하는 한 방법이다. 예를 들어서, 1년 내내 매일 매일 차가 정확히 20대만 지나갔었는데 어느날 보니 차가 21대가 지나갔다. 얼마나 이상한 일인가? 이 경우 Mahalanobis distance는 굉장히 큰 값을 가질 것이다. 그런데, 차가 어느날은 10대, 다음날은 30대, 또 다른날은 24대, ... 이와 같이 들쑥 날쑥한 경우에 21대가 지나간 것은 전혀 이상한 일이 아닐 것이다. 그래서 이 경우 Mahalanobis distance는 굉장히 작은 값이 나올 것이다.


Mahalanobis distance는 어떤 데이터가 가짜 데이터인지, 아니면 진짜 데이터인지를 구분하는 용도로 주로 사용된다. 예를 들어, 일일 교통량에 대한 평균을 내고자 하는데 어느날 갑자기 정말 이상한 데이터가 들어왔다면 이걸 포함해서 평균을 내는 것 보다는 이것은 이상한 놈으로 치고 정상적인 것으로 판단되는 데이터들만 이용해서 평균을 구하는 것이 보다 합리적일 수 있다. 


우리가 고등학교 수학에서 (확률과 통계 파트) 표준정규분포로 바꾼 후에 z 값을 구하는 것이 바로 Mahalanobis distance를 구하는 과정이다. 그리고 우리가 통상적으로 사용하는 자로 잰 거리는 유클리디언 거리(Euclidean distance)라고 부른다. 


by 다크 프로그래머

'수학 이야기' 카테고리의 다른 글

뿔의 부피가 기둥 부피의 3분의 1인 이유  (39) 2013.02.24
각에도 부피가 있을까  (14) 2013.02.15
수학을 공부하는 방법  (10) 2013.01.30

욕실 화장실 냄새 없애는 방법 - 환풍기 역류 차단하기 [#1]

잡기장 2013. 2. 17. 22:51

욕실 화장실 냄새의 원인중 하나가 환풍기에서 넘어오는 냄새 때문이라는 것은 사람들이 잘 모르는 것 같다.


얼마 전에 욕실 화장실 환풍기가 고장나서 새로 교체하다가 환풍기를 통해 안좋은 냄새가 역류해 넘어온다는 것을 알게 되었다.


환풍기를 교체하려고 환풍기에 연결된 관을 분리해보니 연결된 관으로부터 약간 역겨운 냄새와 함께 꽤나 센 바람이 불어나왔다. 머리카락이 흩날릴 정도로 꽤나 센 바람이었다.




알다시피 아파트에서는 욕실 화장실 환풍기들이 서로 하나의 관으로 연결되어 있다. 그래서 집집마다 환풍기를 틀어서 화장실 냄새들을 관으로 열심히 내보내면 담배냄새며 그 않좋은 냄새들이 연결된 관을 타고 다시 우리 집으로 역류해 들어오는 것이다.


물론 우리집도 강력한 환풍기로 24시간 열심히 돌려서 냄새를 밀어내면 된다.


하지만, 환기시키려고 환풍기를 트는게 아니라 들어오는 냄새를 막기 위해서 환풍기를 튼다는 것이 말이 되는가.

그럴 바에야 아에 환풍기를 밀봉해버리는 것이 낫다. --

참고로 우리 윗집은 환풍기를 아에 막아버리고 그냥 화장실 문 열어 놓고 산다고 한다.


어쨌든 교체하려고 새로 산 환풍기는 힘펠에서 만든 것으로 최신 모델이라고 해서 산 것인데 이건 머 틀지 않으면 냄새가 그대로 역류해 들어온다. (참고로 환풍기는 동네 철문점에서 살 수 있으며 직접 손쉽게 교체할 수 있다)



아무튼 이런 냄새들을 막아주는 것이 환풍기의 역할일 텐데, 이런 것 하나도 제대로 잘 못만드나 하는 생각이 든다. 그래도 20년 이상 환풍기만 만든 것으로 알고 있는데...


24시간 환풍기를 틀어 놓을 수도 없는 노릇이고,

어떻게든 손을 봐야지 생각하고 있다가 오늘 큰 맘 먹고 화장실 환풍기를 다시 뜯어냈다 (나사 몇 번 풀면 천정에서 쉽게 떼어 낼 수 있다).


아래 그림처럼 개폐 부위가 스폰지로 막아져 있다. 환풍기를 켜면 뚜껑을 밀어올리면서 냄새를 밀어내지만 전원을 끄면 환풍관에서 역류해오는 바람의 힘에 의해서 뚜껑이 닫히면서 냄새가 차단되는 원리이다.




그런데 문제는 스폰지 사이로 공기가 새는지 아니면 다른 곳에서 새는지 잘은 모르겠지만 환풍기 전원을 내리면 냄새가 역류해 들어온다는 것이다. (왜 고무링 같은 것으로 막지 않았을까??)


집에 있는 랩을 이용해서 어떻게든 냄새가 역류하는 것을 막아보고자 수를 내 봤다.

먼저, 뚜껑을 분리해 낸 후에 안의 개폐구까지 빼 낸다 (손으로 쉽게 빠진다).




다음에 랩으로 개폐구를 한번 감싸서 공기가 통하지 않도록 한 후에, 뚜껑을 끼운다.





그리고 나서 가운데 부분만 구멍을 내었다.




다시 조립




이렇게 하고 환풍기를 다시 화장실 천장에 달아 놓았다.


결과는?


...


좀더 두고 봐야 하겠지만, 반은 실패고 반은 성공이다.


그 전에는 아침에 화장실 문을 열면 안 좋은 냄새가 확 풍겨왔는데, 이제는 일부러 냄새를 맡아봐야 미약하게나마 냄새가 느껴진다.


그래도 냄새가 들어오는 것은 확실히 줄은 것 같지만 완전히 차단되지는 않는다. 아마도 스폰지 사이로 계속 공기가 들어오는 것 같다.

그리고 환풍기 소리가 조금 시끄러워졌다 ㅠ.ㅠ


아무래도 뚜껑까지 렙으로 싸버려야 완전히 역류가 차단될 모양이다.

(그러면 랩끼리 붙는 게 또 걱정이다. 아니면 그냥 뚜껑만 렙으로 싸는게 낳았나 하는 생각도 든다.)


어쨌든 환풍기 때고 붙이고 하는 것도 일이라 일단 좀 더 써보고 한번 더 손을 봐야 할지 말아야 할지 결정할 생각이다.


☞ 이후, 방법을 좀더 보완을 해 봤는데, 이젠 냄새가 완벽히 차단되었습니다. => 화장실 환풍기 냄새 역류 간단하게 차단하는 방법 [#2]

by 다크 프로그래머

'잡기장' 카테고리의 다른 글

욕실, 화장실 냄새 - 환풍기 역류 차단하는 방법 [#2]  (37) 2013.02.24
마나님  (2) 2013.02.07
논문 심사 결과  (2) 2013.02.05

각에도 부피가 있을까

수학 이야기 2013. 2. 15. 00:29

원을 한바퀴 돌면 360도라는 것은 누구나 알고 있습니다. 그렇다면 구 전체를 돌면 몇 도일까요?


흔히 2차원 평면에서는 넓이를 말하고 3차원 공간에서는 부피를 말합니다.


우리가 사용하는 각도는 2차원 평면에서만 정의되는 개념입니다. 그런데, 각도를 3차원 공간으로 확장하면 어떻게 될까요?


부피라는 개념을 각에도 적용할 수 있지 않을까요?




예를 들어서, 길쭉한 형태의 원뿔들이 무수히 많이 있습니다. 이 원뿔들을 서로 붙이는데, 원뿔의 꼭지점들이 한 점에서 만나도록 원뿔들을 서로 붙여서 구 형태를 만든다고 상상해 보겠습니다. 그러면 구를 이루는데 필요한 원뿔의 개수는 몇개나 될까요?


아시다시피 구를 이루는데 필요한 원뿔의 개수는 원뿔의 크기나 길이와는 무관하며 원뿔이 얼마나 뾰족한가, 즉, 원뿔의 뿔 부분의 각이 얼마나 되는가와만 관계됩니다.


이를 바꾸어 말하면, 각각의 원뿔들은 특정 부피의 각을 가지고 있고 이들 부피의 각들이 모두 모여서 구에 해당되는 각을 이룬다고 볼 수 있습니다. 이 때, 이 구의 각은 원에서의 360도를 3차원 부피 공간으로 확장한 개념으로 볼 수 있습니다.


물론 아직 수학적으로 각에 부피라는 개념은 없습니다. 하지만 3차원, 더 나아가서는 n차원에서 수학적으로 각을 정의하고 계산할 수 있다면 새로운 수학적 발견이 될 것입니다 ^^


예를 들어서, 어떤 원뿔 형태의 빈 공간이 있고 이 공간을 가느다란 원뿔 조각들을 이용하여 매꾼다고 했을 때, 필요한 원뿔 조각의 개수를 알고 싶다고 해 보죠. 그럴 때, '원래 빈 공간의 각의 부피가 a, 원뿔 조각의 각의 부피가 b이므로 필요한 원뿔 조각의 개수는 최대 a/b 개이다' 라는 식으로 문제를 해결할 수 있을 것입니다.


예전에 전국 고교수학경시대회에 나왔던 문제가 있습니다.


'3차원 공간에서 한 점에서 만날 수 있는 직선들은 최대 몇 개인가? 단, 어느 두 직선도 최소 30도 이상은 서로 떨어져 있어야 한다.'


당시 문제를 풀다가 시간에 쫒겨서 다 풀지는 못했지만 어쨌든 구의 부피를 뿔의 각이 30도인 원뿔의 부피로 나누는 방식으로 푸는 문제입니다. 답은 이 글을 읽는 분들의 몫으로 남기겠습니다 ^^


☞ 아래 댓글을 보고 steradian이라고 하는 3d에서의 각의 단위가 이미 정의되어 있음을 알게 되었습니다. 찾아보니 1 steradian은 반지름이 r인 구의 표면에 면적이 r2인 도형을 그렸을 때 이 도형에 대응하는 중심각의 크기입니다. 따라서, 3d에서 구 전체에 해당하는 각은 구의 겉넓이가 4πr2이므로 4πr2/r2 = 4π steradian 입니다. steradian에 대한 자세한 내용은 위키피디아를 참조해 주세요.



by 다크 프로그래머

'수학 이야기' 카테고리의 다른 글

평균, 표준편차, 분산, 그리고 Mahalanobis 거리  (68) 2013.02.18
수학을 공부하는 방법  (10) 2013.01.30
대분수의 나눗셈  (2) 2013.01.30