[책] 불멸의 이론steemCreated with Sketch.

in #kr-book5 years ago

지난 몇 주 간 샤론 버치 맥그레인의 불멸의 이론이라는 책을 읽었다.

이 책은 확률, 통계학에서 근간이 되는 베이즈 정리의 역사에 대해서 다루고 있다.

image.png

이전에 빅데이터 관련 대중서적을 보다가 눈여겨 봤던 책으로 드디어 책을 다 읽었다.

2013년도에 출간됬는데 2019년인 지금은 절판되서 새 상품은 구할 수 가 없다. 이런 책들이 그렇듯이 중고상품으로 나온 가격은 원 가격의 배를 넘어 선다.

베이즈 정리

베이즈 정리란 사후확률과 사전 확률을 이용하여 조건부 확률을 기술하는 정리를 말한다.

간단히 식을 기술해 보면

image.png

로 사건 B 가 먼저 일어나고 그 후 사건 A 가 일어날 때,

P(B) 를 사전 확률, 즉 사건 A 가 일어나기 전 사건 B 가 일어날 확률 로 정의하고 P(A|B) 를 사건 B 가 일어난 후 사건 A 가 일어날 확률 이라 정의한다.

이 때 사후 확률, 즉 어떤 특정 사건이 이미 발생했을 때 그 특정 사건이 나온 원인이 무엇인지 불확실한 상황을 나타내는 식 여기선 P(B|A) 로 사건 A 가 나중에 일어났는데 그게 앞선 사건 B 와 연관이 있었다는 확률을 의미한다.

[항상 이 P(B|A) 와 P(A|B) 가 헷갈리곤 하다.]

사실 오늘날이 되서야, 이 조건부 확률은 학계의 공식적 이론으로 인정받아 교과서에도 등장했어서 우리는 이를 당연시 여기는데 사실 이 개념은 우리의 직관과 조금 동 떨어져 있어 역사적으로 많은 논란이 있어왔다.

우리에게 이 베이즈 정리, 조건부 확률 문제는, 몬티홀 문제나, 진단 문제 등으로 유명하다.

대표적인 예로

[몬티홀 문제] 세 개의 문 중에 하나를 선택하여 문 뒤에 있는 선물을 가질 수 있는 게임쇼에 참가했다. 한 문 뒤에는 자동차가 있고, 나머지 두 문 뒤에는 염소가 있다. 이때 어떤 사람이 예를 들어 1번 문을 선택했을 때, 게임쇼 진행자는 3번 문을 열어 문뒤에 염소가 있음을 보여주면서 1번 대신 2번을 선택하겠냐고 물었다. 참가자가 자동차를 가지려할 때 원래 선택했던 번호를 바꾸는 것이 유리할까?



자동차 사고로 사망한 사람의 40%는 안전띠를 매지 않았다고 한다. 그런데 뒤집어서 말하면 자동차 사고로 사망한 사람의 60%는 안전띠를 매고도 죽었다는 뜻인데, 그렇다면 안전띠가 더 위험한 것 아닌가?

이 문제들의 변형들은 이미 예전 퀴즈 포스팅에서 다룬 적이 있으니 자세한 설명은 생략한다.

[사실 우리는 이미 입시를 통해 이러한 조건부 확률 문제를 수없이 많이 풀어왔다.]

왜 베이즈 정리인가?

베이즈 정리는 매우 경제적이다.

기존의 확률은 "빈도" 사건의 시행 횟수와 직접적으로 연관이 되어 있던 반면에, 베이즈 정리는 예를 들어 모집단 전체를 시행 하는 것이 아닌 표본을 꺼내 표본을 가지고 시험하여 전체의 확률을 추정하는 방법이기에 경제적이다. 쉽게 말하면 베이즈 정리는 "정보를 바탕으로 한 결정"을 수월하게 한다.

불량 제품을 검사하기 위해 모든 제품을 검사하는 것은 엄청난 낭비이다.

또한 베이즈 정리의 또 다른 이름인 조건부 확률은, 사고적 관점에서도 매우 유연하다. 현대 사회에서 이러한 베이지안적 사고는 [결국 원인의 확률을 알아가는 과정을 말한다.] 많은 영향을 끼쳤다. 자세한 내용을 서술하기 위해 책의 내용을 알아보자.

책의 흐름

이 책은 베이즈 정리의 역사와 그 응용성에 대해 다루는 책이다. 역사 책으로 볼 수 있겠다. 베이즈 정리는 1740년 영국의 목사 베이즈가 발견했지만, 그는 자신의 이론을 발전시키지 않았고 또 그 이론을 신과 연관시켰다. 그의 발견은 그가 직접 공표하지 않았으며, 그의 친구 프라이스가 자신의 책에서 베이즈가 이런이런 내용을 남겼다 부터 시작한다.

독립적으로 1774년 수학자 라플라스가 확률론을 연구하면서 조건부 확률을 발전시켰고, 지금 교과서에 쓰는 방식과 공식은 라플라스로부터 온다. [고등학교 교과서의 확률과 통계 이 부분은 사실상 라플라스의 업적이라고 해도 무방하다. 중심극한 정리나, 조건부 확률, 그 유명한 "대수의 법칙" 모두 라플라스의 업적이다. c.f) 대수의 법칙 : " 큰 모집단에서 무작위로 뽑은 표본의 평균이 전체 모집단의 평균과 가까울 가능성이 높다" ]

이후 쇠퇴와 다시 소생의 작업을 거쳐 베이즈 정리가 어떻게 다시 학계에서 살아남았고, 또 실생활에 응용 되었는지에 대해 다룬다. 특히 이 책은 세계 2차 대전의 독일의 암호체계 해석과, 냉전시기에도 쓰였으며, 지금도 실생활에 이 베이즈 정리가 쓰이고 있다고 말한다.

지금은 정론이 된 이 베이즈 정리는 "조건부" [이 말은 객관성과 정확성과는 떨어진다.], 즉 주관적인 믿음을 측정하기에, 한동안 과학적 이론으로 인정받지 못했다. 여기에는 여러가지 철학적 관점들도 등장하는데, 내 생각엔 이러한 것은 결국 양자역학 처럼 세상이 결정적론적이냐 아니냐와 관련이 있어 보인다.

아무튼 이 책은 이러한 철학적 이야기를 포함하여, 베이즈 이론과 관련된 사람들과 응용 분야들에 대해 상당히 많은 내용을 다루고 있다. [베이즈 이론이 있었기에 온갖 파생상품들과 보험상품들이 세상에 태어났다.]

개인적으로 책에 서술된 예제 중에 신기했던 것은 1899년 프랑스의 드레퓌스 사건에서 수학자 푸앙카레가 서술한 편지이다.

나는 당신이 왜 걱정을 하는지 이해할 수 없습니다. 나는 피고가 유죄판결을 받을 것이라고는 생각하지 않습니다. 하지만 만일 유죄판결을 받는다면, 그 서류 외에 다른 증거가 있기 때문이겠지요. 그가 유죄라는 주장이 있다 하더라도 이것은 건전한 과학 교육을 받은 편견 없는 사람들에게 영향을 미칠 수 없습니다.


자신의 필적과 비슷한 서류 한 장 때문에, 드레퓌스는 간첩으로 몰려 종신형을 선고 받을 뻔했는데, 조건부 확률을 예로 들어 그가 무죄임을 주장했다. [ 1899년의 프랑스는 이랬는데, 1954년의 우리나라는 사사오입 사건을...]

옛날 사람들은 저 조건부 표현이 불쾌하고 이상하게 여겨졌다고 하지만, 지금의 우리는 저런 사고가 아주 당연하다고 생각한다. 이 말은 이미 베이즈식 사고가 우리에게 널리 퍼졌다는 것을 말해 주는게 아닌가?

600페이지에 관하는 방대한 역사를 다루고 있는 책이고 한번 읽어서는 책의 내용을 온전히 이해하기 힘들지만, 한번쯤 시도해 볼 만한 책이 아닌가 싶다.

Sort:  

조건부 확률로 무죄를 주장하다니... 대단하네요!!

Posted using Partiko Android

조건부 확률은 우리 삶에 다 녹아져 있죠 ㅋㅋㅋ

훔.... 어려운 이론이네유.