본서는 인문사회계 독자들에게 소소한 도움이 되고자 집필되었다. 인문사회계 독자들이 통계학 전공자에 비해 수리적 능력이나 모형 해석력이 떨어진다고 감히 말할 수는 없을 것이다. 오히려, 필자가 만나본 대부분의 경제학, 심리학 전공자들은 상당한 수준의 통계학 지식을 보유하고 있었으며 해당 분야에 특화된 통계 모형의 “응용”에 있어서는 필자가 범접할 바가 아니었다. 그럼에도, 인문사회(사회과학에 더 가깝다고 할 것이다) 계열 출신으로서 통계학과 벗하여 살아온 경험에 비추어 볼 때 통계학 비전공자와 전공자가 나뉘는 갈림길이 ‘수리통계학’이라는 교차로 를 통과했느냐, 아니면 우회했느냐 임을 실감하게 되었다. 우회가 반드시 나쁜 것은 아니며 학습자의 환경에 따라 내려진 선택에 대해 일의적으로 평가를 내릴 수는 없다. 단지 본서를 통해 전공 영역의 데이터 분석과 결과 해석에 능한 분들에게 그 밑바탕까지 잘 이해할 수 있도록 기여하고 싶었다.
수리통계학의 주요 토픽을 두 권의 시리즈로 구성하였다((II)권은 발간 예정). 그런데 확률론-분포 이론-추정 이론-가설검정 이론-대표본 이론 순의 통상적인 수리통계학 서적에 담긴 편제가 아닌 필자의 경험에 의한 순수하게 주관적으로 설정된 토픽을 중심으로 구성했다. 인문사회계 독자들이 수리통계학을 공부할 때 막힐 만한 부분을 정리했다고 보면 좋을 것이다. 예를 들어, t 검정을 수백, 수천 회 실시하면서도 t 분포가 수리적으로 어떤 함수식을 따르는지, 그리고 왜 그러한지 궁금할 때가 많았는데 필자와 비슷한 생각을 가진 분들에게는 도움이 되리라 생각한다. 그래서 이 책은 조금 특별할 수 있다. 전공 서적에서는 별도의 설명 없이 넘어가거나 한 두 문장으로 끝낼 수 있는 설명을 본서에서는 한 장(章)에 걸쳐 설명하였기 때문이며, 본서의 내용들이 사회과학 각 전공에서 출간된 연구방법론 서적에는 잘 등장하지 않기 때문이다.
그리고 이 책은 아주 쉽지도 아주 어렵지도 않다. 아주 쉽지도 않다는 것은 독자들이 확률과 기초통계에 관한 기본지식이 있음을 전제로 집필했음을 의미한다. 그래서 구체적인 용어 설명이 생략된 것이 많다. 예컨대, 단순대립가설이 무엇을 의미하는지 정도는 이 책을 찾게 된 독자라면 익히 알고 있으리라 상정한 것이다. (그럼에도, 책을 읽는 동안 등장하는 개념 가운데 되짚어 봐야 할 중요한 개념은 별도의 박스를 만들어 정리했다.) 반면 아주 어렵지 않다는 것은 본서에서 유도된 내용들을 이미 알고 있는 경우에 해당할 것이다.
서문(序文)
Chapter 1. Heavenly, earthly bodies & human (하늘 天 따 地 사람 人)
Chapter 2. Jacobian
Chapter 3. Gamma distribution (Ⅰ)
Chapter 4. Gamma distribution (Ⅱ)
Chapter 5. Beta distribution
Chapter 6. Neyman-Pearson lemma
Chapter 7. Generalized likelihood ratio test
<Appendix> Latent Dirichlet Allocation (LDA)
References
뉴욕주립대학교(버팔로) 교육통계학 박사
고려대학교 통계학 석사
고려대학교 문학사/경제학사