Wook's AI and Marketing

1920년대 후반, 영국 케임브리지의 화창한 어느 여름날. 학자들이 모인 야외 파티에서 우아하게 홍차(밀크티)를 마시던 한 부인이 이렇게 말했습니다.

"저는 컵에 홍차를 먼저 붓고 우유를 넣었는지, 아니면 우유를 먼저 붓고 홍차를 넣었는지 맛만 보고도 정확히 알아맞힐 수 있답니다."

주변에 있던 과학자들과 신사들은 헛웃음을 쳤습니다. "에이, 액체가 섞이고 나면 화학적 성분은 완벽히 똑같은데 어떻게 사람의 혀로 그걸 구별합니까? 억지 부리지 마시죠."라며 부인을 비웃었습니다.

하지만 그 무리 속에 있던 한 깐깐해 보이는 안경 낀 남자는 웃지 않았습니다. 그는 곧바로 주방으로 달려가 8개의 찻잔을 준비했습니다. 이 남자의 이름은 바로 현대 통계학의 아버지, 로널드 피셔(Ronald A. Fisher)였습니다.

☕ 1. 세상에서 가장 우아한 실험의 설계

피셔는 부인의 말이 '진짜 능력'인지, 아니면 그저 '우연히 찍어서 맞히는 것(찍기 운)'인지 과학적으로 증명하고 싶었습니다.

단순히 한 잔을 주고 맞혀보라고 하는 것은 의미가 없습니다. 찍어서 맞힐 확률이 50%나 되니까요. 그래서 피셔는 아주 정교한 '무작위 대조 실험(Randomized Controlled Trial)'을 설계합니다.

밀크티를 맛보는 여인 인포그래픽 (피셔가 설계한 8잔의 밀크티 실험과 귀무가설의 원리를 보여주는 데이터 시각화)

8잔의 찻잔을 준비합니다.
4잔은 '홍차 먼저', 나머지 4잔은 '우유 먼저' 따릅니다.
부인에게 "이 8잔 중 4잔은 홍차가 먼저, 4잔은 우유가 먼저 들어갔다"라고 알려줍니다.
부인이 8잔의 차를 모두 맛보고, 어떤 것이 '우유가 먼저 들어간 4잔'인지 정확히 골라내게 합니다.

이 실험에서 부인이 순전히 '찍어서' 4잔을 모두 완벽하게 골라낼 확률은 얼마나 될까요? 조합(Combination) 공식을 사용하면, 8잔 중 4잔을 고르는 경우의 수는 8C4 = 70입니다. 즉, 부인이 아무런 미각 능력이 없는데 뽀록(?)으로 4잔을 다 맞힐 확률은 1/70, 약 1.4%에 불과합니다.

⚖️ 2. 귀무가설(Null Hypothesis)의 탄생

피셔는 이 실험을 통해 통계학 역사상 가장 중요한 개념 중 하나를 창시합니다. 바로 '귀무가설(Null Hypothesis, H0)'입니다.

피셔는 이렇게 생각했습니다. *"부인이 미각 능력이 뛰어나다는 것을 직접 증명하기는 어렵다. 그렇다면 반대로 생각하자. **'부인은 아무런 능력이 없고, 그저 무작위로 찍을 뿐이다'*라는 가설을 세워보자. 만약 실험 결과가 이 가설로는 도저히 설명할 수 없을 만큼 기적적인 확률로 나온다면, 그때 가서 이 가설을 기각하고 부인의 능력을 인정하면 된다."

여기서 '부인은 능력이 없고, 차이는 우연일 뿐이다'라고 설정한 기본 가설이 바로 귀무가설입니다. (효과가 '없을 무(無)'로 돌아갈 '귀(歸)')

🎲 3. p-value (유의확률): 우연을 수치화하다

부인이 차를 음미하기 시작했습니다. 첫 번째 잔, 두 번째 잔... 부인은 신중하게 4잔을 골라냈습니다. 결과는 어떻게 되었을까요? 놀랍게도 부인은 4잔을 완벽하게 모두 맞혔습니다!

자, 이제 피셔는 결론을 내려야 합니다. 앞서 계산했듯, 귀무가설(부인은 능력이 없고 찍었을 뿐이다)이 참일 때 부인이 4잔을 다 맞힐 확률은 1.4%입니다.

통계학에서는 이를 p-value (유의확률)라고 부릅니다. "당신이 그냥 찍었다고 가정(귀무가설)했을 때, 지금과 같은 결과가 우연히 나올 확률(p-value)은 고작 1.4%밖에 안 됩니다. 세상에 1.4%의 우연이 일어났다고 믿기에는 너무 희박하네요. 따라서 당신이 찍었다는 가설을 폐기(기각)하겠습니다. 당신의 미각 능력을 인정합니다!"

이 실험을 계기로 현대 과학 논문에서 흔히 쓰이는 기준점인 "p-value가 0.05(5%) 미만이면 우연이 아니라고 보고 통계적으로 유의미하다(Significant)고 판단한다"는 가설 검정의 기초가 확립되었습니다.

💡 4. 세상을 바꾼 홍차 파티

피셔의 '밀크티 실험'은 단순히 사교계 부인의 허풍을 테스트한 기행이 아니었습니다. 이 실험에 쓰인 무작위 배정(Randomization)과 귀무가설, p-value 검정은 오늘날 인류가 과학적 진실을 탐구하는 완벽한 표준 무기가 되었습니다.

신약이 개발되었을 때, 이 약이 진짜로 효과가 있는가? (귀무가설: 약 효과는 없고 자연 치유된 것이다)
새로운 알고리즘을 도입했을 때, 진짜로 전환율이 올랐는가? (귀무가설: 알고리즘 효과는 없고 트래픽이 우연히 튀었을 뿐이다)

이 모든 검증의 뼈대가 바로 100년 전, 우아한 영국식 정원에서 밀크티를 마시던 여인을 위해 만들어진 것입니다.

오늘날 우리가 당연하게 믿고 있는 수많은 의학적, 과학적, 비즈니스적 사실들은 모두 "어차피 우연일 거야"라는 냉소적인 귀무가설의 공격을 이겨내고 살아남은 진실들입니다.

📚 참고자료 및 주석

Ronald A. Fisher, "The Design of Experiments" (실험계획법)
귀무가설 (Null Hypothesis), p-value, 무작위 대조 실험의 기원

현대 통계학을 탄생시킨 한 잔의 홍차: '밀크티를 맛보는 여인'과 귀무가설 (Null Hypothesis)

☕ 1. 세상에서 가장 우아한 실험의 설계

⚖️ 2. 귀무가설(Null Hypothesis)의 탄생

🎲 3. p-value (유의확률): 우연을 수치화하다

💡 4. 세상을 바꾼 홍차 파티

📚 참고자료 및 주석

💡 More from Data

A/B 테스트와 통계적 유의성의 함정: p-value의 진실과 가짜 승리(False Positive) 피하기

Vibe Coding 기반 광고 낭비 감시 자동화 시스템 구축 (n8n, Antigravity)

AI에 끌려가지 않는 '신호 설계자(Signal Designer)' 전략

전문가도 속는 통계 오류: 상관/인과, 교란 변수, 유의성의 함정

우리가 믿었던 '공부법'의 배신: 데이터가 폭로한 3가지 학습 신화

8만 명 중 1등 — 한국 대학생이 세계 퀀트 대회를 제패한 '32개 알고리즘'의 비밀

하루 8잔? 물에 관한 가장 유명한 건강 신화의 탄생과 붕괴