Wook's AI and Marketing

숫자의 사기꾼들: 데이터 조작과 해석의 함정이 부른 역사적 대참사 10선

Marketing 2026-05-13

데이터는 객관적이라고 믿습니다. 하지만 데이터를 만드는 것도, 해석하는 것도 결국 사람입니다. 엑셀 한 칸의 실수가 수백만 명의 삶을 바꾸고, 조작된 12명의 데이터가 전 세계적 공중보건 위기를 만들며, 자동차 안에 심어진 몇 줄의 코드가 기업의 존립을 뒤흔듭니다.

이 글에서는 이전 편(데이터가 거짓말을 하는 순간: 심화편)에서 다루지 않은, 의도적 조작·시스템적 오류·구조적 편향이 초래한 역사상 가장 충격적인 데이터 사기와 착시 사례 10가지를 심층 분석합니다.


1. 엑셀 한 칸의 실수가 전 세계 긴축 정책을 낳다: 라인하트-로고프 사건

  • 배경: 2010년, 하버드 경제학자 카르멘 라인하트와 케네스 로고프는 "부채의 시대의 성장(Growth in a Time of Debt)"이라는 논문을 발표합니다. 전 세계 정책 입안자들은 이 논문을 경제 위기 타개를 위한 '긴축 정책(Austerity)'의 핵심 근거로 채택했습니다.
  • 데이터의 착시: 국가 부채가 GDP의 90%를 초과할 경우, 경제 성장률이 급감하여 평균 -0.1%로 수축한다는 명확한 '임계점'이 존재한다고 주장했습니다.
  • 무엇이 잘못되었나: 매사추세츠 대학 대학원생 토마스 허든이 논문의 데이터를 검증하는 과정에서 기초적인 엑셀 스프레드시트 수식 코딩 오류를 발견합니다. 이 오류로 인해 고부채 상황에서도 견조한 성장을 보였던 캐나다, 뉴질랜드, 호주 등 주요 국가의 데이터가 평균 계산에서 완전히 누락되어 있었습니다.
  • 실제 진실: 데이터를 올바르게 수정하자, 고부채 국가의 실제 경제 성장률은 +2.2%인 것으로 나타났습니다. 엑셀의 셀 범위 지정 오류 하나가 국가의 공공 지출을 삭감하는 긴축 정책의 기반이 되어, 유럽을 중심으로 전 세계 수백만 명에게 경제적 어려움을 안겨준 것입니다.

2. 조작된 논문 12명의 데이터가 전 세계 백신 공포를 낳다: 웨이크필드 MMR 사기

  • 배경: 1998년, 영국 의사 앤드루 웨이크필드가 의학 저널 란셋(The Lancet)에 MMR(홍역·볼거리·풍진) 3종 혼합 백신이 자폐증과 장 질환을 유발한다는 논문을 게재합니다.
  • 데이터의 착시: 12명의 아동 환자 데이터를 통해, 이전에 정상이었던 아이들이 백신 접종 후 며칠 내에 자폐 증상과 장 염증을 보였다는 새로운 증후군을 주장했습니다.
  • 무엇이 잘못되었나: 선데이 타임스 기자 브라이언 디어의 수년간의 탐사보도 결과, 웨이크필드가 백신 제조사 소송을 준비 중이던 변호사로부터 거액의 돈을 받고 연구를 의뢰받은 이해상충을 숨겼고, 12명 중 5명은 이미 백신 접종 전부터 발달 장애를 겪고 있었으며, 부모들이 "몇 달 후"라고 증언한 증상 발현 시기를 "며칠 내"로 조작하고, 정상이었던 장 조직 검사 결과를 '비특이성 대장염'으로 변조한 것이 밝혀졌습니다.
  • 실제 진실: 이 조작으로 영국과 미국의 백신 접종률이 급락하여 홍역이 대유행했고, 영국 의학 위원회는 그를 의사 명부에서 영구 제명했습니다. 란셋은 2010년에 해당 논문을 완전 철회했지만, 이미 뿌려진 백신 불신의 씨앗은 20년이 지난 지금까지도 공중보건에 심각한 영향을 미치고 있습니다.

3. 학계 역사상 가장 대담한 데이터 날조: 디데릭 스타펠 사건

  • 배경: 네덜란드 틸뷔르흐 대학의 사회심리학 교수 디데릭 스타펠은 '육식을 하는 사람은 이기적이다', '혼란스러운 환경이 차별을 조장한다' 등 대중과 학계의 이목을 끄는 수십 편의 논문을 Science 등 최고 권위 저널에 발표하며 저명한 학자로 명성을 떨쳤습니다.
  • 데이터의 착시: 그의 연구 결과는 통계적으로 너무나 완벽하게 가설에 들어맞았고, 동료 학자들과 리뷰어들은 이를 의심 없이 받아들였습니다.
  • 무엇이 잘못되었나: 그는 실제 설문조사나 실험을 전혀 진행하지 않은 채, 혼자 연구실에 앉아 가설에 맞도록 데이터를 통째로 날조(Fabrication)했습니다. 심지어 데이터를 수집했다고 주장한 학교 자체가 존재하지 않았고, 자신이 지도하는 박사 과정 학생들에게도 자신이 만든 가짜 데이터를 분석하게 하여 14명의 학생이 가짜 데이터로 박사 학위 논문을 작성했습니다.
  • 실제 진실: 제보자들의 고발로 조사가 진행되어 최소 58편의 논문이 철회되었고, 그는 학계에서 퇴출당해 형사 처벌을 받았습니다. 뉴욕 타임스는 그를 "학계 역사상 가장 대담한 사기꾼"이라 불렀습니다.

4. 공정한 알고리즘은 수학적으로 불가능하다: COMPAS 인종 편향

  • 배경: COMPAS는 미국 사법부에서 피고인의 재범 위험성을 예측하여 판사의 형량 선고나 보석 결정에 활용하도록 만든 인공지능(AI) 알고리즘입니다.
  • 데이터의 착시: 탐사보도 매체 ProPublica는 이 알고리즘이 흑인 피고인을 고위험군으로 잘못 분류하는 비율(위양성)이 백인보다 두 배 높다고 폭로하며 "인종차별적 알고리즘"이라 비판했습니다. 반면 제작사 노스포인트는 "같은 점수를 받은 흑인과 백인의 실제 재범 확률이 동일하므로 공정하다"고 반박했습니다.
  • 무엇이 잘못되었나: 양측 모두 틀리지 않았습니다. 문제의 핵심은 두 집단의 '실제 재범 발생 기본 비율(Base rate)'이 구조적으로 달랐다는 데 있습니다.
  • 실제 진실: 여러 대학의 컴퓨터 과학자와 통계학자들이 분석한 결과, 두 집단의 기본 비율이 다를 경우, '예측 정확도의 동일성'과 '오류율의 동일성'이라는 두 가지 공정성 기준을 동시에 만족시키는 것은 수학적으로 불가능하다는 사실이 증명되었습니다. AI가 만든 '숫자'도 사회적 맥락 없이는 공정할 수 없다는 것을 보여주는 기념비적 사건입니다.

5. 자동차가 시험관을 알아본다: 폭스바겐 디젤게이트

  • 배경: 폭스바겐은 미국과 유럽에서 연비와 출력이 뛰어나면서도 환경 기준을 완벽히 충족하는 '클린 디젤' 차량을 대대적으로 홍보하고 전 세계에 1,100만 대 이상을 판매했습니다.
  • 데이터의 착시: 미국 환경보호청(EPA) 등의 실험실 배출가스 검사에서는 문제의 차량들이 기준치 이내의 안전한 수준으로 질소산화물(NOx)을 배출하는 것처럼 보였습니다.
  • 무엇이 잘못되었나: 차량의 엔진 제어 컴퓨터(ECU) 안에 '차단 장치(Defeat device)'라는 불법 소프트웨어를 심었습니다. 이 코드는 주행 거리, 속도, 스티어링 휠의 위치 등을 분석해 현재 차량이 '실험실에서 배출가스 테스트를 받고 있는지'를 스스로 인지하고, 테스트 중일 때만 배출가스 저감 장치를 최대한 가동했습니다.
  • 실제 진실: 테스트가 끝나고 실제 도로에 나가면 저감 장치를 꺼버려 기준치의 최대 40배에 달하는 오염 물질을 배출했습니다. 100억 달러가 넘는 벌금과 대규모 리콜, CEO 등의 형사 처벌로 이어졌습니다.

6. 교과서에 실린 '호손 효과'는 허구였다: 호손 실험의 재분석

  • 배경: 1920년대 미국 웨스턴 일렉트릭의 호손 공장에서 조명의 밝기가 노동 생산성에 미치는 영향을 알아보기 위한 실험이 진행되었습니다. "조명을 밝게 하든 어둡게 하든 생산성이 무조건 증가했다. 누군가 자신을 관찰하고 있다는 사실만으로도 행동이 변하기 때문이다"라는 이른바 '호손 효과'는 심리학과 경영학의 교과서에 실리며 수십 년간 정설로 굳어졌습니다.
  • 데이터의 착시: 기존 학자들은 이 실험의 원본 데이터를 정식으로 통계 분석하지 않았고, 심지어 원본 데이터가 유실되었다고 믿었습니다.
  • 무엇이 잘못되었나: 2011년, 경제학자 스티븐 레빗(Steven D. Levitt)과 존 리스트(John A. List)가 극적으로 원본 데이터를 찾아내 재분석합니다.
  • 실제 진실: 기존에 알려진 것처럼 마법처럼 생산성이 계속 향상되었다는 놀라운 데이터 패턴은 완전히 '허구(Fictional)'로 드러났습니다. 과거의 학자들이 일화적인 관찰을 부풀려 해석한 것이었으며, 데이터를 올바르게 해석하면 호손 효과를 지지하는 뚜렷한 증거는 거의 없었습니다.

7. 런던 교외의 개인 트레이더가 월가를 폭파시키다: 2010 플래시 크래시

  • 배경: 2010년 5월 6일, 다우존스 산업평균지수가 단 5분여 만에 약 1,000포인트 급락하며 순식간에 약 1조 달러의 시가총액이 증발했다가 곧바로 급반등합니다. 초기에는 '주문 실수(Fat-finger)'나 고빈도 매매(HFT) 알고리즘의 오작동으로 여겨졌습니다.
  • 데이터의 착시: 시장의 주문장(Order book)에는 엄청난 양의 매도 물량이 실재하는 것처럼 보였고, 알고리즘들은 이를 '진짜 매도 압력'으로 해석하여 연쇄적으로 패닉 셀링에 가담했습니다.
  • 무엇이 잘못되었나: 영국 런던 교외의 부모님 집에 살던 개인 트레이더 나빈더 싱 사라오가 '스푸핑(Spoofing)' 기법을 쓴 것이 결정적 원인이었습니다. 그는 체결할 의도가 전혀 없는 막대한 양의 가짜 매도 주문을 현재가 바로 위에 겹겹이 쌓아 올려(layering), 시장의 매도 수급 데이터 자체를 조작했습니다.
  • 실제 진실: 그의 가짜 주문은 한때 전체 E-mini S&P 500 매도 주문의 20% 이상을 차지했습니다. 이 가짜 데이터가 HFT 알고리즘들의 기계적 연쇄 매도 반응과 맞물리며 역사적 폭락이 발생한 것입니다. 그는 이 수법으로 1,200만 달러 이상의 부당 이득을 챙긴 혐의로 체포되었습니다.

8. 세계에서 가장 중요한 금리 지표가 은행들의 카르텔이었다: LIBOR 조작 스캔들

  • 배경: 리보(LIBOR)는 런던의 주요 은행들이 서로 돈을 빌릴 때 적용되는 평균 금리로, 전 세계 수백조 달러에 달하는 대출, 모기지, 파생상품의 기준 금리 역할을 해왔습니다.
  • 데이터의 착시: 2008년 글로벌 금융위기 당시 은행들이 극심한 자금난을 겪고 있었음에도 불구하고, 이들이 보고한 리보 금리는 매우 안정적이거나 실제 자금 조달 비용보다 훨씬 낮게 나타났습니다.
  • 무엇이 잘못되었나: 리보는 은행들의 실제 거래 데이터가 아니라 담당자들의 '추정치' 제출에 의존한다는 치명적 허점이 있었습니다. 은행들은 자신들이 위기에 처한 것처럼 보이지 않기 위해 금리를 실제보다 낮게 보고하는 '로볼링(Lowballing)'을 자행했고, 트레이더들은 자신의 금리 파생상품 포지션에서 이익을 내기 위해 금리 제출자에게 조작을 지시했습니다.
  • 실제 진실: 바클레이스, 도이치방크, UBS 등이 수십억 달러의 벌금을 부과받았고, 세계에서 가장 중요한 지표 금리였던 리보는 결국 2023년에 역사 속으로 사라지고 SOFR 등 새로운 무위험 지표금리로 교체되었습니다.

9. 손가락 한 방울의 피로 세상을 속이다: 테라노스 사기극

  • 배경: 스탠퍼드 중퇴생 엘리자베스 홈즈가 창업한 실리콘밸리 스타트업 테라노스는 "손가락에서 채취한 단 몇 방울의 피만으로 수십 가지 질병을 검사할 수 있다"고 홍보하여 기업 가치 90억 달러(약 12조 원)를 인정받았습니다.
  • 데이터의 착시: 자체 개발한 '에디슨(Edison)' 기기가 기존 혈액 검사를 혁신한 것처럼 포장되었고, 투자자와 대형 마트 체인(Walgreens)은 이를 굳게 믿었습니다.
  • 무엇이 잘못되었나: 실제 에디슨 기기는 심각한 오류가 있어 정확한 검사가 불가능했습니다. 테라노스는 이를 은폐하기 위해 혈액을 희석한 뒤, 시중에서 판매되는 지멘스 등 다른 회사의 상용 혈액 분석 기기를 몰래 사용해 검사를 진행했습니다.
  • 실제 진실: 월스트리트 저널의 존 캐리루 기자가 내부 고발자들과 함께 진실을 폭로했고, 엘리자베스 홈즈는 7억 달러 이상의 투자금을 사기로 끌어모은 혐의로 11년 이상의 징역형을 선고받았습니다.

10. 숫자의 첫째 자리가 사기꾼을 고발한다: 벤포드 법칙

  • 배경: 자연적으로 발생한 숫자 데이터(인구수, 강 길이, 세금 신고 항목 등)에서, 첫 번째 자리에 오는 숫자는 균등하게 분포하지 않고 숫자 '1'이 약 30.1%로 가장 많이 등장하며, '9'는 약 4.6%로 가장 적게 등장한다는 통계적 법칙입니다.
  • 데이터의 착시: 회계 사기범들은 숫자를 조작할 때 '무작위성'을 가장하기 위해 1부터 9까지의 숫자가 균등하게(약 11%씩) 등장하도록 골고루 섞어서 가짜 장부를 만듭니다. 하지만 이 '균등한 분포'야말로 인위적 개입의 결정적 증거입니다.
  • 벤포드 법칙으로 잡힌 대형 사건들:
    • 엔론(Enron, 2001): 수익 회계 조작에서 첫째 자리 숫자의 비정상적 분포가 감지됨
    • 버니 메이도프(Madoff, 2008): 천문학적 폰지 사기 장부의 수익률이 벤포드 법칙을 심하게 위반
    • 그리스 정부(2011): EU에 보고한 거시 경제 지표가 벤포드 법칙에서 유의미하게 이탈
    • 이란 대선(2009): 특정 후보의 득표수에서 벤포드 법칙 위반이 발견되어 부정선거 의혹 제기

📚 참고자료

  • Herndon, T., Ash, M., & Pollin, R. (2013). Does High Public Debt Consistently Stifle Economic Growth? A Critique of Reinhart and Rogoff. Cambridge Journal of Economics.
  • Deer, B. (2020). The Doctor Who Fooled the World: Science, Deception, and the War on Vaccines. Johns Hopkins University Press.
  • Levelt Committee (2012). Flawed Science: The Fraudulent Research Practices of Social Psychologist Diederik Stapel. Tilburg University.
  • Angwin, J. et al. (2016). Machine Bias. ProPublica.
  • Kleinberg, J. et al. (2016). Inherent Trade-Offs in the Fair Determination of Risk Scores. arXiv.
  • EPA (2016). Volkswagen Clean Air Act Civil Settlement.
  • Levitt, S. D. & List, J. A. (2011). Was there Really a Hawthorne Effect at the Hawthorne Plant? American Economic Journal: Applied Economics.
  • DOJ (2015). Futures Trader Charged with Illegally Manipulating Stock Market, Contributing to the May 2010 "Flash Crash."
  • UK Treasury Committee (2012). Fixing LIBOR: Some Preliminary Findings.
  • Carreyrou, J. (2018). Bad Blood: Secrets and Lies in a Silicon Valley Startup.
  • Nigrini, M. J. (2012). Benford's Law: Applications for Forensic Accounting, Auditing, and Fraud Detection. Wiley.

💡 More from Marketing

View all

리타게팅 광고, 무조건 구체적일수록 좋을까? 고객의 취향 형성과 최적의 타이밍

고객이 우리 쇼핑몰에서 구경만 하고 나갔을 때, 방금 본 바로 그 상품을 다른 웹사이트에서 다시 보여주는 전략을 흔히 사용합니다. 과연 이 방법은 언제나 정답일까요? 오늘은 Lambrecht & Tucker (2013)의 연구 논문을 바탕으로 리타게팅 광고의 숨겨진 타...

2026-05-13

데이터와 실험이 밝혀낸 디지털 광고의 민낯: 우리는 진짜 ROI를 측정하고 있는가?

백화점의 선구자인 존 워너메이커(John Wanamaker)는 마케팅 역사상 가장 유명한 격언을 남겼습니다. **"내가 광고에 쓰는 돈의 절반은 낭비되고 있다. 문제는 어느 쪽 절반이 낭비인지 모른다는 것이다."** 인터넷과 디지털 매체의 등장으로 많은 마케터들은 이...

2026-05-13

데이터가 세상을 구한 순간: 낡은 직관을 박살 낸 10가지 거대한 패러다임 전환

> **퀴즈 하나.** 다음 중 사실은 몇 번일까요? > > A. 전 세계 극심한 빈곤 인구 비율은 지난 20년간 거의 두 배로 늘었다 > B. 전 세계 평균 기대수명은 약 50세다 > C. 저소득국 여자아이 중 초등학교에 다니는 비율은 20%다 > > **정답...

2026-05-13

데이터가 거짓말을 하는 순간 (심화편): 역사상 최악의 통계적 착시 8선

흔히 "데이터는 거짓말을 하지 않는다"고 말합니다. 하지만 데이터를 '해석하는 사람'은 종종 치명적인 착각에 빠집니다. 생존자 편향이나 심슨의 역설과 같이 비교적 널리 알려진 통계의 함정 외에도, 역사상 전문가들조차 속아 넘어간 훨씬 교묘하고 위험한 데이터의 착시 현상...

2026-05-13

[마케팅 데이터 함정 퀴즈 7편] 예산의 역설: 광고를 끊어도 매출이 안 떨어지는 이유

*마케팅 데이터 함정 퀴즈 시리즈의 마지막 7편입니다. 이번에는 예산 배분과 장기/단기 전략에서 발생하는 역설을 다룹니다.* --- **❌ 이것이 바로 Binet & Field가 경고한 '효율성 함정(The Efficiency Trap)'입니다.** 퍼포먼스 광고(검색...

2026-05-13

[마케팅 데이터 함정 퀴즈 6편] 거짓말하는 설문조사: 고객은 왜 진심을 말하지 않을까?

*마케팅 데이터 함정 퀴즈 시리즈 6편입니다. 이번에는 설문조사와 리서치 데이터가 왜곡되는 심리적 메커니즘을 다룹니다.* --- **❌ '사회적 바람직성 편향(Social Desirability Bias)'에 속고 있습니다.** "환경을 생각하시나요?"라는 질문에 "아...

2026-05-13

[마케팅 데이터 함정 퀴즈 5편] 알고리즘의 배신: 구글 AI가 추천하면 무조건 따라야 할까?

*마케팅 데이터 함정 퀴즈 시리즈 5편입니다. 이번에는 구글·메타의 알고리즘과 타겟팅 전략이 만들어내는 함정을 다룹니다.* --- **⚠️ 전형적인 '권위 편향(Authority Bias)'입니다.** 구글이나 메타의 시스템이 "AI 자동화(PMax, Advantage...

2026-05-13