탑배너 닫기

노컷뉴스

[책볼래]당신이 여전히 '통계의 함정'에 빠져 있는 이유

책/학술

    [책볼래]당신이 여전히 '통계의 함정'에 빠져 있는 이유

    통계 너머의 삶 조명…통계적 오류와 역설 폭로

    통계 인포그래픽 자료 이미지. 스마트이미지 제공통계 인포그래픽 자료 이미지. 스마트이미지 제공
    2021년 기준 서울에서 반지하를 벗어난 가구는 단 650가구(국토교통부)에 불과했다. 서울시내 지하나 반지하에 거주하고 있는 가구 가운데 0.3% 수준이다.

    법무부가 급증했다던 만 13세 소년원생 비율의 경우 10~12세보다 많은 것은 맞지만 여전히 전체 소년원생 가운데 1.6% 수준(법무부, 2019~2021년)이다. 이들에 대한 '처분'이 아니라 형사 '처벌'을 말하기 전에 다시 사회로 갈 기회를 충분히 주고 있는 것일까.

    학교폭력을 당하고도 신고하지 않았다는 이들에게 이유를 물으니, 17.3%가 "이야기해도 소용이 없을 것 같아서"라고 답했다.

    책 '퍼센트 % 통계로 읽는 한국 사회, 숫자가 담지 못한 삶'(이데아)은 고도화된 한국 사회에 통계라는 거울을 들이밀어 통계가 가리키는 현실과 숫자가 미처 읽어주지 못한, 우리가 놓친 삶들을 조명한다.

    책은 0%에서 시작한다. 2020년 일본 출신 방송인 사유리 씨는 2020년 '푸른 눈의 아이'를 출산해 세상을 놀라게 했다. 저자는 한국에서 정자 기증으로 출산한 사례가 아직 보고된 바 없다며 출산율이 0.6%대로 추락한 한국에서 선택할 수는 없는 방법인가 묻는다.

    법률로 딱히 금지하고 있는 규정은 없지만 대한산부인과학회의 윤리 지침이 문제였다. 여성 단독 출산에 필요한 정자 공여를 '사실혼을 포함한 부부에 한해서'로 제한하고 있어, 국가인권위원회의 차별 권고에도 '사회적 합의가 우선'이라며 거부했다. 2021년 서울시 여성가족재단 조사결과 비혼 여성 응답자의 26%가 "결혼하지 않고 아이를 낳을 것을 생각해본 적이 있다"고 답했다.

    이 외에도 장애인 이동권 투쟁 이유, 서울에서 택시를 잡기 어려운 이유, 고기나 생선을 주 1회도 못 먹는 아이들, 자립 준비 청년들의 어려움, 경력 단절 여성, 20년 뒤 한국의 여름, AI로 사라질 직업 등 때론 '현타'를 만나지만 통계를 통해 한국인들이 바라보는 미래를 읽을 수 있다.

    한국 사회에서 통계를 마주하는 일은 어렵지 않다. 지금도 어디에선가 'OECD 평균 몇 %', '통계청 발표 몇 %', 'OO정당 지지율 몇 %' 등 통계 수치가 끊임없이 발표되거나 인용되고 있다.

    이렇듯 책의 통계들은 재난, 세대, 주거, 교육, 의료, 젠더, 노동, 환경 등 한국 사회를 관통하는 40개의 주제를 심도 있게 다루면서 통계 속에서 놓쳤거나 주목받지 못했던, 다시 한번 생각해봐야 할 사안들을 조목조목 끄집어낸다.


    이데아·에이콘 제공 이데아·에이콘 제공 
    그런가 하면, 앨런 B. 다우니 매사추세츠 올린공과대학(Olin College of Engineering) 컴퓨터공학과의 명예교수는 통계 수용자를 '함정'에 빠뜨리는 논쟁적 주제를 정면에 던진다.

    책 '통계의 함정'에서 그는 '평균'의 문제를 지적하며 "대부분의 사람들은 평균에 가깝고 그 이하나 이상으로 점점 더 멀어질수록 그에 해당하는 사람의 수도 점점 줄어든다"며 "한 가지 특징만을 고려할 때 참인 것이 몇 가지 특징들을 한꺼번에 고려하면 예상과 달리 거짓으로 판명되고, 그 특징들의 숫자를 더 늘리면 더욱 명확하게 거짓으로 드러난다"고 비판한다.

    질문에 답하고 논쟁적 주제의 문제를 해소하는 데 데이터가 효과적이고, 더 나은 결정을 내리는 데도 데이터가 많이 활용된다. 하지만 오히려 확률에 대한 우리의 직관이 때로 위험할 정도로 사실을 호도하는 경우도 있다는 것이다. 이는 자칫 오해를 넘어 부정확한 의료 진단, 대규모 지진 예측 실패, 사회 불평등 악화, 엉터리 정책 결정 등으로 이어질 수 있기 때문이다.

    저자는 코로나19 팬데믹을 예로 든다. 2021년 10월 한 유명 팟캐스트의 출연자는 "영국에서 코로나19로 인한 사망자의 70% 이상이 백신 접종을 받은 사람들"이라고 주장했다. 그의 주장은 정확했다. 그 숫자는 영국 공중보건국(Public Health England)이 신뢰할 만한 전국 통계를 바탕으로 발표한 보고서에서 나온 것이었기 때문이다. 하지만 이것이 백신이 소용 없거나 실제로는 해롭다는 암시는 잘못됐다고 꼬집는다.

    책에서 다룬 '백신의 유효성'을 예로 들며, 동일한 보고서의 데이터를 바탕으로 백신의 효율성을 계산해 몇 명의 목숨을 구했는지 추산할 수 있다면서, 동일 데이터에 따르면 백신은 사망을 예방하는 데 80% 넘게 효과적이었고, 4주 동안 4800만 명의 인구 가운데 7000명 이상의 목숨을 구했다. 만약 한 달에 7000명의 목숨을 구할 기회가 우리에게 주어진다면 그 기회를 잡아야 할 것이라고 강조한다.

    이 팟캐스트 출연자가 저지른 실수는 '기저율 오류(base rate fallacy)'라고 불리는데 누구나 쉽게 저지를 수 있는 실수다. 팟캐스트의 주장을 받아 논쟁적 주장을 펼친 장본인이 당시 뉴욕타임스(NYT) 기자였기에 파장은 전 세계로 확산됐다. 이는 한국에서도 마찬가지로 백신 접종 거부자들, 그리고 팬데믹 음모론자들에게 좋은 무기가 됐다.

    국립통계청의 공식 데이터를 정확히 반영한 것처럼 보이는 그 자료와 그래프는 그러나 두 가지 치명적인 문제를 안고 있었다. 첫째, 백신이 도리어 사망률을 높인다고 주장한 기자는 통계 자료를 제대로 해석할 아무런 지식과 전문성을 갖고 있지 않았다. 둘째, 자신의 주장과 부합하는 연령대와 시간 간격만 선택하고 그렇지 않은 데이터는 무시했다. 그래서 실상은 백신의 효과를 입증하는 자료로 나온 통계청의 자료를 그 반대의 목적으로 왜곡한 것이었다.

    개별 연령대나 성별로 나눠 해당 데이터를 보면 '감소 추세(혹은 증가 추세)'를 보이는데, 전연령대와 성별을 한데 묶어 데이터를 보면 거꾸로 '증가 추세(혹은 감소 추세)'를 보이는 소위 '심슨의 역설'이 이 기자의 백신 위험론에 작용했다.

    책 3장 '전통을 거부하고 세계를 구하라'는 특히 출산율 최저를 갱신하고 있는 한국 사회의 암울한 미래 '인구 절벽'에 경종을 울린다는 점에서 살펴볼 대목이기도 하다.

    저자는 중국의 '한 가정 한 자녀' 출산 정책이 어떤 사회적 영향을 몰고 왔는지 통계학의 시각에서 분석하는 한편, 적절한 출산 정책이 감안해야 할 여러 변수도 제시한다. 그럼으로써 '인구 절벽'으로부터 한국 사회를 지켜낼 아이디어를 찾아낼 수도 있을 것이다.

    1971년 임산부의 흡연이 태아에게 유익할지 모른다는 데이터를 발견한 사람은 양심적인 연구자얐다. 하지만 그가 데이터를 잘못 해석하는 바람에 정부의 금연 대책을 10년 지연시키는 결과를 낳았다고 한다. 저자는 명징하고 설득력 있는 분석으로 왜 데이터가 다른 많은 경우들과 마찬가지로 오해되는지 설명하고자 한다.

    그릇된 통계 분석과 해석은 단순한 오해를 넘어 부정확한 의료 진단, 대규모 지진 예측 실패, 사회 불평등 악화, 엉터리 정책 결정 등으로 이어질 수 있다. 저자는 이 점에 주목해 독자들이 함정에 빠지지 않도록 통계적 오류와 역설을 흥미롭게 폭로하고 파헤친다.


    ■ 퍼센트 %
    안지현 지음 | 이데아 | 286쪽

    ■ 통계의 함정
    앨런 B. 다우니 지음 | 김상현 옮김 | 에이콘 | 328쪽


    ※CBS노컷뉴스는 여러분의 제보로 함께 세상을 바꿉니다. 각종 비리와 부당대우, 사건사고와 미담 등 모든 얘깃거리를 알려주세요.

    이 시각 주요뉴스


    실시간 랭킹 뉴스

    노컷영상

    노컷포토

    오늘의 기자