대선 후보자 지지율 그래프, 새로운 형태를 제안한다
상태바
대선 후보자 지지율 그래프, 새로운 형태를 제안한다
  • 편집위원 양혜승
  • 승인 2017.02.05 22:12
  • 댓글 3
이 기사를 공유합니다

/ 편집위원 양혜승

작년 20대 총선 때 선거 여론조사가 황당하리만치 빗나갔다. 선거 전에는 모든 언론이 새누리당의 우세를 예상했다. 하지만 결과는 새누리당의 참패였다. 더불어민주당이 제1당을 차지할 거라는 예상은 어떤 언론도 하지 못했다. 선거 여론조사의 문제점에 대해 수많은 지적이 나왔다.

물론 선거 여론조사의 문제점은 우리나라에만 있는 것은 아니다. 재작년 영국에서 치러진 총선에서도, 작년에 미국에서 치러진 대선에서도 최악의 패배자는 여론조사였다는 말까지 생겨났다. 그만큼 현대사회에 여론을 정확히 간파해 내기란 녹록지 않다는 말일 거다. 그럼에도 불구하고 선거 여론조사 무용론까지 들먹일 필요는 없다. 선거 국면에서 국민들이 정확한 여론을 이해하는 것은 중요하기 때문이다.

미국의 사회심리학자 레온 페스팅거는 인간은 자신의 능력이나 의견을 다른 사람들과 비교하는 사회비교(social comparison) 성향이 있다고 말했다. 선거 상황에서 다른 사람들이 어떤 표심을 갖고 있는지 궁금한 것은 어쩌면 인지상정이다. 독일의 정치학자 노엘레 노이만은 정치적 상황에서 인간은 유사통계적 감각(quasi-statistical sense)을 활용한다고도 말했다. 다른 사람들이 어떤 의견을 갖는지 알기 위해 소위 ‘촉’을 동원한다는 의미다. 따라서 언론이 선거 상황에서 개인들의 궁금증과 ‘촉’에 도움을 주어야 하는 것은 너무나 당연하다.

하지만 선거 여론조사의 문제는 조사 자체의 문제에서만 비롯된 것은 아니다. 조사 결과를 보도하는 언론의 보도행태도 큰 문제다. 대선이 다가온다. 다시금 언론보도가 시험대에 올랐다. 지난 12월 8일에는 방송협회와 신문협회, 신문방송편집인협회, 한국기자협회, 인터넷신문협회 등 언론관련 5개 단체들이 함께 모여 선거여론조사 보도준칙을 제정했다. 작년 총선 때의 과오를 발판 삼아 제대로 된 선거 여론조사 보도를 하겠다고 나선 것이다. 이 준칙은 여론조사와 관련된 언론보도의 문제점들을 상당히 정확히 짚어냈다. 여론조사의 수치에 과도한 의미를 부여하지 않는다는 원칙, 오차 범위 내 조사 결과는 순위를 매기거나 서열화하지 않는다는 원칙도 포함되었다.

하지만 혹시나 하는 기대가 역시나 하는 탄식으로 바뀌는 것은 순식간이다. 봇물 터지는 대선 후보 지지율 보도를 보면서 괜한 기대를 했다는 자괴감이 밀려온다. 여전히 우리 언론은 자성의 기미가 없는 부정확한 보도를 쏟아낸다. 뭐하려고 선거 여론조사 보도준칙까지 만들었나 싶다. 기억상실증에 걸린 것은 아닌가도 싶다.

문제의 핵심은 표집오차다. 대체로 선거 여론조사는 전체 유권자를 대상으로 하지는 않는다. 비용이나 시간의 효율성 때문이다. 전체 유권자를 잘 대표할 수 있는 소수의 표본을 추출해서 조사를 진행하고, 그 결과를 전체 유권자에 확대해서 통계적으로 유추한다. 그러다 보니 아무리 대표성을 잘 갖춘 표본을 선정해서 조사를 진행해도, 결국 표본의 결과는 근사값일 수밖에 없다. 우리가 궁극적으로 궁금해 하는 참값, 즉 전체 유권자에게 확대 유추한 값과 표본조사로부터 얻어진 근사값의 차이가 바로 표집오차다.

선거 여론조사와 관련된 보도를 보면, “이번 조사의 표집오차는 95% 신뢰수준에서 ±3.1%포인트” 라는 문구가 등장한다. 표집오차는 응답자의 수, 즉 표본의 크기와 밀접한 관계가 있다. 표본의 크기가 커질수록 표집오차는 작아지고, 표본의 크기가 작아질수록 표집오차는 커진다. 통계적으로 보아 표본이 1,000명이면 ±3.1%포인트, 500명이면 ±4.4%포인트 정도다. 대개는 1,000명 수준의 조사를 흔하게 실시한다. 따라서 ±3.1%포인트의 표집오차를 갖는 경우가 많다.

중요한 것은 언론보도가 표집오차의 의미를 정확하게 설명해주지 못한다는 점이다. A후보가 30.0%의 지지율을 보였다면, 사실은 A후보의 지지율은 최대 33.1%에서 최저 26.9% 범위 안에 존재할 수 있다는 의미다. 그렇기 때문에 후보 간 지지율 차이가 통계적으로 유의미하려면, 그 차이가 최소 ±3.1%포인트, 즉 최소 6.2%포인트가 되어야만 한다. 6.2%포인트 이내의 차이는 그야말로 아무런 의미가 없다. 그럼에도 불구하고 언론에서는 순위를 매겨서 보도를 하곤 한다. 이것은 엄청나게 잘못된 보도다.

표집오차와 함께 등장하는 ‘신뢰수준’이라는 것에도 주목할 필요가 있다. 예를 들어서 “이번 조사의 표집오차는 95% 신뢰수준에서 ±3.1%포인트”라는 표현에서 신뢰수준이 95%라는 것은, 아무리 대표성을 잘 갖춘 표본을 대상으로 조사를 해도 5%의 오류 가능성은 존재한다는 의미다. 따라서 이 5%의 비신뢰수준과 더불어 표집오차를 함께 고려한다면, 일회성의 표본조사 결과를 마치 참값인 양 단정적으로 보도하는 것은 몹시 그릇된 행태다.

표집오차와 관련된 해석만이라도 정확하게 이루어졌으면 한다. 국민들이 궁극적으로 궁금한 것은 표본조사의 결과가 아니다. 참값, 즉 전체 유권자의 결과다. 따라서 언론은 표집오차를 고려한 참값의 범위를 알려주어야 마땅하다. 즉 각 후보의 지지율이 존재할 수 있는 참값의 범위, 즉 최소값과 최대값의 수치를 알려주어야 한다.

2월 1일에 반기문 전 유엔사무총장이 대선 출마를 포기했다. 대선 후보들의 지지율에 미치는 파장을 언론사들이 일제히 보도했다. 표본의 크기가 1,000명인 여론조사 결과였다. 아래의 그래프 A와 같은 막대그래프가 동원되었다. 문재인 후보에 이어 황교안 총리가 2위로 올라섰다고 보도했다. 안희정, 이재명, 안철수 후보가 뒤를 잇는다고 덧붙였다. 하지만 이것은 분명한 오류다. 후보 간 지지율이 6.2%포인트 차이를 넘지 않는 이상 등수를 매기는 자체가 오류다. ‘문재인 후보를 제외한 대부분 후보들의 지지율이 엇비슷하다’가 정답이다. 등수를 매기는 순간, 보도는 오류가 된다. 하지만 언론사들은 이런 오류를 남발했다.

이런 오류는 막대그래프가 더욱 거든다. 막대의 높이에 따라 등수가 확연하게 차이나는 것처럼 보이기 때문이다. 막대그래프의 함정이다. 따라서 지지율 그래프의 새로운 형태가 필요하다. 예를 들어 B와 같은 박스형 그래프를 고려해볼 수 있다. 표집오차를 고려해서 최소값과 최대값을 명시하고, 표본조사에서 얻어진 수치는 과감히 제시하지 않는 방식이다.

이런 그래프 형태가 국민들에게 익숙하지는 않다. 하지만 익숙해지면 된다. 만들기도, 이해하기도 그렇게 어렵지 않다. 이 그래프는 각 후보의 지지율을 범위의 차원에서 인식하게 도울 수 있다. 최소값과 최대값의 구간 높이가 겹친 후보 간에는 통계적으로 차이가 없다는 사실까지도 이해하기 쉽게 해준다. 말하자면 이 그래프에서는 문재인 후보를 제외하고는 대부분의 후보들 간에 지지율 격차가 의미 없음을 쉽게 보여줄 수 있다.

선거 때마다 언론보도의 문제점을 지적하는 목소리가 높다. 후보자들의 정책과 비전에 대한 검증자 역할을 제대로 수행하지 못한다는 지적이 거듭된다. 마치 경마장에서 말의 순위를 매기듯 후보자들의 지지율만을 지나치게 부각시켜 보도하는 ‘경마 저널리즘’에 대한 우려도 반복된다. 하지만 언론이 후보자들의 지지율에 대한 전달과 분석을 게을리 할 수도 없는 노릇이다. 여론의 동향을 보도하는 것, 또한 언론의 중요한 역할 중의 하나이기 때문이다. 기왕 전달할 여론 동향이라면 제대로 했으면 한다.

늘 그렇게 해왔기에 예전의 것을 답습하지는 않기를 바란다. 뭔가를 새로이 시도하는 언론이었으면 한다. 그런 의미에서 지지율 그래프의 형식을 고민해보는 것도 작지만 중요한 시도일 것이다. 이런 작은 시도마저 등한시한다면 우리 언론은 선거가 끝날 때마다 반성문을 쓰는 고약한 문제아, 혹은 기억상실증 환자로 머물 수밖에 없다. 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 3
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
모도맘 2017-02-26 21:56:10
언론은 표집오차를 고려한 참값의 범위를 알려주어야
마땅하묘 즉 각 후보의 지지율이 존재할 수 있는 참값의 범위,
즉 최소값과 최대값의 수치를 알려주어야할것 같아요...

포로루 2017-02-09 15:11:30
최근 k 방송국 여론조사 주부층 1위가 황교안이라죠 ;
도대체 어느부류에서 조사하는지 ;;

ㅇㅇ 2017-02-06 18:03:55
작년 총선 조사방법도 문제였다고 생각합니다. 보니까 대부분이 유선조사던데 유선이면 주부나 고령층이 받을 확률이 높은데 이 계층이 새누리 주요 지지층이었죠. 그러다보니 실제보다 과도하게 새누리 지지응답이 높앗다고 생각합니다