남영준 ICT어드바이저/전 국제종합기계(주)대표
남영준 ICT어드바이저/전 국제종합기계(주)대표

여론조사가 맞다 안 맞다가 시중의 화제다. 미국은 여론조사가 가장 발달했지만, 대통령선거를 맞추지 못했다. 뉴욕타임즈, CNN 등 주요언론은 바이든이 압승한다고 예측했었다. 그러나 결과는 경합 주에서 막판에 승리했다.

경제 주간지 이코노미스트는 트럼프를 지지하는 백인 노동자들의 전화 응답률이 낮아 조사에 오류가 있었다고 인정했다. 국내 여론조사도 보수 진영에서는 잘 믿지 않는다. 보수 쪽 사람들은 조사에 많이 응하지 않는다는 이유이다.

대부분 조사는 표본 조사이다. 전수 조사를 한다는 것은 사실상 불가능하므로 모집단을 대표하는 표본을 추출해 조사한다.

여론조사 표본도 성별, 지역별, 연령으로 구분하여 만든다. 문제는 응답률이다. 직접 전화를 하면 20% 정도, 자동응답(ARS)은 5% 이내가 응한다. 조사기관이 보정을 하나 왜곡될 가능성이 있다.

여론조사 결과를 보자. 발표는 95% 신뢰수준에 ±3.1%라고 나온다. 이는 지지율이 20%이면 17~23% 안에 95%가 있다는 의미이다. 그런데 누가 22%만 되어도 크게 앞선다고 표현한다. 실제는 19~25%이니까 대부분이 그 안에서 겹친다. 오차범위는 표본 수가 1,000이면 3.1%, 2,000이면 2.2%이다. 오차범위 내에서는 큰 의미가 없다.

최근에 통계청이 발표한 쌀 생산량을 가지고 소란스럽다. 10월에 발표한 통계청의 쌀 생산량은 전년 대비 11만 톤이 줄 것으로 보았으나, 최종 생산량은 23만 톤이 줄었다. 표본 추출에서 농업 현장 감각이 떨어진 것이 아니냐는 이야기가 있다.

또 다른 문제는 통계 해석이다. 대표적인 게 부동산이다. 한국감정원의 주간 서울 아파트 매매가격지수는 상승률이 낮다. 그래서 정부 당국자는 이 수치를 잘 인용한다. 반면 같은 기관에서 발표하는 월간 상승률은 높다. 이는 월간이 조사시간이 길어 잘 반영되기 때문이다. 무엇을 인용하느냐에 따라 달라진다.

실적을 이야기할 때도 종종 오류를 일으킨다. 실적을 과거와 비교해서 몇 % 증가했든가, 감소했다고 한다. 여기서 비교하는 과거가 어느 시점이냐에 따라 확 달라진다.

기준 시점이 낮을 때면 증가하고, 좋아 보인다. 만일 높을 때로 하면 감소하게 된다.
비교 시점만이 아니다. 통계 기준과 포함되는 범위에 따라 다르다. 한국은행은 지난 9월에 가계 대출이 10조 늘었다고 한다. 반면 금융위원회는 6조라고 한다. 포함되는 금융 종류가 다르기 때문이다.

통계는 수치로 표현하니까 가장 객관적이고 정확한 것으로 생각한다. 아니다. 통계는 누가 어떻게 만드느냐에 따라 달라질 수 있다. 여론조사도 질문 내용과 순서를 조금만 바꾸어도 결과가 달라진다.

여론조사를 다른 기관의 조사와 비교하는 것은 별 의미가 없다. 조사방법과 설문내용이 다르기 때문이다. 같은 기관에서 발표하는 수치의 흐름을 보는 게 중요하다.

통계를 잘못 해석하면 사회적 혼란이 온다. 2002년 국내 이혼율이 47.4%라는 통계가 발표되어 반이 이혼한다고 방송에 나왔다. 이는 특정 연도에 이혼한 사람을 그해에 결혼한 사람으로 나눈 수치였다. 이혼하는 사람은 그동안 결혼한 수많은 부부 중에서 나오는 것이고, 결혼은 한 해만 따진 통계오류이다.

통계를 그래프로 보여 주는 경우에도 의도가 숨어있을 수 있다. 세로와 가로의 수치 간격을 어느 정도로 하느냐에 따라 차이가 크게 보일 수도, 작게 보일 수도 있다. 실업률이나 고용률을 방송사에 따라 그래프를 다르게 그린다. 똑같은 수치인데도 느낌이 다르다.

저작권자 © 한국농기계신문 무단전재 및 재배포 금지