우리 모두 웃어봐요! 우리들의 이야기로.
통계의 오용과 악용
‘매 17초마다 차가 한대씩 도난당합니다.’
도난방지용 핸들 잠금장치를 파는 업체에서 이용하는 광고문구입니다.
북미에서 1년에 도난당하는 차량의 숫자를 1년 365일 즉 31536000초로 나누면 그렇다는 것이지요.
17초마다 한 대꼴로 도난당하는 사실을 알면 내 차도 곧 도난당할 것처럼 느껴지지 않습니까?
북미에 차량의 총 숫자는 얼마나 될까요?
승용차만 256 million대라고 합니다(2013년)
과연 내차가 도난당할 확률은 얼마나 될까여?
복권에 당첨되기만큼이나 어렵습니다.
통계라는 숫자개념을 악용하는 한 예입니다.
한사람이 평생 동안 6마리의 거미를 알게 모르게 먹어치운다고 말하면 소름이 돋습니다..
이 또한 세계인류가 60년 동안 먹어치우는 거미의 숫자를 세계 인구로 나누어 본 것의 결과입니다.
물론 거미를 먹는 인종도 있습니다.
또 입을 벌리고 자면서 자신도 모르게 입안으로 들어온 거미를 먹게 되는 수도 있다고 합니다.
이렇게 인류가 먹는 거미의 총 숫자를 세계인구로 나누어 보면 평균 한사람이 평생 동안 6마리의 거미를 먹어 치운 셈이 된다는 통계가 나옵니다.
그렇지만 실제 거미를 먹은 사람은 몇 명이나 될까요?
통계는 이렇듯 숫자의 착오와 오용과 인위적 요소가 가미 될 수 있습니다.
정부에서 또는 미디어 업체에서 조사하고 내는 통계는 이미 목적을 염두에 두고 조사하고 또 목적에 맞추어 해석을 할 수도 있습니다.
간단하게 말해서 절대적으로 믿을 수 없는 것이 통계입니다.
통계는 전체적인 이해를 돕기 위한 것이지 통계에 의한 숫자에 의존해서는 안 된다는 제 생각입니다.
세상은 항상 옳은 방향으로만 가는 것이 아닙니다.
풍운고월님이 말하는 경우는 이런 것 같습니다.
1. 누군가 횡단보도에서 담배를 핀다.
2. 지나가는 행인이 간접흡연을 이유로 들며 담배를 꺼달라 부탁한다.
3. 그 사람이 간접흡연의 위험성을 믿지 않기에 담배를 끄지 않는다. 길빵은 아직 경범죄가 아니니 그 사람을 강제할 수는 없다.
4. 지나가는 행인이 여러 통계적 자료를 들어서 간접흡연과 건강악화 사이에는 유의미한 연관성이 존재한다 주장한다.
5. 그 사람이 그건 통계일 뿐이고 나는 통계를 믿지 않는다며 거부한다.
그러니까 이런 것 같다 생각합니다. 통계의 안에는 정보가 담겨 있습니다. 그 정보의 참거짓은 정보를 얻어내기위해 사용 된 통계학적 방법론의 정당성에 의해 결정됩니다. 만약 그 정당성이 검증된다면 그 정보 자체는 진실이 됩니다. 그 정보의 진실성을 부정하는 것은 제법 당혹스런 행위이고요.
풍운고월님은 그 정보가 어떻게 사용되는지와는 별개로, 그 정보의 진실성 자체를 부정하는 사람들에 대해 불평한 것 같습니다. 그리고 그렇기에 통계에 담긴 정보의 오용을 가지고 풍운고월님을 비판하는 것은 약간 핀트가 어긋난 것 같다 생각합니다.
본문은 포괄적으로 말한 것이고,
한 예로 통계와 관련된 개인적인 경험을 이야기 해보자면,
제가 가장 자주 접하는 데이터는 주로 로그분석입니다. 저마다 처한 환경에서 통계와 관련된 데이터를 찾아보실 수 있을 것입니다.
제 경우 접속데이터를 종종 파악해야 해서 보곤 하는데, 이것이 사람들의 생활패턴과 심리와도 연관이 있습니다.
언제 월간, 주간, 일간 접속 및 구매패턴등을 알 수 있죠. 또한 배너광고를 클릭하는 비율이 놀랍도록 균일합니다.
오처범위를 줄이기 위한 방법도 많이 개발되어 있죠.
그리고, 본문에 적은 내용을 가장 정확히 말씀하신분은 위에 강림주의님이시네요.
예전 일 하나를 말씀드리면,
제가 웹 개발을 하던 시절(제가 직원일떄) 이런저런 데이터를 제시해도, 무조건 자기 생각이 옳다고 말씀하시는 클라이언트 때문에 답답해 하던 사장님 생각도 좀 납니다.
Comment ' 18