2012/08/12 19:52

중위-평균소득 비율이 왜 소득불균형의 지표로 활용 가능할까? Business


저번 포스팅 내 소득은 어느 정도일까? - 평균(mean)과 중앙값(median)의 차이 에서 리플로 많은 분들이 의견을 주셨습니다. 그 중에서 특히 나츠메 님이 꽤 날카로운 질문을 해주셨는데 그 내용은 아래와 같습니다.

여기서 나츠메님이 말씀하신 내용은 논리적으로 하자가 없으며 타당한 지적입니다. 그런데 실제로 소득 분포와 관련된 여러 자료들을 살펴보면 국민 소득의 중앙값-평균값의 비율 또는 중위소득과 평균소득 증가율의 괴리 등은 심화되는 소득 불균형을 나타내는 예시로 수없이 인용되고 있으며 게다가 사전적 설명없이 중위-평균소득의 괴리는 소득 불균형을 나타내는게 당연하다는 듯이 사용되고 있습니다.

요즘 크게 이슈화 되고 있는 미국 실질 가계소득 중앙값(median)과 1인당 GDP(평균)의 괴리를 보여주는 그래프

그렇다면 이렇게 아무 설명없이 중앙값-평균값의 비율의 하락이 소득 불균형을 나타내는 것이라고 당연하게 사용될 수 있는 이유는 무엇일까요? 결론만 먼저 말씀드리면 한 국가내 개인 또는 가계의 소득 분포는 자연대수 정규분포(log-normal distribution)를 따른다는 것이 알려져있기 때문입니다.


Ⅰ. 소득 분포는 자연대수 정규분포를 따른다.


자연대수 정규분포는 한 변수에 로그(log)를 취하면 그 로그값이 정규분포를 따르는 확률분포 입니다. 물론 한 국가의 진짜 통계값이 이렇게 이론적인 분포를 따른다는 것에 의문을 제기할 분도 계실테고, 실제로 소득의 분포가 어떻게 하면 더 잘 설명될 수 있는지에 대한 문제는 여전히 열려있는 문제입니다. - 예를 들어 상위 1~3%의 소득은 파레토 분포(Pareto distribution)에 더 가깝다고 함 - 그러나 현재 우리가 살펴보고자 하는 문제에서는 우리나라의 가계소득 분포는 자연대수 정규분포를 따른다고 봐도 크게 무리가 없습니다. 우리나라의 가계소득에 로그값을 취한 분포가 진짜로 어떤 모양인지 한 번 살펴보도록 할까요?


위 그래프는 우리나라의 가구소득에 로그를 취한 자연대수 가구소득 ln(y)의 연도별 분포를 나타낸 그래프입니다. 회색 음영부분이 이론적인 정규분포 그래프이고 실선 부분이 실제 통계값을 가지고 추정한 자연대수 가구소득의 확률분포라고 이해하시면 됩니다. 보시다시피 1982년, 1992년 회색음영과 실선은 잘 일치하며 외환위기 직전인 1997년 실선부분이 이론적 정규분포보다 더 좌측으로 편향되어 소득의 불균형이 심화된 모습을 보여주고 있으나, 2002년 자연대수 가구소득은 다시 정규분포의 모습으로 되돌아 왔습니다.

즉, 우리나라에서도 가구소득 y가 자연대수 정규분포를 따르고, 따라서 자연대수 가구소득 ln(y)는 정규분포를 따른다는 특성은 매우강하고 안정적입니다. 비록 경제에 타격이 심했던 1997~98년 이 특성은 다소 왜곡되었으나 외환위기 극복후 2002년 다시 자연대수 가구소득은 정규분포의 모양으로 돌아왔을 정도로 안정되고 복원력이 강한것이 소득 분포의 한 특징입니다.


Ⅱ. 자연대수 정규분포의 특징은?


위에서 보여드린 그래프는 가구소득 y가 자연대수 정규분포를 따를경우 자연대수 가구소득 ln(y)이 정규분포를 따른다는 것을 보여준 그래프 입니다. 그렇다면 로그를 취하기 전 자연대수 가구소득 ln(y)이 아닌 자연대수 정규분포를 따르는 가구소득 y는 어떤 모양의 분포를 가지고 있을까요? 그 모양은 다음과 같습니다.


위의 세 그래프는 모두 자연대수 정규분포의 확률 밀도함수 그래프 입니다. 일단 정규분포와 달리 왼쪽으로 치우친 듯한 모양이 특징입니다. 그런데 확률 및 통계학에서 이런 비대칭성을 나타내는 지표는 비대칭도(skewness) 또는 왜도(歪度)라고 부릅니다. 너무 깊이 들어갈 필요가 없으니 간단히 설명드리면 비대칭도가 양(+)의 값으로 커질수록 오른쪽으로 긴 꼬리를 가지며 자료가 왼쪽에 더 많이 분포한 모양을 가지게 된다는 것만 먼저 알아두시면 될 것 같습니다.


Ⅲ. 비대칭도(skewness)와 중위-평균소득의 관계


자연대수 정규분포의 특징은 로그를 취한 값이 정규분포를 따르는 확률변수의 평균 μ 와 표준편차 σ 로 중요한 통계값을 모두 표현할 수 있다는 것입니다. 여러 수식이 나오지만 일단 거부감 없이 한번 보시도록 할까요?


자 여기서 우리가 사용하고자 하는 지표는 중위소득/평균소득 비율에 대한 것이니 위 표의 mean과 median 그리고 위에서 설명드린 그래프의 모양을 나타내는 skewness가 되겠습니다.

먼저 중위소득/평균소득 비율이 하락한다는 것은 어떤 의미일까요? 위 표의 수식을 잠깐 활용해볼까요?


아하 그러니까 중위소득/평균소득의 비율은 자연대수 정규분포에서 자연지수 함수로 표현되고 중위-평균소득 비율이 하락하기 위해서는  σ^2 이 커져야 하는군요. (지수함수의 모양을 생각하시면 됩니다.)

자 그렇다면 σ^2이 커진다면 skewness는 어떻게 변해야 할까요?


아하 산식을 보니  σ^2이 커질수록 skewness는 증가하게 되는군요. 이는 결국 중위소득/평균소득 비율이 하락할 수록 소득의 분포 그래프는 점점 비대칭적으로 좌측으로 치우친 모양으로 변한다는 것을 의미하게되며 이는 결국 소득 불균형의 차이가 커진다는 말과 동일한 내용입니다.

중위소득/평균소득 비율이 하락하면 소득분포는 보라색 실선에서 보라색 점선 그래프로 변화하게 된다.


그리고 이렇게 비대칭도(skewness)가 커진다는 것은 자연대수 정규분포를 따르는 가계소득의 경우 단순히 불균형만을 의미하지는 않습니다. 아래의 그래프는 같은 평균값을 가지는 그래프입니다. 그러나 비대칭도(skewness)가 커지게 되면 예를들어 중앙값(median)의 50% 미만의 소득을 가지는 빈곤가구의 비율이 커지게 되며 따라서 이는 빈곤율의 확대를 의미하는 신호로도 받아들여질 수 있는 것입니다.

평균(mean)은 같은 두 그래프, 비대칭도(skewness)가 증가하면 빈곤층의 비율이 확대된다. (A의 면적>B의 면적)


Ⅳ. 맺음말


이번 포스팅에는 수식이 약간 나아서 그렇기는 하지만 잘 보셨나요? 수식만 보면 거부반응을 보이시는 분들도 분명히 계시겠지만 우리 사회의 많은 부분들은 이런 수식과 통계학을 이용해서 돌아가고 있습니다. 그러니 이번 기회에 예전에 덮어두었던 수학책을 다시 펼쳐보는 것도 괜찮을것 같다는 생각과 함께 이번 글은 마무리 하겠습니다...^^

마지막으로 귀여운 여러가지 확률 밀도함수 그래프 모양 쿠션들 다시 한번...^^;;



[참조자료]

김종면, 소득분배구조의 향후 추이에 대한 일고 - 연령별 소득 분포의 특성을 이용하여, 한국조세연구원, 2003.12월
성명재, 소득이동성과 빈곤의 관계, 한국조세연구원, 2007.4월

덧글

  • 오땅 2012/08/12 19:56 # 답글

    쿠션이 귀엽네요 ^^

    그런데 덧글란에 웬 토끼가 ㅋㅋㅋ
  • Orca 2012/08/12 19:58 #

    제가 옛날에 토끼를 키웠거든요...ㅎㅎㅎ...지금은 하늘나라에서 놀고 있지요...^^;;
  • 오땅 2012/08/12 19:59 #

    아아 ㅠㅠ

    천국에서 잘 뛰놀기를 빌겠습니다.
  • 漁夫 2012/08/12 20:09 # 답글

    잘 보았습니다. 전 경제학에는 문외한이라 도움이 많이 되고 있습니다.
  • Orca 2012/08/13 10:20 #

    잘 보셨다니 다행이네요...^^ 저도 어부님의 진화관련 포스팅 잘 보고 있습니다...ㄳ
  • 피그말리온 2012/08/12 20:19 # 답글

    정규분포는 항상 믿기지 않으면서도 뭔가 신비로워 보이는게 있습니다.
  • Orca 2012/08/13 07:49 #

    그런게 몇가지 있죠...ㅎㅎ....말씀하신 정규분포, Power curve 등등....
  • 긁적 2012/08/12 20:35 # 답글

    전 막연히 소득분포가 동일한 형태의 수식에서 상수값만 변하는 방식으로 변화하기 때문이라고 생각했습니다. 자세한 통계적 설명 재미있게 보았습니다^^
  • Orca 2012/08/13 07:49 #

    잘 보셨다니 감사합니다....ㄳ
  • 일화 2012/08/12 22:42 # 답글

    역시 통계는 어려워!! 고3때도 확률까지는 어찌어찌 이해가 되었으나, 통계에 접어들자 멘붕크리... 그나마 수능은 통계가 시험범위 밖이어서 살았었죠.
  • Orca 2012/08/13 07:50 #

    오 그렇군요. 저도 고등학교때 정규분포 그래프보던 기억이 나네요...^^
  • 나츠메 2012/08/13 16:34 # 답글

    생업에 바쁘실텐데도, 필자의 미진한 댓글에 대해 친절한 포스팅을 해주셨네요. 잘 보았습니다.^^

    1. 논지를 전개하면서 자연대수 정규분포(의 로그값)과 실제 통계를 대조하여, 정규분포와 실제가 동일하게 연동한다는 것을 제시하셨습니다. 그러나 본문에 제시된 통계는 조사된 실측값을 단순나열한 데이터가 아니라 실측값을 '정규분포'에 맞게 수정`보완한 자료이므로, 정규분포의 신뢰도와 확률값에 대해 좀 더 자세히 논증한 다음 자연대수 분포와 비교하는 것이 어땠을까 하는 아쉬움이 남습니다.


    2. 통계학은 일반인이 접근하기 어려운 분야인 탓에, 설명하기 난해한 부분임에 분명한데 나름 쉽게 설명하신 것 같습니다. 개인적으로도 mean income과 median income의 정규분포 모델과 유의성에 대해 공부의 필요성을 다시 한 번 느끼게 됩니다.
  • Orca 2012/08/13 08:22 #

    아 잘 보셨다니 감사합니다.

    일단 본문에도 있지만 회색음영은 이론적 정규분포, 그리고 부드러운 곡선으로 표시된 실선은 Kernel을 사용해서 smoothing한걸로 보입니다. 정규분포에 끼워 맞추기 위한 연구자의 자의성은 많이 배제되어 있지요. 일단 요 두개가 잘 맞아보이는 거긴하지만.....나츠메 님은 이정도 설명으론 만족 못하실것 같기는 하네요.

    자세한 방법론은 아래 링크된 문서를 참조해 주세요. 로딩에 좀 시간이 걸립니다...^^
    http://www.kif.re.kr/KMFileDir/bke0303-3.pdf
  • 나츠메 2012/08/13 18:30 #

    항상 친절한 댓글 감사합니다. orca 님의 연이은 답글과 포스팅으로 많은 걸 배워갑니다.
  • goodspeed 2012/08/15 19:47 # 삭제 답글

    흥미이ㅆ는 글 잘읽어ㅆ습니다.
    추천 꾹~!!
  • Orca 2012/08/19 21:19 #

    잘 보신것 같아서 다행입니다...^^
  • chemica 2012/09/18 22:18 # 답글

    잘 보고 갑니다 , ..
  • Orca 2012/09/19 07:39 #

    잘 보셨다니 감사합니다...^^
  • 궁금 2012/10/18 16:21 # 삭제 답글

    궁금한 거 질문해도 될까요?
    소득분배가 악화되면 중위소득은 낮아집니까? 그대로입니까?
    좀 가르쳐주세요
  • Orca 2012/10/18 18:36 #

    소득 분배가 악화된다면 가계 소득이 자연대수 정규분포를 따른다는 가정에서(꽤 안정적인 가정입니다.)
    비대칭도가 커진다 → σ가 커진다는 거고, 자연대수 정규분포에서 중앙값(median)은 e^μ 가 되니 중앙값(중위소득)은 변화가 없겠군요. (σ의 영향을 받는게 아니니...)

    혹시 포스팅 본문과 혼돈 되실까봐 말씀드리면 이 포스팅은 "중위소득/평균소득 비율이 하락 → 소득분배가 악화" 되는 내용을 설명한 것이지 "소득분배가 악화 → 중위소득이 변화한다(낮아진다)."를 설명한게 아니라는 걸 이해하시면 될 것 같습니다...^^

    내용이 약간 틀리기는 하지만 '명제 P→Q가 참이라고 해서 이 명제의 역인 Q→P가 언제나 참은 아니다' 라는걸로 생각하셔도 될 것 같습니다.
  • 궁금 2012/10/19 10:46 # 삭제 답글

    "소득분배가 악화되면 중위소득은 낮아지게 된다"라는 진술이 참이 아니라는 것을 알고 싶었는데 덕분에 잘 알게 되었습니다. 소득분배가 악화되더라도 중위소득 이하의 사람들의 소득이 상위로 이동하는 경우, 중위소득은 그대로 있을 수도 있고 상승할 수도 있다는 것을 알았습니다. 감사합니다.
  • Orca 2012/10/19 12:50 #

    예 잘 보셨다니 다행이네요...^^

    말씀하신 내용도 있고해서 보통 평균소득과 중위소득을 비교해서 보는게 더 많은 정보를 얻을 수 있지요.
    가장 좋은건 전체 가계 소득의 분포를 파악하는 것이고요.
  • 2017/07/24 01:42 # 삭제 답글

    재미있는 글 잘 읽었습니다! 가계소득에 자연대수를 취하였을 때 그 분포가 정규분포를 이룬다니 신기할 따름인데요, 혹시 이련 자연대수 정규분포가 발생하게 되는 이유에 대해 여쭤볼 수 있을까요?
댓글 입력 영역


시계