본문 바로가기
분석가의 데이터 이야기/데이터 리터러시

숫자 제대로 읽기 ② 비율 재료 뜯어보기 3편

by 니나노래방 2023. 3. 3.

안녕하세요?

오늘은 숫자 읽기 시리즈 2번째, 비율 재료 뜯어보기를 또다시 이어서 포스팅하겠습니다 (생각보다 내용이 많아지네요!)

이번에는 비율을 조금 더 활용할 수 있는 방법 두 가지를 소개합니다. 거창하진 않지만 나름 유용합니다. 

숫자 읽기 시리즈 

1. 실수와 비율을 구분합시다. 

2. 비율 재료 뜯어보기
     - 비율에는 기준이 있다.

     - 비중을 본다면 합계를 찾으세요 
     - 비율 재미있게 가지고 놀기 (이번 포스팅) 
3. 추세와 지속은 다릅니다.
4. 기간이 있는 유량, 스냅샷을 찍는 저량
5. 평균 만으로 비교해도 될까요? 대표값의 함정

 

1. 평균값으로 비중 파악하기

1) 어떤 정보를 얻을 수 있을까요? 

이번에는 이런 자료가 있다고 해보겠습니다. 한 프로그램의 여성 시청률, 남성 시청률, 그리고 전체 시청률이 나와 있는 자료입니다. 

여성 시청률 11.5 %
남성 시청률 8.3%
전체 시청률 10.2%

💡 이 자료에서 얻을 수 있는 단서는 다음과 같습니다. 

    ① 여성 시청률이 남성 시청률보다 높다.

    ② 전체 시청률이 남성 시청률보다 높다.

    ③ 조사 대상의 수는 남성보다 여성이 많다. 

 

여기서 ③번이 우리가 간접적으로 파악할 수 있는 정보입니다. 전체 시청률과 각 성별 시청률의 관계를 이용해서 말이죠! 

 

 

2) 전체 시청률 안에 여성과 남성 시청률의 관계가 들어 있습니다.

여기서 여성 시청률과 남성 시청률을 어떻게 구하는지 산식을 써보겠습니다. 

 

이번에는 전체 시청률의 산식을 구해보겠습니다. 

전체 시청률 산식을 다시 한번 조합해보면 여성 시청률과 남성 시청률의 평균을 구하는 것과 비슷합니다. 하지만 여성 시청률과 남성 시청률을 단순 평균한 것과는 차이가 있다는 것을 보실 수 있습니다. 즉, 전체 시청률의 값이 남성과 여성의 비중의 영향을 받는 거죠. 바로 가중 평균이 적용된 것입니다. 

 

3) 가중 평균이 뭔가요?

가중산술평균(a weighted arithmetic average)이란 통계학에서 각 항목에 중요도를 부여하는 가중치를 감안해서 평균을 구하는 것을 말합니다. 쉽게 말해 '무게를 감안한' 평균을 구하는 것입니다. 반면 단순 평균은 '무게를 감안하지 않고' 단순히 수치의 합을 갯수의 합으로 나눈 것입니다. 

 

4) 가중 평균 = 시소 놀이의 원리 

가중 평균의 원리를 살짝 틀어보면 시소 놀이 원리와 동일합니다. 

*사진 출처 : Photo by Markus Winkler on Unsplash

 

 

어른과 아이가 시소를 타면 무게가 무거운 어른 쪽으로 시소가 기울 수밖에 없는데요. 

이때 이 시소가 균형을 이루려면 아이들을 계속 앉혀서 무게를 맞추거나 어른을 시소 받침대에 가깝게 옮겨야 합니다. 시소 받침대와 거리가 가까울 수록 아이쪽에 힘이 실리기 때문입니다. 이때 완전한 균형을 이루려면 아래 식을 만족해야 합니다. 

어른 몸무게 X 어른과 받침대와의 거리 = 아이 몸무게 X 아이와 받침대와의 거리

즉, 어른 거리 : 아이 거리 = 어른 몸무게 : 아이 몸무게가 됩니다.

 

이것을 평균의 문제로 가져와 보겠습니다.  아까 전체 시청률을 이렇게 구했었는데요.

전체 시청률 =  여성 시청률 X 조사 대상 중 여성 비중 + 남성 시청률 X 조사 대상 중 남성 비중

시소 놀이에 그대로 대입하면 전체 시청률은 시소의 받침대에 있고, 여성 시청률과 남성 시청률이 시소의 각각 한쪽을 차지하고 있습니다. 

이때 여성과 남성의 비중은 '무게'와도 같은데요. 예를 들어 여성 비중이 더 높으면 시소는 왼쪽으로 기웁니다. 

균형을 맞추려면 여성 시청률이 시소 받침대 가까이 이동해야 하는데요.  

여성 시청률과 전체 시청률과의 거리  :  남성 시청률과 전체 시청률과의 거리 = 남성 비중 : 여성 비중 임을 알 수 있어요. 

 

 

5) 시소 놀이를 거꾸로 적용해보기 

이 원리를 이용하면 시청률 정보만 이용해서 여성과 남성의 비중을 계산해볼 수 있습니다. 

여성이 전체 시청률과의 거리가 가까우니 비중은 그 만큼 높을 것입니다. 거리의 비를 거꾸로 적용한 것이 비중의 비입니다. 

쉽게 말해 '전체 시청률과의 차이가 가까우면 아, 비중이 높은 거구나! ' 이렇게 생각하면 돼요 😄

  시청률 전체 시청률과의 차이 여성과 남성의 비중
여성 11.5 % 1.3%p  59.3% ( 1.9 / 1.3 + 1.9)
남성 8.3% 1.9%p 40.7% (1.3 / 1.9 + 1.3)

 

6) 다른 사례도 생각해보기 

전체 평균 정보와 각 요소의 평균 정보를 알 수 있다면 가중평균(시소)의 원리를 응용할 수 있습니다. 아래의 사례처럼 말이죠. 

우리 서비스는 마케팅 채널로 페이스북, 트위터, 인스타그램을 사용하고 있습니다.
마케팅 채널의 전체 회원가입 전환율은 10%입니다.
각 채널 별 회원가입 전환율을 페이스북 8%, 트위터 6%, 인스타그램 11%라고 한다면 어떤 채널에서 도달 수가 가장 많을까요?

💡 인스타그램 채널의 도달수가 가장 많음을 알 수 있습니다.  전체 전환율과의 차이가 인스타그램이 가장 낮습니다(1%p) .

 

 

2. 진리의 쪼개기

비율을 분해하면 색다른 통찰을 얻을 수 있습니다. 분석(分석析)이라는 말 자체가 뭔가를 쪼갠다는 의미이니까요! 설명보다는 사례를 가지고 이해하려 해볼게요! 

 

1) 분자와 분모로 쪼개보기

호기는 다이어트 챌린지에 참가했습니다. 100kg였던 그는 한 달 동안 먹는 양을 줄여 몸무게를 5kg 빼는 데 성공했습니다. 하지만 체지방율은 그대로여서 충격을 받았는데요. 호기의 다이어트는 뭐가 잘못된 걸까요? 이 비율을 한번 분자와 분모로 나눠 살펴보죠. 

더보기

체지방률 (%)  = {체지방량(kg) / 몸무게(kg)}× 100 (%)

여기서 호기의 몸무게가 감소했지만 체지방률이 그대로인 이유는 체지방량이 몸무게 만큼 감량되지 않았기 때문입니다. 

총 몸무게가 100kg-> 95kg으로 5kg(5%) 감소했고 체지방은 30kg -> 28.5kg으로 역시 5%(1.5kg)이 빠진 셈입니다. 

여기서 알 수 있는 사실은 몸무게의 감소율(5%)과 체지방량의 감소율(%)이 동일했다는 점입니다.

반대로 체지방 증가율(감소율), 체중의 증가율(감소율)을 비교하면 체지방율이 커지는지 작아지는 지도 그대로일지 예상할 수 있습니다. 

 

 

이런 문제도 한번 풀어볼까요?

더보기

2010년부터 2018년까지 남녀 성비는 꾸준히 감소하고 있습니다. 

이 그래프를 보고 파악할 수 있는 정보는 무엇일까요? 

출처 : 연합뉴스

💡 비율이 감소하는 것만 확인할 수 있으므로 여러 가지 추론을 해볼 수 있습니다. 

① 남자와 여자 둘다 증가했지만, 남자 증가율 보다 여자의 증가율이 더 높았다. 

② 남자는 감소하고 여자는 증가했다. 

③ 남자와 여자 둘다 감소했지만, 남자 감소율이 여자 감소율 보다 더 높았다. 

 

 

2) 비율의 곱으로 쪼개보기

비율을 분수 그 자체로도 볼 수 있지만, 이 비율을 쪼개서 여러 분수의 곱으로 확인할 수 있는 방법이 있습니다. 분모와 분자에 같은 수를 곱하면 그 수가 약분된다는 점을 응용한 것입니다. 예를 들어 아래의 수식에서 C는 사실 없어도 되는 수이지만, C가 포함되면 A/B의 구성을 쪼개서 생각해볼 수 있습니다. 

 

1️⃣ ROE가 왜 떨어졌을까?

자기자본이익률(Return On Equity, ROE)은 기업 증권 자료에서 많이 보던 자료인데요. 기업이 자본을 이용하여 얼마만큼의 이익을 냈는지를 나타내는 지표를 말합니다. 이 지표를 보면 업이 본인 자본을 활용해 얼마나 수익을 만들어냈는지 알 수 있어 기업의 재무 건전성을 판단하는 데 도움이 됩니다. 

 

어떤 기업의 자기자본이익률(ROE : Return on Equity)이 전년도에 비해 올랐습니다. 이때 이 비율을 한번 더 쪼개보면 왜 이 지표가 올랐는지 생각해볼 수 있습니다. 

  • 순이익률이 더 많이 올랐다면 매출액에서 순이익이 차지하는 비중이 많이 늘었다는 뜻입니다. 내실 있는 상품을 판매했다고 볼 수 있습니다. 
  • 자산회전율이 더 많이 올랐다면 한정된 자산을 가지고 많은 매출을 만들어냈다는 뜻입니다. 
  • 재무레버리지가 더 많이 올랐다면 빚을 져서 ROE가 올라간 것이라 주의해서 볼 필요가 있습니다(단, 꼭 빚이 많다고 해서 나쁜 건 아닙니다!)

 

2️⃣ 어떤 단계에서 구매전환율이 떨어지는지 찾기

전환율(Conversion Rate)이란 특정 기준에서 전환된 비율을 의미합니다. 전환율의 기준은 다양해서 상황 마다 정의가 필요한데요. 이번 사례에서는 2023년 2월 한 달 동안 '구매' 행동과 관련된 구매 전환율을 구하고, 그 기준은 서비스를 이용하는 '사용자 수'로 측정한다고 가정하겠습니다. 여기서 구매 전환율은 크게 한 개의 분수로 구성할 수 있습니다. 

 

쇼핑앱에 들어온 사용자는 여러 단계를 거쳐 구매를 결정합니다. 전시된 상품을 클릭하고 -> 장바구니에 담고 -> 주문서를 작성하고 -> 결제까지 해야(상품 구입 사용자 수) 구매가 완료된다고 합시다. 이 단계를 쪼개서 보면 어떤 단계에서 전환율에 문제가 있는지 파악할 수 있습니다. 

 

 

 

지금까지 비율을 가지고 다른 정보를 추론할 수 있는 두 가지 방법을 소개해 드렸습니다.

비율을 정확하게 읽고, 응용하면 비슷한 숫자 안에서도 가치 있는 정보를 발견할 수 있습니다. 

다음 포스팅에서는 시계열 데이터(날짜, 숫자)를 읽을 때 주의할 점을 간단히 소개해 드리겠습니다. 

 

감사합니다. 

 

 

 


참고

1. [이미지] 남녀 성비 추이 - 연합뉴스 

https://www.yna.co.kr/view/GYH20190120000100044

 

2. [이미지] Unsplash - Markus Winkler

https://unsplash.com/@markuswinkler?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText

 

3. [기사] ROE로 보는 '다이소'와 '이디야'의 공통점 - 이재학 (사이다 경제)

https://cidermics.com/contents/detail/2149

 

댓글