어제 님께서 "저자 보상과 스팀 파워는 상관관계가 있을까?" (https://steemit.com/kr/@yoon/77wp9d) 관련해서 통계를 추출해 주실수 없냐구 여쭈어 보시더군요^^ 일단 yoon님께서 작성하신 글을 읽고 제가 지금까지 보고서 작성하면서 수집한 데이터 및 지표로 통계치를 내보았는데 제가
님의 의도를 제대로 파악했는지 모르겠네요 (한국말이 약해서 ㅠ.ㅠ)
- 저자 보상이 '자본'과 상관 관계가 있을까?
- 저장 보상이 '자본'에 의해서만 발생한다고 보지는 않습니다. 저자 보상과 스팀 파워 보상의 상관 관계는 그 사이 어딘가에 있을 거라 생각합니다.
위 내용을 제가 받아들은 바로 풀이 하자면
"저자보상에 영향을 주는 요소들은 무엇이며? 그리고 주요요소중에 하나인 '자본' 즉 스팀파워는 어느 정도의 영향력을 미칠까?"
님이 리스트 한것중에 현재 제가 가지고 있는 데이터로 도출해내지 못하는 부분도 있으니 참고 하시고, 이 보고서를 어제 밤 퇴근후에
시작한거라 어제 부터 관련 데이터를 수집하고 있습니다.
그럼 일단 제가 지금까지 도출한 결과 보고서(초안) 입니다.
데이터
아래 내용은 다음 데이터를 가지고 추출하였습니다.
-글 작성자 760명
-총 글수 4678 (2017-08-14 ~ 2017-08-29)
스팀파워(가로축)와 저자 보상(세로축) 그래프
*VESTS는 스팀잇 상에서의 영향력 그리고 *Author Awards는 저자 보상입니다. X, Y축 모두 로그 변환된 값입니다. 여기서 VEST값이 약16(log)부터 점점 올라가는 추세를 보여주네요.
VESTS의 영향력을 보기 위해서 VESTS기준으로 5개의 나누어 살펴 보겠습니다.
(그룹을 나눈 기준을 단순하게 최대/최소 값을 5구간으로 균등하게 나눈 겁니다^^)
#VESTS 그룹별 보상
위 챠트는 그룹별 보상의 분포 및 Outlier를 나타내는데요. 단순해 보이지만 엄청나게 큰 의미를 지니고 있습니다. 일단 보시면 1번과 2번 그룹에 많은 빨간색 점들이 보이시나요? 이 점들의 의미를 단순하게 생각하시면 특정 집단에서 유별난 얘들입니다.
즉, 1번과 2번 그룹은 스팀파워가 적은 유저들의 집단을 의미 하는 것인데, 그 안에서 적은 스팀 파워를 가지고도 많은 저자 보상을 받아가는 사람들이 존재 한다는 것입니다 (글을 잘쓰는 사람들이 있다는 의미겠죠^^)
위 그래프에서 보여주는 것이 하나 더 있습니다. 그리고 저는 개인적으로 이 의미가 앞에 말씀드린 내용만큼 크다고 생각하는데요. 바로 일정 스팀 파워이상을 보유하신 분들의 저자보상이 일정 금액 이상을 유지 한다 라고 받아 들여집니다.
또한 스팀 파워를 많이 가지면 가질수록 저자 보상은 늘어납니다(이건 당연하다고 생각 하시겠죠?). 그렇지만 2번 그룹과 3번그룹의 보상폭이 엄청나게 크네요. 그리고 1번 2번 그룹의 Outlier가 많다는 이야기는 다시 말하면 저자 보상이 불규칙적이다라고 보실수도 있습니다. 반면 상위 그룹들은 아주 안정적이죠.
저자 보상에 끼치는 주요 요소
"2번째 내용 - 저장 보상이 '자본'에 의해서만 발생한다고 보지는 않습니다. 저자 보상과 스팀 파워 보상의 상관 관계는 그 사이 어딘가에 있을 거라 생각합니다" 관련해서 그럼 여기서 제가 몇가지 낸 지표를 가지고 조금더 들어다 보겠습니다.
글이 "좋다" "안좋다" 를 판별 하기에는 어려움이 많습니다. 그렇다고 손놓고 앉아 있을수는 없으니^^
예전부터 저는 글에 "정보력"을 나타내는 지표 몇개를 계산해서 수집하고 있었습니다.
(아직 보완이 필요하지만 일단 현재 수집된 내용을 가지고 분석해 보겠습니다)
글의 정보력을 나타내기 위해 추출한 지표들
-보팅 수 = VotCnt
-글에 담긴 이미지 수=ImgCnt
-제목의 정보력(WordCount) = TitleLv
-글의 정보력 = bodyLineCnt(양) / ContentsLv (내용=유니크 워드 카운트 / 총 워드 카운트)
위 챠트는 각 그룹(상단 왼쪽부터 그룹 1(하위 VESTS) 하단 오른쪽)의 글의 정보력 및 스팀파워 와 저자 보상에 상관도를 보여줍니다.
각 챠트의 상단 첫번째 줄을 보시면 되는데요. 왼쪽에 (Award)와 각 변수간에 상관도를 보여주는데 파랑색이 짙에 질수록 강한 상관관계를 그리고 빨강색이 짙에 질수록 역 상관 관계를 나타냅니다. 예: 1번그룹에는 bodylinecnt가 꽤 긍정적인 상관도를 부여주느데요, 이는 컨텐츠 양이 커질수록 보상이 대채로 올라간다는 의미를 부여합니다.
Tree - 의사 결정나무
위 의사 결정나무는 글이 어떤 보상(맨 아래)을 받게되는지 변수별로 분류를 해서 보여주는 건데요 상단에 VEST가 위치한걸로 보면 VEST가 가장 큰 영향력을 나타내고 있네요. ^^