안녕하세요, 고무판 귀염둥이 다라나입니다. ^^v
으음... 사실 통계 분야인지도 잘 모르겠습니다. ㅜ.ㅜ (학교 댕길 때 열심히 할 걸...)
하고 싶은 게 뭐냐 하먼요.
지금 연재되고 있는 각 작품에 분야별로 점수를 줘서 종합 점수를 매길려고 하는데요. 일단 4개의 항목을 둡니다. 숫자를 예로 들어보겠습니다.
편당 평균 조회수, 편당 평균 댓글수, 선호작 선정수, 편당 평균 용량
A작품: 10,000 60 개 2500 회 9,582 byte
B작품: 1,000 10 개 300 회 18,135 byte
① ② ③ ④
① ~ ④ 각 항목을 30점씩 배정합니다. 그래서 총 120 만점으로 해서 종합 점수를 내고 싶습니다. 물론 다른 작품은 각각의 값이 다르게 나오겠지요. 최대값/최소값은 아직 모릅니다. 주어진 정보는 현재 저것 뿐입니다.
위 4개의 값을 그냥 더하면 숫자가 높은 항목의 영향력이 커지겠죠. 댓글이 아무리 많이 달려도 조회수보단 낮을 거잖습니까.
이런 고민 때문에, 정확한 용어인지는 모르겠지만 정규화라고 하나요, 뭐 그런 걸 하고 싶은데 어떻게 해야하는 지 모르겠네요. 그러니까 평균 조회수가 아무리 많더라도 종합 점수에선 30점의 효과만 낼 수 있도록 하려면 어떻게 해야 하나요?
지금처럼 똑같이 30점씩 주는 게 아니라 조회수에는 50점, 댓글수는 30점 하는 식으로 가중치를 달리 했을때는 어떻게 하는 건지도 알았으면 합니다.
휴, 제대로 표현이 됐나 모르겠네요. 모르는 걸 물어보는 것도 어렵네요. ㅜ.ㅜ
암튼 메주처럼 얘기해도 찰떡처럼 알아들으시는 뛰어난 분들의 고견을 바랍니다.
Comment ' 8