[00] 인공신경망을 이용한 롤스타 파워랭킹 모델 설명
앞 글과 이어지는 내용입니다.
제가 사용할 모델은 통계학을 전공하며 익힌 인공신경망 모델입니다. 인공신경망은 학습할 데이터를 입력해주면 알아서 학습하고 결과값을 출력하는 좋은 모델입니다. 우리의 ANN(인공신경망)은 2019, 2020 시즌 선수들의 데이터를 학습합니다 (2018년은 롤스타 제도가 없기에 제외되었습니다). 우리의 AI는 학습 과정에서 특히 '롤스타'를 받은 선수들의 데이터를 좋다고 생각합니다. 그럼 '좋다는' 것은 무엇일까요? 롤스타를 투표한 리그 관계자들의 생각 속으로 가봅시다.
그 생각을 정확히 알 수는 없겠지만 예를 들어 추측하자면 "롤스타 탱커로 Fearless를 투표해야겠어. 리그 최강의 윈스턴이니까!" 정도 일 것입니다. "Fearless가 탱커 중에서 딜량 1등, 낙사킬 1등이니까, Fearless를 투표해야겠어!" 이렇게 생각할 확률이 얼마나 될까요. 두 생각 차이에는 큰 차이가 있다는 것을 명심해야 합니다. 이렇게 사람들은 현실적으로 기본적으로 정확한 수치보다 임팩트에 의존해서 투표를 할 수밖에 없습니다.
따라서 이런 논리 구조를 학습받는 AI는 "Fearless가 잘하는 선수구나, Fearless의 딜량이나 낙사킬 스탯이 압도적으로 높은대? 그렇다면 딜량이나 낙사킬이 메인탱커 임팩트의 큰 비중을 차지하는구나!" 라고 생각하게 됩니다. 선후관계를 비틀어 "막타, 낙사킬은 메인탱커의 필수 소양이지! 그런데 Fearless가 이 부문에서 압도적이네, 그러면 Fearless가 좋은 선수네" 라고 생각하는 것이 절대 아니라는 것입니다! 위 문단에서 한 이야기와 같은 논리입니다.
제가 만든 롤스타 모델에서는 2021시즌의 어느 선수가 가장 과거 '롤스타'와 유사한 스탯을 통해 강렬한 임팩트를 보여주고 있는지 보여드릴 것입니다. 해당 플레이어의 점수가 높다면, 그만큼 그 선수가 올해 '롤스타' 후보가 될 확률이 높아진다고 생각할 수도 있겠죠!
주의할 점
롤스타 파워랭킹은 가장 잘하는 선수를 뽑는 것이 절대 아닙니다. 따라서 단순히 점수가 높다고 해서 해당 선수가 타선수보다 우수한 선수라고 단정 짓는 것은 어불성설입니다.
2021 모델
학습 데이터 - 2019년과 2020년 정규시즌
Basic Model - 선수의 기초적인 스탯만을 다룬다.
Adjusted Model - Basic을 기반으로 팀의 영향력을 최대한 보정한 모델
설명 변수
Basic 변수
1. 막타 - 사실 막타만 잘 쳐도 임팩트는 독식합니다. {그러니까 나노겐지에게 막타는 양보를?}
2. 처치 - 경쟁전 정치용 스탯1. {그만큼 중요하시다는 거죠}
3. 딜량 - 경쟁전 정치용 스탯2. {자리야, 모이라로 딜금 먹고 거 정치는 하지 맙시다..}
4. 단독처치 - 스나이퍼를 위한 스탯처럼 보인다. 하지만 잘하는 투사체(==둠), 탱커, 섭힐 유저 또한 쏠쏠히 단독 처치를 보여줄 수 있다. {메인힐 유저한테는 딱히 바라지는 않는다}
5. 토너먼트 우승 - 정규시즌 토너먼트 우승자만 해당, 롤스타 제도 자체가 정규시즌만을 다루기에 Grand Final은 해당되지 않는다. {다행히도 카르페는 2020 롤스타를 수상했습니다..}
6. 죽음 - 잘하는 선수는 생존력도 좋다! 고금을 막론하는 진리.
7. 힐량 - 힐러의 주업무
8. 환경킬(낙사) - 잘 보이지 않는 메인힐러들의 존재감을 두둑히 챙겨주는 몇 안 되는 스탯! 낙사만 잘 시켜도 POTM을 받는다!
Adj 변수
1. 한타 첫 킬 비율 - 다른 FPS 게임도 그렇지만 첫 킬은 한타의 승률에 가장 큰 요소이다. 하지만 성적이 낮은 팀들은 소년가장이 첫 킬을 내더라도 지는 경우가 상대적으로 많다. 이 수치가 높은 소년가장은 Basic Model보다 점수가 개선될 여지가 있다. (개선되기보다 오히려 악화될 수도 있습니다. 막상 롤스타 수상자의 해당 스탯 수치가 나쁘다면, 오히려 우리 AI는 한타에서 첫 킬을 따는 것을 부정적으로 판단할 것이기 때문입니다)
2. 한타 첫 데스 비율 - 마찬가지로 첫 데스는 팀에게 크나큰 악재이다. 하지만 잘하는 팀들은 불리한 한타도 이겨낸다. 이 수치가 높은 소위 '캐리받는 선수는' Basic Model보다 점수가 감소할 여지가 있다. (위에서 언급한 것처럼 무조건 감소하지는 않습니다. 가장 중요한 것은 롤스타의 해당 수치가 어떻냐는 것입니다)
점수 산정 방식
롤스타는 다수의 리그 관계자가 투표합니다. 그러면 이 모델에서도 여러 명이 참여하게 해야겠군요. 이제 33명의 AI 로봇 친구에게 (마땅한 이름이 없네요...) 데이터를 학습시킵니다. 시험 범위는 동일하지만 데이터를 각각 다른 배열로 제공받는 로봇들은 각자 비슷하지만 다른 대답을 내놓습니다. 이 33개의 로봇이 출력하는 점수를 평균을 내어서 최종 점수를 결산합니다. 33을 굳이 정한 이유는 오버워치의 33번째 영웅의 출시를 기원하는 의미입니다 ㅠㅠ
한계점
임의로 공개 데이터에서 변수를 선정하였기에 {1. 리그측 비공개 데이터에서 의미 있는 변수의 존재 가능성} {2. 공개 데이터에서 미처 찾지 못한 중요 변수의 존재 가능성} 등의 이유로 모델은 개선될 여지가 충분히 존재합니다. 개선점을 찾게되면, 가능할 때마다 모델을 업데이트 해볼 생각입니다!