|
Correctiemodel voor winstpercentages
Bij de tafeltenniscompetitie worden niet alleen per team punten toegekend, maar worden ook per speler winstpercentages berekend. Dat gebeurt
logischerwijs door het aantal winstpartijen te delen door het aantal gespeelde wedstrijden. Dit geeft het winstpercentage per speler aan. Als
je deze percentages echter wilt gebruiken om de sterkte van spelers aan te duiden en te gebruiken voor ranglijsten, toernooien en
licenties, is het beter om gecorrigeerde percentages te berekenen. Je zou dan moeten corrigeren voor het feit dat binnen een competitie
(bijv. Jeugd, Pupillen A, Poule A) niet iedereen tegen dezelfde spelers heeft gespeeld. Je kan namelijk een betere vergelijking maken tussen
spelers als ze tegen dezelfde tegenstanders hebben gespeeld, dan wanneer ze tegen verschillende tegenstanders hebben gespeeld.
Een dergelijk correctiemodel is ontwikkeld op basis van een groot aantal wedstrijden uit de tafeltenniscompetitie 2011 en 2012.
Drie redenen voor correctie
Er zijn drie redenen waarom binnen een competitie spelers niet tegen dezelfde tegenstanders hebben gespeeld en waarom correctie nodig is, namelijk:
1. er zijn teams met 3 spelers, maar ook met 4 of 5 spelers, terwijl er per keer maar 3 spelen,
2. er zijn wedstrijden waarbij er maar 2 spelers komen opdagen,
3. je speelt niet tegen je eigen teamgenoten.
Bij de eerste twee redenen is het waarschijnlijk direct duidelijk dat dit leidt tot ongelijkheid: als je net moet spelen tegen de drie sterkste
spelers van een 5-mans team, dan heeft dat een negatieve invloed op je percentage. Een andere negatieve invloed is bijvoorbeeld als een relatief
zwakke speler, waar je waarschijnlijk wel van zou winnen, niet op komt dagen. Andersom kunnen beide redenen ook een positieve invloed hebben op
je percentage zoals dat bij de bond staat genoteerd. Ook de derde reden is van belang en leidt tot ongelijkheid: als je als sterke speler een zwakke
speler in je team hebt, dan zullen andere spelers in die competitie daar eenvoudig van winnen en verhoogt dit hun percentage, terwijl jezelf niet
dat voordeel hebt, omdat deze speler, die wel tot de competitie behoort, in je eigen team speelt. Je hebt dan een relatief nadeel ten opzichte
van alle andere spelers uit andere teams wat betreft het geregistreerde percentage.
Het correctiemodel
Als je dus iets wilt zeggen over onderlinge sterkte, is het beter de oorspronkelijke percentages te corrigeren voor deze drie effecten.
Dat is gedaan met behulp van een aantal stappen en een iteratieproces. De eerste stap is het maken van een
voorspellingsmodel.
Daarin is op basis van het verschil in winstpercentages van spelers en het (beperkte) thuisvoordeel, de kans op winst geschat. In de
tweede stap worden deze winstkansen toegekend aan de wedstrijden tussen spelers die niet gespeeld zijn, maar wel gespeeld hadden moeten
worden om een eerlijke vergelijking te kunnen maken. In de derde stap worden dan gecorrigeerde winstpercentages berekend op alle wedstrijden,
dus zowel op de echt gespeelde, als de niet-gespeelde. Vervolgens worden de stappen 1 t/m 3 tweemaal herhaald, totdat de percentages zich
stabiliseren en de uiteindelijk gecorrigeerde percentages zijn bepaald.
Bijkomende aspecten
Om tot een dergelijk model en gecorrigeerde winstpercentages te komen, zijn nog wel een aantal praktische en inhoudelijke dingen waar je
tegenaan loopt, zoals:
1. hoe krijg ik al deze data ingelezen in statistische programma's?
2. wat te doen met invallers?
3. wat te doen met spelers die heel weinig wedstrijden hebben gespeeld?
Een praktisch probleem is dat de data bij de NTTB in bezit is, gepubliceerd wordt op hun website, maar dat daarvan geen databestand beschikbaar
wordt gesteld. Rest de oplossing om middels copy en paste de data in een txt-bestand weg te schrijven en van daaruit in te lezen in SPSS en R,
de twee programma's die gebruikt zijn. Wellicht is het mogelijk via PHP-scripts de data sneller en eenvoudiger in databestanden te krijgen, maar
daar weet ik helaas te weinig van.
Het probleem doet zich voor dat er regelmatig invallers zijn in competities, die incidenteel meedoen en van wie geen winstpercentages in
diezelfde competitie worden geregistreerd. Ook is het een probleem als er spelers zijn die heel weinig wedstrijden hebben gespeeld. Hun
winstpercentage is dan slechts een onbetrouwbare afspiegeling van hun sterkte.
|
|
|