Estatística e futebol: o que falta responder?
No meu artigo anual em que não escrevo inteiramente sobre basket e sobre a NBA, vou debruçar-me sobre as questões que gostava de ver respondidas, e o que gostava de ver melhorado, quando a estatística avançada no futebol se tornar mainstream. Foi com todo o gosto que li a peça de investigação do meu amigo twitteiro Nate Wolf, que participou numa formação de estatística no futebol organizada por Ted Knutson, que é um dos fundadores e CEO da StatsBomb Services, uma das maiores empresas neste mercado emergente no mundo da bola.
Eu, sendo um grande apologista da matemática e da análise estatística no desporto, principalmente naquele que é a minha grande paixão, o basket, curiosamente tenho-me tornado bastante céptico no que toca ao desenvolvimento da estatística no futebol, pelo menos o que vai ficando disponível para o público, quer em sites da especialidade, quer em artigos. Portanto, o que precisa de acontecer para acabar com o meu cepticismo?
1 – Como é que a estatística vai optimizar um desporto em que a sorte e jogadas “ineficientes” têm um impacto tão grande no resultado final?
Para me refugiar onde tenho mais conhecimentos, acabarei por utilizar a NBA como termo comparativo, se bem que também posso falar do ténis, ou de outros desportos em que todos os momentos do jogo têm influência directa no resultado final. Um jogador da NBA pode lançar um triplo, com um defensor pendurado em cima, em stepback com dois segundos no relógio…. e a bola entra. Há poucos lançamentos mais ineficientes do que este que descrevi e Kemba Walker, novo base dos Boston Celtics, que actuou pelos Charlotte Hornets em 2018-19, foi a estrela da NBA que mais lançamentos como descrevi lançou o ano todo, 2,2%, sendo que acertou 18,9%.
Portanto, nem uma estrela quando forçada a um lançamento dos mais complicados que existem consegue marcar com uma frequência minimamente aceitável, e ainda bem. Só que este lançamento só vale 3 pontos, e esta época, para vencer um jogo na NBA, foi preciso marcar uma média bem superior a 100 por partida. Um lançamento que entre por sorte, pode valer, no máximo 2-3% da pontuação necessária para ganhar, enquanto que no futebol, não só há muito mais situações em que ineficiências ou sorte/azar têm influência no resultado, como essa influência é gigantesca.
No futebol há auto-golos (no basket também, mas acontecem tão raramente que nem encontrei uma estatística sobre tal na NBA), há remates que podem desviar num defesa e ir para dentro da baliza, há frangos do guarda-redes, há ressaltos na relva e há remates do meio da rua com um expected goal de 0,02 que podem dar um título. O que é que a estatística vai mudar numa modalidade que tem milhares de acções ao longo do jogo, mas que apenas uma ínfima percentagem tem impacto directo no resultado?
2- Qual será o medidor de performance que todos vão perceber e adoptar?
Voltando ao exemplo de Kemba Walker, aquele lançamento teve uma percentagem de acerto terrível, que dá 0.567 pontos por posse de bola. Sim, no basket tentamos quantificar tudo por posse de bola, por ser de interpretação muito mais simples. Ainda não é garantido que qualquer adepto da NBA que eu aborde entenda quantos pontos por jogada um lançamento vale, mas a modalidade caminha rapidamente nesse sentido. Qual vai ser o equivalente no futebol? Qual vai ser o termo que, da mesma maneira que se for ler um rescaldo de um jogo na ESPN e me vai lá aparecer quantos pontos por posse de bola cada equipa marcou, eu vou ficar a saber quando fizer um clique num site de desporto ou abrir o jornal no dia a seguir?
3- Como é que a estatística vai calcular o impacto de cada jogador em campo no resultado?
Imaginemos que o Porto vence o Braga por 1-0, o golo foi marcado por Tiquinho Soares, mas a jogada iniciou-se no guarda-redes, passou por 7 jogadores diferentes, num total de 12 passes, até chegar à cabeça de Soares, através de um cruzamento certeiro de Otávio. Diria que tanto a assistência como o remate são as duas acções fundamentais para este golo, terão maior relevância no resultado que o primeiro passe do guarda-redes que inicia a jogada, porém como é que tudo isto pode ser quantificável?
Terá sido mais importante o guarda-redes ter iniciado a jogada do golo ou o número de remates à baliza que defendeu ao longo da partida? O conceito de que estou a falar é o de Win Shares. Basicamente é um método que avalia todas as acções quantificáveis tanto no ataque como na defesa, de um jogador de basket e atribui-lhes um valor.
Uma equipa que tenha ganho 60 jogos numa época, terá esse sucesso dividido pelos membros do plantel que estiveram em court, em estimativa (não é um método 100% rigoroso) mas que faz uma aproximação muito grande ao real impacto individual no contributo para o sucesso colectivo, tal é o número de anos que já foi testado e consegue resultados muito próximos da realidade.
Na NBA existem as Win Shares que estimam a contribuição de um jogador ao longo da temporada, e as Win Shares per 48, que fazem o mesmo exercício mas dividindo o esforço pela duração de um jogo, porque ao contrário do futebol, é muito raro um jogador de basket estar em campo a totalidade dos encontros.
4- Como é que posso calcular o sucesso por determinado tipo de acção? E como poderei eu ter acesso a essa informação?
Penso que é mais ou menos aceite que Sergio Busquets é o melhor médio defensivo do mundo. Lê o jogo de forma sublime, toma decisões com uma antecedência incrível, ainda a bola não lhe chegou aos pés e ele já sabe que colega estará solto, ou se o melhor é ultrapassar o defensor directo em drible. Eu, como enorme admirador de Busquets adorava saber qual é a percentagem de jogadas que lhe passam pelos pés e terminam numa ocasião de golo.
Os meus olhos dizem-me que muito poucos jogadores terão um sucesso tão alto a sair de uma zona defensiva de pressão e a partir para o ataque organizado como ele. Só que eu, como tenho a mania dos números, queria que existisse um site onde posso consultar quantas vezes por jogo é que o Busquets iniciou uma jogada de perigo ao ultrapassar um adversário em drible. Ou, simplesmente, com que frequência é que ele recebe e conduz vs a frequência com que recebe e passa.
Na NBA, com sites como o stats.nba.com ou o basketball-reference.com (existem outros como o cleaningtheglass.com ou o synergysportstech.com mas eu estou focado nos estritamente grátis), o céu é praticamente o limite. Não só tenho acesso a uma variedade enorme de estatísticas, das mais básicas às mais avançadas, como posso comparar temporadas recentes com outras eras mais antigas.
Posso consultar a percentagem de acerto de lançamento de cada jogador com um determinado defensor, ou a que distância é que esse defensor se encontrava do lançador. No futebol, gostava de transpor esta informação e adaptá-la para analisar aquela estatística quase inacreditável sobre o central do Liverpool Virgil Van Dijk, que, segundo uma rápida pesquisa, está há 66 jogos sem que nenhum opositor consiga ultrapassá-lo em drible, sendo que também li argumentos de que terá acontecido na final da Liga dos Campeões contra o Tottenham, ou na última vez que defrontou o Manchester City para a Premier League. Adiante, não só gostava de saber quantas vezes por jogo é que o tentam ultrapassar em drible, como também queria ver calculada a distância média a que se encontra do atacante nestas acções.
5- Quando poderei aprender e consultar informação sozinho?
Esta é a pergunta bónus, que serve tanto de conclusão como de aproximação aos argumentos de Ted Knutson sobre as principais razões pelas quais ainda não tenha acontecido o boom da estatística avançada no mundo do futebol. A meu ver, há três características que terão de se verificar para que este aconteça: acessibilidade compreensão e educação. Enquanto que haverá sempre estatísticas ou fórmulas matemáticas mais fáceis de aprender que outras, é imperativo que se venham a desenvolver algumas maneiras de explicar o jogo com análise de números de forma a que um adepto sem formação nesta área compreenda o que está a ler.
Adicionalmente, tem que haver acesso público à informação para que os próprios adeptos se possam educar e saber mais, um adepto curioso e informado será sempre uma mais-valia em qualquer desporto.
Potencialmente, o futebol pode tornar-se num universo ainda maior ao nível da estatística avançada que o basket. Os jogos são maiores, há mais intervenientes, há mais acções, há menos pausas, o que se traduz em mais variáveis quantificáveis. Por outro lado, empresas como a StatsBomb Services ainda não conseguem ser muito lucrativas, nem há muitos clubes a apostar nestes serviços de consultoria. A ligação entre a estatística e o adepto é a última barreira a ultrapassar, porém a mais complicada e mais próxima é a da aceitação dos clubes nesta próxima revolução.