Inledning

I denna analys försöker vi hitta de spelare som i Superettan 2019 utmärker sig som exceptionella avslutare och målvakter. Som underlag används data från wyscout;. För varje match finns detaljerad data för 6 intervall a ca 15 minuter. För varje sådant intervall finns t ex antal gjorda mål och antal förväntat gjorda mål (xG) för alla spelare som spelat i intervallet.

Utespelare är olika bra på att skapa målchanser och att förvalta målchanser. Målvakter är olika bra på att avstyra målchanser. Det är svårt att identifiera en spelares förmåga att skapa målchanser eftersom målchanser skapas tillsammans med det egna laget. Det borde vara lättare att identifiera en spelares förmåga att förvalta målchanser. Förväntat antal mål, xG, är ett mått på en eller flera målschansers kvalite som tar hänsyn till flera faktorer som avslutsposition, antal täckande försvarare m m. Även om xG inte identiskt med faktiskt antal gjorda mål skall det i genomsnitt vara korrekt. Förväntat antal mål tar inte hänsyn till målvaktens eller avslutarens skicklighet. För att tydliggöra detta kommer vi fortsättningsvis kalla xG för opersonligt fötväntat antal mål.

Skillnaden i opersonligt förväntat antal mål och antal gjorda mål kan förklaras av 3 faktorer: 1. Avslutarens skicklighet. 2. Målvaktens skicklighet. 3. Slumpen. För alla utespelare med minst ett avsluta med opersonligt xG större än noll och varje målvakt som varit inblandad i ett avslut med xG större än noll skall vi försöka att räkna ut en xG-faktor > 0. För utespelare innebär det att en spelare med dubbelt så hög xG-faktor kan förväntas göra dubbelt så många mål, vid likvärdiga målchanser. För målvakter innebär det att en målvakt med hälften så stor xG-faktor kan förväntas släppa in hälften så många mål, vid likvärdiga målchanser.

Data

Datan består av observationer från alla matcher i Superettan 2019 och kommer från wyscout. Matcherna är indelade i sex intervall med en observation per intervall och spelare. I Tabell 1 visas beskrivande statistik för de observationer som använts i analysen. Endast intervall där en utespelaren har haft minst en målchans har tagits med. Observationerna har delats in i grupper baserat på Spelartyp (utespelare eller målvakt) och Lag. Tabellen visar antal intervall (#Obs), speltid (Speltid), opersonligt förväntat antal mål (xG), faktiskt antal gjorda mål (Mål). Minsta och största observation ges längst till vänster respektive höger. Standardavvikelsen ges inom parentes. Lagen har sorterats i fallande ordning utifrån genomsnittligt Mål / xG.

Tabell 1: Beskrivning av data

  Spelartyp               Lag  #Obs                 Speltid                           xG                    Mål
 Utespelare        Trelleborg   302   5 ≤ 15.66 (1.92) ≤ 21    0.01 ≤ 0.12 (0.13) ≤ 0.82    0 ≤ 0.11 (0.31) ≤ 1
 Utespelare           Mjällby   318   2 ≤ 15.87 (2.32) ≤ 21    0.01 ≤ 0.13 (0.16) ≤ 1.07    0 ≤ 0.14 (0.34) ≤ 1
 Utespelare  Jönköpings Södra   285   4 ≤ 15.80 (2.41) ≤ 24    0.01 ≤ 0.16 (0.19) ≤ 1.01    0 ≤ 0.18 (0.40) ≤ 2
 Utespelare           Dalkurd   293   2 ≤ 15.91 (2.64) ≤ 23    0.01 ≤ 0.15 (0.20) ≤ 1.68    0 ≤ 0.14 (0.35) ≤ 1
 Utespelare            Norrby   282   3 ≤ 15.87 (2.44) ≤ 21    0.01 ≤ 0.16 (0.20) ≤ 1.43    0 ≤ 0.15 (0.37) ≤ 2
 Utespelare             Brage   302   4 ≤ 15.80 (2.46) ≤ 24    0.01 ≤ 0.16 (0.21) ≤ 1.33    0 ≤ 0.17 (0.38) ≤ 1
 Utespelare      Syrianska FC   264   3 ≤ 15.85 (2.48) ≤ 23    0.01 ≤ 0.12 (0.15) ≤ 0.89    0 ≤ 0.10 (0.30) ≤ 1
 Utespelare           Örgryte   290   2 ≤ 15.66 (2.67) ≤ 26    0.01 ≤ 0.15 (0.18) ≤ 1.30    0 ≤ 0.15 (0.37) ≤ 2
 Utespelare           Varberg   358   5 ≤ 15.96 (2.11) ≤ 22    0.01 ≤ 0.16 (0.19) ≤ 1.13    0 ≤ 0.14 (0.34) ≤ 1
 Utespelare       Västerås SK   305   2 ≤ 16.13 (2.58) ≤ 31    0.01 ≤ 0.14 (0.16) ≤ 0.80    0 ≤ 0.13 (0.34) ≤ 1
 Utespelare              Frej   316   4 ≤ 15.97 (2.40) ≤ 23    0.01 ≤ 0.13 (0.17) ≤ 1.25    0 ≤ 0.11 (0.32) ≤ 2
 Utespelare    Brommapojkarna   279   4 ≤ 15.65 (2.40) ≤ 23    0.01 ≤ 0.14 (0.15) ≤ 0.85    0 ≤ 0.14 (0.34) ≤ 1
 Utespelare         Degerfors   323   4 ≤ 15.58 (2.42) ≤ 24    0.01 ≤ 0.16 (0.20) ≤ 1.58    0 ≤ 0.14 (0.37) ≤ 2
 Utespelare          Halmstad   319   7 ≤ 15.62 (2.14) ≤ 21    0.01 ≤ 0.17 (0.22) ≤ 1.49    0 ≤ 0.14 (0.35) ≤ 2
 Utespelare             Öster   288   5 ≤ 15.99 (2.59) ≤ 32    0.01 ≤ 0.15 (0.20) ≤ 1.29    0 ≤ 0.11 (0.33) ≤ 2
 Utespelare              GAIS   262   2 ≤ 15.70 (2.92) ≤ 26    0.01 ≤ 0.14 (0.18) ≤ 1.32    0 ≤ 0.08 (0.27) ≤ 1
    Målvakt              GAIS   150   2 ≤ 16.09 (2.43) ≤ 26  -2.76 ≤ -0.27 (0.45) ≤ 0.00  -2 ≤ -0.26 (0.52) ≤ 0
    Målvakt           Örgryte   127  15 ≤ 16.24 (2.15) ≤ 26  -4.38 ≤ -0.30 (0.52) ≤ 0.00  -2 ≤ -0.29 (0.52) ≤ 0
    Målvakt    Brommapojkarna   153  15 ≤ 15.94 (1.72) ≤ 23  -2.14 ≤ -0.31 (0.46) ≤ 0.00  -2 ≤ -0.31 (0.53) ≤ 0
    Målvakt  Jönköpings Södra   138  15 ≤ 16.09 (1.96) ≤ 24  -1.50 ≤ -0.22 (0.34) ≤ 0.00  -2 ≤ -0.22 (0.45) ≤ 0
    Målvakt             Öster   139  15 ≤ 15.87 (1.68) ≤ 22  -1.79 ≤ -0.28 (0.40) ≤ 0.00  -3 ≤ -0.31 (0.55) ≤ 0
    Målvakt         Degerfors   143  15 ≤ 16.02 (1.90) ≤ 24  -1.53 ≤ -0.22 (0.32) ≤ 0.00  -1 ≤ -0.24 (0.43) ≤ 0
    Målvakt           Mjällby   146   1 ≤ 15.89 (2.10) ≤ 21  -1.88 ≤ -0.23 (0.34) ≤ 0.00  -2 ≤ -0.21 (0.44) ≤ 0
    Målvakt             Brage   149  15 ≤ 16.19 (2.10) ≤ 24  -2.42 ≤ -0.25 (0.41) ≤ 0.00  -2 ≤ -0.22 (0.48) ≤ 0
    Målvakt              Frej   149  15 ≤ 15.99 (1.76) ≤ 23  -1.97 ≤ -0.38 (0.45) ≤ 0.00  -2 ≤ -0.37 (0.57) ≤ 0
    Målvakt      Syrianska FC   157   5 ≤ 15.83 (2.34) ≤ 23  -2.83 ≤ -0.37 (0.49) ≤ 0.00  -2 ≤ -0.38 (0.57) ≤ 0
    Målvakt        Trelleborg   159  15 ≤ 15.89 (1.59) ≤ 21  -2.38 ≤ -0.30 (0.38) ≤ 0.00  -2 ≤ -0.30 (0.48) ≤ 0
    Målvakt           Dalkurd   143  15 ≤ 16.13 (2.23) ≤ 31  -2.29 ≤ -0.34 (0.44) ≤ 0.00  -3 ≤ -0.33 (0.58) ≤ 0
    Målvakt            Norrby   156  15 ≤ 15.96 (1.71) ≤ 21  -2.39 ≤ -0.30 (0.40) ≤ 0.00  -2 ≤ -0.28 (0.52) ≤ 0
    Målvakt       Västerås SK   161   4 ≤ 15.97 (2.12) ≤ 23  -1.92 ≤ -0.28 (0.39) ≤ 0.00  -3 ≤ -0.25 (0.51) ≤ 0
    Målvakt           Varberg   119  14 ≤ 16.28 (1.90) ≤ 22  -1.72 ≤ -0.23 (0.36) ≤ 0.00  -2 ≤ -0.23 (0.49) ≤ 0
    Målvakt          Halmstad   133   3 ≤ 15.78 (1.99) ≤ 22  -1.65 ≤ -0.27 (0.36) ≤ 0.00  -2 ≤ -0.26 (0.49) ≤ 0

I normalfallet omfattar varje observation 15 minuters speltid. Detta gäller dock inte intervallen 31-45 och 76-90 då det tillkommer tilläggstid. Det gäller inte heller de intervall där spelaren byts in eller byts ut. Kolumnen Speltid visar minsta, genomsnittlig och längsta, speltid och avslöjar en del fel i datan. T ex har Öster en längsta speltid på 36 minuter vilket kommer från felaktig data för Månz Berg i matchen mot Degerfors borta.

Teknisk beskrivning

I detta avsnitt följer en mera detaljerad beskrivning kring den statistiska modell och metod som använts. Givet N målchanser där en utespelare med xG-faktor \( s \) försöker göra mål på en målvakt med xG-faktor \( g \). Låt målchansernas opersonliga sannolikhet för mål vara \(p_1, p_2, \cdots , p_N\). Vi antar att verkligt förväntat antal mål \(EG\) bestäms enligt: \[ EG = p_1 \times s \times g + p_2 \times s \times g + \cdots + p_N \times s \times g = (p_1 + p_2 + \cdots + p_N) \times s \times g = x_G \times s \times g \] Vidare antar vi att verkligt antal gjorda mål, givet \( x_G, s, g \), kan beskrivas av en slumpvariabel \(G\) enligt \[ G \sim Po(EG) \] där Po står för Poissonfördelningen. Givet denna modell samt datan över opersonligt förväntat antal mål och antal faktiskt gjorda mål kan vi skatta spelares xG-faktor.

För att skatta alla spelares xG-faktorer används Bayesiansk inferens. Vi gissar apriori sannolikheten för olika värden på alla spelares xG-faktorer. Modellen ovan för faktiskt antal mål, tillsammans med observationerna av \( G \) och \( x_G \), gör det möjligt att med Bayes teorem uppdatera sannolikheten för alla spelares xG-faktorer. Rent tekniskt skattas logaritmen av xG-faktorerna och för att centrera xG-faktorerna kring 1 har alla xG-faktorer en apriorfördelning vars logaritm är normalfördelning med förväntat värde 0. Det är värt att notera att alla xG-faktorerna är relativa och att inga slutstater om en spelares skickligt kan dras utifrån endast spelarens skattade xG-faktor.

Valet av Poissionfördelningen är tilltalande för att den parametriseras med en lättolkad parameter, dess väntevärde och tillbaka varians. Nackdelen är att fördelningen är oflexibel då den baserat har en parameter. Istället kan den negativa binomialfördelningen användas. Denna fördelnings parameterisering är enkel då en av parametrarna ger väntevärdet och den andra parametern ger graden av överspridning. Utan överspridning, sammanfaller den negativa binomialfördelningen med Poissionfördelningen. Annars är fördelningens varians större än väntevärdet. Skattning av modellen, med negativ binomialfördelning har inte gett någon skillnad för resultaten. Inte heller skattningar med "zero-inflated-varianter" av dessa fördelningar har gett avvikande resultat. Skattningar med fördelningar med underspridning har inte gjorts då inga sådana fördelningar finns som standard i PyMC3.

Analysen ger inte bara ett uppskattat värde på varje spelares xG-faktor utan också ett mått på hur säker uppskattning är. I Figur 1 visualiseras hur säkerheten i det uppskattade xG-faktorn påverkas av hur många mål spelaren gjort och i hur många intervall spelaren har haft minst en målchans. Varje punkt i figuren motsvar en uppskattad xG-faktor för en utespelare. Punktens horisontella placering visar spelarens antal intervall med målchanser. Punktens vertikala placering ger variationskoefficienten för logaritmen av xG-faktorn. Siffran vid punkten visar antal mål spelaren har gjort. De två räta linjerna ger minsta kvadratenskattningen för utespelare respektive målvakter. Utespelare markeras med fyllda cirklar och målvakter ned kryss.

Figur 1: Precision och rimlighet

Förklaring: Siffran vid punkten ger totalt antal gjorda eller insläppta mål. Varje fylld gröna cirkel motsvaras av en enskild utespelares xG-faktor. Varje rött kryss motsvaras av en enskild målvakts xG-faktor. I figurerna a) och b) ger varje punkts placering på x-axeln ger spelarens antal intervall/observationer. Placeringen på y-axeln ger variationskoefficienten. I figurer c) och d) visas korrelationen mellan modellens skattning av xG-faktorerna och genomsnittet för Mål / xG. Figur d) ger istället korrelationen för respektive storhets ranking. Källa: wyscout.

Från figurerna a) och b) framgår det att flera observerade intervall ökar precisionen i skattade xG-faktorer. Antal observerade mål verkar också öka precisionen med avtagande marginaleffekt. Ett naivt sätt att skatta varje spelares xG-faktor är att ta genomsnittet av kvoten Mål / xG uträknad för alla spelarens intervall. Figur c) visar att modellens skattade xG-faktorer ligger i linje med den naiva skattningen. Figur d) jämför istället den naiva xG-faktorns ranking av spelare med modellens ranking. Även i detta fall verkar modellen ge rimliga xG-faktorer.

Resultat

Den korta sammanfattningen av den tekniska beskrivningen ovan är att med hjälp av
1. En enkel statistik modell där antal mål givet en eller flera målchanser beror på opersonligt förväntat antal mål (eg xG) multiplicerat med utespelarens och målvaktens respektive xG-faktorer.
2. Matchdata för 15 minuters intervall med opersonligt förväntat antal mål för alla utespelare-målvakt par, för alla matcher i superettan 2019.
3. En vedertagen statistisk metod för att bestämma modellens parametrar, i detta fall alla spelares xG-faktorer.
går det att skatta varje spelares xG-faktor samt erhålla en uppskattning av hur säker skattningen är.

I Figur 2 illustreras xG-faktorer för alla målvakter som har data för minst 18 intervall och släppt in minst 1 mål. Varje markör i figuren illustrerar spelarens uppskattade xG-faktor och målvaktens förväntade totalt insläppta mål, utifrån opersonligt förväntat antal mål. Eftersom figuren illustrerar målvakter är en lägre xG-faktor bättre. Notera att varje målvakts xG-faktor har multiplicerats med medianen för samtliga utespelares xG-faktorer. På så vis kan en xG-faktor på, t ex 0.75, tolkas som att innebär att målvaktens personliga förväntade antal insläppta mål är 25% lägre än genomsnittsmålvaktens, om en genomsnittsanfallare försöker göra mål.

Rektanglarna ger det 50% trovärdiga intervaller för varje målvakts uppskattad xG-faktor. Det betyder att det är, om modellen är korrekt, 50% sannolikhet att spelares sanna xG-faktor ligger mellan rektangelns golv och tak. För varje spelare anges också antal matcher och antal insläppta mål i hakparentesen.

Figur 2: xG-faktor för målvakter i Superettan 2019

Förklaring: Varje punkt motsvarar en målvakts xG-faktor. Placeringen på y-axeln ger xG-faktorn och placeringen på x-axeln ger opersonligt förväntat antal insläppta mål. Rektanglarna runt punkterna visar skattningens trovärdiga 50%-intervall. Siffrorna inom hakparenteserna ger antal intervall och antal faktiskt insläppta mål. Källa: wyscout.

Från figuren framgår det att endast 2 målvakter kan sägas att med 75% säkerhet ha en xG-faktor mindre än 1. D v s om målvakten ställs mot genomsnittlig utespelare kommer målvaktens personliga förväntat antal mål var mindre än det opersonliga förväntade antal mål. Dessa två målvakter är Anton Fagerström (Västerås) och Carl-John Eriksson (Mjällby). Dejan Garaca (Syrianska) och Rasmus Emanuelsson (Brommapojkarna) å andra sidan är de enda två målvakterna son ned 75% sannolikhet kan sägas ha en xG-faktor större än 1.

Utespelare

I Figur 3 illustreras xG-faktorer för alla utespelare som har data för minst 18 intervall och gjort minst 1 mål. Varje markör i figuren illustrerar spelarens uppskattade xG-faktor och spelarens förväntade totala anta mål utifrån opersonligt förväntat antal mål. Eftersom figuren illustrerar utespelare är en högre xG-faktor bättre. Notera att varje utespelares xG-faktor har multiplicerats med medianen för samtliga målvakters xG-faktor. På så vis kan en xG-faktor på t ex 1.25 tolkas som att opersonligt förväntat antal underskattar spelarens verkliga personliga förväntat antal mål med 25%.

Rektanglarna ger det 50% trovärdiga intervaller för varje spelares uppskattad xG-faktor. Det betyder att, om modellen är korrekt, är det 50% sannolikhet att spelares xG-faktor ligger mellan rektangelns golv och tak. För varje spelare anges också antal matcher och antal mål i hakparentesen.

Figur 3: xG-faktor för utespelare i Superettan 2019

Förklaring: Varje punkt motsvarar en utespelares xG-faktor. Placeringen på y-axeln ger xG-faktorn och placeringen på x-axeln ger opersonligt förväntat antal insläppta mål. Rektanglarna runt punkterna visar skattningens trovärdiga 50%-intervall. Siffrorna inom hakparenteserna ger antal intervall och antal faktiskt gjorda mål. Källa: wyscout.

Från Figur 3 framgår det tydligt att säkerheten i skattningen ökar, men antal observerade intervall och antal mål, spelarna längre till höger i figuren. Värt att notera är att en erfaren spelare som Aílton Almeida enligt modellen har en ganska dålig xG-faktor, knappt 0.75. 2019 års skyttekung i Superettan, Erik Björndahl, framstår inte heller som någon Benny Guldfot, utan mer som average Joe när det gäller att förvalta målchanser. Halmstads Rasmus Wiedesheim-Paul som slutade tvåa i skytteligan är den enda av spelarna i toppen av skytteligan som med nästan 75% sannolikhet kan sägas vara bättre än average Joe.

Till vänster i Figur 3 återfinns spelare som har haft få målchanser och gjort få antal matcher. Följaktligen är deras 50%s trovärdiga intervall också större. Trots det så väcker t ex Albert Ejupi (Varberg) och Bjarni Mark Antonsson (Brage) en del frågor kring modellens tillförlitlighet. Osäkerheten i den skattade xG-faktorn för dessa och övriga spelare långt till vänster i figuren är större, men det nästan bara bland dessa spelare som xG-faktorerna, enligt modellen, kan sägas skilja säg från 1.0 (average Joe) med 50% säkerhet. Därför är de oklart hur xG-faktorerna för t ex Bubacarr Jobe (Mjällby) och Daryl Smylie (Jönköpings Södra) skall värderas.

Sammanfattning

Denna text beskriver resultatet av systematisk analyserat av alla 15 minuters intervall i alla matcher i Superettan 2019. För varje sådant intervall har vi för varje utespelare-målvakts-par använt skillnaden i opersonligt förväntat antal mål kontra faktiskt gjorda mål för att bestämma varje målvakts och utespelares individuella xG-faktor. Dessa xG-faktorer kan inte användas enskilt, men de kan användas för att jämföra spelare. En utespelare med t ex 10% högre xG-faktor än en annan utespelare kan förväntas att i genomsnitt göra 10% mera mål på likvärdiga chanser. En målvakt med t ex 10% lägre xG-faktor än en annan utespelare kan förväntas att i genomsnitt släppa in 10% färre mål på likvärdiga chanser.

De målvakter som har såväl de lägsta (bra) som högsta (dåligt) xG-faktor är de målvakter med få intervall att utgå från. Modellen verkar inte fullt ut fånga osäkerheten i uppskattningen för dessa målvakter. Av målvakter de som har minst 18 observationer, vilket i princip innebär 3 matcher, är Superettan 2019s 5 bästa målvakter:

 Ranking             Spelare          Lag  xG-faktor  Variation  Observationer
       1  A FAGERSTRÖM ('91)  Västerås SK       0.73      38.80            147
       2    C ERIKSSON ('95)      Mjällby       0.74      41.14            120
       3    P ROSENDAL ('88)        Brage       0.80      39.87            132
       4      A LARSEN ('90)   Trelleborg       0.84      38.08            149
       5    M KRASNIQI ('92)       Norrby       0.85      38.36            156

Precis som för målvakter återfinns det utespelare med högst och lägst xG-faktorer bland de spelare med minst tillgänglig data. Modellen verkar inte fullt ut fånga osäkerheten i uppskattningen för dessa spelare. Från texten ovan verkar det som om precisionen i de skattade xG-faktorerna stabiliserar sig efter 36 (4 matcher) intervall och minst 3 mål. I denna grupp spelare är Superettan 2019s 20 bästa avslutare:

 Ranking                  Spelare               Lag  xG-faktor  Variation  Observationer
       1     AMIR AL-AMMARI ('97)  Jönköpings Södra       2.65      52.54             45
       2             B JOBE ('94)           Mjällby       1.87      48.15             46
       3           J MORSAY ('97)             Brage       1.56      54.24             42
       7           F TRONÊT ('93)       Västerås SK       1.28      54.44             49
       5         AHMED AWAD ('92)           Dalkurd       1.26      47.42             36
       6           A JALLOW ('98)  Jönköpings Södra       1.25      50.93             36
      10              R ALM ('95)         Degerfors       1.22      58.25             37
       4  R WIEDESHEIM-PAUL ('99)          Halmstad       1.22      41.82             61
       8           A LUNDIN ('95)             Brage       1.17      46.68             41
      14        E ANDERSSON ('97)        Trelleborg       1.17      62.15             43
      12            D JAJIĆ ('98)    Brommapojkarna       1.16      54.73             46
       9         A SELJMANI ('97)           Varberg       1.14      44.00             50
      11        G LUDWIGSON ('93)           Örgryte       1.10      45.70             64
      13        E HAMIDOVIC ('93)  Jönköpings Södra       1.06      43.94             61
      17           N GIRMAI ('94)           Varberg       1.00      50.32             52
      19           R SELLIN ('90)             Brage       0.99      61.92             36
      15        E BJÖRNDAHL ('90)         Degerfors       0.98      41.60             62
      18           K SAFARI ('92)       Västerås SK       0.97      48.50             43
      16          C KOUAKOU ('95)             Brage       0.97      44.63             53
      20          J NILSSON ('94)           Mjällby       0.93      59.02             37

MED RESERVATION FÖR FEL!

Skapad 2020-07-19 00:27:43 av Positively 4th.

Lägg till ny kommentar

  • Tillåtna HTML-taggar: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • Rader och stycken bryts automatiskt.
  • Webbadresser och e-postadresser görs automatiskt om till länkar.