Gästkrönika: WAR, what is it good for?

Här kommer en gästkrönika från Niklas Bergljung (Myslas på Twitter) som skriver uttömmande och medryckande om det både hyllade och beskyllda fenomenet sabermetrics inom baseboll. Håll till godo!

WAR, what is it good for?

Jag är en nörd. Det innebär inte automatiskt att jag är särskilt smart (förmodligen inte) men jag är otvivelaktigt en nörd. Jag fick min första dator, en VIC 20, när jag var runt tio år gammal, har studerat matematik och datorvetenskap på högskolenivå och jag är autistisk. Kort och gott, siffror är min grej. Nu råkar det vara så att jag också är väldigt idrottsintresserad och även om fotboll och bordtennis var huvudintresset under mina unga år så fastnade jag ofta för de lite mer udda grenarna på det olympiska programmet och när något jag aldrig sett tidigare visades på någon av alla sportkanaler på TV så stannade jag gärna upp och tittade en stund. Med de förutsättningarna var det förmodligen bara en tidsfråga innan jag skulle fastna för just baseball, spelet med fler siffror än någon annan idrott.

Idag ser jag mycket passion till spelet från de små grupper av svenska fans som existerar men ibland kan jag sakna diskussioner med ett djupare grävande ner bland siffrorna. Jag vet inte om det beror på att folk inte intresserar sig för dem, om de saknar kunskap kring dem eller om det beror på något helt annat skäl men oavsett vilket ska jag försöka mig på att introducera en sorts sabermetrics och stats för nybörjare och förhoppningsvis finns det någon där ute som tycker det är intressant.

Låt mig redan från början göra en sak glasklar. Man är inte ett bättre eller sämre baseballfan för att man nördar ner sig i de minsta detaljerna av spelet. Det var definitivt inte siffror som gjorde att jag började kolla på baseball från början och det tog många år innan jag förstod att det fanns en hel värld av statistik bortom AVG, RBI och ERA, men när jag väl klev in i den världen så ökade mitt intresse och min förståelse för idrotten mångfalt. Jag skriver inte det här för att säga “aja baja, där har ni helt fel, titta på de här siffrorna så får ni se att jag har rätt”. Jag skriver detta för att jag vet att den här djungeln är snårig och inte helt lätt att förstå och åtminstone tror att det kan finnas intresse att lära sig mer om den. Dessutom nämner fler kommentatorer på TV och journalister som bevakar sporten de här sakerna och då kan det med en ny säsong runt hörnet vara bra att ha lite förståelse för vad det är de pratar och skriver om, även om man inte själv har något intresse av att fördjupa sig i de statistiska delarna. Inte för att jag vet om jag är rätt person att förklara det här men jag tänker åtminstone försöka.

Om den här kunskapen ger en positiv stående effekt hos någon annan som läser det här blir jag förstås glad men om det inte gör någon skillnad alls för ert baseballintresse så är det helt ok. Så länge vi alla kan vara överens om att Bartolo Colon är det bästa som hänt baseballen är jag nöjd.

 

Nördarna och deras sabermetrics

Sabermetrics är ett värdeladdat ord och inte helt sällan ger det en negativ reaktion. Vi har hört journalister och gamla spelare genom åren klaga på att “nördarna tar över”. Även aktiva spelare och managers har starka åsikter om alla dessa siffror som kastas runt och om nu några av de bästa som varit en del av spelet under många år är negativa är det inte svårt att förstå att fansen tar till sig samma åsikter.

Vad beror då denna aversion mot sabermetrics på? Jag tror att det till stor del beror på missförstånd om vad sabermetrics innebär och även en motvilja att försöka förstå sig på det eftersom det låter väldigt komplicerat. Helt klart är att exempelvis de matematiska formler som ofta ligger bakom den statistiska analysen är mycket komplicerade, men det behöver inte vara så svårt att förstå innebörden av dem.

Låt oss börja med det stora missförståndet. Ibland kan man läsa eller höra att siffrorna inte kan ge samma förståelse för en spelare som vanlig hederlig scouting, men det är inte heller det som är tanken. Det finns inget som helst motsatsförhållande mellan scouting och sabermetrics. Scouting är en del av sabermetrics!

Så vad innebär egentligen sabermetrics? Man kan väldigt förenklat säga att sabermetrics består av tre beståndsdelar. Vi har scouting som ska bedöma både fysiska och mentala förmågor hos spelare. Den här delen är förstås den viktigaste när det gäller att hitta talang. Sedan har vi statistikdelen som förgrenar sig i lite olika delar men där mycket fokus läggs på antingen enskilda spelare eller på taktiska delar av spelet. Slutligen har vi den del som diskuteras minst men som kanske är den viktigaste för att kunna bygga ett vinnande lag idag, nämligen affärssidan. Här ingår bland annat spelarkontrakten men också olika sätt att generera pengar genom media deals, som TV-kontrakt, och genom sin stadion. Det var ingen slump att Chicago Cubs påbörjade en gigantisk renovering av Wrigley Field och området däromkring när Theo Epstein och Jed Hoyer tog över rodret och vill man verkligen grotta ner sig i hur det kan gå till när en klubb ska få den finansiella sidan att sammanfalla med den sportsliga sidan finns det en fantastisk artikel att läsa om detta på Bleacher Nation.

Eftersom varken scouting eller affärssinne tillhör någon av mina starkaste sidor, snarare det motsatta, tänker jag lämna dem därhän nu. Istället tänker jag koncentrera mig på vad statistiska data och analys av dem kan lära oss om spelarna och vilka taktiska förändringar som skett i spelet de senaste åren till följd av dessa.

 

Det taktiska spelet i modern baseball

Realiteten i dagens baseball, oavsett vad folk runt omkring den tycker, är att siffror och statistisk analys används mer och mer och gör ett stort avtryck på hur matcherna spelas. Alla lag i MLB har numera staber och egna datorsystem som behandlar all den data som kommer från bland annat PITCHf/x och Statcast för att förhoppningsvis kunna hitta den där lilla grejen som alla andra lag missat och som kan hjälpa dem att vinna. För Kansas City Royals (som några felaktigt påstår är anti sabermetrics) resulterade det i en vinst av World Series förra säsongen då de satsade på allmänt undervärderade saker som bra defensiv, high contact hitting och en stark bullpen.

Taktiskt har vi sett stora förändringar av spelet på planen till följd av statistisk data. Bland annat ser vi en nedgående trend vad gäller sacrifice bunts och intentional walks då all tillgänglig data säger att det, i de allra flesta fallen, är en dålig taktik. När det gäller sacrifice bunts säger statistiken att man i snitt gör 0.86 runs när man har en man på första bas och 0 outs. Samma statistik säger också att snittet när man har en man på andra bas med 1 out ger 0.68 runs. Du försämrar alltså rent statistiskt dina chanser att få en run genom en sacrifice bunt. Det finns tillfällen då det blir en lyckad taktik ändå, men på samma sätt som att du kan dra ett kort till i Black Jack när du står på 19 och få en tvåa så innebär inte slutresultatet att det faktiskt var en bra idé från början, du hade helt enkelt tur och om du fortsätter använda samma taktik om och om igen så kommer det i slutändan ha genererat en negativ utgång i majoriteten av försöken. Det finns undantag till denna regeln, som när en pitcher ska slå men också vid några få speciella omständigheter under de senare delarna av en match och dessutom mot Matt Garza (jag kunde nämnt Jon Lester också men förra säsongen sjönk antalet lyckade bunts mot honom rejält, förmodligen mer beroende på för litet statistiskt underlag än något annat). Bunts som sådana kommer dock inte att försvinna från spelet, att lägga en bunt för en hit kan vara ett offensivt vapen och framförallt ett sätt att komma runt nästa taktiska detalj, defensive shifts.

Defensive shifts är något som alla lag i olika grad använder sig av och vi kan förvänta oss att de kommer att användas än mer framöver och förmodligen sprida sig till outfield shifts (Astros är ett lag som testat på det) ända till någon hittar ett medel mot dem. Det här är något som framförallt används mot vänsterhänta slagmän eftersom de i många fall är extrema pull hitters som oftast slår bollen ut mot right field. Då kan motståndarlaget välja att flytta sin tredje basman till att fylla hållet mellan första och andra bas och lämna tredje bas helt öppen. Det finns röster som vill förbjuda denna form av extrema shifts vilket i mitt tycke är helt galet. Det är upp till motståndarlaget och slagmannen som möter dessa shifts att lösa det problemet och en av dessa lösningarna är att lägga en bunt som Anthony Rizzo gjorde två gånger mot Cardinals i en match 2014.

Ett annat taktiskt drag vi ser är hur bullpens används mer och mer. Det finns överväldigande statistiska bevis på att en pitcher klarar sig mycket sämre tredje gången genom en slagordning. Om du heter Clayton Kershaw spelar det inte så stor roll eftersom du redan är så dominant att även om du tappar den där tredje gången genom slagordningen är du fortfarande i de allra flesta fallen bättre än ett alternativ från lagets bullpen. Heter du däremot Nate Karns eller Erasmo Ramirez är det mer tveksamt att så är fallet. Så Tampa Bay Rays och deras nya manager Kevin Cash valde i stort sett hela förra säsongen att plocka ut deras starters, med Chris Archer som det stora undantaget, efter att de gått två gånger genom motståndarnas slagordning och låta deras bullpen ta över. Senare under året kunde vi se Chicago Cubs göra samma sak med Jason Hammel, Kyle Hendricks och Dan Haren och Pittsburgh Pirates fick J.A. Happ att se ut som en stjärna med samma taktik. Ja, och så var det där med att Kansas City Royals faktiskt vann World Series med en rätt skakig starting rotation men med en shut down bullpen. Till den här säsongen har New York Yankees förstärkt sin bullpen så att den ser ut som ett monster för motståndarna, Pittsburgh Pirates och Houston Astros har följt i samma spår och Chicago Cubs kommer att ha fyra gamla starters i sin bullpen. Trenden är väldigt tydlig att bullpens får en mycket större roll, vilket till viss del också beror på att starting pitching blivit så otroligt dyrt de senaste åren. Frågan blir då om något eller några lag inom en nära framtid istället för en fjärde och femte starter kommer att ha ett gäng pitchers som kan ta 2-3 innings åt gången lite oftare än var femte dag. Det är en fascinerande tanke och Colorado Rockies testade på något liknande redan 2012.

Vi ser också mer användande av så kallade platoons där man låter två spelare dela på en position om det finns stora skillnader, så kallade splits, mellan hur de slår beroende på om de möter en vänsterhänt eller högerhänt pitcher. Det är en bra taktik men det gäller att vara försiktig så att det inte förhindrar unga spelares utveckling. Spelare som Michael Conforto och Kyle Schwarber som rusade genom minors för att debutera i MLB förra säsongen har vid en snabb anblick riktigt dåliga stats mot vänsterhänta pitchers. En alltför snabb slutledning kan vara att bara låta dem starta mot högerhänta, men det är att göra dem en björntjänst. De har så få at bats mot vänsterhänta att de aldrig fått en chans att kunna justera och om du inte tillåter dem att misslyckas ett tag ger du dem aldrig chansen att nå sin fulla potential. Anthony Rizzo var också dålig mot vänsterhänta pitchers i början av sin karriär men de senaste två åren har han slagit nästan .300 mot dem. Däremot kan man många år in i Chris Coghlans karriär dra slutsatsen att han aldrig kommer att kunna hantera lefties, men han är en väldigt nyttig spelare som slår bra mot righties och därför en perfekt spelare att använda som en del av en platoon.

Slagordning är något som ofta debatterats men det är först de senaste åren man börjat se lag mixtra lite mer utifrån vad siffrorna säger. Det har under många år sagts från statistikerna att ett lag bör låta sin allra bästa hitter vara tvåa i slagordningen. Anledningen är enkel, om du slår som tvåa får du ett gäng fler PA under en säsong än om du slår som trea och det borde vara i alla lags intresse att ha sin allra bästa slagman där ute när matcherna ska avgöras. Det finns dock en andra anledning också. Statistiskt sett har det visat sig att nummer tre i slagordningen oftast kommer upp med inga spelare på bas och två outs, och det med stor marginal. Clint Hurdle har under hela våren låtit Andrew McCutchen slå som nummer två av just denna anledningen. Joe Maddon har också tagit upp detta under våren och även om han ändrar en hel del i slagordningen från match till match så är det inte helt otroligt att vi får se en spelare som Ben Zobrist slå som nummer tre hos Cubs, inte någon power hitter som annars varit mer regel genom historien i MLB utan en spelare med högt OBP som mer typiskt brukar slå som nummer ett. Det här är ingen trend ännu men om fler managers tar till sig denna data så bör vi se superstjärnor som Trout, Harper, Votto och många andra börja slå som nummer två regelbundet istället. Det är något att hålla koll på.

 

Hur kan jag som ett fan ta hjälp av statistik för att utvärdera en spelare?

För att få en helt rättvis utvärdering av en spelare så bör man scouta honom. Problemet är att väldigt få av oss kan scouta spelare, förmodligen inte ni som läser detta och definitivt inte jag. Vårt bästa medel för att kunna göra en bedömning blir då att använda oss av de mängder av statistiska data som finns tillgängliga för oss. Efter att Statcast introducerades för allmänheten förra säsongen finns det egentligen hur mycket som helst att sätta tänderna i och det är lätt att få huvudvärk när man börjar stirra på siffrorna för exit velocity och annat. Istället för att grotta in oss i det mest avancerade låt mig förklara några jämförelsevis enkla stats som, i mitt och många andras tycke, ger en bättre bild av en spelares förmåga än exempelvis AVG, RBI, OPS och ERA.

 

OBP (On-Base Percentage)

Låt oss börja med något som de flesta baseball-fans känner till, särskilt sedan boken, och sedermera filmen, Moneyball kom ut. OBP räknar ut alla gånger en spelares at bat inte leder till en out, vilket är viktigt för man har enbart 27 outs att spela med under en match och när vi idag ser fler och fler strikeouts är det viktigt för spelare att kunna ta en walk för att nå bas.

Ta Carlos Santana i Cleveland Indians som ett exempel. Santana är en spelare som inte är särskilt uppskattad av publiken i Cleveland, och då uttrycker jag mig väldigt milt. En stor del av den kritik som riktas mot honom beror på hans låga batting average och har man genom karriären slagit .245 ser det inte ut som en spelare man vill ha i sitt lag. Tittar man däremot på hans walk rate på 15,7% så får man en helt annan bild av honom. Sammantaget leder det till en OBP på .365 vilket är mycket bra och gör honom till en produktiv spelare offensivt. Han är en usel fielder men som DH finns det få spelare i ligan som är bättre.

 

wOBA (Weighted On-Base Average)

Ett problem med batting average och även OBP är att de behandlar olika hits och walks som om de vore lika värdefulla och jag tror vi alla kan komma överens om att så inte är fallet (nämn inte det här för kommentatorer och journalister som klagar på att Joey Votto tar för många walks). Man hör ofta slugging och OPS citeras för att kunna ge en bättre bild men det är också för simplistiska formler för att på ett rättvist sätt kalkylera en spelares styrka som slagman. I slugging räknas en double som dubbelt så värdefull som en single och det är inte heller riktigt. I OPS tar man och slår ihop två stycken helt olika statistiska underlag och säger att en procentenhet av den ena statistiken är lika mycket värd som en procentenhet av den andra och det är inte ens i närheten av korrekt matematik (OBP är snarare värt dubbelt så mycket som slugging). Med wOBA försöker man rätta till detta genom att ge alla offensiva utgångar vid ett at bat olika värden baserat på statistik från den gångna säsongen. OBP ger alltså alltid utgången 1.000 oavsett om det är en walk, en double eller en HR man slår. För wOBA var värdena dessa under 2015:

BB = .687 (OBS, gäller ej intentional walks, de plockas bort helt och hållet)
HBP = .722
1B = .881
2B = 1.256
3B = 1.594
HR = 2.065

Låter det komplicerat? Visst, själva uträkningen är väldigt komplicerad. Som tur väl är behöver vi inte bry oss särskilt mycket om det rent matematiska utan allt vi behöver veta är att formeln är utformad så att ett medelvärde på wOBA kommer att ligga på samma medelvärde som OBP under ett år (runt .320) vilket gör den lätt att använda men ger en betydligt rättvisare bild av en spelares kvalitet som slagman. Topp 5 i wOBA under 2015 var Bryce Harper (.461), Joey Votto (.427), Paul Goldschmidt (.418), Mike Trout (.415) och Miguel Cabrera (.413).

 

wRC+ (Weighted Runs Created Plus)

Även om wOBA är en statistik som på ett bra sätt kalkylerar en spelares offensiva kvaliteter vid plattan så finns det utrymme till förbättring genom att ta med fler statistiska variabler. Det är exempelvis allmänt känt att det är lättare att slå i Colorado än i Seattle. Är det då verkligen rättvist att räkna en homerun från Carlos Gonzalez på Coors Field som exakt likvärdig en homerun från Nelson Cruz på Safeco Field? Det finns också vissa skillnader ligorna emellan, i NL har vi pitchers som slår medan man i AL använder sig av DH, det förändrar också saker en del. wRC+ är en statistik som baseras på wOBA men som också tar så kallade park factors och league factors med i sin ekvation och dessutom spottar ut ett resultat som gör jämförelse spelare emellan lättare än någon annan statistik. I wRC+ kommer medelvärdet för ligan alltid att vara 100 och varje steg upp eller ner är värd exakt en procentenhet. Så en spelare med 120 i wRC+ kan alltså sägas vara 20 procentenheter bättre som slagman än en spelare med 100 i wRC+ den aktuella säsongen. Om wOBA kan sägas vara en bättre version av OBP så är wRC+ en betydligt bättre version av OPS+. Statistiken är precis lika enkel att använda men tar in så många olika variabler att det är en mer rättvis statistik över en spelares offensiva produktion. Topp 5 i wRC+ under 2015 innehåller samma namn som topplistan för wOBA men i en lite annan ordning, Bryce Harper (197), Mike Trout (172), Joey Votto (172), Miguel Cabrera (165) och Paul Goldschmidt (164).

 

BABIP (Batting Average on Balls In Play)

Att tur och otur är en del av spelet är de flesta medvetna om. Ibland lyckas en spelare slå små dribblers genom motståndarnas infield gång på gång eller så blir det en bloop single som råkar hamna mellan infield och outfield. Det är knappast resultat av någon form av skicklighet. Det omvända är förstås att man slår ett helt gäng stenhårda linedrives som råkar hamna rakt på motståndaren, väldigt frustrerande men knappast ett resultat av att man är en dålig slagman. Under en lång säsong brukar sådant här jämna ut sig även om det finns undantag (mer om det senare). Under ett kortare spann, som i baseball kan vara 2-3 månader, kan det dock vara svårare att värdera hur mycket av en spelares batting average (eller wOBA och wRC+ för den delen) består av tur eller otur. BABIP är då statistiken att gå till.

BABIP beräknar batting average när man helt plockat bort homeruns och strikeouts ur bilden. Det vill säga, vad händer när bollen sätts i spel. I det normala fallet blir det en hit i runt 30% (alltså .300) av gångerna men det finns många variabler som gör att det blir en högre eller lägre grad för vissa spelare. En spelare som hela tiden slår hårda linedrives till exempel kommer att ha ett högre BABIP än någon som ofta slår flyballs eller groundballs, Miggy Cabrera (.348 BABIP genom karriären) är ett bra bevis på detta. En spelares snabbhet spelar också stor roll, om du kan slå en massa groundballs men är väldigt snabb så kommer du oftare att få en hit än någon som är långsam, Dee Gordon (.346 BABIP genom karriären) är en sådan spelare. Dessa faktorer gör att BABIP är väldigt dåligt att använda för att jämföra olika spelare med varandra. Däremot så ligger en spelares egna BABIP på runt samma nivå år efter år och det är här man kan göra en jämförelse. Om spelarens BABIP exempelvis ligger mycket högre än vad som är normalt för honom så kan man lätt dra slutsatsen att han haft en hel del tur och man kan förvänta sig att det inte kommer att hålla i sig. Detsamma gäller för det omvända, har man ett mycket lägre BABIP har man haft en del otur och spelaren kommer förmodligen att vända på det och prestera bättre offensivt framöver.

Ett bra exempel från förra säsongen är Shin-Soo Choo i Texas Rangers. Han hade ingen kul första halva av säsongen och slog riktigt dåliga .221 i AVG, .303 wOBA och 84 wRC+. Siffror som helt tagna från sitt sammanhang skulle kunna tänkas visa att han inte borde vara en starter i MLB. Han hade också väldigt låga .265 i BABIP samtidigt som han under sin karriär legat på .344. En indikation på att han haft rätt mycket missflyt under första halvan av säsongen och att det borde komma en vändning. Under andra halvan slog han för .343 AVG, .436 wOBA och 176 wRC+ med ett BABIP på .420. En halva med mycket otur och en halva med mycket tur. Under en hel säsong jämnar det alltså ut sig och de totala slutsiffrorna blev .276 AVG, .365 wOBA och 127 wRC+ med ett BABIP på .335, helt i linje med hans karriärssiffror.

Som sagt, BABIP används bäst för att kolla om en viss trend för en spelare under en kortare period är legitim, men ibland kan en spelare gå igenom en hel säsong med ett högt eller lågt BABIP och då kan man förvänta sig att normaliseringen sker nästa säsong. Ett bra exempel på detta är Danny Santana i Minnesota Twins. 2014 kallades han upp för att spela SS och CF. Han var inget större prospect att tala om och hade inte utmärkt sig som någon särskilt bra spelare i minors, men han hade en kanonsäsong 2014. Han slutade med ett AVG på .319, wOBA på .362 och wRC+ på 133, en mycket bra offensiv spelare alltså. Han hade också ett BABIP på .405 vilket ska vara i princip omöjligt att hålla under en längre tid. Han hade med andra ord en sagolik tur under den säsongen. När förra säsongen skulle börja var en del skeptiska till hans offensiva kvaliteter och få blev förvånade när han slog .215 AVG, .231 wOBA och 40 wRC+ innan han flyttades ner till AAA.

Vem kan årets Danny Santana vara då? Chris Colabello i Toronto Blue Jays ligger nog närmast till hand. Under 360 PA förra säsongen hade han .321 AVG, .381 wOBA och 142 wRC+, han hade också osannolika .411 i BABIP. Han är en bättre offensiv spelare än Danny Santana och kommer förmodligen bara få en platoon-roll den här säsongen men var inte förvånande om hans AVG sjunker ända ner till runt .250.

BABIP finns även för pitchers och där fungerar det precis tvärtom som för hitters. Ett väldigt lågt BABIP betyder att man haft lite tur och ett väldigt högt BABIP att man haft lite otur. Det finns dock ett annat statistiskt värde för pitchers som bedömer deras styrka utan att ta hänsyn till medspelarnas defensiv.

 

FIP (Fielder Independent Pitching)

ERA är inte någon dålig statistik, åtminstone inte under längre perioder, men det finns ett problem där ren otur eller dålig defensiv kan påverka den negativt, med FIP försöker man rätta till detta. FIP fungerar nästan precis omvänt mot BABIP. Man plockar helt bort alla utgångar när bollen sätts i spel eftersom tanken är att pitchern inte har någon, eller åtminstone väldigt liten, påverkan på vad som händer då. Det han direkt kan påverka är strikeouts, walks, hit by pitches och homeruns. FIP blir då ett bra värde på hur en pitcher egentligen presterat och var hans nivå bör ligga fortsättningsvis. I det långa loppet bör ERA och FIP bli likvärdigt, även om det finns undantag.

Som ett exempel, minns ni paniken över Clayton Kershaws dåliga start förra säsongen? I slutet på maj satt han med ett ERA på 4.32 och folk undrade vad som var fel med honom. Hans FIP berättade dock en annan historia, det låg vid detta tillfälle nere på 2.88 och har man ett FIP 1.5 runs lägre än ERA så kan man misstänka att en hel del otur ligger bakom och att hans ERA framöver kommer att ligga mer i linje med sitt FIP. Nu är 2.88 för Kershaw också ovanligt högt så han var kanske inte sitt normala jag men inte så att man får panik. När man studerade siffrorna närmare så hittade man ett helt galet högt homerun per flyball ratio på 20% som var den stora orsaken till detta, något som inte ska hålla i sig i ett längre perspektiv. Vid säsongens slut var det ingen som pratade om den dåliga starten längre, Kershaw slutade med ett 2.13 ERA (med 1.99 FIP).

Det motsatta fallet där någon sitter med ett lågt ERA men ett högt FIP händer såklart också och då brukar det gå utför för pitchern framöver (som för Tim Lincecum förra säsongen) men det finns ett undantag här. Det har visat sig att fly ball pitchers som kan kontrollera springspelen så att man inte ger bort stulna baser allt som oftast har ett FIP något högre än deras ERA, Johnny Cueto är en sådan som nästan alltid slår sitt FIP.

 

WAR (Wins Above Replacement)

Låt oss avsluta med den förmodligen mest kontroversiella uträkningen där ute. Den som kanske startade hela den här motsättningen mellan olika filosofier när det gäller baseball. När Miguel Cabrera blev framröstad som AL MVP 2012 före Mike Trout var det många statheads som stönade och när det hände igen 2013 var det nästan upploppsstämning från en del håll och WAR var den stora vattendelaren mellan de olika lägren.

WAR är alltså ett försök att värdesätta alla aspekter av vad en spelare gör ute på planen, hur han är som slagman, löpare, försvarare och hur pass viktig hans position är. Det är svårt att förklara uträkningen av WAR på ett enkelt sätt och det många fastnar på är själva replacement-delen. Att jämföra mot en teoretisk spelare låter mysko för många och att försöka förklara den delen för icke-matematiker är som att försöka förklara Einsteins relativitetsteori för icke-fysiker. Man får lita på att de som ställer upp den ekvationen är bra på sitt jobb.

Det finns också olika sätt att räkna ut WAR på beroende på vilka variabler man stoppar in i ekvationen. Baseball-Reference (allmänt kallat bWAR, eller ibland rWAR), Fangraphs (fWAR) och Baseball Prospectus (WARP) är de man oftast hör talas om men ni kan vara helt säkra på att alla lag i ligan har sina egna sätt att räkna ut WAR. Skillnaderna mellan de olika uträkningarna är förhållandevis små, åtminstone när det gäller positionsspelare. När det gäller pitchers kan det skilja sig en del då bWAR använder sig av ERA som huvudkomponent, fWAR använder sig av FIP och WARP använder sig av deras egna pitcherstatistik DRA (Deserved Run Average). Baseball Prospectus har också tagit fram en helt ny catcherstatistik som gör att deras uträkning för catchers också blir annorlunda.

Det är viktigt att påpeka att WAR är långt ifrån någon exakt vetenskap och när man tar så pass många andra statistiska uträkningar som variabler i en ekvation som WAR gör så kan marginalerna bli rätt stora. Defensiva metrics är framförallt de som visat sig inte vara helt tillförlitliga. Det är alltså ingen bra idé att säga att en spelare som har fått ihop 3.5 i WAR under en säsong har varit bättre än en annan spelare som fått ihop 3.0 i WAR. Det enda man kan utläsa av de siffrorna är att det är spelare med bra säsonger, spannet emellan måste vara större än så om man ska kunna dra några jämförande slutsatser. Man kan säga att en säsong på över 2 i WAR är solid, över 3 är bra, över 4 är All Star-kaliber, över 5 är stjärnstatus och över 6 är MVP-värdigt. Några mer övergripande slutsatser bör man inte dra utan att gå närmare in på djupet.

Så skulle Mike Trout vunnit de där MVP-titlarna istället för Miggy? Tja, det beror väl lite på hur man definierar MVP. Om man anser att MVP ska gå till den bästa offensiva spelaren så var det rätt att ge titlarna till Cabrera, han var något bättre än Trout båda åren om man begränsar sig till de kategorierna. Om man däremot anser att det ska gå till den mest kompletta spelaren så finns det inget att diskutera. Trout med sina två säsonger med 10+ i WAR var utan tvekan bättre än Miggy och skillnaden bestod i att Trout förutom offensiva kvaliteter också var ett vapen som löpare på baserna och en bra försvarare i center field.

WAR kommer förmodligen vara en kontroversiell uträkning ett bra tag framöver men så länge man inte använder den som ett exakt mått utan mer som en fingervisning där men sedan kan gå in mer på djupet och studera mer exakt varför någon hamnat på just det värdet så är den användbar.

 

Till slut

Jag skulle förmodligen kunna skriva tusentals fler ord om andra statistiska mått som UZR (Ultimate Zone Rating), WPA (Win Probability Added), DRS (Defensive Runs Saved), projection systems och en hel massa annat men det får kanske bli en uppföljare någon gång. Vad jag hoppas är att de som läst det här har fått en liten inblick i hur sabermetrics och några av de avancerade stats som oftast nämns fungerar och hur de kan användas för att ge en större förståelse för spelet. Det är viktigt att alltid komma ihåg att dessa statistiska data inte är perfekta, att det nästan alltid finns någon anomali men att de kan ge en bra startpunkt för att studera vidare.

Alla statistiska data jag nämnt går att hitta om man gör en spelarsökning på Fangraphs och om man tycker att det här verkar intressant och vill lära sig mer så rekommenderar jag att man frekvent läser artiklarna på Fangraphs, The Hardball Times och Baseball Prospectus. Om man däremot anser att allting det här är humbug så kom ihåg att vi alla åtminstone kan vara överens om en sak, att Bartolo Colon är bäst.

 

Niklas Bergljung

Foto: Intel Free Press

Visa kommentarerStäng kommentarer

Kommentera!