Mikko Aaltonen & Heikki Kauppi

Oppivat koneet rikollisuutta torjumassa?

Rikosennustemalleja on kehitetty maailmalla rikosoikeusjärjestelmän tarpeisiin

Rodeo / Value Stock Images

On sanomattakin selvää, että rikosten ennaltaehkäisy helpottuisi huomattavasti, jos tulevat rikokset voitaisiin ennustaa tarkasti. Yleisesti ottaen rikollisuuden määrän muutoksia on kuitenkin kovin vaikea ennakoida edes aggregaattitasolla. Vaikka rikoskäyttäytymisen varhaisista riskitekijöistä tiedetään kohtalaisen paljon, emme silti pysty kovinkaan tarkkaan ennustamaan sitä, ketkä lopulta päätyvät rikosuralle.

Näistä vaikeuksista huolimatta maailmalta on löydettävissä useita esimerkkejä sekä poliisin että rikosseuraamusjärjestelmän toiminnasta, joka nojaa tavalla tai toisella rikosennusteisiin. Näyttäisi siltä, että erityisesti koneoppimiseen (machine learning) perustuvien yksilö- ja aluetasoisten rikosennusteiden rooli on kasvamassa.

Nopeasti kehittyvien koneoppimismenetelmien tarjoamia mahdollisuuksia on käsitelty viime vuosina myös akateemisessa tutkimuksessa. Koneoppimismallien ennustetarkkuutta käsittelevään tutkimushankkeeseemme liittyvä kirjoituksemme perustuu muutamaan keskeiseen tutkimukseen, joissa on käsitelty yksilötasoista uusintarikollisuuden riskin arviointia, tutkintavankeuspäätöksiä sekä poliisitoiminnan alueellista suuntaamista koneoppimisen avulla.

Mitä koneoppiminen on?

Koneoppiminen viittaa etupäässä tietojärjestelmätieteilijöiden kehittämiin ennuste-, erottelu- ja tunnistamismenetelmiin. Alkuperäinen tavoite on ollut esimerkiksi "opettaa" tietokone tunnistamaan käsinkirjoitetun tekstin kirjaimia tai erottamaan kuvasta esineitä tai eläimiä. On myös haettu menetelmiä dynaamisiin ongelmiin, joissa paras reagointitapa tai oikea resurssien allokointi on opittava toistuvissa päätöksentekotilanteissa.

Koneoppimisen varhaisia ennusteongelmia yhdistää se, että niihin on lähes mahdotonta soveltaa perinteisiä tilastollisia menetelmiä ja malleja. Esimerkiksi kuvantunnistamisongelmassa ennuste muodostetaan valtavasta määrästä digitalisoidun kuvan pikseleitä. Ei ole selvää teoriaa, miten pikselit tulisi muuntaa ennustemuuttujiksi ja millaisella tilastollisella mallilla niistä saisi parhaan erottelu- tai ennustesäännön.

Koneoppimisessa ennustesääntö muodostetaan algoritmilla, joka jäljittelee oppimisprosessia tai voidaan ainakin mieltää sellaiseksi. Parhaat tulokset ovat syntyneet algoritmeilla, joissa ennustesääntö rakennetaan kumulatiivisesti askel kerrallaan. Kussakin algoritmin askeleessa ennustesääntöön lisätään uusi osanen, joka ennustaa jotain sellaista, mitä edeltävissä askeleissa ei kyetty ennustamaan. Vaikka koneoppimisalgoritmin yksittäisessä askeleessa tehty lisäys perustuu yleensä yksinkertaiseen malliin, iteroinnin myötä kumulatiivisesti syntyvä ennustesääntö voi olla mielivaltaisen monimutkainen. Tämä merkitsee, että koneoppimisen avulla aineistosta voidaan löytää paras ennustesääntö riippumatta siitä kuinka monimutkainen se on.

Toisaalta menetelmässä on huomioitava, että oppiva ennustesääntö saattaa lopulta mukautua aineistoon liian hyvin, jolloin samaa ennustetarkkuutta ei saavuteta, kun ennustesääntöä sovelletaan havaintoihin, jotka eivät olleet ennustesäännön muodostuksessa mukana. Tätä ongelmaa kutsutaan ylisovittamiseksi (overfitting).

Koneoppimismenetelmien menestys nojaa suurelta osin tekniikkoihin, joilla ylisovittamista pyritään välttämään. Keskeinen kysymys on, miten löydetään optimaalinen askelmäärä, jonka tuottama ennustesääntö antaa tarkimmat ennusteet havainnoille, jotka eivät ole algoritmin käytössä. Yleensä askelmäärä ratkaistaan soveltamalla ristiinvalidointia, jossa osa alkuperäisestä aineistosta varataan otoksen ulkopuolisen ennustetarkkuuden mittaamiseen. Lukuisat sovellukset ja analyysit viittaavat siihen, että ylisovittamista kontrolloivat tekniikat onnistuvat hyvin – jopa niin hyvin, että algoritmeja pidetään ylisovittamisen suhteen lähes immuuneina.

Yleisesti voidaan todeta, että koneoppimisen avulla laajasta tietomassasta saadaan tehokkaammin paras ennustava informaatio esille kuin perinteisillä tilastotieteellisillä menetelmillä. Koska koneoppimismenetelmät löytävät oikeat muuttujat ja niiden ennustavat vaikutukset automaattisesti, sama ennustetarkkuus voidaan saavuttaa erilaisilla syötetiedoilla. Koneoppisessa ei ole niin kriittistä, että ennusteeseen valitaan "oikeat" muuttujat vaan riittää, että mukaan valitaan muuttujat, jotka pitävät ennustamisen kannalta olennaisen informaation sisällään. Lisäksi syötteenä käytetyt muuttujat voivat olla keskenään päällekkäisiä tai voimakkaasti riippuvia.

Koneoppimismenetelmää on kuitenkin kritisoitu siitä, että sen tuottama ennustesääntö saattaa jäädä "mustaksi laatikoksi", joka ei paljasta, millä tekijöillä on merkittävin vaikutus saatuun ennusteeseen. Mm. tähän ongelmaan haetaan uusia ratkaisuja kirjoittajien meneillään olevassa tutkimuksessa, jossa ennustetaan rikollisuuden uusimista suomalaisella aineistolla.

Koneoppimismallit ehdonalaisen vapauttamisen ja tutkintavankeuspäätösten tukena

Yksilötasoisten ennustemallien paremmuudesta suhteessa "kliiniseen" päätöksentekoon on tehty paljon tutkimusta, ja keskimäärin vaikuttaa siltä, että perinteisetkin tilastolliset mallit ovat ihmisen tekemiä arvioita tarkempia (Dawes ym. 1989). Myös koneoppimismalleja hyödyntävät tutkimukset palautuvat usein tähän samaan kysymykseen: jos päätöksiä tekevät ammattilaiset näkevät saman datan kuin algoritmi, osaavatko he tehdä konetta parempia päätöksiä?

Yhdysvaltalaisen Pennsylvanian yliopiston professori Richard Berk on ollut yksi näkyvimmistä koneoppimismenetelmien puolustajista kriminologian alalla. Tuoreessa tutkimuksessaan hän tarkasteli sitä, onko rikosten uusimisessa tapahtunut muutoksia sen jälkeen, kun Pennsylvanian osavaltion ehdonalaislautakunta (Probation and Parole Board) otti käyttöön koneoppimismalliin (ns. Random Forest -algoritmi) perustuvan uusimisriskiennusteen ehdonalaispäätösten tueksi. Kyseessä oli lähtötilanne, jossa erilaisia yksilön taustaan perustuvia uusintarikollisuusennusteita oli käytetty jo pitkään.

Tutkimuksen tulokset viittaavat eräistä epävarmuustekijöistä huolimatta siihen, että sekä väkivaltarikosten että muiden rikosten uusiminen vähentyi sen jälkeen, kun koneoppimismallin ennusteita alettiin käyttää päätöksenteon tukena. Toisaalta tutkimus antaa viitteitä siitä, että käytännöt muuttuivat jo sinä aikana, kun uutta mallia ajettiin sisään, joten ero vanhan ja uuden käytännön välillä ei ole ajallisesti tarkkarajainen. Vaikuttaa kuitenkin siltä, että koneoppimismallit ovat parantaneet vapauttamispäätösten laatua, ainakin uusintarikollisuudella mitattuna.

Merkittävämpiäkin eroja on löydetty. Toistaiseksi kenties vakuuttavin ja monipuolisin koneoppimismalleja hyödyntävä tutkimus julkaistiin alkuvuodesta NBER:n (National Bureau of Economic Research) työpaperina. Siinä Kleinberg ja kumppanit tarkastelevat New Yorkissa sitä, missä määrin tuomareiden tekemiä tutkintavankeuspäätöksiä voitaisiin parantaa riskiennusteiden avulla. Tutkimuksen lähtöajatuksena on se, että tutkintavankeuspäätös ("bail decision") on huomattavasti rangaistuksen mittaamista yksinkertaisempi päätöksentekotilanne, jossa päätökseen pitäisi vaikuttaa vain se, millaiseksi henkilön pako- ja uusimisriski ennen tuomion langettamista arvioidaan. Erityisen innovatiiviseksi tutkimuksen tekee se, että siinä hyödynnetään tuomarikohtaista vaihtelua rangaistusankaruudessa tavalla, joka mahdollistaa koneoppimismallien tulosten ja tuomarien todellisten päätösten osuvuuden vertailun.

Päätuloksena tutkimuksessa havaittiin, että rikostaustaan perustuva ennustemalli on huomattavasti amerikkalaistuomareiden päätöksiä tarkempi. Simulaatioiden perusteella tutkijat päätyvät arvioimaan, että ennusteisiin perustuvilla vapautuksilla voitaisiin vähentää oikeudenkäyntiä edeltävän uusintarikollisuuden määrää noin 25 prosentilla pitämällä tutkintavankien määrä ennallaan. Vaihtoehtoisesti tutkintavankien määrää voitaisiin vähentää jopa 42 prosentilla ilman uusintarikollisuusvaikutuksia. Erityisen kiinnostavaa on se, että algoritmin käyttö näyttäisi johtavan myös pienempiin etnisten ryhmien välisiin eroihin tutkintavankeuden käyttöasteessa.

Rikosennustemalleja hyödynnetty poliisitoiminnassa

Yksilötasoisten ennusteiden lisäksi koneoppimismalleja on hyödynnetty viime aikoina ennakoivan poliisitoiminnan apuna. Mohlerin ja kumppaneiden tutkimuksessa vertailtiin täysin automatisoitua alueellisia rikosennusteita tuottavaa algoritmia poliisin analytiikkojen tekemiin vastaaviin karttoihin, ja havaittiin koneen tuottavan parempia ennusteita. Tuon työn tulokset on sittemmin kaupallistettu PredPol-palveluksi (www.predpol.com), joka tarjoaa poliisilaitoksille työkaluja rikosennusteiden laatimiseen.

Näiden työkalujen yleistymiseen poliisitoiminnassa ainakin Yhdysvalloissa viittaa se, että kansallinen oikeusinstituutti (National Institute of Justice) järjesti viime vuonna ennustekilpailun ("Real-Time Crime Forecasting Challenge"), jonka tavoitteena oli löytää paras malli alueperustaisten rikosennusteiden laatimiseen. Kilpailun osanottajat saivat käyttöönsä saman aineiston, jonka perusteella he pyrkivät rakentamaan mahdollisimman tarkan ennustemallin. Palkintorahaa oli tarjolla yhteensä 1,2 miljoonaa dollaria, ja kilpailu käytiin kolmessa eri sarjassa. Kilpailun tärkeimpänä tavoitteena oli houkutella muiden alojen osaajia kehittämään kilpailevia työkaluja nyt käytössä oleville analytiikkasovelluksille.

Systemaattisen syrjinnän paheneminen uhkana?

Vuosituhannen alussa ilmestynyt tieteiselokuva Minority Report nousee usein esiin rikosennusteita koskevissa keskusteluissa. Elokuvassa henkirikosten torjunta perustuu teknologiaan, joka mahdollistaa rikosten näkemisen ennen niiden tapahtumista. Tämä johtaa puolestaan siihen, että ihmiset tuomitaan vielä tekemättömien rikosten perusteella. Uusintarikollisuusennusteisiin perustuvaa riskienarviointia on arvostelu juuri tästä syystä. Miten tahansa riskienarviointimalli rakennetaankin, perustuu yksilöä koskeva riskiarvio viime kädessä tilastollisesti samankaltaisten ihmisten uusintarikollisuuteen.

Toinen keskeinen kysymys algoritmien käytössä liittyy siihen, johtaisiko tilastollisten sääntöjen käyttäminen eriarvoisempaan rikosseuraamusjärjestelmään. Tällaisia epäilyksiä on esitetty laajalti (Barry-Jester ym. 2015). Vastaus tähän kysymykseen riippuu ainakin siitä, millaisia muuttujia käyttämällä algoritmi rakennetaan. Väistämätön lopputulema se ei kuitenkaan ole, kuten Kleinbergin ja kumppaneiden edellä mainittu tutkimus osoittaa. Näin on siksi, että nykyisetkin käytännöt saattavat olla joitain väestöryhmiä implisiittisesti syrjiviä.

Erityisesti yksilötason uusimisennusteita tuottavien koneoppimismallien käyttöön liittyvät eettiset kysymykset ovat monilta osin samoja kuin perinteisessä riskienarvioinnissa, eikä näitä kysymyksiä voida ratkaista teknisillä sovelluksilla. Sikäli kun tilastollisiin aineistoihin perustuvia ennusteita päädytään käyttämään laajemmin myös Suomessa, on koneoppimismallien kehitystä syytä seurata tarkkaan, sillä mallien ennustetarkkuus suhteessa perinteisiin malleihin tulee todennäköisesti parantumaan entisestään. Lisäksi on tarpeen ymmärtää paremmin, mitä "mustan laatikon" sisällä oikein tapahtuu.

VTT Mikko Aaltonen toimii yliopistotutkijana Kriminologian ja oikeuspolitiikan instituutissa. VTT Heikki Kauppi on taloustieteen professori Turun yliopistossa.

Lähteitä:

Barry-Jester, Anna & Casselman, Ben & Goldstein, Dana (2015). Should Prison Sentences Be Based On Crimes That Haven’t Been Committed Yet? https://fivethirtyeight.com/features/prison-reform-risk-assessment/

Berk, Richard (2017) An impact assessment of machine learning risk forecasts on parole board decisions and recidivism. Journal of Experimental Criminology, tulossa.

Dawes, Robyn & Faust, David & Meehl, Paul (1989) Clinical Versus Acturial Judgment. Science 243: 1668–1674.

Kleinberg, Jon ym. (2017) Human Decisions and Machine Predictions. NBER Working Paper Series 23180. Cambridge, MA: National Bureau of Economic Research.

Mohler, G.O. ym. (2016) Randomized Controlled Field Trials of Predictive Policing. Journal of the American Statistical Association 110: 1399–1411.

National Institute of Justice (2016) Real-Time Crime Forecasting Challenge http://www.nij.gov/funding/Pages/fy16-crime-forecasting-challenge.aspx

 
Julkaistu 15.12.2017
Sivun alkuun |