Koneoppimisjärjestelmät maha-suolikanavan tähystyksissä

Michael Alexander Riegler | Loka 2019 | Gastroenterologia |

Michael Alexander Riegler
Tutkija
SimulaMet, Oslo

Pia Smedsrud
Lääkäri, väitöskirjatutkija
SimulaMet ja Augere Medical AS,
Oslo

Thomas de Lange
Lääkäri, Oslon yliopistosairaala
Johtava amanuenssi,
Kliinisen lääketieteen laitos,
Oslon yliopisto

Pål Halvorsen
Tutkija, SimulaMet, Oslo
Professori, Metropolitan University,
Oslo

Tekoälyavusteiselle diagnostiikalle on ollut kysyntää jo pitkään, ja laitteiston nopean kehityksen siivittämänä siitä voi tulla lääketieteelle tärkeä apuväline. Näin ollen tällaisten apuvälineiden käyttöönotto on mahdollistunut suhteellisen lyhyessä ajassa.  Radiologisten ja endoskooppisten löydösten ja leesioiden luotettavammasta havaitsemisesta ja luokittelusta on muodostumassa tärkeä tekoälyn tutkimusalue, ja tämä koskee etenkin koneoppimista. Onnistunut kehitys edellyttää kuitenkin perusteellista järjestelmää, jota voidaan käyttää reaaliaikaisesti käytännön työssä ja joka rajoittuu algoritmien kehittymiseen.  Tarvitaan myös laajoja, satunnaistettuja tutkimuksia järjestelmien hyvän laadun ja luotettavuuden osoittamiseksi. Kerromme tässä artikkelissa kokemuksistamme maha-suolikanavan tähystyksiä varten tarkoitetun järjestelmän kehittämisestä1-5 ja havainnollistamme tehokkaan digitaalisen avustajan kehityksen merkittäviä haasteita. Avusteinen diagnostiikka maha-suolikanavan tähystystutkimuksissa Olemme kehittäneet koneoppimisjärjestelmiä monentyyppisiin sovelluskohteisiin, ja lääketieteessä olemme panostaneet mm. maha-suolikanavan tähystyksiin yhteistyössä Bærumin sairaalan, Oslon yliopistosairaalan, Karolinska Institutet’in ja Norjan syöpärekisterin kanssa. Vaikka tähystysvälineiden tekniikka on parantunut huomattavasti viimeisten 10–15 vuoden aikana, ei-toivottu variaatio eri tähystäjien välillä aiheuttaa edelleen haasteita.  Tästä aiheutuu merkittävää variaatiota limakalvomuutosten ja anatomisten tuntomerkkien havaitsemisessa ja arvioinnissa.7,8 Tutkimukset ovat osoittaneet, että noin 20 % paksusuolipolyypeistä jää havaitsematta.9 Variaatio johtuu mm. taitojen, hahmottamisen, persoonallisuuden, kokemuksen ja tietojen eroista.6 Automatisoidun dataohjatun tukijärjestelmän kehittäminen limakalvomuutosten havaitsemista ja karakterisointia varten voi osaltaan vähentää merkittävästi tähystäjien välistä variaatiota.  ”Data is king” ”Data is king” on yksi koneoppimisen motoista, ja hyvän datan keräämiseen käytetäänkin paljon resursseja. Jotta mallit oppisivat tunnistamaan leesioita, lääkärien tiedot normaaleista ja epänormaaleista leesioista on siirrettävä tietokoneisiin. Näistä tiedoista tai ”tuloksista” käytetään usein nimitystä ”ground truth”. Keräämällä ja merkitsemällä dataa koneille näytetään, mitä niiden halutaan oppivan ja havaitsevan.  Mallien ja algoritmien kehitys ja opettaminen riippuu pitkälti datan saatavuudesta ja laadusta. Tämä koskee kaikentyyppistä koneoppimista, mutta erityisesti niin kutsuttua syväoppimista, jota käytetään runsaasti kuva-analyysin apuvälineenä.10 Koneoppimismallit oppivat analysoimalla saatavilla olevaa dataa, ja näin ollen sekä laatu että määrä ovat onnistumisen kannalta olennaisia. Kone toimii oppimallaan tavalla, ja jos oppiminen perustuu huonolaatuiseen dataan, ovat myös tulokset huonoja. Moitteettoman dataperustan varmistamiseksi useamman asiantuntijan...