PROF. JOHAN DECRUYENAERE OVER DE ROL VAN ARTIFICIËLE INTELLIGENTIE

FASCINERENDE DOORBRAKEN IN MEDISCHE BEELDHERKENNING

Medische vakbladen staan vol van begrippen als ‘big data’, ‘machine learning’, ‘artificiële intelligentie’ (AI) en ‘digitale geneeskunde’. Zijn het hypes of is de gezondheidszorg bezig aan een paradigmashift? Prof. Johan Decruyenaere, internist-intensivist aan het UZ Gent, staat al 20 jaar met beide voeten in de digitale geneeskunde. Hij relativeert: “behalve de medische beeldherkenning is het allemaal niet zo nieuw. Al zitten we vandaag wel in een belangrijke stroomversnelling.” 

Hoe zou u zichzelf omschrijven? Als een arts met een wiskundeknobbel of een mathe­maticus met een artsenhart?
“Ik ben een arts in hart en nieren, laat daar geen twijfel over bestaan. Aan het UZ Gent heb ik destijds het programma voor levertransplantatie mee opgezet en nadien ben ik 12 jaar diensthoofd Intensieve Zorg geweest. Al moet ik toegeven dat van kindsbeen af wiskunde mijn lievelingsvak was. Eind jaren 1990 heb ik een interuniversitair postgraduaat ICT gevolgd en vanaf 2003 hebben we progressief de volledige afdeling Intensieve Zorg, die 64 bedden telt, gecomputeriseerd. We waren hierin pioniers en papier gebruiken we sindsdien niet meer. Intensieve Zorggeneeskunde levert ontzettend veel data op, dagelijks ongeveer 25.000 datapunten per patiënt. Meer dan 10 jaar geleden zijn we dan ook gestart met het opzetten van verschillende grote databankprojecten, ook interuniversitair. Vandaag zouden we daar de termen ‘big data’ en ‘artificiële intelligentie’ op plakken, maar toen waren die begrippen nog niet in de mode.” 

Nochtans zag artificiële intelligentie als onderzoeksdiscipline al het levenslicht in 1956.
“Het is een domein dat zomers en winters heeft gekend. Er zijn periodes geweest dat iedereen volop geloofde in artifi­ciële intelligentie. Er ging bij momenten ontzettend veel onderzoeksgeld naartoe. De discipline kon die verwachtingen niet inlossen en het hele onderzoeksgebied ging de koelkast in. Het heeft sinds zijn ontstaan in 1956 verschillende dieptepunten gekend. Vandaag zitten we volop terug in de zomer, ook in de geneeskunde. We mogen echter niet de fouten uit het verleden maken. Heel verstandige mensen hebben ooit in de jaren 1970 van de vorige eeuw in The New England Journal of Medicine geschreven dat tegen het eind van de jaren 1980 computers alle taken van artsen zouden overnemen. Zo’n vaart zal het ook nu niet lopen.” 

Hoe zou u artificiële intelligentie defi­niëren?
“Voor mij gaat het om computersystemen die in staat zijn op een intelligente en autonome manier complexe taken uit te voeren. Maar intelligentie is een complex begrip met veel facetten. Patroonherkenning is er één van en hier heeft machine learning en vooral deep learning voor een spectaculaire doorbraak gezorgd. Maar intelligentie heeft ook veel te maken met het écht begrijpen van dagelijkse fenomenen en hierover kunnen redeneren, reflecteren en oorzakelijke verbanden zien. Het is precies dat wat kinderen van ’s morgens tot ‘s avonds doen en waar computers nauwelijks of niet toe in staat zijn. Denk aan de stroom van waarom-vragen die kinderen aan hun vertwijfelde ouders stellen, waarop die ouders uiteindelijk ‘daarom’ antwoorden. Het absorberen van een enorme hoeveelheid wereldkennis en common sense, kan de huidige AI (nog) niet.”

Waarom zit artificiële intelligentie dan vandaag opnieuw zo in de lift?
“Een heel belangrijke factor is de enorme beschikbaarheid aan gegevens. Vandaag meten we heel veel bij onze patiënten. Gegevens die we ook digitaal bijhouden. Niet alleen alle diagnoses, medicaties, procedures en numerieke data, maar ook beelden uit bijvoorbeeld radiologie. Meer en meer komen daar nog genomics en andere ‘omics’-data bij. Dat leidt tot een enorme, onoverzichtelijke berg aan data waarop we computeralgoritmes loslaten. Die gegevenszondvloed gecombineerd met de huidige explosieve rekenkracht van computers en nieuwe algoritmes, opent een scala van mogelijkheden.”

Welke praktische toepassingen kunnen we dan verwachten in de geneeskunde?
“Het domein waarin de grootste vooruitgang werd gemaakt, is het herkennen van patronen in beelden. Een computer die een kat identificeert op een foto, dat zouden we ons 20 jaar geleden niet kunnen voorstellen. Binnen de geneeskunde is dat onmiddellijk bruikbaar in de radiologie, de dermatologie en de histopathologie, drie disciplines die bij uitstek beeldgericht zijn. En natuurlijk ook in ‘omics’-onderzoek dat eveneens op zoek gaat naar verborgen, dikwijls zeer zeldzame patronen. Zo’n intelligent image recognition-programma heeft op basis van duizenden en duizenden beelden geleerd om afwijkingen ‘te zien’. Het doet dat snel en accuraat. Ook in het UZ Gent starten we een proefproject dat op de spoedopname in realtime hersen-, wervel- en leverscans analyseert. Als het programma een afwijking vaststelt, wordt die onmiddellijk bovenaan de lijst gezet voor verdere evaluatie door de radioloog. Dat is pure tijdswinst voor de patiënt en de arts. Andere algoritmes zijn in staat om afwijkingen op longfoto’s vast te stellen of subtiele breuken te zien. Het gaat in deze sector heel snel. Die technologie leidt vandaag in de eerste plaats tot een beter management van de workflow, maar wellicht ook tot een betere kwaliteit.”

Je moet artificiële intelligentie en digi­tale geneeskunde zien als een hulpmiddel voor de arts, niet als een toekomstige vervanger. De radiologen, anatoom-pathologen en dermatologen hoeven niet te vrezen voor hun jobs. Ze zullen altijd nodig blijven.

Hoezeer kan je op de uitkomsten van die programma’s vertrouwen?
“Die programma’s zijn nog geen routine in het ziekenhuis. Precies omdat we de validiteit en betrouwbaarheid nog verder willen onderzoeken, brengen we in het UZ Gent dergelijke toepassingen ook eerst binnen via onderzoeksprogramma’s. Naast fouten in het algoritme kunnen zich nog andere problemen voordoen. Ik denk onder meer aan automation bias: artsen met een sterk vertrouwen in geautomatiseerde systemen lopen het risico dat ze minder aandachtig worden. Dat ze denken: ‘de computer heeft niks gevonden, dus er zal wel niks zijn.’ Dat is een gevaar. Je moet die technologieën dan ook altijd zien als een hulpmiddel voor de arts en zeker niet als een toekomstige vervanger. De radiologen, anatoom-pathologen en dermatologen hoeven niet te vrezen voor hun jobs. Ze zullen altijd nodig blijven.”

Is er ook niet het gevaar dat een computer iets als een afwijking kwalificeert terwijl die helemaal niet pathologisch is? Of het omgekeerde, dat de computer een relevante afwijking over het hoofd ziet?
“Dat is het klassieke probleem van de vals­positieve en valsnegatieve resultaten. Daarover breken wij als artsen altijd ons hoofd want beide zijn aan elkaar gekoppeld, maar waar ligt de juiste trade-off? Op een spoeddienst willen de computer en de radioloog zeker geen hersenbloeding missen. Dus je wenst geen enkele vals­negatieve bevinding en je kan ermee leven dat een programma een aantal niet-­relevante afwijkingen toch catalogeert als positief. Het is aan de arts om de evaluatie te maken. Maar bij kankerscreening wil je het aantal valspositieve resultaten beperken. Anders stuur je mensen naar verdere diagnostische onderzoeken, soms invasief en soms jarenlang. Er is zelfs een risico dat dit nutteloze therapieën induceert. Overdiagnose en overbehandeling kunnen dan écht een probleem worden. Daarenboven zijn die mensen bij elk onderzoek doodongerust, het kost de samenleving handenvol geld en uiteindelijk was het allemaal voor niets. Je moet dit natuurlijk afwegen tegen het voordeel dat je andere patiënten in een vroegtijdiger stadium detecteert. Maar dat klinkt allemaal eenvoudiger dan het intuïtief lijkt.”

Artificiële intelligentie en digitale geneeskunde worden ook sterk gekoppeld aan voorspellende geneeskunde. Ziet u daar grote doorbraken?
“Er zijn heel wat concrete toepassingen op komst. In het UZ Gent alleen al hebben we verschillende projecten lopen. Zo hebben IDLab, een imec-onderzoeksgroep aan de Universiteit Gent, en de Afdeling Verloskunde van het UZ Gent een algoritme ontwikkeld om het tijdstip van geboorte in te schatten bij risico op vroeggeboorte. Bij een vroeggeboorte is het belangrijk om tijdig corticosteroïden toe te dienen om foetale longrijping te bevorderen. Die behandeling lijkt het meest efficiënt tussen twee en zeven dagen voor de bevalling. Een correcte inschatting van de timing van een eventuele vroeggeboorte is dus belangrijk. Het algoritme moet nog wel verder gevalideerd worden en dan volgt een klinische studie. Nog enkele Gentse voorbeelden zijn het onderzoek naar complicaties bij borstreconstructies (recent gepubliceerd in Nature Scientific Reports), een project rond migraine, het optimaliseren van antibioticaspiegels bij zware infecties en het automatisch interpreteren van huidletsels.”

Ook u trekt al jaren aan de kar van de digi­tale geneeskunde.
“Sinds 2003 werk ik intens samen met ingenieurs van de Universiteit Gent. We voerden al meer dan 30 projecten uit. Recent hebben we een onderzoek gepubliceerd waarbij we op basis van negen variabelen vrij betrouwbaar kunnen voorspellen of de bloedcultuur die we afnemen bij een mogelijke ernstige infectie, al dan niet positief zal worden. We hebben daarvoor een neuronaal netwerk ingezet om data van 2.177 culturen te analyseren. Nu moeten eerst verdere datasets getest worden. Als het zich echter verder uitkristalliseert, zou het algoritme nuttige informatie kunnen leveren over het al dan niet opstarten van antibiotica. De uitslag van een bloedcultuur neemt immers 24 tot 72 uur in beslag.”

Is de grote moeilijkheid niet de kloof tussen onderzoek en bruikbaarheid in de dagelijkse praktijk? Je trekt bepaalde conclusies op groepsniveau, maar hoe bruikbaar zijn die voor voorspellingen over individuele patiënten?
“De kloof van studie naar routinematig gebruik is inderdaad het moeilijkste om te overbruggen. Dat is in de eerste plaats een probleem van validatie. Er komt meer en meer consensus om voor die validatie gerandomiseerde studies in te zetten, naar analogie met geneesmiddelen. Er zal dus nog flink wat onderzoekswerk aan te pas komen. Verder zijn veel predictiemodellen zogenaamde ‘black boxes’. Zij doen een voorspelling maar kunnen de arts niet vertellen waarom. 

Een ander groot probleem is dat de huidige algoritmen zich beperken tot het vinden van correlaties tussen factoren en uitkomsten. En correlatie betekent niet automatisch oorzakelijkheid – causaliteit, met een geleerd woord. Een voorbeeld: als wij een model maken om te voorspellen of een patiënt op intensieve zorg zou kunnen overlijden, dan zullen daar altijd factoren uitkomen als ‘de patiënt krijgt dialyse’, ‘krijgt bloeddrukmedicatie’ en/of ‘ligt aan de beademingsmachine’. Indien dat causale factoren zouden zijn, dan moeten wij natuurlijk onmiddellijk stoppen met dialyseren of ventileren, maar dan is de patiënt zeker dood. Dus die factoren zijn wel goede voorspellers, maar helemaal geen oorzakelijke factoren. 

In de geneeskunde is oorzakelijkheid ‘corebusiness’. Het vormt de basis van elke medische behandeling. De huidige generatie ‘machine learning’ is echter niet in staat om ‘cause and effect’-analyses uit te voeren. Voorlopig is dat nog echt basisonderzoek, maar ongetwijfeld wel dé ‘next big thing’ in artificiële intelligentie. Naast de computer automatisch ‘wereldkennis’ aanleren. Denk maar aan de waarom-vragen van kinderen.” 

 

TEKST: PETER RAEYMAEKERS (LYRAGEN) • BEELD: PETER DE SCHRYVER