Clinical data science: Samen meer bereiken dan alleen

Deze week las ik een interessant interview met Ymke de Jong, Clinical Data Scientist bij Philips. Ze noemt twee uitdagingen bij de toepassing van data science in de zorg:
- Praktische implementatie: Hoe breng je een innovatie van het lab naar de klinische praktijk?
- Data: Hoe verkrijg je de voor AI benodigde grote hoeveelheden data?
Multi-disciplinaire samenwerking binnen het team
Voor de eerste uitdaging, de praktische implementatie, is het volgens de Jong belangrijk multi-disciplinair te werken en technische kennis, klinische expertise, en ervaring op het gebied van procesinnovatie en veranderingsmanagement bijeen te brengen in een team.
Ik herken dit punt in mijn eigen werk. De klassieke driedeling van statistiek / IT / Domein-specifieke kennis, die doorgaans aan data scientists wordt toegeschreven, wordt in de zorg al snel te veelomvattend om in 1 persoon te verenigen. Daardoor vereist een succesvol data science project in de zorg vaak een team van specialisten op klinisch, statistisch en IT gebied, in plaats van een team van data scientists. Om het team goed te laten samenwerken zijn people-skills onontbeerlijk.
Samenwerking tussen instellingen
Voor de tweede uitdaging, beschikbaarheid van data, is samenwerking wederom belangrijk, maar dan op instellingsniveau. Zoals de Jong het verwoordt: "Als je met meerdere partijen samenwerkt, kun je de schaalgrootte bereiken die je nodig hebt om AI-modellen te ontwikkelen en de zorg te verbeteren. Of, zoals een arts het onlangs heel mooi zei: ‘In relatief korte tijd hebben we laten zien dat we samen meer kunnen bereiken dan alleen'."
Die schaalgrootte is naar mijn mening niet altijd eenvoudig te realiseren. Vaak zijn data van verschillende instellingen niet uniform vastgelegd, verzameld, of bewerkt. Daardoor kan het trainen van een model op data bijeengebracht uit verschillende systemen veel lastiger blijken dan wanneer deze uit een enkel systeem komt. Bovendien maakt privacywetgeving het lastig om de uiterst gevoelige data van patienten uit te wisselen of op een centrale plaats bijeen te brengen. Gelukkig is er tegenwoordig echter veel mogelijk om dit op een verantwoorde manier te doen, bijvoorbeeld door decentrale analyse van data (zoals federated learning), of het gebruik van synthetische data.