Genoomonderzoekers in Nederland werken intensief met elkaar samen aan omics data (zoals genoom- en metaboloomdata). Om omics data makkelijk en veilig onderling te kunnen uitwisselen loopt nu een pilot met E-LAN netwerktechnologie. Hiermee is een gezamenlijke netwerkomgeving ontwikkeld die is afgescheiden van het internet: het UMC Research LAN. In deze pilot testen we ook een infrastructuur voor authenticatie- en autorisatie, zodat onderzoekers van verschillende instellingen elkaar veilig toegang kunnen geven tot hun datasets en rekenkracht.
Noodzaak tot samenwerken
Genoomonderzoekers in Nederland werken intensief met elkaar samen aan omics data (zoals genoom- en metaboloomdata). Samenwerken is ook hard nodig, want er zijn grote steekproeven nodig om significante patronen te kunnen vinden in data, zeker nu het hele genoom geanalyseerd kan worden. “Het is te kostbaar en onmogelijk om zelf alle data te verzamelen”, licht Marian Beekman toe. Beekman is werkzaam bij het LUMC en werkpakketcoördinator binnen de nationale infrastructuur voor biobanken BBMRI-NL (Biobanking and BioMolecular resources Research Infrastructure The Netherlands). Om samen te kunnen werken, bouwt BBMRI nu aan één virtueel platform, dat deels gefedereerd is en deels centraal bij SURF staat. Dit platform voor omics data is een virtueel ‘datahuis’ waar verschillende soorten datasets zijn te vinden en onderzoekers van verschillende UMC’s ook analyses kunnen doen.
Data uitwisselen tussen UMC’s
“Binnen BBMRI werken onderzoekers aan grote datasets waarvan ze niet alle analyses op één locatie kunnen doen”, vertelt Jeroen Laros, onderzoeker aan het LUMC. Een voor de hand liggende oplossing is het snel en veilig kunnen overzetten van data tussen de verschillende UMC’s en het delen van rekenkracht. “Op dit moment gebeurt dit al tussen het UMCG en LUMC en op termijn willen we met meer UMC’s data en rekenkracht gaan uitwisselen”, aldus Laros.
Speciale netwerkinfrastructuur
Het combineren en uitwisselen van zulke grote datasets vraagt om een speciale netwerkinfrastructuur. Om omics data makkelijk en veilig onderling te kunnen uitwisselen loopt nu een pilot met E-LAN netwerktechnologie. Hiermee is een gezamenlijke netwerkomgeving ontwikkeld die is afgescheiden van het internet: het UMC Research LAN. Hiermee is in feite een landelijk ‘lokaal’ netwerk voor UMC’s gebouwd (zie figuur 1). Hierdoor komen data en rekenclusters van verschillende UMC’s en ook SURF virtueel op één plek samen. Op deze manier kunnen onderzoekers gegevens uitwisselen en analyseren in een afgeschermde netwerkomgeving die is geoptimaliseerd voor onderzoek. Omdat ook SURFsara is aangesloten op het UMC Research LAN, kan een onderzoeker bovendien moeiteloos opschalen naar meer rekenkracht bij SURFsara als binnen het eigen UMC onvoldoende capaciteit beschikbaar is.

Figuur 1. Generieke internetverbinding (links) en gesloten UMC Research LAN-verbinding voor high performance doeleinden (rechts)
Toegang tot data
Zulke samenwerkingen die over instellingsmuren heen gaan, vragen ook om een geschikte infrastructuur voor authenticatie- en autorisatie. “Je moet op een makkelijke manier kunnen bepalen wie toegang heeft tot de data en wat iemand mag doen met de data”, vertelt Marian Beekman. Daarvoor loopt op dit moment een pilot met COmanage en OpenConext. Een onderzoeker kan dan met zijn instellingsaccount inloggen. Dat heeft voordelen voor de onderzoeker – het is zijn eigen vertrouwde account -, en voor de eigenaar van de gedeelde dataset of rekenkracht. Deze weet nu zeker wie de gebruiker is, want deze heeft zich geauthentiseerd met een account dat door de instelling is geverifieerd. De hoofdonderzoeker kan met COmanage groepen aanmaken, onderzoekers uitnodigen en rollen toekennen aan wie wat mag doen. Het doel is dat onderzoekers uit heel Nederland toegang hebben tot het virtuele datahuis, maar uiteindelijk moeten eveneens onderzoekers in internationale samenwerkingsprojecten toegang tot deze data kunnen krijgen.
Samenwerken aan geneeskunde op maat
Het uiteindelijke doel van dit alles is geneeskunde op maat: Geneeskunde die predictief, gepersonaliseerd, preventief en participatief is. Dat vraagt om goede samenwerking tussen onderzoekers, maar ook om een ICT-infrastructuur die het onderling vertrouwen waarborgt en die is ingericht op de veiligheidseisen en behoeften van de onderzoekers, zoals het snel kunnen uitwisselen van datasets en rekenkracht. Zonder een geschikte ICT-infrastructuur kunnen onderzoekers niet optimaal samenwerken en worden wellicht oplossingen gekozen die de veiligheidstoets niet doorstaan.
Meer informatie
- De UMC Research LAN pilot wordt uitgevoerd in de context van het Data4lifesciences programma
- Lees de blog Naar een veilige afgeschermde netwerkomgeving voor umcs