Mesterséges intelligencia és a klinikai képalkotás 2018
A SFR-IA Group és a CERF közös közleménye (white paper)
SFR-IA Group:
Artificial Intelligence Group of the French Radiology Society (Societé franc ̧aise de
radiologie-Groupe intelligence artificielle)
CERF:
French College of Radiology Teachers (Collège des enseignants en radiologie de France)
forrás: Artificial intelligence and medical imaging 2018: French Radiology Community white paper. Diagnostic and Interventional Imaging (2018), https://doi.org/10.1016/j.diii.2018.10.003
A mesterséges intelligencia (M.I./A.I.) alkalmazása folyamatosan növekszik számos területen. A leggyakoribb alkalmazási területek közé tartoznak a hangutasításon alapuló segédprogramok, a viselkedés alapú algoritmusok által irányított, valós idejű telefonbeszélgetéseknél alkalmazott programok, illetve a prediktív analízisen alapuló vásárlási útmutatók. Ez a fokozott fejlődés olyan úttörő innovációkhoz vezetett, mint a hangfelismerés, az automatikus fordítás, önvezető járművek, arcfelismerő rendszerek, katonai és civil robotok, illetve az egészségügyi képalkotó rendszerekben is alkalmazott mintafelismerő rendszerek. Az egészségügyben számos M.I. alkalmazás elérhető, vagy fejlesztés alatt áll. Az M.I. klinikai alkalmazása várhatóan jelentős következményekkel fog járni mind az egészségügyben dolgozók, mind a betegek számára. A radiológiának az egészségügyben játszott központi szerepe, társulva a digitalizáció és a „Képarchiváló és Kommunikáló Rendszerek” (Picture Archiving and Communication Systems (PACSs)) felvirágzásaával a digitális adathalmazok exponenciális növekedéséhez vezetett az elmúlt húsz évben. Az M.I. algoritmusok hozzárendelése ezen adathalmazokhoz optimalizálhatja az egészségügyi ellátás relevanciáját és minőségét, továbbá az egészségügyi rendszer hatékonyságát és elérhetőségét is növelheti. Olyan klinikai személyek lévén, akik a diagnosztikai és terápiás képalkotás szakértői vagyunk, úgy gondoljuk, hogy a radiológusoknak kell kezelnie ezen adat-vezérelt rendszereknek a klinikai hitelesítését, illetve formálni ezek klinikai implementációját, annak érdekében, hogy javítsuk a betegellátás menetét, és biztosítsuk az aktív megfigyelést. 2017 Októberén, a Francia Radiológus Társaság (Société Francaise de Radiologie) egy olyan M.I. csoportot állított fel, akiknek a feladata az volt, hogy reflektáljon a klinikai gyakorlatban bevetett M.I. rendszerek hatásaira, különös figyelemmel annak etikai, kutatási és szervezési oldalára. A csoportot a Francia Radiológiai Oktatói Főiskola (Collège des enseignants en radiologie de France [CERF]) szervezte, hogy megalkossák ezt az álláspontunkat tartalmazó értekezést, melyet folyamatosan bővíteni fogunk, hogy biztosítsuk a radiológiai közösség vezető pozícióját az M.I. rendszerek radiológiai alkalmazásával kapcsolatos döntéshozatalban Franciaországban. Ennek megfelelően a radiológusok fogják ezen új technológiák bevezetését irányítani, illetve elemezni ezen innovációk és a bevont szakértők hatását a klinikai munkafolyamatokon belül, azzal a céllal, hogy a betegek számára precíz, személyre szabott, a részvételt támogató, emberséges és magas minőségű kezelést biztosítsák. Ez az értekezés számos, a radiológia folyamatában résztvevő specialisták és számos egyéb diszciplinában dolgozók részvételével készült, mint a képalkotó informatikában dolgozók, mérnökök, biofizikusok és kutatók. Ezen értekezés céljai a következők: (i) M.I. alapelvek és terminológiák elemzése; (ii) szervezési alapelvek és problémák elemzése, melyek azon adathalmazok által léphetnek fel, melyek képek és egyéb társváltozókból állnak (a képvizsgálat relevanciája, a beteg állapota, jelentések állapota, nyomon követés helyzete és egyéb információk), melyeket metaadatokként ismerünk; (iii)Az M.I.-al kapcsolatos fejlesztések és kutatások frissítése; (iv) az M.I. alkalmazásának jelenlegi és potenciális lehetőségeinek megtárgyalása a klinikai képalkotás tekintetében; (v) radiológusok szerepének megállapítása az M.I. alkalmazásának oktatásában; (vi) az M.I. etikai és társadalmi hatásainak elemzése; (vii) alapelvek javaslata az M.I. képalkotás használatában. Amellett, hogy ez az értekezés frissíti Franciaország álláspontját a rohamosan fejlődő M.I. alkalmazásával kapcsolatban, a jövőben megírandó kiegészítő publikációk egy-egy specifikus problémára is kitekintenek majd, mint az egészségügyi adatok birtokjoga, a klinikai képalkotás és az M.I. témája, ill. ennek későbbi alkalmazási lehetőségei.
Terminusok meghatározása és bevezetés a mesterséges intelligenciába (M.I./A.I.)
Mesterséges intelligenciától az idegrendszer működéséig
Az M.I./A.I. minden olyan tudományos és technikai területet lefed, amely olyan gépeket alkalmaz, mely az emberi intelligencia utánzására, kiterjesztésére, vagy fejlesztésére képes. Az M.I. szoros kapcsolatban áll az információs technológia, a kognitív tudományok, statisztikák és algoritmusok fejlesztésével. Az A segédlet által nyújtott szószedet minden olyan kifejezést leír, melyet ez az értekezés használ. Az M.I. területén belül számos kutatási terület alakult ki. Az évek során a hosszasan megfigyelhető érdektelenséget (vagyis „M.I. telet”) többször váltották fel erős és kutatásokban intenzív időszakok. A média által közismertté tett M.I. fogalma a radiológiában egy specifikus alterületre vonatkozik, név szerint a gépek öntanulási képességére (1. ábra). A gépek öntanulásába magában foglalja Y (a címke, vagy kimenet) predikcióját D (bemenet) alapján egy olyan funkció használatával, melyek paramétereit a tanulási fázis alatt számítanak ki, és amelyet a teszt fázis alatt értékelnek ki, a tanulói fázisban használtaktól eltérő adatokkal. A teszt fázis értékeli az algoritmus generalizációs képességét (pl.: mennyire volt képes az algoritmus megtanulni a kívánt feladat elvégzését). Ez a teszt fázis rendkívül fontos, mivel ez határozza meg, hogy az algoritmus képes e pontos előrejelzéseket adni az új adat használatával. A teszt fázisban tapasztalható balsikerek általában túlillesztés következményei, amelyben az algoritmus csupán azokat az adatokat ismeri fel, amellyel már találkozott (pl.: megtanulta az adatkezelést, de nem tudja felismerni azt a rendszert, amely által az előrejelzést végrehajthatná). Pontosabban fogalmazva, a jelenleg radiológiában alkalmazott öntanulási rendszerek ellenőrzött tanuláson alapulnak. E folyamat során az algoritmusnak egy adathalmazt szolgáltatunk (bemenet; ez esetben képek) amelyeket külsőleg már feltérképeztünk és megjelöltünk a megfelelő címkékkel (kimenet; ebben az esetben a címkék, melyeket az M.I. előre jelez). A kimenet lehet kategorikus változó (osztályozási feladatok esetén, mint pl. az ACR értékek meghatározása egy mammográfiai kiértékelésénél), vagy egy folyamatos változó (regressziós feladatok során, mint pl. az agy kormeghatározása egy MRI vizsgálat során). A tanulási képesség lehetővé teszi a gépnek, hogy olyan feladatokat végezzen el, melyekre nem lenne lehetőség, ha az adatokat manuálisan kéne beprogramozni megadott paraméterekkel. Például szolgálhat az ilyen típusú feladatokra a kép, hang és szövegfelismerés. A tanuló feladatok végrehajthatóak felügyelet nélkül is, például csoportosítás során. A legismertebb csoportosítási feladat az Főelem analízis (Principal Component Analysis), mely során az egy, vagy több dimenzión alapuló mintákat felismerhetővé tesszük egy heterogén adathalmazon belül, mely által az adathalmaz eddig rejtett tulajdonságai is kiderülnek. Habár a csoportosító technikák nem tudnak olyan jól teljesíteni, mint az emberi intelligencia a klinikai képalkotás tekintetében, de hasznosnak bizonyulhatnak az adatfeldolgozás során fellépő részrehajlás (data bisases) esetén.
1-es ábra: A mesterséges intelligencia területeinek hierarchiája a szöveg szerint
A gépi öntanulás segítheti a klinikai képalkotásban szükséges feladatok automatikus végrehajtását. Ilyenek közé tartoznak például a rendellenességek detektálása (gép által segített detektálás, CADe), az észlelt rendellenességek karakterizációja (gép által támogatott diagnózis, CADx), és a szervi szegmentáció. A radiológiában használt gépi öntanulásra tipikus példa a pulmonáris nodulusok felismerése egy CT vizsgálat során. Az algoritmust ez esetben a CT képek szolgáltatják, melyeket úgy címkéztek fel, hogy mutasson, illetve, hogy ne mutasson nodulusokat. Minden ismételt vizsgálat során az algoritmus feldolgozza a képi adatot és jelzi, hogy látható e rajta nodulus, vagy sem. A javított, külsőleg megalkotott címkéket ez után betáplálják, majd az algoritmus belső paramétereit bekalibrálják, a teljesítmény maximalizálása végett. A folyamatot ezután megismétlik egy új példánnyal. Amint az algoritmus „megfelelő számú” példával találkozott, utána képes a megfelelő címkét felismerni egy új, korábban nem használt képen is, pl.: „pulmonáris nodulus igen: 90%/nem 10%) Jelenleg a mesterséges intelligencia által támogatott nodulus felismerés nagyszámú hamis-pozitív eredménnyel jár. A későbbi fejlesztések jó eséllyel képesek lesznek a nodulusok rosszindulatúságának felismerésére is. Az adathalmaz bővítése javíthat az M.I. képességein. Például a radiológia szemszögéből nézve, a pontosan címkézett képek segíthetnek (pl.: egy nodulus manuális szegmentációja során, vagy egy biopszia eredmény alapján). De mielőtt az algoritmus kialakítása és betanítása arra, hogy egy bizonyos típusú képet felismerjen megkezdődik, azelőtt a rendkívül időigényes adatgyűjtés és adatcímkézést végre kell hajtani, ha ugyanolyan, vagy jobb eredményeket akarunk elérni, mint amilyenre az emberi ítélőképesség alkalmas. A címkézés többé, vagy éppen kevésbé lehet kvalitatív értékű. Szegmentáció esetén például a radiológusnak kínkeserves munka által muszáj a tumor határait elkülöníteni. A megfelelő címke, melyet az M.I.-nek fel kellene ismernie, utána nagyfokú pontossággal felismertetik. De ez nem mindig van így. Az adatokkal foglalkozó kutatók (akik számszerű adatokkal, statisztikákkal, menedzsment informatikával és óriási adathalmazokkal dolgoznak különböző cégek számára), jóval gyengébb, kevésbé pontos és kevésbé jól strukturált adatokkal is képesek dolgozni. Például, habár egy radiológiai jelentés tartalmaz olyan információkat, amelyeket utána címkeként lehet kategorizálni (e.g. a tüdő egy adott szegmensén jelenlévő nodulus), de egy köztes adatfeldolgozási folyamat is szükséges ahhoz, hogy ezt egy olyan címkével azonosítsa, amely látható a képen. A pontosabb és strukturáltabb algoritmusok segítik annak feladatellátási képességét és csökkentik a szükséges adathalmaz méretét. A gépi öntanulásban használt algoritmus egy specifikus kategóriát is tartalmaz, mely jelenleg is jelentős fejlődést generál, nevezetesen a mély tanulás, vagy mély neurális feldolgozó rétegeket, melyet a hálózatban használnak.
Mélytanulás a klinikai képalkotásban
A tanuló algoritmusok közül a mély neurális hálózatok úttörőknek számítanak a feladatvégrehajtás tekintetében, különösen a klinikai képalkotás területén. Korábban a mintafelismerést tanuló rendszerek két részből álltak: egy kézileg programozott jellemző kiemelőből és egy tanuló algoritmusból a kép vizsgálata érdekében. Egy igen hasznos példája az automatikus karakterizációnak a tüdőben található nodulusok karakterizációja malignitásuk szerint. A kiemelő fázis során (i) szegmentálják a nodulust, majd (ii) kiválasztják és kiemelik a nodulus azon jellemzőit, melyek relevánsak a benignus és a malignus tumorok elkülönítésében, mint a tumor határvonala, tömöttsége, fejlődése, entrópiája és felületi érdessége/keménysége. Ezeket a jellemzőket vektorokba csoportosítják. A következő fázisban kiválasztják a vektorok feldolgozására alkalmas, öntanuló algoritmust, mely megfelelően osztályozza a nodulust. A képek szegmentációja és a releváns jellemzők kiválasztása különösen komplex feladatoknak számítanak, mely során számos hiba felmerülhet. Ugyanis közel lehetetlen bizonyítani, hogy az adott probléma megoldására az optimális jellemzők lettek e kiválasztva. A tekervényes neurális hálózatok döntő fontosságúak lehetnek ezen akadály ledöntésében (2. ábra), mivel alapvetően változtatják meg az eddigi paradigmát a két fázis egyesítésével pl.: úgy, hogy kiemelik és kategorizálják a képet. A kép jellemzőit ugyanis nem kell előre kiemelni a későbbi klasszifikáció érdekében. A mélytanuló hálózatok a kép pixeleit, vagy a kép egy-egy részét használják bemenetként, majd azt alakítják át több feldolgozó réteg által (innét jön a „mély” jelző) döntéshozásra és klasszifikációra (kimenet). Jó példa erre a ResNet 50, amely 50 feldolgozó réteggel dolgozik. A köztes, vagy rejtett rétegek felelősek a kép jellemzőinek kiemeléséért, melyeket nem a hálózat fejlesztője programoz be külön, hanem amelyet a gép saját maga tanul meg a próbafázis alatt betáplált adatcímkék elemzése által.
2. ábra: A gépi tanulás klasszikus lépései: a: kétlépcsős analízis b: az első általában az adat kiemelése, általában szegmentáció által, melyet a klasszifikáció követ; c: a gépi tanulást segítő algoritmusok közül az összetett neurális hálózatok paradigmaváltók, mivel kombinálják az első és a második lépés.
A folyamatot kezdettől végéig végrehajtja, a nyers adatok elemzésétől a kép klasszifikációjáig, amelyekben a köztes lépéseket a hálózat ellenőrzi. A neurális hálózatok működésének leírása viszont túlnőne ezen értekezés szűk keretein, bővebb információval számos internetes leírás szolgál. Összefoglalóan, a neurális hálózatok némi hasonlóságot mutatnak az emberi idegrendszerrel, mivel többszörösen kötött „mesterséges neuronokat” tartalmaznak. Minden neuron egy súlyozott mennyiségű (W, a funkciós paraméterek súlya a neuron számításai alapján) X bementet kap és Y mennyiségű kimenetet aktivál, amikor a mennyiség az előrejelzésben megadott határon túlmegy. A hálózat által alkotott előrejelzést (kimenet) ezután összehasonlítja a várt előrejelzéssel. A tanulási folyamat rendszeresen módosítja a „szinaptikus” W súlyt, hogy minimalizálja a hibalehetőségek arányát, amellyel egy olyan előrejelzést tesz, mely a legközelebb áll a várt eredményhez. A „mély” meghatározás a hálózat szerkezetére utal a számos rétegen. A köztes rétegeket rejtett rétegekként ismertek. Ez a szerkezeti egység lehetővé teszi a non-lineáris válaszok megalkotását egy-egy adott kérdésre, ami többréteges neurális hálózatként, vagy mély tanulási hálózatként ismert. A többszinten kapcsolódó neurális hálózatoknak két eredendő problémáját viszont érdemes kiemelni: (i) ezen hálózatok betanítására nagymennyiségű kézileg címkézett adatra van szükség, továbbá (ii) az előrejelzéseket nem lehet azonnal visszakövetni azon jellemzőkre, amelyeket az algoritmus kiemel, amelyet a neurális hálózatok „fekete dobozaként” ismernek.
Klinikai képalkotás adatai: Szervezés és fellépő problémák
Adatgyűjtés szervezése (Általános adatvédelmi szabályozások, Francia Gépi Adatkezelési és Szabadság rendelet, illetve a Francia „Jardé” törvény)
Mivel az M.I. rendszerek kutatása adatbázisokhoz kötött, ezért az Európai Általános Adatvédelmi Szabályozás (GDPR), melyet 2018. május 25.-én vezettek be Franciaországban, további változást hozott az M.I. kutatás fejlesztési lehetőségeiben. E mellett a Francia Computerizált Adat és Szabadság rendeletet (Loi Informatique et Libertés, amely modernizálta az egészségügyi rendszert) frissítették annak érdekében, hogy az adatalapú kutatásokat is figyelembe vegye. Végezetül pedig a Francia klinikai kutatói törvényeket is jelentősen módosították az utóbbi két évben. A „Jardé” törvény (amelynek beiktatási javaslatát 2016 novemberében nyújtották be, és amelyet számos alkalommal módosítottak) egy új struktúrát definiál, mely három különböző egészségügyi kutatásformát határoz meg: amelyeket direkt betegek útján végeznek, amit az egészségügyi adatok által végeznek és a biológiai minták alapján végzetteket. Azon adatok tanulmányozását, amelyek összegyűjtésénél és analízisénél nem volt szükség egyéni interakcióra, azok csak a Francia Computerizált Adattörvény és a Szabadság rendelet meghatározásai alá esnek. Ezen tanulmányok lehetnek retrospektívek, vagy prospektívek.
A betegektől felvett adatok szükségessége
A betegeket tájékoztatni kell, hogy adataikat ez esetben felhasználásra kerülnek kutatási célok érdekében. E végnél fogva minden betegnek egy írott dokumentumot kell átnyújtani, hogy biztosítsák, hogy a betegnek nincs ellenvetése adatai felhasználásával. az új törvény egy globális megegyezési folyamatot tesz lehetővé, mely esetben egyszer és mindenkorra engedélyezi adatai felhasználását kutatási célok érdekében. Amíg egy referens metodológiai eljárás elérhetővé nem válik (MR004), addig az MR003-as metodológia, melyeket a nem-beavatkozó jellegű tanulmányokra szabtak, addigis használatban marad. Minden más esetben a Francia Egészségügyi Kutatói, Tanulmányi és Értékelői illetékes Szakértői Bizottsághoz kell fordulni tanácsért (Comité d’expertise pour les recherches, les études et les évaluations dans le domaine de la santé, CEREES). A bizottságnak egy hónapon belül kötelessége választ küldeni a metodológiai eljárásról, az adatgyűjtés szükségességéről, a gyűjtött adat relevanciájáról, és a projekt tudományos értékéről. A beteginformációk szükségéről való lemondást lehet kérvényezni a CEREES-től. A CEREES, ha egy hónapon belül nem válaszol, akkor az beleegyezésnek megfelelő. Ezt követően a Francia Adatvédelmi Hatóságtól is engedélyt kell kérvényezni (Commission nationale de l’informatique et des libertés, CNIL). Francia törvénykezés alapján ez nem követel etikai bizottsági elismervényt az egészségügyi adatok hozzáféréséhez. Ez a tény az angol nyelvű kutatásokkal foglalkozó lapokkal konfliktust válthat ki, amelyek elutasíthatják azon tanulmányok kiadását, amelyeket nem ismertettek el az etikai bizottsággal. Az etikai bizottság szerepe ebben a felállásban továbbra is vita tárgyát képezi.
Átnevesítés szükségessége
Az adatbázisba gyűjtött adatot de-identifikálni kell (vagyis át kell nevesíteni). A klinikai képek egy különleges adatfajtának minősülnek, melyekhez elővigyázatosság szükséges. Emellett átnevesítési problémák is felléphetnek nemzetközi szinteken. A DICOM formátum tartalmazza a képről és a képalkotás technikájáról, a képalkotást végző centrumról, és a betegről is, amely szabadon eltávolítható (Dicom 1 és 2). A de-identifikáció egy jóval komplexebb és visszafordíthatatlanabb folyamat, amely minden kapcsolódási pontot eltávolít az „anonimizált” kép és az egyéb fájlok között, mint a védelem alatt álló egészségügyi információk és az adatmegosztó bejegyzések között, melyek a tanulmányokat a betegekhez kötik. Az agy és az arc volumetrikus akvizíció általi felszíni felépítése részletes képeket tud szolgáltatni a beteg arcáról, amely újra-azonosításra adhat lehetőséget. Egy ilyen újra-azonosítás az arcfelismerő technikák fejlesztésével is lehet segíteni. A de-identifikáció megelőzése érdekében „arctalanító” és a koponya feltáró technikákat kell alkalmazni egy agy, orr, fül, vagy torok rendellenességek vizsgálatára szánt, többközpontú tanulmány esetén.
Felelősség és a különböző engedélyek
Azon kötelezettségeken túl, amelyeket a francia és az európai szabályozások írnak elő a klinikai kutatásokra, a klinikai képalkotással kapcsolatos kutatások egy egyéni etikai és erkölcselméleti problémát alkotnak. Az adatbázisok felállítására és használatára születtek már útmutatók (B segédlet), amely garantálja az adatok minőségét és az egyenlőséget az adatot összegyűjtő és felhasználó felek között. A retrospektív és prospektív tanulmányok kissé más problémakört vetnek fel.
Elköteleződés az adat relevanciáját és minőségét tekintve
Am