Jövőbeli digitalizálás a Big Data-tól az Smart Data -ig

München 2020.01.04

Grafikon technológia: a nagyadattól az intelligens adatig?

Ha az adatok "okosak", akkor ennek megfelelően kell elkészíteni őket. Korábbi probléma: Az adatok nagyon heterogének, gyakran strukturálatlanok és különféle adatbázisokban (adat silókban) különböző helyeken szunnyadnak. Ezenkívül az információk általában nem kereshetők vagy nagyon nehezen kereshetők.

Alexander Jarasch

Az elrejtett kincsek visszaszerzése és hipotézisek levezetése érdekében az adatoknak hozzáférhetőnek, interoperábilisnak és kereshetőnek kell lenniük - a „big data” csak akkor alakítható „intelligens adatká” a modern informatikai megoldások segítségével. Pontosan ezen dolgozik a müncheni német cukorbetegség-kutató központ (DZD) „Grafikonok a cukorbetegség elleni küzdelemért” projektje a gráftechnika segítségével. A csapat reméli, hogy az adatok összekapcsolása és szisztematikus elemzése is beletartozik A személyre szabott megelőzés és terápia hipotézisei. Még egy olyan forró téma kapcsán is, mint a Covid-19 fertőzések, a grafikon technológia olyan kapcsolatokat hozhat létre, amelyek rejtve maradhatnak e módszer nélkül. Egy interjúban Dr. Alexander Jarasch, hogyan működik.

Dr. Alexander Jarasch, München

Dr. Jarasch, világszerte nagyon nagy adatbázis létezik a cukorbetegségről. Mi a probléma ezzel?
Sokféle alapkutatási szakterület, állatkísérlet, egyetemi epidemiológiai vizsgálat és egyetemi kórházak klinikai tanulmányainak adatai állnak rendelkezésre. Az így keletkezett adatokat azonban általában úgynevezett adattárolókban rögzítik, azaz Excel táblákba, szöveges fájlokba vagy ideális esetben adatbázisokba. Ezeket az adatokat ilyenkor nem vagy csak nagyon kezdetleges módon kapcsolják össze. Éppen ezért nehéz kapcsolatot létesíteni különböző kutatási projektek között, amelyek mindegyike különböző módon foglalkozik a cukorbetegséggel.

És itt jön be a gráf technológia?
Egyetértek. A gráf adatbázisokban az adatok natív módon kapcsolódnak, úgynevezett csomópontokként és élekként. Például: Elmentem a BMI-t, a magasságot és így tovább a beteg személyi csomópontján. Ha ezután egy kísérletet végeznek ezen a páciensen, amelynek során például vért vesznek és megmérik a HbA1c értéket, létrehozok egy új csomópont "vérvételt". Ezen mentem a vérminta mennyiségét, a HbA1c értéket, amelyet XY hűtőszekrényben tárolunk stb. A "Személy" és a "Vérvétel" csomópontokat ezután egy él köti össze. Akkor közvetlenül látom például, hogy az embernek milyen HbA1c értéke van, milyen BMI-je van, és hol tárolják a mintát. Most kereshetem az emberek közötti hasonlóságokat, és így hipotéziseket tehetek a kapcsolatokról. És minél több adatot táplálok a grafikon adatbázisba, annál valószínűbb, hogy összefüggéseket vagy mintákat találok.

Hogyan használja ezt a technológiát a DZD-ben?
Például a helyünk, a fegyelem és a fajok közötti lekérdezés a kísérletekről és a mintákról. Martin Hrabě de Angelis, a DZD igazgatósági tagjának, a DZD „adatkatalógusának” elképzelése volt. Ezzel viszonylag egyszerűen meghatározhatjuk: Hol vannak az adatok tárolva? Szabad-e egyáltalán veled dolgozni adatvédelmi okokból? És hány mintám van? Tegyük fel, hogy egy egérrel végzett kísérletben 20 egérrel szeretnék statisztikai kimutatást tenni egy paraméterről. A szám azonban nem elegendő statisztikailag szignifikáns állításokhoz. A grafikon adatbázisban láthattuk, hogy 5800 egeret mértek ugyanezzel a paraméterrel a DZD egy másik helyén - és ezt az adatot egyesíthetem.

Nem válik a rendszer egyre zavaróbbá, minél több adat egyesül?
Nem. A trükk az, hogy rendelkezünk olyan interaktív felülettel, amelyet informatikai háttérrel nem rendelkező orvosok és tudósok használhatnak a tájékozódáshoz. Csúsztathatja előre és hátra a csomópontokat és az éleket, széthúzhatja őket a részletek és az összekapcsolt csomópontok megtekintéséhez, behajthatja őket az összkép megtekintéséhez. Ily módon teljesen új adatelemzések működtethetők interaktív módon. Ha a csomópontok és élek száma jelentősen megnő, akkor nagyon egyszerű lekérdezési nyelvvel küldhet lekérdezéseket az adatbázisba.

A grafikon technológiával különböző klinikai képek kutatási adatait is összekapcsolhatja?
Ez a következő lépés. Mivel a technológia univerzálisan használható, és könnyen bővíthető vagy módosítható. A számítógépek számítási teljesítménye pedig akkora, hogy hatalmas mennyiségű adat dolgozható fel. Jelenleg van egy kísérletünk más német egészségügyi kutatóközpontokkal 1,8 milliárd csomópont és 3,9 milliárd éllel!

Miről szól ez a kísérleti projekt?
A cukorbetegség lehetséges következményeiről van szó. Például az egyik meglehetősen agresszív májrák. Most felmerül a kérdés: Vannak-e olyan betegek adatai vagy állatmodellek, amelyek cukorbetegségre utalnak rákra vagy fordítva? Például genetikai hiba, környezeti tényező, bizonyos életmód? A gráftechnika alkalmazási lehetőségei végtelenek. Ezért a jövőben egyre fontosabb szerepet játszik.

Köszönöm az interjút, Dr. Jarasch!

Több információ

A grafikon technológiájáról a D.U.T 2020. jelentés 160. oldalán olvashat bővebben a "Hálózati adatok a jövőbeli cukorbetegség kutatásához" cikkben, amelyet dr. Alexander Jarasch, Dr. Astrid Glaser és Prof. Dr. Martin Hrabě de Angelis.

További információt talál a "Grafikonok a cukorbetegség elleni küzdelemről" projektről, amelyet a bytes4diabetes Award 2. helyezettjével díjaztak, ITT.