Fonts de grans dades en medicina

Fonts de grans dades en medicina

Una definició senzilla de grans dades en medicina és "la totalitat de dades relacionades amb l'atenció i el benestar de la salut dels pacients" (Raghupathi 2014). Però, què són exactament aquests tipus de dades i d'on vénen?

A continuació es presenta una àmplia visió general dels tipus i fonts de grans dades d'interès per als proveïdors sanitaris, investigadors, contribuents, responsables polítics i la indústria.

Aquestes categories no són mútuament excloents, perquè les mateixes dades poden provenir de diverses fonts.

Tampoc aquesta llista és exhaustiva, perquè segurament l'aplicació pràctica de grans analítiques de dades continuarà expandint-se.

Sistemes d'informació clínica

Són fonts tradicionals de dades clíniques que els proveïdors de salut estan acostumats a visualitzar.

Dades de reclamacions dels pagadors

Els contribuents públics (per exemple, Medicare) i els contribuents privats tenen dipòsits grans de dades de reclamacions als seus beneficiaris. Alguns asseguradors de salut ara també ofereixen incentius per compartir les vostres dades de salut.

Estudis de recerca

Les bases de dades de recerca contenen informació sobre els participants de l'estudi, els tractaments experimentals i els resultats clínics. Els grans estudis solen estar patrocinats per empreses farmacèutiques o agències governamentals. Una aplicació de medicina personalitzada consisteix a unir pacients individuals amb tractaments eficaços, basats en patrons en dades d'assaigs clínics.

Aquest enfocament va més enllà de l'aplicació de principis de la medicina basada en l'evidència, pel qual un proveïdor de salut determina si un pacient comparteix característiques generals (per exemple, edat, sexe, raça, estat clínic) amb els participants en el procés. Amb grans analítiques de dades, és possible seleccionar un tractament basat en informació molt més granular, com el perfil genètic del càncer d'un pacient (veure a sota).

Els sistemes de suport a la decisió clínica (CDSS) també han estat desenvolupant-se ràpidament i ara representen una gran part de la intel·ligència artificial (AI) en medicina.

Utilitzen dades de pacients per ajudar els metges amb la presa de decisions i sovint es combinen amb EHR.

Bases de dades genètiques

El dipòsit de la informació genètica humana continua acumulant-se ràpidament. Des que el Projecte Genoma Humà es va completar el 2003, el cost de la seqüenciació de l'ADN humà s'ha reduït en un milió de vegades. El Projecte Genoma Personal (PGP), llançat el 2005 per Harvard Medical School, pretén seqüenciar i difondre els genomes complets de 100.000 voluntaris de tot el món. El propi PGP és un excel·lent exemple de gran projecte de dades a causa del gran volum i varietat de dades.

Un genoma personal conté uns 100 gigabytes de dades. A més de la seqüenciació de genomes, el PGP també recopila dades d'EHR, enquestes i perfils de microbiomes.

Diverses empreses ofereixen una seqüenciació genètica directa a consum per a la salut, els trets personals i la farmacogenètica en una base comercial.

Aquesta informació personal es podria sotmetre a grans analítiques de dades. Per exemple, 23andMe va deixar d'oferir informes genètics relacionats amb la salut a clients nous a partir del 22 de novembre de 2013 per complir amb l'Administració de Drogues i Aliments dels EUA. Tanmateix, el 2015, l'empresa va començar a oferir diversos components de salut de la seva prova de saliva genètica de nou, aquesta vegada amb l'aprovació de la FDA.

Registres públics

El govern manté registres detallats d'esdeveniments relacionats amb la salut, com ara la immigració, el matrimoni, el naixement i la mort. El Cens dels Estats Units ha recopilat gran quantitat d'informació cada 10 anys des de 1790. El lloc web d'estadístiques del Cens tenia 370 mil milions de cel·les a partir del 2013, amb aproximadament 11 mil milions més anuals.

Recerques web

La informació de cerca web recopilada per Google i altres proveïdors de cerca web podria proporcionar informació en temps real relacionada amb la salut de la població. Tanmateix, el valor de les grans dades dels patrons de cerca web es pot millorar combinant-lo amb fonts tradicionals de dades de salut.

Mitjà de comunicació social

Facebook, Twitter i altres plataformes de xarxes socials generen una gran varietat de dades al dia, oferint visions sobre les ubicacions, comportaments de salut, emocions i interaccions socials dels usuaris. L'aplicació de les grans dades de xarxes socials a la salut pública s'ha anomenat detecció de malalties digitals o epidemiologia digital. Twitter, per exemple, s'ha utilitzat per analitzar les epidèmies de grip entre la població general.

El projecte de benestar mundial que es va iniciar a la Universitat de Pennsilvània és un altre exemple d'estudi de mitjans socials per entendre millor l'experiència i la salut de les persones. El projecte reuneix psicòlegs, estadístics i informàtics que analitzen el llenguatge utilitzat quan interactuen en línia, per exemple, quan escriviu actualitzacions d'estat a Facebook i Twitter. Els científics observen com l'idioma dels usuaris es relaciona amb la seva salut i la seva felicitat. Els avenços en el processament del llenguatge natural i l'aprenentatge automàtic estan ajudant amb els seus esforços. Una publicació recent de la Universitat de Pennsilvània va estudiar maneres de predir la malaltia mental mitjançant l'anàlisi dels mitjans socials. Sembla que es poden detectar símptomes de depressió i altres condicions de salut mental estudiant el nostre ús d'Internet. Els científics esperen que en el futur aquests mètodes puguin identificar i ajudar millor als individus en risc.

Internet de les coses (IoT)

També es recullen i emmagatzemen dades massives d'informació relacionada amb la salut en dispositius mòbils i domèstics .

Transaccions financeres

Les transaccions amb targeta de crèdit dels pacients s'inclouen en els models predictius utilitzats per Carolinas HealthCare System per identificar pacients amb risc d'ingrés a l'hospital. El proveïdor d'atenció mèdica de Charlotte usa grans dades per dividir els pacients en diversos grups, per exemple, en funció de la malaltia i la ubicació geogràfica.

Implicacions ètiques i de privadesa

Cal destacar que, en alguns casos, hi pot haver implicacions ètiques i de privadesa importants a l'hora de recollir i accedir a dades en l'atenció sanitària. Les noves fonts de dades importants poden millorar la nostra comprensió del que afecta els individus i la salut de la població, però, els riscos diferents han de ser acuradament considerats i supervisats. També s'ha reconegut que les dades prèviament considerades anònimes es poden tornar a identificar. Per exemple, el professor Latanya Sweeney del Laboratori de privadesa de dades d'Harvard va revisar 1.130 voluntaris implicats en el Projecte Genoma Personal. Ella i el seu equip van poder nomenar correctament el 42% dels participants en funció de la informació que compartien (codi postal, data de naixement o sexe). Aquest coneixement pot augmentar la nostra consciència sobre els possibles riscos i ajudar-nos a prendre millors decisions per compartir dades.

> Fonts:

> Conway M, O'Connor D. Mitjans socials, grans dades i salut mental: avenços actuals i implicacions ètiques. Opinió actual en Psicologia 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Dades grans, resultats més grans. Diari de The American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Detecció de depressió i malaltia mental a les xarxes socials: una revisió integradora . Opinió actual en Ciències del comportament 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. La paràbola de la grip de Google: trampes en l'anàlisi de grans dades . Ciència 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Gran analítica de dades en salut: promesa i potenciació. Ciències de la informació i sistemes de salut 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identificar els participants en el projecte genoma personal per nom . Universitat de Hardvard. Laboratori de privadesa de dades. Llibre Blanc 1021-1. 24 d'abril de 2013.