Fonts de grans dades en medicina
Una definició senzilla de grans dades en medicina és "la totalitat de dades relacionades amb l'atenció i el benestar de la salut dels pacients" (Raghupathi 2014). Però, què són exactament aquests tipus de dades i d'on vénen?
A continuació es presenta una àmplia visió general dels tipus i fonts de grans dades d'interès per als proveïdors sanitaris, investigadors, contribuents, responsables polítics i la indústria.
Aquestes categories no són mútuament excloents, perquè les mateixes dades poden provenir de diverses fonts.
Tampoc aquesta llista és exhaustiva, perquè segurament l'aplicació pràctica de grans analítiques de dades continuarà expandint-se.
Sistemes d'informació clínica
Són fonts tradicionals de dades clíniques que els proveïdors de salut estan acostumats a visualitzar.
- Els registres mèdics electrònics (EHR) recopilen, emmagatzemen i mostren informació com ara dades demogràfiques, antecedents mèdics passats, problemes mèdics actius, immunitzacions, al·lèrgies, medicaments, signes vitals, resultats de proves de laboratori i radiologia, informes de patologia, notes de progrés creades per l'assistència sanitària proveïdors i documents administratius i financers
- Els registres mèdics electrònics (EMR) no són idèntics als EHR i solen pertànyer a dades emmagatzemades amb un metge en particular.
- Els intercanvis d'informació sanitària serveixen de nucli entre sistemes dispars d'informació clínica
- Els registres de pacients, mantinguts per organitzacions sanitàries en els seus propis pacients, estan sovint lligats a l'EHR. Altres registres realitzen immunitzacions, càncer, traumes i altres problemes de salut pública en una escala geogràfica més àmplia.
- Els portals del pacient permeten als pacients accedir a la informació de salut personal emmagatzemada en un EHR de l'organització de la salut. Alguns portals de pacients també permeten als usuaris demanar recanvis de receptes i intercanviar missatges electrònics segurs amb l'equip de salut.
- Els magatzems de dades clíniques agreguen dades del pacient a partir de múltiples sistemes d'informació clínica, com ara EHRs i altres fonts esmentades anteriorment
Dades de reclamacions dels pagadors
Els contribuents públics (per exemple, Medicare) i els contribuents privats tenen dipòsits grans de dades de reclamacions als seus beneficiaris. Alguns asseguradors de salut ara també ofereixen incentius per compartir les vostres dades de salut.
Estudis de recerca
Les bases de dades de recerca contenen informació sobre els participants de l'estudi, els tractaments experimentals i els resultats clínics. Els grans estudis solen estar patrocinats per empreses farmacèutiques o agències governamentals. Una aplicació de medicina personalitzada consisteix a unir pacients individuals amb tractaments eficaços, basats en patrons en dades d'assaigs clínics.
Aquest enfocament va més enllà de l'aplicació de principis de la medicina basada en l'evidència, pel qual un proveïdor de salut determina si un pacient comparteix característiques generals (per exemple, edat, sexe, raça, estat clínic) amb els participants en el procés. Amb grans analítiques de dades, és possible seleccionar un tractament basat en informació molt més granular, com el perfil genètic del càncer d'un pacient (veure a sota).
Els sistemes de suport a la decisió clínica (CDSS) també han estat desenvolupant-se ràpidament i ara representen una gran part de la intel·ligència artificial (AI) en medicina.
Utilitzen dades de pacients per ajudar els metges amb la presa de decisions i sovint es combinen amb EHR.
Bases de dades genètiques
El dipòsit de la informació genètica humana continua acumulant-se ràpidament. Des que el Projecte Genoma Humà es va completar el 2003, el cost de la seqüenciació de l'ADN humà s'ha reduït en un milió de vegades. El Projecte Genoma Personal (PGP), llançat el 2005 per Harvard Medical School, pretén seqüenciar i difondre els genomes complets de 100.000 voluntaris de tot el món. El propi PGP és un excel·lent exemple de gran projecte de dades a causa del gran volum i varietat de dades.
Un genoma personal conté uns 100 gigabytes de dades. A més de la seqüenciació de genomes, el PGP també recopila dades d'EHR, enquestes i perfils de microbiomes.
Diverses empreses ofereixen una seqüenciació genètica directa a consum per a la salut, els trets personals i la farmacogenètica en una base comercial.
Aquesta informació personal es podria sotmetre a grans analítiques de dades. Per exemple, 23andMe va deixar d'oferir informes genètics relacionats amb la salut a clients nous a partir del 22 de novembre de 2013 per complir amb l'Administració de Drogues i Aliments dels EUA. Tanmateix, el 2015, l'empresa va començar a oferir diversos components de salut de la seva prova de saliva genètica de nou, aquesta vegada amb l'aprovació de la FDA.
Registres públics
El govern manté registres detallats d'esdeveniments relacionats amb la salut, com ara la immigració, el matrimoni, el naixement i la mort. El Cens dels Estats Units ha recopilat gran quantitat d'informació cada 10 anys des de 1790. El lloc web d'estadístiques del Cens tenia 370 mil milions de cel·les a partir del 2013, amb aproximadament 11 mil milions més anuals.
Recerques web
La informació de cerca web recopilada per Google i altres proveïdors de cerca web podria proporcionar informació en temps real relacionada amb la salut de la població. Tanmateix, el valor de les grans dades dels patrons de cerca web es pot millorar combinant-lo amb fonts tradicionals de dades de salut.
Mitjà de comunicació social
Facebook, Twitter i altres plataformes de xarxes socials generen una gran varietat de dades al dia, oferint visions sobre les ubicacions, comportaments de salut, emocions i interaccions socials dels usuaris. L'aplicació de les grans dades de xarxes socials a la salut pública s'ha anomenat detecció de malalties digitals o epidemiologia digital. Twitter, per exemple, s'ha utilitzat per analitzar les epidèmies de grip entre la població general.
El projecte de benestar mundial que es va iniciar a la Universitat de Pennsilvània és un altre exemple d'estudi de mitjans socials per entendre millor l'experiència i la salut de les persones. El projecte reuneix psicòlegs, estadístics i informàtics que analitzen el llenguatge utilitzat quan interactuen en línia, per exemple, quan escriviu actualitzacions d'estat a Facebook i Twitter. Els científics observen com l'idioma dels usuaris es relaciona amb la seva salut i la seva felicitat. Els avenços en el processament del llenguatge natural i l'aprenentatge automàtic estan ajudant amb els seus esforços. Una publicació recent de la Universitat de Pennsilvània va estudiar maneres de predir la malaltia mental mitjançant l'anàlisi dels mitjans socials. Sembla que es poden detectar símptomes de depressió i altres condicions de salut mental estudiant el nostre ús d'Internet. Els científics esperen que en el futur aquests mètodes puguin identificar i ajudar millor als individus en risc.
Internet de les coses (IoT)
També es recullen i emmagatzemen dades massives d'informació relacionada amb la salut en dispositius mòbils i domèstics .
- Telèfons intel·ligents : milers d'aplicacions mHealth capturen informació sobre l'activitat física de l'usuari, la ingesta nutricional, els patrons de son, les emocions i altres paràmetres. Les aplicacions de telèfon mòbil natiu (per exemple, GPS, correu electrònic, missatges de text) també poden donar pistes sobre l'estat de salut d'un individu.
- Monitors i dispositius usables: els pedòmetres, els acceleròmetres, les ulleres, els rellotges i les fitxes incrustades sota la pell també recopilen informació relacionada amb la salut i també poden enviar-los al núvol.
- Els dispositius de telemedicina permeten als proveïdors d'atenció mèdica controlar els paràmetres dels pacients, com la pressió arterial, la freqüència cardíaca, la freqüència respiratòria, l'oxigenació, la temperatura, els traçats d'ECG i el pes.
Transaccions financeres
Les transaccions amb targeta de crèdit dels pacients s'inclouen en els models predictius utilitzats per Carolinas HealthCare System per identificar pacients amb risc d'ingrés a l'hospital. El proveïdor d'atenció mèdica de Charlotte usa grans dades per dividir els pacients en diversos grups, per exemple, en funció de la malaltia i la ubicació geogràfica.
Implicacions ètiques i de privadesa
Cal destacar que, en alguns casos, hi pot haver implicacions ètiques i de privadesa importants a l'hora de recollir i accedir a dades en l'atenció sanitària. Les noves fonts de dades importants poden millorar la nostra comprensió del que afecta els individus i la salut de la població, però, els riscos diferents han de ser acuradament considerats i supervisats. També s'ha reconegut que les dades prèviament considerades anònimes es poden tornar a identificar. Per exemple, el professor Latanya Sweeney del Laboratori de privadesa de dades d'Harvard va revisar 1.130 voluntaris implicats en el Projecte Genoma Personal. Ella i el seu equip van poder nomenar correctament el 42% dels participants en funció de la informació que compartien (codi postal, data de naixement o sexe). Aquest coneixement pot augmentar la nostra consciència sobre els possibles riscos i ajudar-nos a prendre millors decisions per compartir dades.
> Fonts:
> Conway M, O'Connor D. Mitjans socials, grans dades i salut mental: avenços actuals i implicacions ètiques. Opinió actual en Psicologia 2016; 9: 77-82.
> Fernandes L, O'Connor M, Weaver V. Dades grans, resultats més grans. Diari de The American Health Information Management Association 2012; 83 (10): 38-43
> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Detecció de depressió i malaltia mental a les xarxes socials: una revisió integradora . Opinió actual en Ciències del comportament 2017; 18: 43-49.
> Lazer D, Kennedy R, King G, Vespignani A. La paràbola de la grip de Google: trampes en l'anàlisi de grans dades . Ciència 2014; 343 (6176): 1203-1205.
> Raghupathi W, Raghupathi V. Gran analítica de dades en salut: promesa i potenciació. Ciències de la informació i sistemes de salut 2014; 2: 3.
> Sweeney L, Abu A, Winn J. Identificar els participants en el projecte genoma personal per nom . Universitat de Hardvard. Laboratori de privadesa de dades. Llibre Blanc 1021-1. 24 d'abril de 2013.