A taxonomy of tools and approaches for distributed genomic analyses
Artículo de revista
2022
Elsevier Ltd
Biometría
Biometry
Análisis de la información
Information analysis
Investigación biomédica
Biomedical research
Tecnología médica
Medical technology
Distributed biomedical analyses
Análisis biomédicos distribuidos
Fully distributed collaborations
Colaboraciones totalmente distribuidas
Reproducibility
Reproducibilidad
Scalability Multi-site analyses
Análisis de escalabilidad multisitio
Distributed workflow analyses
Análisis de flujo de trabajo distribuido
Biometry
Análisis de la información
Information analysis
Investigación biomédica
Biomedical research
Tecnología médica
Medical technology
Distributed biomedical analyses
Análisis biomédicos distribuidos
Fully distributed collaborations
Colaboraciones totalmente distribuidas
Reproducibility
Reproducibilidad
Scalability Multi-site analyses
Análisis de escalabilidad multisitio
Distributed workflow analyses
Análisis de flujo de trabajo distribuido
The amount of biomedical data collected and stored has grown significantly. Analyzing these extensive amounts of data cannot be done by individuals or single organizations anymore. Thus, the scientific community is creating global collaborative efforts to analyze these data. However, biomedical data is subject to several legal and socio- economic restrictions hindering the possibilities for research collaboration. In this paper, we argue that researchers require new tools and techniques to address the restrictions and needs of global scientific collaborations over geo-distributed biomedical data. These tools and techniques must support what we call Fully Distributed Collaborations (FDC), which are research endeavors that harness means to exploit and analyze massive biomedical information collaboratively while respecting legal and socio-economical restrictions. This paper first motivates and discusses the requirements of FDCs in the context of a research collaboration on the development of diagnostic and predictive tools for the risk of intracranial aneurysm formation and rupture (the ICAN project). The paper then presents a taxonomy classifying the current tools and techniques for biomedical analysis with respect to the proposed requirements. The taxonomy considers three key architectural features to support FDC scenarios: data and computation placement, Privacy and Security, and Performance and Scalability. The review reveals new research opportunities to design tools and techniques for multi-site analyses encouraging scientific collaborations while mitigating technical and legal constraints. La cantidad de datos biomédicos recopilados y almacenados ha aumentado significativamente. El análisis de estas grandes cantidades de datos ya no lo pueden realizar individuos ni organizaciones individuales. Así, la comunidad científica está creando esfuerzos colaborativos globales para analizar estos datos. Sin embargo, los datos biomédicos están sujetos a varias restricciones legales y socioeconómicas que obstaculizan las posibilidades de colaboración en investigación. En este artículo, sostenemos que los investigadores necesitan nuevas herramientas y técnicas para abordar las restricciones y necesidades de las colaboraciones científicas globales sobre datos biomédicos geodistribuidos. Estas herramientas y técnicas deben respaldar lo que llamamos Colaboraciones Totalmente Distribuidas (FDC), que son esfuerzos de investigación que aprovechan los medios para explotar y analizar información biomédica masiva de manera colaborativa respetando las restricciones legales y socioeconómicas. En primer lugar, este artículo motiva y analiza los requisitos de los CDF en el contexto de una colaboración de investigación sobre el desarrollo de herramientas de diagnóstico y predicción del riesgo de formación y rotura de aneurismas intracraneales (el proyecto ICAN). Luego, el artículo presenta una taxonomía que clasifica las herramientas y técnicas actuales para el análisis biomédico con respecto a los requisitos propuestos. La taxonomía considera tres características arquitectónicas clave para admitir escenarios FDC: ubicación de datos y cálculos, privacidad y seguridad, y rendimiento y escalabilidad. La revisión revela nuevas oportunidades de investigación para diseñar herramientas y técnicas para análisis multisitio que fomenten colaboraciones científicas y al mismo tiempo mitiguen las limitaciones técnicas y legales.
Descripción:
A taxonomy of tools and approaches for distributed genomic analyses.pdf
Título: A taxonomy of tools and approaches for distributed genomic analyses.pdf
Tamaño: 1.784Mb
PDF
Título: A taxonomy of tools and approaches for distributed genomic analyses.pdf
Tamaño: 1.784Mb