安徽医科大学医学数据分析与超算中心(筹)
Center for Medical Data Analysis and Supercomputing,Anhui Medical University
一、中心的简介
随着新工科,新医科的纵深发展,现代科学技术的日益综合和交叉学科的不断涌现,推动医工的深度交叉融合。我校医学及相关学科门类齐全,附属医院众多,拥有丰富的临床医疗数据,临床医学大数据的充分利用可在个人健康、医疗运营、医学研究、公共卫生等领域产生巨大的社会经济效益。目前,临床医学数据存放散乱、标准不统一、安全性差,无法高效地提取、共享和利用,造成了巨大的资源浪费,制约了医院医疗和科研发展。依托临床数据资源库,整合现有医疗数据资源,按照医疗数 据特性,对数据进行标准化处理和入库,构建临床医学数据知识仓库,基于Hadoop存储海量的医学影像数据、基因数据,提供并行的高效运算和非结构化数据的处理能力,实现低成本的存储和低时延、高并发的查询能力,基于大数据挖掘、自然语言处理和机器学习等技术,进行面向给药、医学影像、放疗的精准治疗研究。提供加强基础与临床学科间的交叉融合,设立可提供计算和技术支持服务的医学数据分析与超算中心具有重要的现实意义。
医学数据分析与超算中心是集中欧洲杯压住平台具有计算机、生物医学工程、电子信息等专业背景的师资力量,联合学校附属医院,依托临床资源数据库,在数据挖掘、移动医疗、智慧医疗、生物信息学等领域开展创新性研究的交叉学科平台。通过基础与临床的交叉融合,提高医疗资源使用效率,形成完善的临床科研数据支撑体系,构建患者的个性化诊疗方法,提升临床医疗水平和科研实力,探索服务医生、患者、科研、医院运营和卫生决策的大数据场景。
二、中心的架构、管理与人员
1.中心的架构与管理
中心实行课题组负责制,中心暂下设若干个课题组,实行课题组组长负责(PI)制,课题组负责人负责各自得实验室得安全与课题运转。为了更好的发挥现有人员的作用,中心实行全员参与管理。
2.中心的科研力量与课题组:
中心骨干人员:钱海生、杨飞、王常青、彭振皖、刘光丽、王霞、卜俊杰等。
3.中心的科研方向
建设具有医学特色的精准医学大数据平台,整合现有医疗数据资源,按照医疗数据特性,对数据进行标准化处理和入库,构建医疗数据知识仓库。基于大数据挖掘、自然语言处理和机器学习等技术,进行面向给药、医学影像、放疗的精准治疗研究。将人工智能与传统医学方法紧密结合,科学解读与人体机能和疾病相关的生物医学大数据,在精准医学大数据平台实现“在正确的时间,为正确的人,使用正确的药物”的精准医疗服务。
1)精准医学大数据平台
a.大数据平台构建:设计先进的分布式数据存储与软件计算架构,满足PB级医学数据的存储;研究大数据复杂计算问题的高性能并行算法以及并行算法到实际处理器的映射技术;研究存储容量动态扩充、备份容灾技术;研发符合HL7、DICOM、ICD-10、SNOMED CT标准的精准医学数据采集工具,实现对多源数据的清洗、转化等操作;基于Hadoop存储海量的医学影像数据、基因数据,提供并行的计算和非结构化数据的处理能力,实现低成本的存储和低时延、高并发的查询能力,支持下一代企业级计算关键技术的大数据处理平台。
b.知识库构建:基于自然语言处理技术,开发精准医学本体协同加工系统,实现多源的异构异型词表导入与关联;开发精准医学本体和语义网络共享服务接口,形成标准化、结构化的精准医学本体元数据集,为知识库建设提供灵活的组件模块;通过跨库融合、大数据网络特征分析、模型特征抽取等手段,整合多种生物信息数据,构建涵盖“基因-通路-疾病-症状-诊疗-药物”关联关系的精准医学知识图谱;建立面向文本和组学数据自动注释与融合的流程,基于多维度的证据进行人工审编,形成精准医学知识库;对接“精准医学大数据平台”,实现个性化检索、展示和自动更新,支撑面向精准医学的知识服务。
2)基于大数据挖掘的精准治疗研究
a.精准给药:对大样本人群与特定疾病类型进行生物标记物分析与鉴定,找到病因和治疗靶点,并对疾病的不同状态和过程进行精确分类,提供个性化生物和靶向治疗所需信息;对患者数据中已知药物反应和临床结果进行数据挖掘,构建模型预测靶向受体及指征,分析药物药效、敏感性及副作用等情况,整合药品不良反应知识;评估药物的代谢动力学和毒理学特性,解读患者个体基因密码,构建具有特异性的药物递送系统,制定针对疾病和患者自身特征的个体化精准给药方案和最佳治疗方法。
b.精准医学影像:将海量形态学影像转换为可挖掘的数据信息,通过高通量定量分析,提取高维度特征数据定量描述病变的属性,建立影像特征与基因特征的相关性,为精准治疗提供分子与基因水平的生物学信息;对放射学特征数据和基因表型数据进行存储、检索和分析,构建多学科的放射组学数据库,用于评估疾病预后;利用医学图像三维可视化技术,开发图像引导下的手术导航系统,辅助手术治疗。
c.精准放疗:采集和分析肿瘤患者的临床大数据,根据患者体位和肿瘤部位的不同,在模拟定位、靶区勾画、计划设计、计划验证和治疗实施等阶段,实现全流程自动化的精准治疗,缩短放疗时间,精准打击病灶,避免对正常组织产生不必要的伤害。
3)面向精准医疗服务的智能技术研究
a.精准医疗服务体系研究:研究利用生物学、行为学、社会经济学、流行病学等数据来制定和实施适合特定个体或群体的策略;借助基因测序平台、电子病历等系统收集患者的分子和临床信息,利用生物信息学分析工具对信息进行编辑、处理、整合及应用,形成临床诊断报告,帮助医生精确地预测疾病情况;基于诊断结果,合理选择患者的分子生物信息,对其进行精确的个体化治疗;依据疾病类型和基因特征研发靶向特异性药物,参考个体差异指导用药;通过收集与患者健康状况相关的数据信息以及记录分析患者个人主观性陈述的需求或偏好,实现以患者需求为中心的护理服务。
b.精准医疗服务模式的研究与应用:基于数据驱动的新型医疗服务模式,依托现代人文医学模式,使用证据进行决策,实施多要素均衡策略,从全局性角度进行优化,实现服务模式的相对确定性、预见性和可控性,能够更精确找出病因、更高质量诊断、为患者提供更精准治疗方案,确保医疗质量与安全的同时,消除医疗信息不对称,降低医疗创伤与医疗费用。
c.精准医疗服务应用支撑技术体系研究:通过统计学、分子生物学、计算机科学等领域的方法和软件,结合组学技术,开展队列和疾病研究,分析生物样本库中的生物样本,发现和验证生物标志物;利用生物信息学技术存储和分析生物数据,开展基因组学、蛋白质组学、蛋白质空间结果模拟、药物设计等研究,结合患者信息和实验结果,发现蛋白质、基因、代谢产物等生物标志物,确定药物设计和诊疗方案;利用数据挖掘、本体等大数据分析技术方法,对精准医学大数据平台中存储的数据进行转化规约,为患者、医生、生物制药公司等不同用户提供可视化服务。