当前位置: 首页 > 新闻 > 国际新闻
国际新闻
QB 期刊 |人类细胞图谱计划可重复性的案例分析
发布时间: 2019-05-31     来源:

2019年5月25日,由清华大学发起的“2019国际单细胞组学中国峰会”在清华科技园国际会议中心顺利召开。本次峰会是我国主办的以人类细胞图谱(HCA)为目标的第一次国际学术会议。HCA是一项被Facebook创始人马克·扎克伯格称为可与“人类基因组计划”媲美的国际科研项目,旨在为健康人体中所有细胞类型的分子特征构建一套全面的“谷歌地图”。

本次会议由清华大学自动化系教授、北京信息科学与技术国家研究中心生物信息学研究部主任,也是HCA首批入选项目的唯一一位中国科学家——张学工主持。会议还邀请到了HCA计划的双发起人之一、美国科学院院士、MIT/哈佛大学伯德研究所(BroadInstitute)的Aviv Regev教授出席会议并作大会主题报告,来自美国、英国、日本和中国的18位本领域代表性学者作大会报告或参加圆桌论坛。峰会得到了全国和国际同行的高度关注,现场参会和远程观看视频直播的学者超过4500人。在本次峰会中的一个重要环节是就HCA领域的技术标准、科学伦理、数据共享和全球合作等重要议题开展的圆桌论坛。

      近期,张学工教授团队根据目前HCA构建过程中涉及到的生物信息学处理的技术标准问题,在Quantitative Biology期刊中发表了“A case study on the detailed reproducibility of a human cellatlas project” [1]的文章(请点击下载全文)。文章提到,HCA作为未来其他研究的参考,保障其可重复性至关重要。在HCA构建过程中,除了需要使用不同的单细胞测序技术和平台外,还会涉及复杂的生物信息学分析流程。生物信息学处理中的一些细微差异可能会导致所得图谱的显著差异。因此,在HCA构建过程中一定要多关注生物信息处理过程中的一些细节问题,保证生信分析的可重复性。



文章概要
构建细胞图谱涉及的主要生物信息学流程包括细胞和基因的筛选、归一化、去除批次效应、降维和聚类等,不同的处理步骤有不同的方法及相应的参数,方法和参数的选取往往需要根据不同的问题和数据做多次尝试和调整,所有这些琐碎的步骤都可能影响最终构建的图谱。相反,这些记录的缺失也都可能成为复现一个细胞图谱的障碍。

在本文中,作者选取的人类树突细胞图谱的工作[2]对整个生物信息学分析流程有较为详细的描述,并对关键的分析步骤提供了相应的代码。作者根据文中提供的材料进行了逐步的复现与比较。结果显示,原文中重要的生物发现(一个新的细胞类型和两个细胞亚型)都得到了验证,但复现得到的细胞图谱却和原文的结果有些细微的差别。这说明,与传统的以生物发现为导向的研究相比,人类细胞图谱需要更多的实验细节来保证其可重复性。近期有不少关于规范发表习惯以保证文章可重复性的讨论[3-5],本文得到的实验观察为将来制定人类细胞图谱论文发表规范提供了材料和依据。


                           图1 对人类树突细胞图谱的复现和比较

                         
参考文献:
[1] Hua, K., & Zhang, X. (2018). A case studyon the detailed reproducibility of a human cell atlas project. QuantitativeBiology, 1-8.
[2] Villani, A. C.,Satija, R., Reynolds, G., Sarkizova, S., Shekhar, K., Fletcher, J., ... &Jardine, L. (2017). Single-cell RNA-seq reveals new types of human blooddendritic cells, monocytes, and progenitors. Science, 356(6335),eaah4573.
[3]Baker, M. (2016) Is there a reproducibility crisis? Nature. 533,452–454
[4] Berg, J. (2018) Progress on reproducibility. Science, 359, 9
[5] Stark, P. B. (2018) Before reproducibility must come preproducibility. Nature,
代理服务