当前位置: 首页 > 新闻 > 国际新闻
国际新闻
通过空间研究对抗癌症
发布时间: 2016-10-14     来源: 麦肯息讯

喷气推进实验室(JPL)和国家癌症研究所更新了大数据合作关系

资料来源:美国国家航空和航天管理局/喷气推进实验室

概要:

在过去的15年中,由在加利福尼亚帕萨迪纳NASA的JPL率先推出的大数据技术已彻底变革了生物医学研究。2016年9月6日,JPL和美国国家癌症研究所(NCI)——国立卫生研究院的一部分——更新了到2021年的合作研究关系,延伸了源于太空探索的数据科学的发展,并且目前支撑着新的癌症研究发现。

一直以来人们都使用那些可以被教导认识天体物理相似性的机器学习算法来分析NGC 3718、NGC 3729和其他星系。同样的技术目前也被应用于癌症图像识别。

来源:卡塔利娜航天调查,亚利桑那州大学,以及卡特琳娜实时瞬态调查,加州理工学院

每天,NASA的航天器都会发射数百拍字节的数据,所有这些数据都必须经过编纂、存储并且发布给世界各地的科学家。人工智能也日益有助于“读取”这类数据,并且强调了科学家可能错失的数据集之间的相似性。

NCI支持的早期检测研究网络(EDRN)是分享特定癌症相关的生物标志物、化学或遗传特征的匿名数据的生物医学研究人员的一个联合组织。他们的目标是将所有的研究数据汇集到一个单一的、可搜索的网络中,最终目的是将他们的集体工作转变为癌症或癌症风险的早期诊断技术。

在他们合作期间,JPL和EDRN的工作已经产生了六个新的食品和药物监督管理局批准的癌症生物标志物,以及九个批准用于临床实验改善实验室的生物标志物。FDA已经批准了这些生物标志物用于癌症研究和诊断。这些机构批准的生物标志物已被用于世界各地超过100万患者的诊断测试。

“在EDRN于2000年成立之后,该网站需要专业意见从多个有关癌症生物标志物的研究中获取数据,并为科学家创建一个单一的、可搜索的研究结果网站,”NCI癌症生物标志物研究组织兼EDRN的的负责人Sudhir Srivastava称。JPL有着几十年为NASA进行类似工作的经验,NASA的飞船会发送出数百拍字节的数据,以进行编纂、存储并且发布给世界各地的科学家。

JPL与加利福尼亚帕萨迪纳的加州理工学院开展的数据科学和技术中心项目的负责人Dan Crichton帮助建立一个JPL基础信息中心,该中心致力于支持EDRN的大数据工作。在更新的伙伴关系下,JPL将向研究扩大其数据科学工作,并且为额外的NCI资助的项目应用技术。这些项目包括EDRN、筛查检测型操作分子和细胞特征的联合,以及癌症研究计划的信息技术。

“从NASA的立场来看,开发能够利用常见方法论方法同时支持探索空间的任务和癌症研究的新数据科学能力存在着显著的机遇,”Crichton说。“我们拥有一个很好地机会完善这些技术,培育JPL的数据科学技术,同时服务于我们的国家。”

Crichton说,当涉及从原始观测获得数据得出科学结论时,JPL已经领导了其发展方向。举个例子:JPL经常要处理各种传感器的测量数据——比如相机和质谱仪。这两者都可以用来研究一颗恒星,行星或类似的目标对象。但是,读取一个非常不同的仪器的数据将需要特殊的软件来进行识别。

在癌症研究中存在着类似的问题,从不同生物医学测试或仪器中读取数据需要与另一个测试或仪器相互关联。对于这种情况,数据必须是标准化的,并且算法必须是能被“教导”以了解它们在寻找些什么。

自成立以来,EDRN的主要挑战就是获得访问。美国各地的研究中心拥有大量的生物标志物标本,但每个中心都有自己标注、存储和共享数据集的方式。十个网站可能具有高质量的可供研究的样本,但如果他们的共同数据元素——患者的年龄、癌症类型和其他特性——不能一致上传,那么它们基本上就不能用来进行研究。

“我们并不清楚它们是早期还是晚期的标本,或是否尝试过任何水平的治疗方法,”Srivastava说。“但JPL告诉我们,‘我们一直在做这类工作!这就是我们管理我们的行星数据系统的方式’。”

随着网络的发展,增加了许多机构性成员,其中包括达特茅斯学院盖泽尔医学院;哈佛医学院麻省总医院;斯坦福NIST基因组尺度测量组;德克萨斯大学安德森医博士癌症中心以及众多其他机构。

NCI癌症生物标志物研究组的项目主管Christos Patriotis说,该网站的成员目前包括来自英国、中国、日本、澳大利亚、以色列和智利的国际研究员。

“我们扩张越大,就会整合越多的数据,”Patriotis说。“与成为发射井不同,现在我们的合作伙伴可以整合他们的研究结果。每一个系统都能够与其他系统交谈。”

随着JPL和NCI的合作进展,接下来的步骤包括:图像识别技术,如帮助EDRN存档癌症样本图片。这些图片可以通过计算机视觉进行分析,这也是目前用于识别星团和其他天体物理学研究的相信性的技术。

在不久的将来,Crichton说,机器学习算法可以通过相似图片的归档比较CT扫描,根据患者的年龄、种族背景和其他人口统计寻找癌症的早期迹象。

“随着我们开发更多的自动化图像检测和图像特征分类的方法,我们就能够看到了提高数据发现的巨大机遇,”Crichton说。“我们拥有将运用于天文图像的功能检测的算法转移到生物学或反向转移的例子。”

想了解这项研究的更多信息,请访问:http://edrn.cancer.gov

Caltech为NASA管理JPL

代理服务