华大正式发布基因变异检测算法大赛与区块链平台
5月27日下午,2018中国国际大数据产业博览会“生命大数据高峰论坛——数聚生命 • 智惠未来”在贵阳国际生态会议中心2F舞阳河厅正式召开。据悉,本次活动由贵阳国家高新区管委会与深圳华大基因科技有限公司(以下简称“华大”)联合主办。贵州省科技厅副厅长彭勃、省教育厅副厅长王红红、贵阳市人民政府副市长魏定梅,华大董事长汪建,华大执行副总裁、贵州华大董事长路军等相关领导出席本次活动。
在本次论坛的第二阶段,华大以“生命大数据的演算与区块链”为主题,结合当下热点的深度学习与区块链等前沿技术,探讨生命大数据的智能应用、隐私保护与安全共享。该阶段包含了首届“BGI CUp”基因变异检测算法大赛启动仪式、华大区块链平台暨《华大区块链白皮书V1.0》发布会、“基因大数据隐私保护与安全共享”圆桌对话三个环节。
【华大智造举办首届“BGI CUp”基因变异检测算法大赛 面向全球征集超高精度的基因变异检测模型】
图 华大智造COO、华大生命科学研究院执行副院长蒋慧演讲
深圳华大智造科技有限公司(以下简称“华大智造”)COO、深圳华大生命科学研究院执行副院长蒋慧宣布首届“BGI CUp”基因变异检测算法大赛正式启动。
蒋慧表示,基因大数据的爆发增长也对传统生物信息分析的方法学带来了挑战。与传统GATK生物信息分析流程相比,以深度学习为代表的算法,正在基因组大数据分析的领域显示出诸多应用潜力。
“BGI CUp”基因变异检测算法大赛是由华大智造主办,面向全球征集超高精度的基因变异检测模型的年度系列赛事。本次比赛所用的训练集与测试集均是基于华大智造自主研发的MGISEQ系列测序仪生产的全外显子组(WES)和全基因(WGS)测序数据。此外,主办方将为参赛者部署GpU集群,并提供算法框架与技术指导。华大将为参赛者提交的算法模型在多节点做区块链存证,确保比赛公平公正。比赛将接受团队报名形式(3-6人),分为初赛与决赛两个阶段。具体报名信息请登陆大赛官网(http://bgicup.mgitech.cn)了解详情。
【华大正式发布区块链平台 打造组学数据共享交互基础设施】
图 华大区块链负责人杨梦演讲
华大区块链负责人杨梦介绍了华大区块链的项目发展,并发布了《华大区块链白皮书V1.0》(以下简称“《白皮书》”)。
作为全球领先的基因组学研发机构,华大创造性地提出了以“大人群生命组学大数据(2B4D)”的方法论来认识生命,即从DNA开始,遵循生命中心法则,从基因组到蛋白组到跨组学贯穿,从微观到宏观,从生到死的跨尺度、多维度、多模态、全方位、全周期的海量全景式生命大数据解读。此外,由华大参与发起的“地球生物基因组计划(EBp)”日前正式对外发布,旨在通过数字化地球,认知生物多样性与物种演化、进化的物质基础。本届数博会的主题是“数化万物,智在融合”。华大正是希望和合作伙伴一起数字化生命,数字化地球,为掌控万物生长,探索生命起源,掌控生老病死奠定基础。万物相形以生,众生互惠而成。这与区块链所倡导的分布式价值交换不谋而合。
随着华大在测序仪等核心工具上的突破,使得高效低成本的基因技术应用于大人群的疾病防控成为可能。华大已在深圳、长沙、阜阳等城市开展全市范围内的孕妇无创产前基因检测,累计完成超过三百万例的孕妇基因检测。在贵州的黔西南及毕节等地区,华大累计完成了十万余例的无创产前基因检测、宫颈癌HpV病毒检测、新生儿遗传性疾病检测等民生项目。面对海量的生命大数据,如何与政府、医疗机构等各方共有、共享、共为,在确保数据安全和隐私保护的前提下进行大数据挖掘,为大人群提供全方位、全周期的服务,是华大的核心要务。
作为一种集合分布式存储、点对点传输、共识机制、加密算法等技术的创新式应用,区块链为个人数据自治和跨机构共享交换提供了全新的解决方案。杨梦表示,通过应用区块链和现代密码学技术,搭建组学数据共享基础设施,在确保生命大数据的数据安全与隐私保护的前提下,促进数字化生命的价值流动,具有重大意义。华大自2018年起开始布局区块链,目前已应用于员工及其家属跨组学数据的隐私保护与安全共享,并且以健康积分的形式正向激励个人健康提升。华大希望通过逐步将生产级的联盟链BaaS开放给外部合作伙伴,以隐私保护为前提,以数据共享为目的,确保数据生产流通全流程可控制、可审计、可监管,从而支撑民生普惠、科学探索和产业应用,最终构建一个共有、共享、共为的生命大数据生态体系(网站:chain.genomics.cn)。
图 Linux基金会亚太区总裁Julian Gordon致辞
本次发布会还邀请了Linux基金会亚太区总裁Julian Gordon先生致辞。Julian Gordon表示,华大在生命科学与民生领域的贡献令人惊叹,他非常欢迎华大加入Linux基金会Hyperledger(超级账本)项目组。Linux基金会希望与华大一起,共同探索区块链技术在生命科学领域的应用,助力生命大数据的隐私保护与安全共享。
【各路大咖对话密码学发展应用 探讨基因数据隐私保护与安全共享】
图 “基因大数据隐私保护与安全共享”圆桌对话
“基因大数据隐私保护与安全共享”圆桌对话由华大区块链负责人杨梦主持,华大智造COO、华大生命科学研究院执行副院长蒋慧、上海交通大学计算机科学与工程系特别研究员郁昱、武汉大学计算机学院教授何德彪、西安电子科技大学通信工程学院教授王保仓、矩阵元技术(深圳)有限公司安全算法总监谢翔作为受邀嘉宾参与本次活动。
在对话环节中,主持人杨梦就基因数据特性、各类型加密算法比较、后量子时代密码学发展趋势等问题与各位嘉宾进行了深入探讨。来自华大智造的蒋慧首先从基因的生物特异性、不可篡改性等方面介绍了保护基因数据安全的重要性。针对基因数据的数据量大、敏感性高等特点,郁昱表示,传统的加密算法已满足不了基因数据的加密需求,业内目前正在探索基于同态加密与安全多方计算的的数据加密与安全共享框架,但该方法尚处于起步阶段。武汉大学何德彪教授则从硬件加密层面介绍了相关解决方案。来自西安电子科技大学的王保仓教授着重向在场观众介绍了后量子时代密码技术发展的问题。面对主持人提出的“量子计算机技术很可能在未来5-10年实现商用,大量现有的密码算法面临被提前淘汰”的问题时,王保仓教授表示,目前国际密码学界已经达成了一个共识,将在未来5年内集中一大批最优秀的大脑联手攻关,共同推动后量子密码标准的制定工作。
主持人杨梦为本次互动对话做了总结,并呼吁政府监管者、科学家们与产业机构携手努力,建立基于伦理规范与技术解决方案的数据共享框架,实现隐私保护前提下的生命大数据价值流动。
欢迎扫码阅读《华大区块链白皮书V1.0》