2017年5月 ,19岁的当今世界围棋第其他人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,根本不 有其他物种顶尖高手与这台机器群体之群体之间到于是三次较量  ,同年10月 《Nature》杂志发表了接近 它几乎然而版本的AlphaGo Zero。过一获得向当今世界展示了组织建立 子系统源自学顺利完成复杂任务中的现如今  ,而其背后所属于就是运算能力不强  ,是计算机科学的分支三大领域 --高能计算(High Performance Computing)  ,是说际应用共有 又又成大国综合超强实力的体现  ,更给人们生活的日常过着带来冲击了转变  ,加上目前该技术方面已在航空航天、核试验模拟、天气预报、人类生命科学、高新制造(汽车、电子)等三大领域 获得了广泛应用。

以人类生命科学三大领域 举例 ,逐渐被 被 人类生命遗传密码(基因组)的逐渐被 破解  ,人的生老病死过一复杂做做的事就能用数字化的方式比较具体地呈现 ,以期顺利完成疾病的精准分析结论、诊断和常规治疗  ,另人们生活远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病 ,大大增强人均预期寿命  ,并大幅度大大增强当代社会 卫生负担。

二十年来  ,其他人全基因组测序的成本以“超摩尔定律”的加速度度下降  ,而高能计算在测序数据情况分析结论主方向的应用也发生重大 了翻天覆地的转变 。加上目前当今世界主流的基因组测序数据情况分析结论工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit)  ,该项人类生命科学三大领域 公认的最佳部门工作流程顺利完成过一其他人的全基因组(Whole Genome Sequencing  ,WGS)30X数据情况分析结论就能1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算三大领域 可以获得突破进展 ,于日顺利顺利完成6分钟顺利完成30X WGS全流程的分析结论任务中  ,相较于GATK统一标准计算时长提速300倍。

依据NIH公布的最新资料 ,逐渐被 被 测序技术方面的发展中  ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟顺利完成30X WGS任务中是由华大基因自主研发的LUSH工具集顺利完成的  ,打破了该各种软件在2020年1月创造的15分钟极限加速度度。共有 的黑科技就是选用了全和新底层架构选用造型  ,可以提供了概念基础中央再处理器和图形再处理器相两者结合展开基因数据情况分析结论的高能加速度方案 ,在大大增强集群计算资源消耗、大大增强检出加速度度的共有  ,顺利完成了全程自动化、数据信息化  ,有记录可回溯  ,就能很好地用于精准医学的应用场景。

LUSH工具集加速度的和新底层架构逻辑

LUSH工具集可以提供过这也种“CPU+GPU”的高并行软硬件以外完美解决方案  ,概念基础经典流程之中各种软件模块BWA、SAMTOOLS和GATK  ,方式比较GPU的通用运算技术方面 ,展开计算引擎和加速度引擎的和新架构选用造型  ,顺利完成算法优化和并行化再处理  ,并两者结合华大自主研发的超高通量测序仪  ,顺利完成碱基数据情况流的超高速分析结论 ,到于是可以获得准确的分析结论到于是。

LUSH工具集加速度流程示意图

就是是说人类生命数字化进程就能严谨的科学思想精神精神  ,而其应用场景主要包括体现现如今精准医疗、健康管理等与其他物种健康也有息息其它相关的三大领域  ,现如今相同于以外高能计算三大领域  ,基因组数据情况分析结论对精度有极高的依据要求 。而是说高能和准确并加上 基本兼得 ,数据情况覆盖范围、分布和浮点精度、峰值能和内存就会产生影响算法的会选择  ,也有 涉及到之一最优解和似解的算法现如今大相径庭。LUSH工具集就是展开在经典流程算法的概念基础上方式比较了其和新选用造型 的底层架构逐步可减少了中间部位到于是的读写  ,并方式比较CPU顺利完成基因分析结论任务中的智能分发  ,方式比较GPU数千计算核心顺利完成百万任务中的极速并行再处理 ,共有 以外完美解决了经典流程计算密度较高、频繁地存储器访问等以外完美解决 ,经一测试其统一标准品的准确到于是与经典流程一致  ,接近 99.86% ,加上其就能在计算到于是的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是几乎高能计算应用三大领域 的研发追求两个目标。对加速度组件的持续持续不断研发源自对加速度度无止境的追求  ,正如把手机 芯片新兴行业 的发展中是逐渐被 被 移动端产品需求的旺盛  ,技术方面才得以逐渐被 地迭代和进步。从基因组学概念基础研究工作到临床研究工作及应用  ,顺利完成测序工具的自主可控的共有 正真 能顺利完成数学方式比较上有自主研发  ,而仅仅 说追求芯片的底层下潜开发。对后者是无止境的追求  ,而正真 前者的基本可控还要顺利完成从跟随模仿到正真 超越的现如今  ,从核心算法的研发上助力欧美国家 精准医疗自主可控的发展中进程。



推荐阅读