通信世界网消息(CWW) 生命科学领域的大数据时代已然到来。据相关统计,全球每年生物数据总量已经达到EB量级,完整的人体基因组有约30亿个碱基对,个体化基因组差异达6百万碱基,基于个性化的遗传背景产生了巨大数据。如果能高效、高速地利用这些大数据,无疑将为生命科学行业带来无限机遇。
在不久前由生物谷和华为云服务联合主办的云服务与大数据知识分享沙龙活动中,演讲嘉宾李亦学教授指出,生命科学正面临从实验驱动向数据驱动的转型局面,海量的数据将成为生命科学的基础,云服务、大数据等相关技术将成为转型重要因素。
李亦学认为,急剧增加的生物数据和计算机能力间的巨大差距是大数据发展面临的首要问题。”放眼国内生物科学院,其在运用现有IT技术处理大数据方面无不面临着部署慢、存储容量小、成本高等困境。
生物科学高性能计算需要海量的计算资源,且计算扩容速度很快,资源的部署周期长。传统IT服务,从设备采购到安装调试,需要数月的时间,难以及时响应业务的变化;同时,生科计算往往比较复杂,传统生命科学计算依靠手工进行环境部署,耗时耗力,效率低下;除此之外,生科计算产生海量数据,对存储有高要求,由于存储能力不足,导致数据人工逐行删除;对于生科企业来说,自建高性能计算平台一次需耗费大量资金,且设备更新换代成本高,可能导致面临资金不足风险等。面对这些问题传统的IT技术已经显露出它的弊端,亟需寻找传统IT的替代。
针对高速有效地分析生物大数据所需要的技术, 李亦学认为云服务或可提供解决有力支撑。
云服务具备弹性、快速扩展、即租即用等特征,可向用户提供弹性海量的计算、存储资源,轻松应对大规模计算处理,帮助用户快速部署和管理大规模可扩展的IT基础设施资源。而在生物科学领域,国内领先的云服务商华为云已经有一整套成熟完整的解决方案。
华为云服务能够为基因工程、蛋白质工程、生物制药等需要高性能计算的业务提供海量并行计算资源,以及提供包括云主机、云硬盘、对象存储服务、线下传输服务等在内的高性能云服务。华为生科云解决方案是一套基于行业特性、工作流程、业务分析流程的需求,整合强大的计算能力、存储能力,为用户提供超算、数据存储等多种服务的云计算服务平台,且操作简单、灵活多样。“华为云服务面向生物科学领域进行的定制开发,运营模式设计,支撑服务方面的能力令人印象深刻。”上海生命科学院相关负责人表示。
华为生科云解决方案由分布式计算引擎、弹性计算云、对象云存储、线下大数据传输服务四部分组成,为客户提供端到端的解决方案。其中分布式计算引擎所需的行业模版由客户自定义或者使用合作伙伴提供的预定义行业模版,华为负责提供计算和存储资源,以及调度能力。
华为云服务相关负责人介绍:分布式计算引擎能够通过用户定义的业务流程,把多步骤的复杂运算过程固化下来,简化运算过程,提高计算效率,运算过程由分布式计算引擎进行判断和驱动,不需要人工干预,实现计算的自动化和流程化。这正好与目前生物科学大数据所需要的复杂业务需求相匹配。
另外,由分布式计算引擎负责部署计算环境,提高环境部署效率,降低部署复杂度;整个业务过程以流程图的形式进行直观展示,让业务过程一目了然;在计算完成或者出现异常情况,会自动提示操作用户,进行人工干预或者修正。
最后,分布式计算引擎可以对资源池里的资源进行有效管理,自动投放任务到空闲节点;可根据业务需要对资源池里的节点资源进行增加或者删除,实现按需使用,按需付费。
这些都是分布式计算引擎受到客户青睐的重要因素。
除此之外,华为云服务具有中立、安全、高可靠、低成本的数据存储能力,来满足用户的原始数据和计算结果的存储需求;在商业模式上,可按需使用、按需付费、即租即用的方式,缩短IT建设周期,降低初始投资成本,减轻企业后期运维成本。
随着基因测序成本等的急剧下降,数字与生物科学高度融合,大数据背景下的云服务将超越提升效率和降低成本的支撑地位,成为生物科学创新的核心竞争力并将重新定义市场的制高点。 对生科企业及研究院所来说,在华为公有云平台上测试和构建自己的业务模式将是一种经济高效的方式, 基于华为云服务平台的生物行业服务范式将被全新构建。
正如李亦学教授所说,生命科学正面临从实验驱动向数据驱动转型。谁先掌握了技术谁就掌握了生命科学的命脉。云服务无疑是生命科学从实验驱动向数据驱动转型的重要驱动因素。
|