旗下微信矩阵:

智算时代,医疗如何逃脱算力困局?

算力与医疗领域的融合正以前所未有的迅猛速度发展,预示着医疗健康领域的智慧化转型正迈入一个全新的阶段。
2024-03-18 13:36 · 微信公众号:亿欧网 王菲

构建全链路自主可控算力生态。

人工智能时代,竞争已不再仅仅局限于算法与应用层面的较量,而是延伸到了算力基础设施的深度博弈。在这个万物互联、数据汹涌的时代,数据量的迅猛增长使得对算力的需求攀升至一个前所未有的水平。

在不断增长的海量智能算力需求推动下,同时也面临着算力基础设施高质量发展所带来的挑战。根据2022年相关数据,中国智能算力在全部算力中的占比达到了22%,然而通用服务器仍然占据主导地位,其占比高达93.2%,而AI服务器的占比仅为6.8%。

作为算法与数据的支撑,算力越来越成为制约AI产业化发展的重要因素。

国务院总理李强在政府工作报告中介绍2024年政府工作任务深入推进数字经济创新发展时提出,适度超前建设数字基础设施,加快形成全国一体化算力体系。李强总理在近期调研时再次强调,人工智能是发展新质生产力的重要引擎,要加强前瞻布局,加快提升算力水平,推进算法突破和数据开发使用,大力开展“人工智能+”行动,更好赋能千行百业。

随着人们进入数字经济时代,数据成为新的生产要素,算力也成为新的生产力根据研报数据显示,算力指数每提高1%,国家数字经济和GDP将分别增长3.5‰和1.8‰。

在医疗健康领域,医疗健康数据的增长是各个行业中增长最快的,其年复合增长率高达36%,数据量已近50万亿GB。随着医院信息化建设步伐的加快,互联网医疗服务的兴起,AI辅助诊断技术的广泛应用,以及医疗垂直大模型等创新技术的不断涌现,传统医疗行业正经历着一场深刻的数字化与智慧化转型。在这一转型过程中,算力作为核心驱动力,发挥着不可替代的作用。

算力支撑医疗智慧应用

手术机器人、远程医疗、可穿戴设备、电子病历等智慧应用的蓬勃发展,都离不开算力的坚实支撑。

作为拥有14亿多人口的大国,2022年全国医疗卫生机构总诊疗人次超84亿,产生海量医疗健康数据。借助强大算力将这些数据进行有效归纳、分析和总结,有助于优化医疗资源配置,提升全国疾病预防、治疗和健康管理能力。

2022年OpenAI发布ChatGPT,生成式AI成为风口,大模型为生成式AI提供了重要的技术基础。与此同时,英伟达作为全球*的图形处理器(GPU)和AI芯片制造商,其财报数据也反映了算力经济爆发的趋势。2022年英伟达数据中心收入150亿美元,占比56%,2023年,数据中心收入474亿美元,其占总收入的比例上涨至78%,其 GPU几乎占据了全球接近80%的市场。

2023年被誉为医疗大模型的元年,算力与医疗领域的融合正以前所未有的迅猛速度发展,预示着医疗健康领域的智慧化转型正迈入一个全新的阶段。

截至2023年10月,我国累计公开的大模型数量已经达到238个,垂直类大模型达到103个。而2-9月,我国发布的医疗大模型近50个,根据亿欧智库发布《2023医疗健康AI大模型行业研究报告》显示,目前国内的医疗大模型可以分为几类:包括患者问诊全流程、医生助手/医院管理、中医、药物研发、医学影像及健康科普类大模型等。

算力技术的发展为医疗大模型提供了强大的计算资源,使其能够在短时间内完成复杂的数据分析和模型训练。通过运用先进的算法和模型,医疗大模型能够从海量数据中提取出有价值的信息,为医生与用户提供更准确、更个性化的诊疗建议。

除医疗大模型外,在生物医药领域,算力提升也极大的促进了基因测序的精准性与新药研发的效率。

《自然》杂志预估,到 2025 年,全球将有 6000 万人以上会采用基因测序来诊断疾病。通常而言,一个人的全基因组数据量在 50GB 以上。这意味着到 2025 年,全球基因组数据的增量就超过 40EB。

在基因测序领域,人类的基因中,碱基对高达 30 亿个组合,从 30 亿个组合当中找出变异,这些运算背后都需要高性能计算在底层做支撑,需要强大的算力支持来进行解析。而在药物发现领域,研究人员经常需要对数亿种化合物,与疾病相关的蛋白质进行一个是否能结合的预测,每一次运算通常需要数万到数十万核的 CPU 算力。

例如,在计算机药物研发的流程当中有一个关键步骤,叫虚拟筛选,就是在已知的化合物里面,通过与病毒蛋白质(靶点)的结合分析,看某些化合物是否有机会可以成为药物。一般来说,科学家需要筛选 10 亿种化合物,和目标蛋白质去做模拟结合,但如调用数万核的虚拟服务器,即可以实现在 24 小时之内完成对 10 亿种化合物的虚拟筛选。

每一次技术的飞跃都离不开充足的算力资源作为坚实支撑,特别是在大模型快速迭代的当下,算力需求呈现出井喷式增长,算力应用同样面临着诸多挑战。

应用挑战与成本考量仍待解决

当前,医疗健康领域的研究和应用都高度依赖于大规模的数据处理和分析,而算力正是支撑这些复杂计算任务的关键要素。

以通用大模型为例,知情人士透露,由于高性能GPU的禁运问题,算力成本变得昂贵,这给医疗机构和企业在购买算力时带来了极大的挑战。许多机构和企业可能无法承受高昂的算力费用,从而限制了它们在生物医药领域的研究和应用。

对于安全保密有要求的医疗机构,为确保数据不出院,模型的预训练多需要大模型以本地私有化的方式入驻,在其硬件和算力技术平台上进行应用与业务的开发,并支持灵活扩展与稳定性要求,从而保障医疗机构的数据安全与业务顺畅运行。

此外,当前模型效率的问题也影响了算力的有效利用。在推理过程中,如果模型效率低下,将导致算力资源的浪费,并可能无法产生足够的价值来推动算力的持续增加。这种商业模型的挑战进一步加大了算力可及性的投入难度。

左手医生创始人兼CEO张超告诉亿欧大健康,如果在已经训练好的通用模型基础上,进一步使用医疗领域的高质量数据进行继续预训练,其训练成本大概是通用模型的1/10左右。但具体的训练成本还会受到多种因素的影响,包括模型的参数规模、所使用的数据量、计算设备的性能等。因此,不同医疗大模型厂家的训练成本可能会有所不同。

再以AI制药为例,通过将AI药物发现技术无缝整合到计算机辅助药物设计软件中,并应用深度学习等非线性方法于药物设计、亲和力预测及成药性分析等领域,产业界已经取得了显著的进步,并逐渐形成了行业共识。在这个过程中,算力成为了进一步提升AI制药准确率并扩大药物筛选范围的瓶颈。

构建自主可控国产算力生态

据了解,目前医疗领域的智慧项目算力支撑主要通过企业合作、自建算力平台或租用云服务器来满足需求。去年12月,医渡科技与华为合作启动医疗大模型联合创新,基于昇腾AI硬件,推出面向B端的训推一体机解决方案,医院可以根据自身需求来购置相应设备。国内AI制药头部企业晶泰科技则选择自主建设AI药物研发所需的算法平台与高性能计算算力平台。

但算力资源的紧缺和高昂成本,以及算力需求的多样化和个性化等问题,使得“算力荒”的风险始终未能完全消除。

为了解决算力瓶颈,2023年10月,工业和信息化部 、国家卫生健康委员会等六部门印发《算力基础设施高质量发展行动计划》指出,加强行业算力建设布局,满足工业互联网、教育、交通、医疗、金融、能源等行业应用需求,支撑传统行业数字化转型。目标是到 2025 年,计算力方面,算力规模超过 300 EFLOPS,智能算力占比达到 35%,东西部算力平衡协调发展。

据工信部数据,截至2022年底,中国坐拥的总算力已高达180EFLOPS,算力核心产业规模高达1.8万亿元,算力总规模稳居全球第二。

在今年的两会提案中,算力基础设施建设也是大家关注的焦点。围绕算力网重建设轻运营,国产智算软硬件生态体系不健全,算力普惠服务供给等问题,两会代表建议成立政府算力管理及运营机构,促进算力网软硬件原研创新,构建国产算力生态圈,推动算力产业高质量发展。

从当前市场占比来看,英伟达虽然占据优势,但近年来,国产GPU发展势头迅猛,国内的华为、寒武纪等企业也能提供高端GPU。上海、广州、西安等城市新建的数据中心特别是政府投建的算力中心中,不少已经用上国产GPU。

目前,我国已构建起了包括超算中心、智算中心、数据中心和“城市大脑”在内的多元化算力形态,并在多个城市同步推进建设,推动“数据向西,算力向东”的战略布局。其中,智算中心尤为受到关注,全国已有30多个城市提出了建设规划。

特别是智能计算中心,作为超算技术和人工智能融合创新的产物,已成为新基建的热点,这些算力基础设施的建设,无疑将为医疗行业的算力需求提供强有力的保障,推动其在药物研发、数据处理及模型训练等方面的快速发展,进而提升医疗服务的质量和效率。

这些智算中心在投资建成后,运营模式、服务标准制定等问题,便成为了另一个全新的商业篇章。如何高效地运营这些智算中心,确保它们能够稳定、安全地提供算力服务,将是摆在运营者面前的又一重要课题。

参考资料:

IT时报:真正落地,生成式 AI 才有生命力

END

推荐阅读

【本文由投资界合作伙伴微信公众号:亿欧网授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。