深圳商报·读创客户端首席记者吴吉杠杆炒股最大几倍
随着国产AI DeepSeek崛起,“神秘的东方力量”引发了科技圈的震动。而近日,一篇在《计算力学学报》上发表的最新研究成果,将人们的目光再次引向了中国。科研团队开发的一种基于图形处理器(GPU)并行的快速近场动力学算法,只需使用普通的家用GPU,即可实现性能的大幅提升,为解决传统计算力学算法的效率问题找到了新的方向。
该文章的第一完成单位是深圳北理莫斯科大学,作者为深圳北理莫斯科大学杨杨副教授、南方科技大学硕士研究生苏梓鑫。1月31日,在接受深圳商报采访时,杨杨副教授表示,这项成果的最大创新在于不必更换GPU,即可将计算效能“最大化”,从而为工业软件的核心技术国产化添砖加瓦。
跨学科合作催生新灵感
近场动力学是一种有效解决断裂问题的方法。然而,其非局部理论使得计算过程较为耗时。并行计算是加速数值计算的有效途径,主要分为基于中央处理器(CPU)的并行计算和GPU的并行计算。其中,GPU并行计算更适合处理逻辑简单但计算量大的场景。
目前,基于GPU的近场动力学并行研究,大多集中在将串行程序转换为并行程序。许多优化策略带来的加速效果主要依赖于GPU自身性能的提升,而针对GPU硬件结构的优化相对较少。此外,GPU并行计算仍存在一些问题,例如在处理大规模问题时“心有余力不足”、内存带宽浪费、一些算法仅能处理均匀分布且未受损的离散结构……
针对这种情况,科研团队研究设计了一个成本效益高且性能优异的近场动力学模拟框架。该分析框架能够以高效的计算速率准确模拟键基和态基近场动力学问题。该算法采用了粒子并行模式,建立了一个通用的邻域生成模块用以优化存储,并提出了一种通用寄存器技术,用于高速访问寄存器内存,减少全局内存访问。该技术不仅消除了对邻域点数量的限制,还适用于材料点的非均匀分布,可以大大提升计算的效率。
“这项研究我们花了大概两年的时间,之所以能取得突破,是因为我们是一个交叉学科的团队”,杨杨说,她本身是研究力学算法的,但团队里招收的硕士研究生是研究计算机领域的,“他对于计算机的架构很清楚。跨学科的合作与碰撞,使得我们提出了一个全新的思路,也走出了不一样的路。”
![](https://np-newspic.dfcfw.com/download/D25028439761984905909_w1709h1499.jpg)
通用寄存器优化算法示意图
无需升级硬件,即可“榨干”算力
“计算效率提升800倍”,这样的描述特别“抓眼球”,有人甚至说AI与之相比都相形见绌。但杨杨严谨地强调:“不要将它与AI相比,两者不在一个架构下,不具备可比性。”
杨杨表示,经过科学测试,与现有基于串行程序和OpenMP并行的近场动力学算法程序相比,该算法分别可实现高达800倍和100倍的加速。在典型的百万级粒子模拟中,执行4000次迭代在单精度下可在5分钟内完成,在双精度下可在20分钟内完成,这在低端GPU PC上即可实现。这意味着,在处理复杂的材料设计和损伤模拟时,研究人员能够更快地获得结果,从而加速科学研究和工程应用的发展。
“我们的优势是能够把英伟达显卡里的一些内部结构充分利用起来,通过对GPU内部寄存器显卡的读取,不需要更换更高级的显卡,即可实现效率的升级,”杨杨说,该成果可以减少对更高水平计算机硬件的硬性需求,只需使用普通的家用GPU,就能够将原本需要数天才能完成的计算任务缩短至几个小时,甚至几分钟,但是“它跟AI解决问题的方向是不一样的”。
杨杨表示,在现有设备单卡的英伟达显卡下,“算力提升800倍”已是现有算法的上限,不过这不意味着该项研究可以画下句号。“我们的研究还有需要完善和迭代的地方,后续我们也会继续将研究深入下去,力争让它服务于更多现实场景。”
为核心技术国产化装上“加速器”
在科技界,有“得算力者得天下”的说法,这也是深北莫该项研究成果如此令人“心潮澎湃”的原因。
杨杨表示,这项技术的广泛应用将有助于推动多个领域的创新,特别是在需要高性能计算支持的行业中。通过利用消费级GPU的强大计算能力,研究人员能够更高效地解决复杂的物理问题,从而推动科技进步和产业升级。
“目前,大部分企业应用的软件都是国外的商用软件。更长远的未来,我们希望新算法可以帮助更多中国的企业研发自己的工业软件,从而支撑更多的开发场景。”杨杨表示,据她所知,很多科研人员和企业正在为工业软件的技术自主而努力,该算法有望助他们一臂之力杠杆炒股最大几倍,为工业软件的核心技术国产化贡献力量。
上一篇:炒股杠杆平台怎么找 刚刚,黄金直线拉升!再创历史新高!
下一篇:没有了