导读:探索生命奥秘、发掘生物潜力是科技发展的重要使命之一,在研究脑科学的过程中,华中科技大学苏州脑空间信息研究院在呈现出一个缤纷多彩的大脑空间的同时,也碰到了巨大的存储瓶颈。为此,华中大苏州脑空间院采用浪潮智能存储AS5500G2构建了25PB容量的统一存储资源池,不仅满足了IO吞吐率、可用性的要求,更实现了节能15%、节省30%研究费用的目标。
大脑,蕴含无限奥秘,它拥有多达上千亿的神经元,被称为已知世界中最复杂的物体之一,至今我们却对它知之甚少。但是,一群中国科学家却能给大脑“拍彩照”,让大脑空间呈现出一个缤纷的多彩世界;并能精准定位,给每个神经元上都标记门牌号;还可以把各种形状的神经元单拎出来,清楚地看到每根神经元的走向;尤为难得的是,他们率先以工业化方式大规模、标准化、高分辨绘制脑图谱数据。
这正是华中科技大学苏州脑空间信息研究院(以下简称:华中大苏州脑空间院)正在推进的重要工作。作为华中科技大学、苏州市政府、苏州工业园区、江苏省产业技术研究院四方强强联手建立的,以发展世界领先的脑空间信息技术的研究院,华中大苏州脑空间院通过高分辨、大探测范围和高通量的三维光学显微成像技术,实现在哺乳动物全脑范围,以真实尺度构建包括神经元和血管等脑内复杂结构的精细形态和连接关系的高分辨脑图。这方面探索不仅有重要科学意义,而且对脑疾病防治、智能技术发展也具有重要引导作用。
脑科学计算应用是典型的计算密集型、IO密集型、存储容量密集型的计算,对于存储系统的容量、带宽要求很高。而随着华中大苏州脑空间院的研究工具的演进以及研究领域的逐步深入,对存储的要求更是呈现指数级增长,如果存储系统“掉了链子”,将很难满足脑科学的进阶研究需求。
在人脑中大概有1000亿个神经元,在分析的过程中会产生非常巨大的数据量,仅小鼠脑就有10TB之多,人脑的体积是是小鼠脑的1500多倍,数据量将达到PB级,随着研究的广域度的增加,未来研究院数据产生的规模,将达到100PB以上,如果以研究院现有速度需要一台成像系统至少花费20年时间完成数据采集,所以研究院需要采用多套成像系统并行工作。
浪潮结合多年来的项目经验,给华中大苏州脑空间院制定了以存储为核心的的解决方案。方案采用近20套浪潮智能存储AS5500G2,构建高效、安全的统一存储资源池,提供了25PB裸容量。
在性能方面,浪潮智能存储G2平台采用智能全闪架构设计,可针对大量随机IO进行加速处理,并通过多种对前端应用的感知技术,提升数据处理效率,提供了高达以6GB/s的写带宽,充分满足了华中大苏州脑空间院对脑空间信息海量数据的应用需求。而且,其还可按需扩展,保证华中大苏州脑空间院业务未来发展的扩容需求。
在可用性方面,浪潮智能存储G2采用全冗余架构、全模块化、冗余缓存、双活控制器设计,主要部件无单点故障。另外,华中大苏州脑空间院还采用了以浪潮DPS备份软件、浪潮磁带库TL3000相结合的数据备份、容灾解决方案,采用LAN备份方式实现集中、统一、快速、自动的数据备份,能够显著降低硬件故障等事故所带来的数据丢失等威胁。
在实现大容量与高带宽的同时,AS5500G2还有助于系统建设成本的控制,数据显示,基于浪潮智能存储AS5500G2的一体化解决方案比传统解决方案节约15%的能源,节省大约30%的研究费用。
浪潮存储解决方案的部署彻底解决了华中大苏州脑空间院面临的存储瓶颈,给脑科学的研究奠定了坚实的存储能力基础。华中大苏州脑空间院科研人员表示:“浪潮智能存储方案满足了我们对于存储性能、扩展性、可用性与成本的需求,将有助于我们进行更广泛、更深入的大脑数据采集,从而促进认知脑功能、防治脑疾病、以及类脑智能技术的发展。未来,我们将在颅内宇宙中继续探索,打开神奇的‘脑洞’,给未来创造更多可能。”
好文章,需要你的鼓励
本文探讨了达成人工通用智能(AGI)七大路线中的线性进阶路径,预测了从2025年至2040年 AI 技术与社会效应的关键年度节点。
这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子电路编译方法的效率瓶颈。研究证明了该模型在不同量子比特数量、电路深度和参数化门比例下的有效性,并通过快速电路生成创建了数据集,从中提取出有价值的结构见解,为量子电路合成提供了新方向。
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
MASKSEARCH是阿里巴巴集团同义实验室开发的新型预训练框架,通过创新的"检索增强掩码预测"任务,训练大型语言模型像人类一样主动使用搜索工具获取信息。这项框架包含两个阶段:首先在掩码预测任务上预训练,然后在下游任务上微调,大幅提升模型在开放域问答中的表现。研究采用监督微调和强化学习两种方法,结合多代理系统和课程学习策略,使AI能够自主分解问题、使用搜索工具并基于搜索结果进行推理。