浪潮资深存储架构师叶毓睿
近日,IDC发布了《新型冠状病毒肺炎对中国ICT市场的影响》报告。借此,我们来共同探讨一下新冠疫情对中国经济尤其是对中国存储市场走势的影响。
目前看来,新冠肺炎疫情对中国乃至全球的经济将产生深远的影响。过去的一两个月,是物理世界(线下)向数字世界(线上)大迁徙的一次大规模实践:近两周内,每天有十亿设备同时在线,超2亿人在线办公,超1亿学生在线学习。抗“疫”、生活和工作的在线化、数字化,促使个体和组织数字化的比率提升进入到快车道,将加速政府数字化治理和数字经济的发展。
对IT市场的影响同对中国经济的影响类似。从IDC报告里,可以看到疫情对中国IT市场的影响主要集中在第一、第二季度,对全年也有一定影响。而在细分领域,疫情对于硬件市场的影响比软件大,对于个人与消费级市场的影响比企业级大。
IDC预测,2020年第一季度IT整体市场下降约10%,这将是中国ICT市场首次出现季度10%的下降,存储市场预计将有15%左右的下降。
新冠肺炎对存储市场影响(图片来源:IDC官网)
同时,我们也应该注意到新的市场机会。在线应用中,如电商、远程办公、远程医疗、线上诊疗、AI辅助、教育、影视、短视频、游戏、音乐、阅读、直播、资讯、社交、非接触服务和政务等呈爆发式增长,将扩大服务器、存储、网络通信、负载均衡、管理运维等IT设备或软件的采购需求。例如,短短十几天内,钉钉扩容12万台服务器。
当下的重点在疫情防控,各省地市政府急需将多维数据融合起来,例如交通运输数据、运营商数据、互联网App的位置数据等,做好个人画像、轨迹追踪,寻找确诊病例尤其是超级传播者的密切接触者。预计类似智慧城市或者城市互联网的应用将不断普及,将催生企业级存储的需求。
在疫情的影响下,人工智能(简称AI)的需求更加迫切。快速响应是核心,用来帮助控制疫情的蔓延。因为非接触的服务和工作、自动化、快速分析决策和响应的需求等,将会爆发。例如,人脸识别(包括免摘口罩的人脸识别)、AI辅助诊断、应急管理、安防监控、知识图谱、基因研究、医药研发、金融服务、智能配送、各行各业的无人值守(例如零售)、物流运输、个人画像、轨迹追踪、舆情分析等等。另外,疫情趋势预测、风险预警、医疗资源和物质的预测和调配,要做到快速、准确、科学的判断,也需要和AI结合。
从大数据、AI等新兴市场来看,其数据量非常之庞大,可能拥有百万千万,甚至到百亿千亿文件的量级,构成一个庞大的数据湖。以智能语音机器人为例,现在国内的技术已经能做到智能外呼,可针对庞大的客户群,较短时间的问答,相对固定的流程,做到无死角无遗漏并且重复呼叫。不仅效率得到了提高,而且减少了传统呼叫中心人员的聚集,还能实现全面记录会话录音,做到有据可查。当然,与此同时,形成了大量数据的存储,并且需要使用大数据或AI技术进行快速的筛选和准确的分类,将决策分析的结果传递给人,来完成下一步的动作。因此,大数据或AI需要借助一个能力较高的集群,包括服务器和GPU集群、存储集群等,来服务上层业务,分布式存储将成为这些新兴市场的主流载体。AI场景所需存储,不久将成为一个较快增长的存储细分领域。
随着多维数据的融合,AI的广泛应用,个人和组织数据的安全变得越来越重要,包含零知识证明等隐私保护技术的区块链存储将逐步得到重视。
人类的发展史,总是和瘟疫纠缠在一起的,为了避免下一次传染病的蔓延,人类需要未雨绸缪,尽可能利用已有经验教训和科技手段来防范。此次疫情过后,物联网和5G技术将快速发展,因为非接触服务能够避免人群聚集,甚至实现无人值守。传感器和通信技术的进步,使得非接触服务成为可能,也将催生大量的边缘设备,边缘计算将推动容器和边缘存储的发展。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。