百舸争流,大数据产业日新月异,行业进入应用“深水区”。以曙光公司为代表的数据产业先行者,正不断夯实自身能力,打造数字时代的“智能引擎”,持续帮助客户挖掘数据价值。
业界认为,随着大数据基础设施的不断完善,行业已经接近完成了数据的“原始积累”,更敏捷、更智能、更融合、更安全的数据分析和智能工具,将成为企业主要需求。
大数据产业研究中心、赛迪顾问股份有限公司发布的《2019中国大数据产业发展白皮书》指出,2019年我国大数据整体规模达到5386.2亿元,预计2020年达到6605.8亿元,大数据产业已经成为数字经济发展“新动能”。
规模扩大同时,产业发展的基础性条件也完成初期储备。政府数据共享、物联网数据搜集等各种数据采集能力不断提升,云计算、人工智能等技术为数据存储、处理提供了可供进一步发展的能力。
中科曙光大数据首席科学家、大数据智能研究院院长宋怀明认为,新技术条件下,行业一些发展趋势特征变得越加明显。突出表现在:庞大的数据量需要足够敏捷的处理能力;大数据预测和决策支持需要更加智能的大数据分析;大数据、AI、云计算的融合,将推动多学科融合;随着大数据应用越来越广,数据安全变得更加重要。
曙光大数据首席科学家宋怀明分析大数据行业趋势
面对行业发展新机遇,曙光公司致力打造1+4+N大数据业务格局。“1”为打造一个大数据平台;“4”为结合自身大数据优势,聚焦“敏捷、智能、融合、安全”四大核心能力;“N”表示联合生态伙伴构建N个行业解决方案,服务百城百行。
曙光大数据平台可以实现模创工厂数据建模、天网知识图谱分析等智能服务。平台内置的XData大数据智能引擎,拥有数据集成、数据治理等多种数据处理能力;拥有DragonDB分布式数据库、MPP分析型数据库等多种数据管理能力。
曙光大数据事业部副总经理郭庆阐述曙光大数据“1+4+N”业务布局
四大核心能力是曙光大数据的核心竞争力。曙光大数据足够敏捷,提供万亿数据实时处理能力,TPCx-BB大数据分析能力性能全球第一;足够智能,可实现灵活精准的向导式自动化模型训练等;足够融合,可以实现存储、计算和管理的融合,多源多模态数据的融合,并与云计算、高性能计算实现了融合管理;足够安全,可以提供涵盖核心计算部件、系统管理、数据内容和运营服务四个层面的全方位安全保障。
在曙光大数据平台基础上,结合四大核心能力,曙光大数据平台这个“智能引擎”,正在联合百城百行的生态伙伴,服务政府、科学、安全、工业等“N”个领域客户。
“进入大数据应用深水区阶段,曙光将与生态合作伙伴戮力同心,形成优势互补的共同体,帮助推动客户从技术改进、运用优化、业务创新三个层级实现全方位、多角度、全链条的数字化升级。”宋怀明说。
具体来说,曙光大数据可以使客户更便捷地集成和管理各类数据,助力客户突破现有数据系统架构的各种瓶颈;依靠全量数据及数据全生命周期价值挖掘能力,提升客户自身运营效率与质量,焕发新动能;携手生态合作伙伴,与各类数据业务场景深度融合,通过数据智能重塑行业应用,推动客户业务创新。
曙光大数据目前构建的开放城市云数据平台,为城市管理提供智慧云脑;构建的人工智能公共服务平台,为区域的初创企业、科研院所和企业用户提供平台资源支撑;以应用需求驱动创新,为行业量身定制数据智能解决方案。
多年来,曙光大数据一直致力为客户创造价值。宋怀明表示,在未来,曙光大数据将继续致力于打造数字大航海时代的大数据“智能引擎”,助力客户开辟新航路、平稳快速横穿深水水域,实现价值大发现。
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。