百舸争流,大数据产业日新月异,行业进入应用“深水区”。以曙光公司为代表的数据产业先行者,正不断夯实自身能力,打造数字时代的“智能引擎”,持续帮助客户挖掘数据价值。
业界认为,随着大数据基础设施的不断完善,行业已经接近完成了数据的“原始积累”,更敏捷、更智能、更融合、更安全的数据分析和智能工具,将成为企业主要需求。
大数据产业研究中心、赛迪顾问股份有限公司发布的《2019中国大数据产业发展白皮书》指出,2019年我国大数据整体规模达到5386.2亿元,预计2020年达到6605.8亿元,大数据产业已经成为数字经济发展“新动能”。
规模扩大同时,产业发展的基础性条件也完成初期储备。政府数据共享、物联网数据搜集等各种数据采集能力不断提升,云计算、人工智能等技术为数据存储、处理提供了可供进一步发展的能力。
中科曙光大数据首席科学家、大数据智能研究院院长宋怀明认为,新技术条件下,行业一些发展趋势特征变得越加明显。突出表现在:庞大的数据量需要足够敏捷的处理能力;大数据预测和决策支持需要更加智能的大数据分析;大数据、AI、云计算的融合,将推动多学科融合;随着大数据应用越来越广,数据安全变得更加重要。
曙光大数据首席科学家宋怀明分析大数据行业趋势
面对行业发展新机遇,曙光公司致力打造1+4+N大数据业务格局。“1”为打造一个大数据平台;“4”为结合自身大数据优势,聚焦“敏捷、智能、融合、安全”四大核心能力;“N”表示联合生态伙伴构建N个行业解决方案,服务百城百行。
曙光大数据平台可以实现模创工厂数据建模、天网知识图谱分析等智能服务。平台内置的XData大数据智能引擎,拥有数据集成、数据治理等多种数据处理能力;拥有DragonDB分布式数据库、MPP分析型数据库等多种数据管理能力。

曙光大数据事业部副总经理郭庆阐述曙光大数据“1+4+N”业务布局
四大核心能力是曙光大数据的核心竞争力。曙光大数据足够敏捷,提供万亿数据实时处理能力,TPCx-BB大数据分析能力性能全球第一;足够智能,可实现灵活精准的向导式自动化模型训练等;足够融合,可以实现存储、计算和管理的融合,多源多模态数据的融合,并与云计算、高性能计算实现了融合管理;足够安全,可以提供涵盖核心计算部件、系统管理、数据内容和运营服务四个层面的全方位安全保障。
在曙光大数据平台基础上,结合四大核心能力,曙光大数据平台这个“智能引擎”,正在联合百城百行的生态伙伴,服务政府、科学、安全、工业等“N”个领域客户。
“进入大数据应用深水区阶段,曙光将与生态合作伙伴戮力同心,形成优势互补的共同体,帮助推动客户从技术改进、运用优化、业务创新三个层级实现全方位、多角度、全链条的数字化升级。”宋怀明说。
具体来说,曙光大数据可以使客户更便捷地集成和管理各类数据,助力客户突破现有数据系统架构的各种瓶颈;依靠全量数据及数据全生命周期价值挖掘能力,提升客户自身运营效率与质量,焕发新动能;携手生态合作伙伴,与各类数据业务场景深度融合,通过数据智能重塑行业应用,推动客户业务创新。
曙光大数据目前构建的开放城市云数据平台,为城市管理提供智慧云脑;构建的人工智能公共服务平台,为区域的初创企业、科研院所和企业用户提供平台资源支撑;以应用需求驱动创新,为行业量身定制数据智能解决方案。
多年来,曙光大数据一直致力为客户创造价值。宋怀明表示,在未来,曙光大数据将继续致力于打造数字大航海时代的大数据“智能引擎”,助力客户开辟新航路、平稳快速横穿深水水域,实现价值大发现。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。