百舸争流,大数据产业日新月异,行业进入应用“深水区”。以曙光公司为代表的数据产业先行者,正不断夯实自身能力,打造数字时代的“智能引擎”,持续帮助客户挖掘数据价值。
业界认为,随着大数据基础设施的不断完善,行业已经接近完成了数据的“原始积累”,更敏捷、更智能、更融合、更安全的数据分析和智能工具,将成为企业主要需求。
大数据产业研究中心、赛迪顾问股份有限公司发布的《2019中国大数据产业发展白皮书》指出,2019年我国大数据整体规模达到5386.2亿元,预计2020年达到6605.8亿元,大数据产业已经成为数字经济发展“新动能”。
规模扩大同时,产业发展的基础性条件也完成初期储备。政府数据共享、物联网数据搜集等各种数据采集能力不断提升,云计算、人工智能等技术为数据存储、处理提供了可供进一步发展的能力。
中科曙光大数据首席科学家、大数据智能研究院院长宋怀明认为,新技术条件下,行业一些发展趋势特征变得越加明显。突出表现在:庞大的数据量需要足够敏捷的处理能力;大数据预测和决策支持需要更加智能的大数据分析;大数据、AI、云计算的融合,将推动多学科融合;随着大数据应用越来越广,数据安全变得更加重要。
曙光大数据首席科学家宋怀明分析大数据行业趋势
面对行业发展新机遇,曙光公司致力打造1+4+N大数据业务格局。“1”为打造一个大数据平台;“4”为结合自身大数据优势,聚焦“敏捷、智能、融合、安全”四大核心能力;“N”表示联合生态伙伴构建N个行业解决方案,服务百城百行。
曙光大数据平台可以实现模创工厂数据建模、天网知识图谱分析等智能服务。平台内置的XData大数据智能引擎,拥有数据集成、数据治理等多种数据处理能力;拥有DragonDB分布式数据库、MPP分析型数据库等多种数据管理能力。

曙光大数据事业部副总经理郭庆阐述曙光大数据“1+4+N”业务布局
四大核心能力是曙光大数据的核心竞争力。曙光大数据足够敏捷,提供万亿数据实时处理能力,TPCx-BB大数据分析能力性能全球第一;足够智能,可实现灵活精准的向导式自动化模型训练等;足够融合,可以实现存储、计算和管理的融合,多源多模态数据的融合,并与云计算、高性能计算实现了融合管理;足够安全,可以提供涵盖核心计算部件、系统管理、数据内容和运营服务四个层面的全方位安全保障。
在曙光大数据平台基础上,结合四大核心能力,曙光大数据平台这个“智能引擎”,正在联合百城百行的生态伙伴,服务政府、科学、安全、工业等“N”个领域客户。
“进入大数据应用深水区阶段,曙光将与生态合作伙伴戮力同心,形成优势互补的共同体,帮助推动客户从技术改进、运用优化、业务创新三个层级实现全方位、多角度、全链条的数字化升级。”宋怀明说。
具体来说,曙光大数据可以使客户更便捷地集成和管理各类数据,助力客户突破现有数据系统架构的各种瓶颈;依靠全量数据及数据全生命周期价值挖掘能力,提升客户自身运营效率与质量,焕发新动能;携手生态合作伙伴,与各类数据业务场景深度融合,通过数据智能重塑行业应用,推动客户业务创新。
曙光大数据目前构建的开放城市云数据平台,为城市管理提供智慧云脑;构建的人工智能公共服务平台,为区域的初创企业、科研院所和企业用户提供平台资源支撑;以应用需求驱动创新,为行业量身定制数据智能解决方案。
多年来,曙光大数据一直致力为客户创造价值。宋怀明表示,在未来,曙光大数据将继续致力于打造数字大航海时代的大数据“智能引擎”,助力客户开辟新航路、平稳快速横穿深水水域,实现价值大发现。
好文章,需要你的鼓励
PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。
华东理工大学团队开发了3DEditFormer系统和3DEditVerse数据集,首次实现了无需手工3D遮罩的高质量3D模型编辑。该技术通过双重引导注意力和时间自适应门控机制,让3D编辑变得像2D修图一样简单直观,在游戏开发、影视制作、AR/VR等领域具有广阔应用前景,标志着3D编辑技术向普及化迈出重要一步。
Ironclad OS项目正在开发一个新的类Unix操作系统内核,面向小型嵌入式系统,计划支持实时功能。该项目的独特之处在于采用Ada编程语言及其可形式化验证的SPARK子集进行开发,而非常见的C、C++或Rust语言。项目还包含运行在Ironclad内核上的完整操作系统Gloire,使用GNU工具构建以提供传统Unix兼容性。
上海AI实验室联合多所高校突破多模态AI训练难题,提出NaViL原生训练方法。通过预训练语言模型起点、混合专家架构和视觉-语言能力最佳平衡三大创新,在有限资源下实现与拼装式模型相当性能。该研究证明原生训练的可行性,为AI真正理解图文结合提供新思路,有望在教育、医疗等领域带来更自然的人机交互体验。