百舸争流,大数据产业日新月异,行业进入应用“深水区”。以曙光公司为代表的数据产业先行者,正不断夯实自身能力,打造数字时代的“智能引擎”,持续帮助客户挖掘数据价值。
业界认为,随着大数据基础设施的不断完善,行业已经接近完成了数据的“原始积累”,更敏捷、更智能、更融合、更安全的数据分析和智能工具,将成为企业主要需求。
大数据产业研究中心、赛迪顾问股份有限公司发布的《2019中国大数据产业发展白皮书》指出,2019年我国大数据整体规模达到5386.2亿元,预计2020年达到6605.8亿元,大数据产业已经成为数字经济发展“新动能”。
规模扩大同时,产业发展的基础性条件也完成初期储备。政府数据共享、物联网数据搜集等各种数据采集能力不断提升,云计算、人工智能等技术为数据存储、处理提供了可供进一步发展的能力。
中科曙光大数据首席科学家、大数据智能研究院院长宋怀明认为,新技术条件下,行业一些发展趋势特征变得越加明显。突出表现在:庞大的数据量需要足够敏捷的处理能力;大数据预测和决策支持需要更加智能的大数据分析;大数据、AI、云计算的融合,将推动多学科融合;随着大数据应用越来越广,数据安全变得更加重要。
曙光大数据首席科学家宋怀明分析大数据行业趋势
面对行业发展新机遇,曙光公司致力打造1+4+N大数据业务格局。“1”为打造一个大数据平台;“4”为结合自身大数据优势,聚焦“敏捷、智能、融合、安全”四大核心能力;“N”表示联合生态伙伴构建N个行业解决方案,服务百城百行。
曙光大数据平台可以实现模创工厂数据建模、天网知识图谱分析等智能服务。平台内置的XData大数据智能引擎,拥有数据集成、数据治理等多种数据处理能力;拥有DragonDB分布式数据库、MPP分析型数据库等多种数据管理能力。
曙光大数据事业部副总经理郭庆阐述曙光大数据“1+4+N”业务布局
四大核心能力是曙光大数据的核心竞争力。曙光大数据足够敏捷,提供万亿数据实时处理能力,TPCx-BB大数据分析能力性能全球第一;足够智能,可实现灵活精准的向导式自动化模型训练等;足够融合,可以实现存储、计算和管理的融合,多源多模态数据的融合,并与云计算、高性能计算实现了融合管理;足够安全,可以提供涵盖核心计算部件、系统管理、数据内容和运营服务四个层面的全方位安全保障。
在曙光大数据平台基础上,结合四大核心能力,曙光大数据平台这个“智能引擎”,正在联合百城百行的生态伙伴,服务政府、科学、安全、工业等“N”个领域客户。
“进入大数据应用深水区阶段,曙光将与生态合作伙伴戮力同心,形成优势互补的共同体,帮助推动客户从技术改进、运用优化、业务创新三个层级实现全方位、多角度、全链条的数字化升级。”宋怀明说。
具体来说,曙光大数据可以使客户更便捷地集成和管理各类数据,助力客户突破现有数据系统架构的各种瓶颈;依靠全量数据及数据全生命周期价值挖掘能力,提升客户自身运营效率与质量,焕发新动能;携手生态合作伙伴,与各类数据业务场景深度融合,通过数据智能重塑行业应用,推动客户业务创新。
曙光大数据目前构建的开放城市云数据平台,为城市管理提供智慧云脑;构建的人工智能公共服务平台,为区域的初创企业、科研院所和企业用户提供平台资源支撑;以应用需求驱动创新,为行业量身定制数据智能解决方案。
多年来,曙光大数据一直致力为客户创造价值。宋怀明表示,在未来,曙光大数据将继续致力于打造数字大航海时代的大数据“智能引擎”,助力客户开辟新航路、平稳快速横穿深水水域,实现价值大发现。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。