随着移动互联网和智能终端的发展,以及5G时代的到来,社交和视频媒体的普及,各行各业已经初步实现互联网+的转型。互联网化对我们的工作和生活影响逐步加深。互联网数据更是呈现核爆式的增长。数据是石油,只有经过提炼才能发挥价值,互联网行业是数据的富矿,如何使用好这一宝藏,对平台数据实现精准分析,优化产品,进一步向数据智能化进阶,帮助用户提供个性化服务,首先需要深度挖掘互联网行业的数据价值。
大数据对算力平台有极高的要求,曙光公司是中国云计算和大数据产业的领先者,数据中国的战略,这些成果来自比较完整的产品线,这些代表产品在国内都是属于领先的。还有曙光的SP战略,以前是服务器、存储、IT解决方案,现在由云计算开始,已经向综合信息服务的产品提供商转型。2009年曙光首次发布了海量数据的处理平台,经过几年发展,在2012年整个公司正式整合了大数据相关的技术能力,发布了XData大数据的产品,这一曙光大数据产品线的拳头产品目前已经发展到第六代。
化繁为简 实现数据统一管理
互联网行业用户建设智能大数据平台,传统做法是将业务数据库做集成,形成简单的数据仓库,然后按业务需求,提供数据展示等服务。但随着业务系统增多,业务数据多样化,传统做法在数据存储、数据管理、决策,以及系统运维等方面面临挑战。曙光大数据平台是结合大数据技术的海量数据智能分析处理解决方案。帮助互联网用户快速构建高效、智能、易用的一体化大数据系统,挖掘数据价值。
曙光大数据分析平台采用融合的技术架构,深度实现存储融合、计算融合、调度融合、多源数据融合、业务流程融合,构建体系化融合的整体系统。系统内嵌深度学习分布式引擎,实现数据智能挖掘;内置机器学习算法库,实现高度专业算法优化;支持全维度任务运行监控,数据可自动分级;利用视觉引擎全景化展示,实现智能数据透视。系统融合内存计算引擎,实现高效数据分析处理;利用任务分解并行执行,实现复杂查询深度优化;采用无共享式数据存储,达到性能线性规模增长;采用流式计算一体处理,满足实时数据在线分析。系统采用类 SQL 接口服务方式,无门槛上手即用;支持结构化和非结构化异构数据统一化管理;通过一体化运维管理,可实现图形化操作简单易用。
数随芯动 卓越架构带来澎湃动力
硬件层面,曙光大数据分析平台运行在开放X86 架构的服务器集群中,采用了英特尔相关的CPU技术,至强可扩展平台、傲腾持久内存等软硬件技术,充分发挥基础硬件的能力,使性能能够在大数据处理的过程当中发挥到极致,会为数据的处理和使用带来非常积极的帮助。具有良好的兼容性,支持结构化和非结构化数据统一处理,通过一体化的运维管理操作,简单易用。可以支撑平台实时数据采集、建模、分析,驱动市场营销、产品优化、用户运营、管理监控。
算力强劲的一体化大数据系统,集成了主流的大数据生态组件,保证良好的应用兼容性,适配各类数据处理;提供多维数据,联动数据,大屏等功能,实现零编码拖拽式的可视化数据分析;采用新一代高性能的数据分析引擎,比传统数据处理速度有显著的提升。
曙光的数据中国和“1+4+N”战略
中科曙光作为信息产业的代表企业之一,致力于帮助各行各业数字化和智能化转型,并提出“数据中国”的构想,旨在构建覆盖全国的信息化、大数据管理服务网络,让全社会共享数据价值。并进一步规划了“1+4+N”战略,其中“1”就是致力于打造一个智能的数据平台,围绕技术积累和行业实践去聚焦并打造敏捷、智能、融合、安全“4”大核心能力,同时联合生态合作伙伴去构建“N”个行业解决方案,服务百城百行、百行百业,推动客户数字化转型升级。
好文章,需要你的鼓励
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
英国宽带服务商Olilo正式推出多千兆宽带服务,专门面向技术人员、工程师、系统管理员和家庭实验室爱好者。该公司自建Layer 2网络基础设施,提供对称多千兆宽带,支持静态IPv4地址和原生IPv6。Olilo与伦敦三大互联网交换中心建立对等连接,在英国对等网络中排名第24位。服务经过150多名技术用户的付费封闭测试,并通过Discord社区持续收集用户反馈优化服务。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。