2018年9月26日 北京—在今日举行的“携手共创未来数据科技;京东与英特尔,大数据合作备忘录签约仪式”上,英特尔与京东共同分享了在大数据分析领域的合作成果,以及将要展开的全新合作。具体而言,京东正在为建立高级数据分析能力而着力打造下一代可扩展的大数据平台,京东和英特尔除了在软件领域展开深入合作外,京东大数据也在计算、存储、网络等领域充分利用英特尔下一代硬件产品;京东大数据团队在大数据领域创新的同时,将持续推动开源社区和整个行业在数据分析领域的进步。
京东与英特尔成立数据计算联合实验室(左:裴健,京东集团副总裁,大数据与智能供应链事业部总裁;右:马子雅,英特尔公司软件和服务部门副总裁,数据分析部门负责人)
京东集团副总裁,大数据平台负责人翁志 (Dennis Weng)表示:“京东的目标是在大数据架构领域成为业界领先的互联网企业,实现京东大数据成本和效率有机的平衡和提升,将京东大数据技术带入行业领先地位。 基于与英特尔在软、硬件方面的全面合作,并借助京东公有云平台,建立并增强通过京东云将大数据分析服务覆盖到外部客户、对外输出大数据分析的相关能力,助力京东公司层面的角色转型。”
京东正在着力打造提供最佳性价比的下一代大数据平台,在虚拟化技术、存储计算分离、存储压缩技术等计算资源横向智能扩展上发力,在AIops等领域进行深耕。其中也包括通过英特尔先进的技术为支撑,对大数据基础架构进行升级。
京东和英特尔在软件领域进行了重要合作,推动英特尔优化过的开源软件的普及应用,诸如Apache Spark on Kubernetes及其相关的框架和工具套件、Adaptive Execution、存储和计算分解、Spark工作负载优化等。结合京东的海量大数据应用,京东和英特尔已经联手对这些项目进行了深度定制,在统一的数据分析和AI流水线上加速并简化了方案开发,并在某些特定场景下发挥了巨大的效能。
“我们正在进入一个先进的数据分析时代,使用复杂的算法和模型以及应用不断增长的数据量和更复杂的数据集正在成为主流。 我们看到传统人工智能与大数据分析的集成越来越多,以解决更复杂的问题,”英特尔公司副总裁、英特尔开源技术中心总经理Imad Sousou表示, “我们与京东利用英特尔在可扩展计算、持久内存、网络和开源软件优化方面的平台创新进行高级分析,并合作开发下一代大数据平台,这是解锁数据智能和加速深入洞察之路的重要一步。”
京东大数据团队也在计算、存储、网络等领域充分利用英特尔下一代硬件产品。京东将会在英特尔®至强®可扩展平台基础上建立基于英特尔的新一代硬件产品,如英特尔傲腾固态硬盘以及英特尔傲腾数据中心级持久内存等,以完成架构升级,降低运行成本,增加集群整体效能。
京东在大数据领域的创新不仅有利于京东自身数据分析能力的提升,也有助于开源社区和整个行业的各种成功应用案例,与英特尔携手推动数据分析的改进。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。