产业数据
IDC与浪潮联合发布《2020-2021中国人工智能计算力发展评估报告》。报告中发布的2020年中国人工智能城市排行榜,排名前五的城市依次为北京、深圳、杭州、上海、重庆,排名6-10的城市为广州、合肥、苏州、西安、南京。与2019年相比,深圳超过杭州位居第二,重庆进入第一梯队,西安超过南京位居第九。
首届中国图计算性能TOP100排行榜“China Graph100”揭晓,部署在国家超级计算无锡中心的“神威·太湖之光”以23755.7GTEPS(TEPS即每秒遍历的边数目,G代表10的9次方)的遍历性能排名第一;部署在国家超级计算广州中心的“天河二号”以2061.48GTEPS的遍历性能排名第二;位列榜单第三位的是由中科院计算所和中科睿芯联合研制的“金刚”高通量集群,与榜上同等性能的结果相比,高通量集群服务器数量减少了99%以上,展现了优越的高通量计算能力和超高的节点效率。
IDC报告指出,中国人工智能基础设施市场规模在2020年达到39.3亿美元,同比增长26.8%。其中,AI服务器市场规模占整体人工智能基础设施市场的87%以上。中国人工智能服务器将保持高速增长,并将在2024年达到78.0亿美元。
Enterprise Technology Research数据表明,只有不到20%的受访者是平均分散工作负载的。相反,企业通常采用80/20或70/30的多云策略,也就是说,他们会选择一个主要的云来完成大部分工作,选择一个替代性的云用于特定工作负载,或者用于做数据保护。
根据IDC全球服务器市场季度追踪报告显示,2020年第三季度全球服务器市场的厂商收入同比增长2.2%,达到226亿美元,出货量同比下降0.2%至近310万台。批量出货的服务器收入增长5.8%,至190亿美元,而中端服务器收入下滑13.9%,至26亿美元,高端服务器收入下滑12.6%,至9.37亿美元。
财务数据
思科近期宣布将收购事件和日志分析初创公司Dashbase,收购金额未公开。Dashbase的软件可以让企业从各种实时通信环境中获取日志数据。这次收购将有助于增强思科的AppDynamics平台,思科是在2017年以37亿美元的价格收购了这款应用监控平台,如今已经成为思科推动应用可视化市场的核心。
近日HPE发布的财报结果均超出此前预测期,尽管数据中心硬件市场仍在持续下滑。HPE的高性能计算和关键任务系统产品,收入同比增长25%,达到9.75亿美元。同时,智能边缘业务(包括有线和无线网络设备)收入增长6%,达到7.86亿美元。不过,HPE的传统业务却表现不佳,计算业务(包括服务器)收入下滑了5%,至32亿美元,存储业务收入下滑了3%,至12亿美元。此外,专业服务收入和金融服务收入也分别下滑了9%和3%。
IBM透露正在收购一家总部位于芬兰的专业服务提供商Nordcloud,该公司可以为企业的云项目提供帮助。IBM没有透露这次交易的财务条款,如果一切按计划进行,收购将在2021年第一季度完成。就此次收购之前的大约一个月,IBM宣布了收购Instana,该公司的软件可以轻松检测出故障应用。此前Instana已经累计获得5000万美元的风投资金。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。