12月24日,主题为“释放数据与AI原力,赋能商业新价值”的第三届中国大数据与智能计算大会在北京成功举办。
本次会议由中央网信办、中华人民共和国科学技术部、国家信息中心指导,中国大数据与智能计算产业联盟、北京大学大数据分析与应用国家工程实验室、财经网主办,大会吸引了国家部委信息化主管领导,新型智慧城市、大数据研究专家学者,全国各地经信委、发改委负责人以及相关企业负责人等300余人参会,会议围绕大数据及智能产业痛点进行深入分析,积极探索数据、计算及智能为数字经济发展所带来的新价值。
作为中国大数据与智能计算产业联盟副理事长单位,中科曙光应邀出席本次会议,并发表了精彩的演讲。
会上,中科曙光大数据及创新业务产品总监刘超指出,数字化转型是当前发展的大趋势,随着大数据与人工智能技术的不断成熟,中国已进入以计算力为基础的数字经济发展新阶段。曙光作为国内计算领域的领军企业,正利用计算力优势,从多方面助力数据智能创新。此外,他还分享了曙光在先进计算领域的应用实践,并借此机会邀请更多上下游企业参与构筑先进计算全球创新生态网络,为中国数字经济发展增砖添瓦。
大会同期举行了2018中国大数据与智能计算产业领军企业奖评选、中国高性能计算机性能排行榜TOP100深入解读及颁奖活动,曙光凭借在大数据与智能计算领域的绝对优势,获得“2018中国大数据与智能计算产业领军企业奖”。
据介绍,2009至2016年中科曙光曾连续8年蝉联HPCChina TOP100榜首,今年以40台数量入围榜单并斩获厂商份额第一。其中在榜单TOP10中,曙光有3台超算系统强势入围;在榜单TOP20中,有10台超算系统入围。中国性能最强的20台高性能计算机中,中科曙光占据了半壁江山。
同时,2018年也是曙光在大数据行业厚积薄发的一年,凭借扎实的技术基础,曙光将人工智能与大数据技术有机结合,相关大数据产品解决方案在多个行业落地开花,在助力各企业单位数字化转型方面扮演了重要角色。
此外,《中国大数据与智能计算产业经典案例研究报告(2018)》也随大会同期发布。其中曙光助力广州建设智慧新海关的案例完美诠释了曙光先进计算如何应用落地,其先进性和代表性获评委专家高度认可,被评选为此次大数据与智能计算产业经典案例,其中涉及的曙光XData大数据智能引擎采用了全新的设计理念和高效的技术架构,是“曙光数据智能”的典型体现。
当前,随着大数据及AI技术的不断成熟,为行业经济结构的优化和调整带来了新的机遇,大数据、人工智能、云计算、高性能计算等技术越来越趋于融合发展。曙光将始终专注IT计算领域,着眼于最先进的信息技术,进一步推动经济建设、科技进步及社会发展。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。