近日,明略科技集团实现了机器学习可视化工具——TensorBoard的C++接口,进一步丰富了基于C++的大模型项目工具集,使得大模型预训练过程监控更加便捷、高效,加速营销领域大模型预训练进程。该工具已在Github开源。
TensorBoard是Google开发的一款机器学习可视化工具,常用于监测机器学习过程的各项指标。明略科技高级技术总监赵亮介绍:“在大模型训练过程中,数据监测是一个重要维度,而TensorBoard通过可视化模型中的各种参数和结果,例如记录大模型训练过程的Loss变化、验证集的PPL变化、学习率变化、Token消耗量、单步参数更新时延等指标,帮助分析训练状态,发现训练过程中出现的问题并及时采取干预措施,提升大模型训练进程和效果。”
明略科技开源的C++接口TensorBoard工具页面
此前,TensorBoard仅支持Python语言接口。此次明略科技通过C++实现TensorBoard,将进一步丰富基于C++实现的大模型项目工具集,大幅提升模型训练监测效率,加速模型训练进程,改写接口后的工具将通过多维度的数据模式展示训练指标,包括标量、直方图、图像、图像合集、音频、文本等数据模式。该工具包通过github项目Tensorboard.cpp分享,助力更多研究者和开发者参与并加速大模型的研发进程,推动人工智能多领域的应用探索。
明略科技在Github开源的两款工具包:ASR-BlockFormer与tensorboard.cpp
明略科技集团CTO郝杰表示:
“我们要在更高效、更低成本的要求下做出营销领域的大模型,通过自适应技术提升大模型的能力。好的行业大模型需要具备通用大模型的逻辑性、语言顺畅度,同时还需要实现通用大模型所不具备的,在某个行业内或具体的领域中的真实性、专业性。我们以明略科技凭借17年来积累的海量行业数据为基础,从客户实际需求出发,借助庞大的数据和知识库进行增强训练,满足客户多样化的任务和场景需求。在训练监测可视化工具的加持下,我们将提升训练速度,及时发现问题,为客户打造一个更加可靠、效果更好的行业大模型。”
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。