人工智能解决交通拥堵
前不久,百度发布了《2017第一季度中国城市研究报告》显示了各城市的交通拥堵情况,同期,百度联合2017 ASC世界大学生超算竞赛,将人工智能交通预测列为赛题,这是当前热门的无人驾驶技术中最关键的应用软件之一,可以在考虑时空关系后对交通情况做出合理预测,帮助车辆选择最合适的路线,特别是在城市拥堵情况下的路线选择更有现实的意义。ASC17超算竞赛有全球230支队伍超1000名大学生参赛,最终选出20支队伍晋级总决赛。
5天,准确预测300+道路交通状况
ASC世界大学生超算竞赛是世界规模最大的超算竞赛,由浪潮和亚洲超算协会共同举办,今年的人工智能赛题来自百度深度学习研究院,预赛阶段给出某城市前50天实际采集的交通状况的训练数据集,要求参赛队预测出第51天的交通状况。在总决赛阶段,赛题难度进一步升级,要求各队伍在3000瓦功耗下采用组委会提供的浪潮超算服务器搭建系统集群,利用百度PaddlePaddle框架开发深度学习神经网络算法,预测多达300+道路在某规定时间的早高峰路况,而所有工作需在5天时间内完成。
某城市早晚高峰交通路网数据
这项看似不可能完成的任务,最终还是得以解决。北京航空航天大学、清华大学、乌拉尔联邦大学以及香港浸会大学表现出自身的独到理解,为解决交通拥堵提供了开阔思路。
北航准确度最高
北京航空航天大学团队的计算平台为10台浪潮NF5280M4服务器的纯CPU集群,每台服务器搭载2颗Intel Xeon E5-2680v4,16G x8 DDR4 内存。其神经网络采用双层LSTM(Long Short Term Memory)结构,其模型配置如图2所示。该团队同时考虑了交通模型的时间特征与空间特征,第一层LSTM采用这两种特征作为输入信息,并将处理过后的输出信息与之前的空间信息一起传递给第二层LSTM,然后由第二层LSTM计算并得到预测结果。在数据的处理过程中,其团队充分利用提供的数据,对道路状况进行聚类处理,并利用HTCondor对训练及测试进行了加速处理。
图2. Model of information extraction based on LSTM
清华大学:历史统计平均值
清华大学团队采用了8台浪潮NF5280M4服务器集群,每台服务器额外搭载1个NVIDIA Tesla P100 GPU加速器。在模型训练及预测前,对数据进行了平衡处理,并对丢失值采取周围平均化方法填补。其训练结果以历史统计平均值方法为基准,对比了多种深度学习模型,并最终采用SAE(Stacked AutoEncoder)方法,取得了较为理想的预测精度。SAE模型的配置由图3给出。
图3. SAE (Stacked AutoEncoder)
乌拉尔联邦大学团队采用了6台浪潮NF5280M4服务器集群,每台服务器额外搭载2个NVidia Tesla K20X GPU加速器。其对模型采取对每条道路单独训练神经网络的策略,且对每条道路的训练数据进行了独立的空间特征的提取,图4展示了路网交通状况的周期性。这种方法具有良好的可拓展性,当有新的道路添加时,只需对新道路进行模型训练即可,而其他道路无需重新训练。在神经网络模型的选择上,乌拉尔联邦大学团队也采用了LSTM网络。
香港浸会大学:时空关联分析
香港浸会大学团队的计算基于4台浪潮NF5280M4服务器,每台服务器额外搭载2个NVIDIA Tesla P100 GPU加速器。其团队对交通数据进行了空间信息提取以及交通流状况的详细动态分析,展示了道路交通状况在时间与空间上的关联性,并以历史平均数据为基准,对比了多种DNN模型与LSTM网络模型的优劣,最终采用3层的LSTM网络进行训练与预测。
人工智能被誉为未来人类十大科技之一,浪潮人工智能与高性能产品部总经理刘军表示,以深度学习为代表的人工智能技术需要与实际的生产、生活有更紧密的结合,才能更好的改变人的生活,而人工智能的发展依赖于算法、数据和计算技术的支撑。浪潮与亚洲超算协会举办ASC竞赛并设立人工智能赛题,就是希望更多年轻人可以更好的理解该技术,培养更多相关人才。
人工智能是浪潮智慧计算战略的重要支撑,浪潮致力打造多样化的硬件平台、管理调度与分析平台和深度学习框架的"平台组合",实现前端承接多源数据、后端支撑智能应用,为人工智能提供领先计算力。同时,浪潮还将进一步推动人工智能人才的培养,而ASC竞赛就是其中之一。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。