
人工智能解决交通拥堵
前不久,百度发布了《2017第一季度中国城市研究报告》显示了各城市的交通拥堵情况,同期,百度联合2017 ASC世界大学生超算竞赛,将人工智能交通预测列为赛题,这是当前热门的无人驾驶技术中最关键的应用软件之一,可以在考虑时空关系后对交通情况做出合理预测,帮助车辆选择最合适的路线,特别是在城市拥堵情况下的路线选择更有现实的意义。ASC17超算竞赛有全球230支队伍超1000名大学生参赛,最终选出20支队伍晋级总决赛。
5天,准确预测300+道路交通状况
ASC世界大学生超算竞赛是世界规模最大的超算竞赛,由浪潮和亚洲超算协会共同举办,今年的人工智能赛题来自百度深度学习研究院,预赛阶段给出某城市前50天实际采集的交通状况的训练数据集,要求参赛队预测出第51天的交通状况。在总决赛阶段,赛题难度进一步升级,要求各队伍在3000瓦功耗下采用组委会提供的浪潮超算服务器搭建系统集群,利用百度PaddlePaddle框架开发深度学习神经网络算法,预测多达300+道路在某规定时间的早高峰路况,而所有工作需在5天时间内完成。

某城市早晚高峰交通路网数据
这项看似不可能完成的任务,最终还是得以解决。北京航空航天大学、清华大学、乌拉尔联邦大学以及香港浸会大学表现出自身的独到理解,为解决交通拥堵提供了开阔思路。
北航准确度最高
北京航空航天大学团队的计算平台为10台浪潮NF5280M4服务器的纯CPU集群,每台服务器搭载2颗Intel Xeon E5-2680v4,16G x8 DDR4 内存。其神经网络采用双层LSTM(Long Short Term Memory)结构,其模型配置如图2所示。该团队同时考虑了交通模型的时间特征与空间特征,第一层LSTM采用这两种特征作为输入信息,并将处理过后的输出信息与之前的空间信息一起传递给第二层LSTM,然后由第二层LSTM计算并得到预测结果。在数据的处理过程中,其团队充分利用提供的数据,对道路状况进行聚类处理,并利用HTCondor对训练及测试进行了加速处理。

图2. Model of information extraction based on LSTM
清华大学:历史统计平均值
清华大学团队采用了8台浪潮NF5280M4服务器集群,每台服务器额外搭载1个NVIDIA Tesla P100 GPU加速器。在模型训练及预测前,对数据进行了平衡处理,并对丢失值采取周围平均化方法填补。其训练结果以历史统计平均值方法为基准,对比了多种深度学习模型,并最终采用SAE(Stacked AutoEncoder)方法,取得了较为理想的预测精度。SAE模型的配置由图3给出。

图3. SAE (Stacked AutoEncoder)
乌拉尔联邦大学团队采用了6台浪潮NF5280M4服务器集群,每台服务器额外搭载2个NVidia Tesla K20X GPU加速器。其对模型采取对每条道路单独训练神经网络的策略,且对每条道路的训练数据进行了独立的空间特征的提取,图4展示了路网交通状况的周期性。这种方法具有良好的可拓展性,当有新的道路添加时,只需对新道路进行模型训练即可,而其他道路无需重新训练。在神经网络模型的选择上,乌拉尔联邦大学团队也采用了LSTM网络。
香港浸会大学:时空关联分析
香港浸会大学团队的计算基于4台浪潮NF5280M4服务器,每台服务器额外搭载2个NVIDIA Tesla P100 GPU加速器。其团队对交通数据进行了空间信息提取以及交通流状况的详细动态分析,展示了道路交通状况在时间与空间上的关联性,并以历史平均数据为基准,对比了多种DNN模型与LSTM网络模型的优劣,最终采用3层的LSTM网络进行训练与预测。
人工智能被誉为未来人类十大科技之一,浪潮人工智能与高性能产品部总经理刘军表示,以深度学习为代表的人工智能技术需要与实际的生产、生活有更紧密的结合,才能更好的改变人的生活,而人工智能的发展依赖于算法、数据和计算技术的支撑。浪潮与亚洲超算协会举办ASC竞赛并设立人工智能赛题,就是希望更多年轻人可以更好的理解该技术,培养更多相关人才。
人工智能是浪潮智慧计算战略的重要支撑,浪潮致力打造多样化的硬件平台、管理调度与分析平台和深度学习框架的"平台组合",实现前端承接多源数据、后端支撑智能应用,为人工智能提供领先计算力。同时,浪潮还将进一步推动人工智能人才的培养,而ASC竞赛就是其中之一。
好文章,需要你的鼓励
据《华尔街日报》报道,在马斯克针对OpenAI的诉讼失败后,OpenAI正加速推进IPO计划。CEO萨姆·奥特曼希望公司最快于今年9月上市,目前已与高盛、摩根士丹利合作,并可能在数日或数周内秘密提交上市申请。与此同时,马斯克旗下SpaceX的IPO文件也预计近期公开。两家公司的上市竞争,标志着马斯克与奥特曼的博弈从法庭转移至资本市场。
要理解这项研究,先得明白现在的AI是怎么"画"图的。 可以把AI生成图片的过程想象成一个特殊的厨房。当AI要学会画图时,它不会像人类画家那样一笔一画地描绘,而是采用一种叫做"自回归"的方式——简单说就是"一个食材接一个食材地添加"。但问题在于,AI厨房处理的"食材"不是真实的图像像素,而是一种被压缩过的"标准化食材包"。 这个压缩过程,叫做"离散分词",由一个叫"分词器"(tokenizer)的设备完成。打个比方,分词器就像一台高级的食材切片机,它把一整张图片切成很多小块,然后给每一小块贴上一个"编号标签",对应到一本"标签字典"(也就是研究者口中的"码本")里的某个条目。比如,标签001可能代表"蓝天的一小块",标签002代表"绿草的一小块"。 这种做法的好处是大幅简化了AI的工作量——它不用记住几百万个像素,只需要记住一串编号就行了。这就是为什么如今像Chameleon、Emu3这些大名鼎鼎的多模态AI模型都用这种技术。 但问题也恰恰出在这里。当切片机以16倍的压缩率工作时(也就是说原本256个像素被压缩成1个标签),很多细节就被无情地丢弃了。蓝天少一些云彩、草地少几根草尖,人眼几乎看不出来。可一旦切到了文字或人脸,灾难就发生了——一个英文字母"e"和"c"的差别可能就在那么几个像素,一张脸上眉眼的位置稍微挪一挪,整个人就变了样。 研究团队发现,认知科学研究早就指出,人类的视线会不自觉地被文字和人脸吸引,对这两类内容的细节扭曲特别敏感。换句话说,AI画其他东西糊一点没关系,但文字和脸糊了,用户立马就能察觉。 之前的研究者也意识到了这个问题,他们的解决思路通常是"加大切片机的容量"——比如把标签字典从1万6千条扩展到26万条,或者让每张图用更多的标签。但这就像为了切好一根胡萝卜而把整个厨房改造成大型工厂,成本高得离谱,而且效果也不见得好。 清华和微软的团队提出了一个完全不同的思路:与其让切片机变得更大,不如教它学会"看重点"。 二、给切片机装上"火眼金睛"
调查显示,51%的专业人士认为AI生成的低质量内容(即"workslop")正在降低生产效率,45%的人因此对职场使用AI更加谨慎。这类内容表面精致却缺乏准确性和实质价值。专家建议两步应对:一是重塑AI生产力思维,推行"AI先行、人工复核"的工作模式;二是保持持续投入,深入掌握AI工具的有效用法。企业领导者强调,真正从AI中受益需要坚持与学习,而非浅尝辄止。
北京中关村学院与中关村人工智能研究院发布PhysBrain 1.0,通过从人类第一视角视频中提取结构化物理知识,训练出能"先理解再行动"的机器人控制系统,在多项机器人操控基准上刷新纪录。