在滑铁卢大学攻读系统设计工程博士学位期间,Alexander Wong没有足够的资金购买其计算机视觉实验所需的硬件。因此,他发明了一项使神经网络模型更小、速度更快的技术。
Sheldon Fernandez回忆道:“Alexander Wong当时正在做项目演示,有人对他说‘嘿,你的博士研究很酷,但你知道吗,你真正的秘密武器,是你为了完成博士研究而发明的技术!’”。
现在,Fernandez和 Wong分别是DarwinAI的首席执行官和首席科学家。而DarwinAI是一家位于加拿大安大略省滑铁卢的初创公司,现在正将那个“秘密武器”商业化。同时,英特尔正在帮助DarwinAI,全面提升从数据中心到边缘应用程序中的软件性能。
DarwinAI首席执行官Sheldon Fernandez(第一排中间穿黑色夹克的男士)与员工合影。
DarwinAI是一家总部位于加拿大安大略省滑铁卢的AI软件初创公司。
在介绍DarwinAI的策略时,Fernandez表示:“我们首先使用其他形式的人工智能,从基础上探索、理解神经网络。在建立对神经网络的复杂了解之后,我们再次使用人工智能技术创建一个全新的神经网络家族,使它与原来的神经网络具备同样优秀的性能,但规模更小,并且能够被解释。”
“原理的可解释性”非常重要。Fernandez指出,人工智能面临的一个重大挑战是“对于设计者而言,人工智能的工作机制并不透明”。如果不知道人工智能应用程序的工作原理及决策原理,开发人员很难提高其性能,或者诊断出问题所在。
比如,DarwinAI的一个汽车客户想要排除一辆自动驾驶汽车的故障——当天空出现某种紫色时,这辆汽车会出现奇怪的左转倾向。DarwinAI的生成合成平台(Generative Synthesis)解决方案帮助客户团队了解到,汽车行为受到了在内华达沙漠中所进行的特定转弯场景训练时的影响,训练时的天空恰巧是那种紫色。
Fernandez解释说,也可以这样理解生成合成平台(Generative Synthesis):想象该人工智能应用程序观察到一栋人类设计的房屋,记录其建造轮廓,然后设计出了更坚固更可靠的全新房屋。Fernandez说:“因为这是人工智能,它具备人脑无法比拟的效率。这就是我们对神经网络的应用。”(神经网络是一种将复杂任务分解为大量简单计算的方法。)
英特尔不仅致力于让所有人都能使用人工智能,并使人工智能速度更快、更易使用。 通过英特尔人工智能创建者项目,英特尔与DarwinAI合作,将生成合成平台(Generative Synthesis)与英特尔OpenVINO工具包以及其他英特尔人工智能软件组件加以结合,实现数量级性能提升。
在最近的案例研究中,基于英特尔至强铂金8153处理器,使用生成合成平台(Generative Synthesis)与面向英特尔架构优化的TensorFlow相结合构建的神经网络,在ResNet50和NASNet这两种流行的图像识别工作负载上,能够提供比基准测试分别高达16.3倍和9.6倍的性能提升。
英特尔机器学习性能副总裁兼总经理Wei Li表示:“英特尔和DarwinAI多次合作,以优化和提升多种英特尔硬件上的人工智能性能。”
Fernandez指出:“两家公司的工具相互辅助:通过DarwinAI的工具获得真正优化的神经网络,同时通过OpenVINO和英特尔工具集将其安装到设备上。”
通过这种结合,可以提供紧凑、精准同时适配部署设备的人工智能解决方案。随着边缘计算的兴起,这种技术正变得至关重要。Fernandez表示:“边缘人工智能会越来越多。可以预见,未来两三年,智能边缘将成为最热门的话题之一。”
疫情期间,对新型冠状病毒的讨论是当前的焦点。DarwinAI本周宣布:“我们已经与滑铁卢大学VIP实验室的研究人员合作开发了COVID-Net,这是一种通过胸片检测COVID-19的卷积神经网络。”DarwinAI目前已经在GitHub上开源了源代码和数据集。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。