ChatGPT的爆火让AI再次成为大众热议的焦点,作为英特尔所提出的搭建起从模拟时代到数字时代桥梁的五大“超级技术力量”之一,伴随着无处不在的智能化,AI可将无穷的数据转化为切实可行的洞察。
作为半导体行业的领先企业,在这一前沿技术领域,英特尔一方面不断拓展创新技术,提供全方位的产品组合,构建可靠可信的新一代信息技术的智能基础设施,另一方面,也致力于以负责任的方式来构建和使用AI,把它塑造成一股向善的力量,让AI能创造繁荣并丰富人们的生活。正如英特尔CEO帕特·基辛格所言:“只有当AI的应用显著且重复优于任何非AI体验时,它才能成为新的标准。”
负责任的生成式AI
具体而言,ChatGPT是一种生成式AI(generative AI)。生成式AI指的是一类算法,其生成的新数据类似于人类创造的内容,包括音频、代码、图像、文本、模拟和视频。这项技术使用现有内容和数据进行训练,为自然语言处理、计算机视觉、元宇宙和语音合成等应用领域带来了全新前景。
在过去几年里,生成式AI的发展十分迅猛,因此,这项技术现在能以更令人信服和更明智的方式,帮助人们解决现实中的各种挑战。虽然有些人担心生成式AI可能会威胁到就业,但负责任地使用生成式AI,从而提高人的效率和创造力,无疑意味着更大的机遇。
然而,如果不了解相关系统的运行流程,就不能信任生成式AI的结果。正如英特尔很早就认识到的那样,与技术进步密切相关的伦理和社会影响极为重要。对于AI而言,这一点尤其如此。因此,英特尔提出了负责任AI框架( Responsible AI framework ),并始终致力于不断完善方法、原则和工具,确保在产品周期的每一步都采取负责任的做法。至关重要的是,确保生成式AI在其发展过程中始终以人为中心。负责任的AI应始于系统的设计和开发之时,而非在部署后再对其进行完善。
英特尔负责任AI框架的重要性在于,通过对AI系统的训练让其不会生成负面内容。为了增强安全性,英特尔在整个开发生命周期中执行严格的多学科评审,包括建立多元化的开发团队以减少偏见,开发遵循伦理原则的AI模型,同时从技术和人文的角度广泛评估结果,并与行业伙伴合作减少AI潜在的负面影响。
英特尔的负责任AI框架,有助于确保人类找到正向运用这项技术的方法,并学会如何尽可能地提升AI效益。
英特尔的探索
基于负责任AI框架,英特尔的相关团队致力于构建造福人类的生成式AI应用,以改善人们的生活,减少他们受到的负面影响,并打造使其它技术变得更加自然的工具。在工作过程中的每一步,英特尔都会秉承负责任的态度,而非仅仅关注结果。
为实现这一愿景,英特尔团队的语音合成项目致力于帮助失去声音的人们再次说话。该技术被用于英特尔与戴尔、劳斯莱斯和运动神经元疾病(MND)协会合作的“我将永远是我”数字故事书项目。任何被诊断患有运动神经元疾病或其它可能影响说话能力的疾病的患者,都能够使用这个交互式网站录制自己的声音,以便在语音辅助设备上使用。
英特尔也致力于利用生成式AI使3D体验更加逼真。例如, CARLA是开源的英特尔城市驾驶模拟器,其开发旨在支持自动驾驶系统的开发、训练和验证。通过生成式AI,驾驶员周围的场景会看起来更加逼真和自然。英特尔还使用生成式AI简化了3D建模和渲染的工作流程,为 3D 艺术家节省了时间,并使游戏运行速度更快。
此外,用于深度伪造(deepfakes)的生成式模型,其目的在于假冒人类。对此,英特尔通过两种方式进行抵御。首先,英特尔将深度伪造检测算法集成到实时平台中。作为系统的核心,FakeCatcher可以检测伪造视频,准确率高达96%,使用户能够实时区分真假内容。其次,英特尔使用负责任的图像生成器,其中之一可以拼接不同的人脸图像。与使用真人面部照片训练图像生成模型的方法相反,它混合、匹配不同人的不同面部区域(如甲的鼻子、乙的嘴、丙的眼睛,以此类推),以生成数据集内尚不存在的全新人脸图像。
让AI真正惠及大众
谈到英特尔在生成式AI领域的愿景,英特尔研究院高级研究专家Ilke Demir表示:“英特尔的目标是秉承负责任的态度和原则,与整个行业密切协作,支持包括生成式AI在内的各种AI模型。”
总而言之,在探索AI应用的过程中,应该不断强调“人本视角”,确保其体现在AI开发的各个阶段中,因为只有这样,才能让AI技术适用性更强、更具协作性、负面影响更小,才能让越来越多的人类受益于未来的技术进步。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。