数字人行业正处于前所未有的快速发展期。2023年,中国虚拟人核心市场规模达到了205.2亿元,并预计到2025年将达到480.6亿元。技术的进步是推动这一行业发展的核心动力,AIGC等前沿技术的应用极大地提升了数字人的交互能力、内容生成能力及智能化水平。
数字人的应用场景已经从传统的影视娱乐领域扩展到了品牌营销、电商直播、金融教育等多个领域,为各行各业带来全新的交互体验和服务模式。
智境云创创始人&CEO王智武告诉记者,智境云创注重技术创新与应用拓展,特别是AI与3D技术的融合。公司持续投入研发资源,在前沿技术领域进行探索和突破,提升数字人的智能水平和交互能力,并关注新兴技术如3D数据集、AIGC、大模型等的融合应用。同时,智境云创将拓展AI数字人在各行业的应用场景,定制化解决方案,并加强与产业链上下游企业的合作,共同构建AI数字人生态系统。
此外,公司还根据市场需求和竞争态势灵活调整市场布局,积极探索数字人技术的国际化应用和推广,特别是在AI+3D技术方面的全球化发展,不断拓宽数字人的应用领域和市场边界。
生成式AI让数字人“焕发新生”
在生成式AI出现之前,数字人的发展面临了多方面的挑战,包括技术上的建模与渲染、动作与表情捕捉、语音合成与交互的不成熟,资源上的计算和数据获取成本高昂,伦理上的隐私保护和形象权归属问题,以及应用上的用户接受度低和技术整合难度大等问题。
然而,生成式AI技术的出现极大地改变了这一状况。它不仅显著提升了数字人在建模、渲染、交互等多方面的技术水平,还极大地丰富了数字人的应用场景,拓展了其商业价值。
生成式AI技术为数字人带来了多项新能力,包括高度个性化的定制能力、多模态交互能力、自主学习与进化能力,以及情感理解与陪伴能力。这些新能力不仅增强了数字人的实用性和用户体验,还使其更加符合用户的期望和需求。智境云创将充分利用这些技术优势,为用户带来更加优质、便捷和个性化的数字人体验。
王智武表示,生成式AI技术的加入,极大地扩展了数字人的落地场景。与过去相比,数字人现在不仅应用于影视、游戏等娱乐领域,还深入到了教育、金融、零售等多个行业,提供了个性化教学、专业理财建议、个性化营销等多样化服务。同时,数字人的交互能力也得到了显著提升,能够与用户进行更加自然、流畅的对话,并结合多种模态进行交互。此外,个性化定制服务和自主学习与进化能力的增强,也使得数字人能够更好地适应不同场景下的需求变化,提供更加精准和个性化的服务。
化解生成式AI与数字人的融合挑战
虽然生成式AI与数字人的融合是大势所趋,但是挑战也显而易见,包括技术层面的模型训练与数据需求、计算资源消耗、多模态交互协同以及情感理解与表达;伦理法律层面的隐私保护、版权与知识产权界定、内容真实性与可信度保障;用户体验层面的个性化与定制化服务、交互自然度提升以及一致性与稳定性确保;以及商业化层面的商业模式探索和市场竞争应对。
这些挑战需要企业、研究机构和社会各界共同努力,通过技术创新、行业规范、用户体验优化和商业模式创新等方式来逐步解决。
王智武表示,当前数字人技术虽然取得了显著进展但仍存在一些不足之处。以下是一些可能的不足点和未来的优化方向:
真实感与交互性不足:尽管数字人在视觉和声音效果上已经取得了很大进步但在真实感和交互性方面仍有待提升。未来的优化方向可能包括引入更高级的图形渲染技术和动作捕捉技术以提高数字人的逼真度和自然度;同时加强多模态交互技术的研发以实现更加自然和流畅的交互体验。
智能水平有限:当前数字人的智能水平仍受到算法和模型性能的限制在复杂语境理解、情感计算等方面仍有待提升。未来的优化方向可能包括加强预训练大模型和垂域小模型的研发和应用以提高数字人的智能水平和泛化能力;同时引入更多领域知识和规则以丰富数字人的知识库和决策依据。
个性化与定制化不足:不同用户对于数字人的需求和期望存在差异但在个性化与定制化方面仍有待提升。未来的优化方向可能包括加强用户画像和行为分析技术的研究以更好地理解用户需求;同时提供更加丰富和灵活的定制化选项以满足不同用户的个性化需求。
隐私与安全问题:随着数字人技术的普及和应用隐私与安全问题也日益凸显。未来的优化方向可能包括加强数据加密和隐私保护技术的研究以保障用户隐私的安全;同时建立完善的安全机制和监管体系以应对潜在的安全威胁和风险。
基于这些思考,智境云创在提升数字人交互能力方面,采取了自研智者千问大模型与合作接入相结合的方式。一方面,智境云创自研了“智者千问”行业大模型,通过大规模的预训练和自学习,学会语言的语义和语法。在预训练时,处理海量文本,学到很多语言知识和模式,所以能理解和生成各种语言,适应不同的场景和任务。与自研元享云平台组成“AI+3D的元宇宙多模态云平台”,为数字人提供了复杂语境理解、长时间连贯性问答以及多语言交流服务的能力。另一方面,智境云创也积极与行业内领先的企业和机构进行合作,通过接入外部大模型来进一步丰富和提升数字人的交互能力。这种自研与合作相结合的方式使得智境云创在数字人交互技术方面保持了领先地位并持续进行创新。
推动数字人的规模化落地
在王智武看来,数字人的规模化落地和融合进产业是一个复杂而长期的过程涉及技术、市场、政策等多个方面的因素。虽然当前数字人技术已经取得了显著进展但在规模化落地和产业化应用方面仍面临一些挑战。不过随着技术的不断进步和应用场景的不断拓展数字人的规模化落地和产业化应用已经初具雏形并有望在未来几年内取得更大进展。
具体来说数字人的规模化落地和产业化应用需要解决以下几个关键问题:一是技术成熟度和稳定性问题需要通过持续的技术创新和优化来提高数字人的性能和可靠性;二是市场需求和接受度问题需要通过深入了解用户需求和应用场景来推动数字人在更多领域的落地应用;三是政策支持和监管问题需要加强政策引导和监管力度以规范数字人产业的发展秩序和保障用户权益。
在技术创新方面,依托在数据、算法、算力三大核心要素的持续积淀,智境云创通过大规模、高精度的3D数据进行模型训练,让AI更全面地理解和计算物理世界;再通过跨模态的数据算法融合。让虚拟世界更接近真实,让物理世界更加智能。
智境云创的数字人产品具备文本、语音、动作等多模态交互能力,可以适用于VR、MR、AR等多样化智能终端。这种多模态交互技术使得数字人能够更自然地与用户进行互动,提升用户体验。
智境云创自研了“智者千问”行业大模型,与元享云平台组成“AI+3D的空间计算多模态云平台,平台核心驱动力在于AI与大模型的深度应用,它们共同构建了一站式AI智能服务体系,涵盖了生成、驱动、数智人交互等多个环节。
在空间计算领域,智境云创具备3D数据采集、训练、内容创作、云渲染等方面的优势。这些技术为数字人的生成和交互提供了坚实的基础,使得数字人在视觉和交互效果上更加逼真和流畅。
在行业方面,智境云创针对教育、金融、电商等多个应用场景打造了数字人解决方案。智境云创在数字人领域已经成功实施了多个案例,并取得了显著的效果。例如,智境云创与华山景区携手合作,共同推出了虚拟形象——沉小香。这一创新举措将传统文化与现代科技完美融合,为游客带来前所未有的沉浸式旅游体验。沉小香作为华山景区的虚拟代言人,不仅拥有文人侠士的清新脱俗外形,更蕴含着深厚的文化内涵和华山精神的独特魅力。以数字化的形式,活灵活现地展现华山的历史传说、自然风光与人文风情,引领游客穿梭于现实与虚拟交织的奇妙世界,感受华山的壮丽与神秘,开启一场别开生面的文化探索之旅。此外,智境云创还携手外研在线打造了虚拟数字人“子衿”,在教育领域的应用中,子衿能够为学生提供个性化的学习辅导和情感支持,提高了教学效果和学习体验。
结语
数字人的规模化落地和融合进产业是一个复杂而长期的过程,涉及技术、市场、政策等多个方面的因素。虽然当前数字人技术已经取得了显著进展,但在规模化落地和产业化应用方面仍面临一些挑战。不过随着技术的不断进步和应用场景的不断拓展,数字人的规模化落地和产业化应用已经初具雏形,并有望在未来几年内取得更大进展。
数字人市场竞争格局呈现出多元化特点,众多参与者凭借各自的技术优势和市场渠道展开激烈竞争,推动了整个行业的快速发展。政策支持力度的加大也为数字人行业的发展提供了有力保障,政府在数据政策、人才培养等方面的举措将进一步促进数字人行业的繁荣。
最后,王智武表示,企业在选择数字人技术提供商时,应综合考虑技术实力与经验、成功案例与作品、资质与合规性、定制化能力、服务与支持以及价格与性价比等多个维度。技术实力是确保项目成功的关键,成功案例能够评估提供商的项目执行能力和成果质量,资质合规性保障项目的合法性和企业信息的安全,定制化能力确保满足企业的个性化需求,服务与支持则保障项目执行过程中的问题解决和技术更新,而价格与性价比则需综合考虑以确保投资回报。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。