7月7日,在2023世界人工智能大会(WAIC)期间,由上海市浦东新区青年联合会、优刻得、达观数据联合主办“AI生成与垂直大语言模型的无限魅力”主题论坛线上线下同步召开。本次大会邀请到中国工程院院士、大模型领域专家学者、大模型应用产业界代表纷纷出席,共同探讨垂直大语言模型的发展现状、未来趋势和重要挑战,分享大模型助力科研创新和产业落地最新成果,共同探索大模型赋能千行百业智能化升级,助力数字经济高质量发展之路。
作为中国工程院院士兼复旦大学金融科技研究院院长,柴洪峰先生在金融领域拥有卓越的工作成就和深厚的学术造诣。他的研究涵盖了金融科技、人工智能等领域,在推动金融行业发展方面做出了重要贡献。他就金融垂域模型构建、金融知识图谱与大模型融合以及金融大模型的监管三大主题发表重要的前瞻与预判。
柴院士提出:“大模型作为金融科技的利器,正不断地赋能金融行业。站在新的历史起点上,在新的历史方位和发展格局中,我们产业研各界,应针对金融科技发展的问题,聚焦国家关键性、基础性、牵引性战略需求任务,发挥产学研协同优势攻关金融科技关键技术,为上海国际金融中心、科创中心建设贡献力量。未来,随着数据、算力和算法的进一步发展,大模型将在金融科技领域发挥更大的作用。同时,我们也需关注数据隐私和安全、资源需求以及透明性与可解释性等挑战,努力促进大模型赋能金融科技的持续创新与发展。”
上海市数据科学重点实验室主任,复旦大学教授肖仰华指出:“大模型不是‘烟花秀’,而是要成为先进生产力,这一波AGI的革命是一场全新的‘元革命’。大模型对于产业发展来讲有非常重要的意义,有了大模型之后企业迎来了一个新的机会,实现了一种“端到端”的价值变现。”
本次论坛的重头戏之一,达观数据董事长兼CEO陈运文正式发布曹植!正式对外开放公测!陈运文表示,全新的文字处理时代近在眼前。
达观数据“曹植”大模型,作为垂直专用的国产大语言模型,具有长文本、垂直化和多语言的特点,通过并联多种模型和知识图谱,曹植大模型支持多种语言长文本的自动化写作和多语种翻译等功能,全方位赋能长文档写作、机器翻译、语义分析审核、知识问答、text-to-SQL等场景,可针对不同行业、领域的文案需求,进行深度优化和个性化定制。无论是金融、政务还是工业,曹植大模型都能提供精准、有效的文案创作解决方案。
区别于一问一答的简单短文本生成,“曹植”可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,同时具有自动排版、智能纠错、文本润色、自动生成摘要等特色功能;还将实现多模态内容生成,如长文档中的表格、图表、图片等;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作,辅助人工大幅提高办公效率;在长文档翻译方面,对原文的标题、段落等内容实现 1:1版式还原,提供实时的翻译体验,广泛应用于多语言文档密集处理的场景。
曹植长文本写作应用
“曹植”针对不同行业开发特定应用和训练专属数据库,使用海量训练数据进行曹植大模型的预训练,生成具备基础语言能力和垂直应用能力的模型;支持个性化定制,本地服务器私有化部署,独家提供精调服务,以加强垂直领域专用任务的能力;坚持训练数据与算法模型自主可控,与国产GPU合作伙伴开展长期合作,不断优化高质量硬件设备,以适应市场需求和技术发展,让大模型赋能百业。
本次大会另一重磅发布是,作为曹植大模型国产战略合作伙伴,UCloud优刻得AIGC算力底座也在本次大会亮相,优刻得董事长兼CEO季昕华发表了“中立安全云计算助力大模型发展”主题演讲,介绍优刻得在AIGC领域的技术产品、工程能力和生态建设等发展情况。
优刻得在本次WAIC上隆重亮相的AIGC解决方案全景图,通过深厚的技术积累和全面的系统工程能力,推出涵盖了数据中心、计算平台、管理平台、网络服务、应用服务、生态接口的一系列产品和解决方案。开放、安全、定制的AIGC解决方案让客户既能利旧已有服务器资源,又可以便捷享受公有云的弹性扩容,实现IT层面的降本增效。并可通过数据中心托管专区,为用户提供完全物理隔离的独享机柜、服务器、网络、存储资源,结合完整的安全方案和专家服务,确保了用户的大模型平稳运行。
优刻得 AIGC解决方案全景图
私有化是垂直大模型的发展方向,针对政府、金融、教育、制造、基金等客户大模型场景,优刻得 AIGC 私有化算力中心和全栈私有云平台,从大模型训练推理多样化场景出发,为客户推荐机型提供预装部分工具的镜像;并提供推理GPU算力/网络资源;同时结合优刻得一云多芯且自主可控的私有云平台,提供虚拟化、存储、网络及 MaaS 模型的私有化交付解决方案,支持 Alpaca-LoRA、ChatGLM、T5、MiniGPT-4 及 Stable Diffusion 等大模型,可覆盖知识推理、问答、图文生成及绘画设计等 AI 应用领域,从而在用户本地或自己数据中心内部署针对特定场景的大模型服务,既可以为内部提供AI训练/推理服务,也可选择性对外提供AI推理服务。
优刻得 AIGC 私有化方案架构图
在会议圆桌环节,来自上海好买财富管理有限公司的CIO付晓敏、无界AI联合创始人马千里、燧原科技创始人张亚林、上海卜算子医疗科技有限公司首席技术官石思远等嘉宾来一起探讨了大模型在金融、医疗等领域的应用未来。
UCloud优刻得将继续通过中立安全的算力底座,与“曹植”大语言模型共同探索AIGC更大的发展前景和更广阔的发展空间。共同提升企业私有化应用大模型能力,促进大模型企业级落地进程。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。