日前,中国人民银行征信中心天津研发测试中心采用近百台浪潮高端双路服务器NF5280M4搭建其大数据研发平台,用来开发符合其业务需求的数据库、统计平台和评分模型等相关软件。
数据多并不是大数据,能够利用IT先进技术将碎片化的信息整合起来才能形成真正有用的大数据,征信的基本过程就是将分散的、看似用处不大的局部信息整合成可以完整描述消费者信用状况的全局信息。
未来征信行业的核心竞争力就在于其数据挖掘能力和模型开发能力,为此,中国人民银行征信中心决心搭建专门的大数据研发平台,开发出适合自己的信用评估模型、更多样的数据库类型和业务平台,从而在海量数据中挖掘出更多不易被发现的信用信息。大数据研发平台需要对新开发的平台和模型进行成百上千次的模拟、测试,进而不断细化和更新,这就需要支撑平台的服务器具备高可靠性,保障平台持续稳定运行。
中国人民银行征信中心专门负责企业和个人征信系统(即金融信用信息基础数据库)的建设、运行和维护。如今,其征信系统已成为世界规模最大、收录人数最多、收集信贷信息最全、覆盖范围和使用最广的信用信息基础数据库。
经过反复考察,中国人民银行征信中心最终选择了浪潮高端双路服务器NF5280M4。NF5280M4采用系统环境动态感知和动态功率调节技术,配合先进的风冷系统实现最佳工作环境,可以保障系统稳定运行;除了电源、风扇、硬盘冗余热插拔外,可实现关键部件故障自动检测和修正,故障部件自动隔离等高级RAS特性。
大数据时代,没有现成的免费午餐,数据和模型都需要提炼,拿来主义是行不通的。目前我们已经积累了海量数据,依托浪潮服务器搭建的大数据开发平台,稳定可靠,能够帮助我们开发出更多的数据分析平台和信用评估模型,更好地利用大数据做好信贷审批和风险管理。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。