至顶网服务器频道 12月25日 新闻消息(文/李祥敬): 近日,2018中国大数据技术大会(BDTC)在北京举行。作为大数据领域极具影响力的行业盛会,已成功举办十一届。数据行业不仅繁花似锦,更诞生了诸多行业创新者。中科天玑就是其中的典型代表。作为BDTC中国大数据技术大会的创始人之一和本次大会的协办者,中科天玑见证了大数据技术生态在中国的建立、发展和成熟。在大会举行期间,中科天玑技术副总裁兼研发中心总经理冯凯接受了记者的采访,畅谈了他眼中的大数据以及中科天玑的布局。
中科天玑技术副总裁兼研发中心总经理冯凯
在冯凯看来,现在大数据市场不断成熟,市场也呈现了新的变化。比如基础类和平台类大数据软件的需求在下降,不像前几年那么热了。这里面的原因除了整个市场环境的成熟外,还在于大数据伴随着开源技术成长,基于开源技术的大数据产品已经能够满足要求不高的用户,所以大数据基础软件的商业模式不再是市场的主流。
冯凯说,现在大数据的应用产品比如可视化、资产管理等在保持平稳增长。此外,垂直领域大数据产品例如教育、精准医疗、风险控制等需求增长明显。因为这个领域人工智能与大数据的结合较多。数据资产管理的需求也随着大数据市场的发展而产生,特别是拥有大量数据的企业对于这方面的需求是比较强烈的。
现在新技术不断发展,比如人工智能、物联网等,这对于大数据市场产生了何种影响呢?冯凯表示,新技术与大数据技术是相互促进的,带动了整个大数据市场的发展。
冯凯认为,大数据技术与人工智能技术都是为了解决用户问题,他们针对的客户需求与市场有一定程度的类似,技术上也有有一些共通的地方可以相互借鉴,很多公司都同时拥有大数据和人工智能两个标签“大数据市场与人工智能市场不是此消彼长,他们相互促进,并不是对立的关系。”
既然现在大数据市场越来越成熟,那么是不是用户落地大数据方面就没有障碍了呢?冯凯说,诚如前面所言,肯为大数据基础软件买单的企业越来越少,如何帮助用户从数据中发现价值成为当下大数据玩家需要思考的问题。
数据是否产生价值取决于数据以及数据的挖掘方向。冯凯表示,企业应该鼓励技术人员从产品和业务角度进行尝试,驱动创新。业务人员需要与技术人员如何协调沟通很重要,很多时候技术人员并不能有效洞察数据的业务价值,这也是目前数据科学家受到追捧的原因。因为只有站在业务的角度看数据才能发现更多数据价值,所以企业如果想从数据中获得更大价值,就要实现技术人员与业务人员的有效沟通,打通技术与业务的阻隔。”
另外,大数据技术需要与业务结合,哪些技术能够解决哪些业务问题,这些也需要企业进行思考,而不是跟风,比如现在的深度学习等技术。这些技术的确很领先,但是需要结合企业的业务应用场景。
据冯凯介绍,2010年,由中科院计算所孵化的大数据高新技术企业中科天玑数据科技股份有限公司正式诞生。作为大数据分析系统国家工程实验室的示范应用基地,成立之初,中科天玑以互联网信息挖掘、舆情监测业务起家。而今天,中科天玑已经完成了大数据行业的多元化布局。
冯凯说,依托中科院计算所,中科天玑在技术人才储备和技术视野具备非常大的优势。另外,中科天玑在网信、情报、教育、金融等行业有着深厚的布局。比如2017年5月,互联网金融监管平台上线,提供互联网金融监测、企业征信、企业重点人群管理等功能,可为金融监管部门及对金融领域企业及人群画像、深度关联分析、风险监测等提供技术支撑。
而在大数据人才培养方面, 2017年6月,中科天玑推出了大数据科研平台,覆盖了数据处理、机器学习、数据可视化等领域,可接入各种数据源,实现数据采集、存储、分析挖掘、价值展现的全流程管理,帮助科研工作者简化流程,提升工作效率。同期上市的大数据实验室平台,内置了丰富的大数据课程资源与项目案例包,成为高校大数据教学、实训与人才培养的重要利器。
在过去一年,中科天玑在舆情分析、媒体影响力等业务都有长足的发展,比如中科天玑互联网舆情分析系统是以“天玑大数据处理引擎”为核心,将数据采集获取、智能分析处理、舆情发现处置三层技术服务体系融为一体的大数据舆情监测分析云服务平台。
系统实现对境内、外全媒体热点舆情事件的事前、事中、事后7乘24小时实时采集、抽取、挖掘和分析处理,为政府、企业、媒体机构提供精准舆情检索、负面舆情感知、热点舆情聚合、专项舆情监测、自动舆情预警、智能舆情报告等多维舆情信息服务,为网络安全监管、风险预警、应急处置、舆论引导提供技术支撑。
另外,中科天玑还在企业多维价值分析方面进行探索,帮助相关行业客户分析企业价值,比如投资顾问等。“基于底层的大数据采集、分析、管理平台,中科天玑不断加强数据管理,与客户进行场景化应用探索。”冯凯说,“有明确业务需求的客户,我们会帮助他们降低实施成本,实现快速交付,满足业务需求;而对于哪些没有确认业务需求但是拥有大量数据的客户,中科天玑帮助他们实现有效数据资产管理、逐步实现数据治理的标准化和规范化,最终实现从数据中挖掘价值。”
谈及未来的规划,冯凯表示,中科天玑将不断做大做强底层大数据引擎,从基础平台着手,强化技术投入,帮助企业实现混合数据管理能力。同时,中科天玑也将不断与业界合作伙伴展开积极合作,发挥各自优势,拓展大数据市场。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。