至顶网服务器频道 12月25日 新闻消息(文/李祥敬): 近日,2018中国大数据技术大会(BDTC)在北京举行。作为大数据领域极具影响力的行业盛会,已成功举办十一届。数据行业不仅繁花似锦,更诞生了诸多行业创新者。中科天玑就是其中的典型代表。作为BDTC中国大数据技术大会的创始人之一和本次大会的协办者,中科天玑见证了大数据技术生态在中国的建立、发展和成熟。在大会举行期间,中科天玑技术副总裁兼研发中心总经理冯凯接受了记者的采访,畅谈了他眼中的大数据以及中科天玑的布局。
中科天玑技术副总裁兼研发中心总经理冯凯
在冯凯看来,现在大数据市场不断成熟,市场也呈现了新的变化。比如基础类和平台类大数据软件的需求在下降,不像前几年那么热了。这里面的原因除了整个市场环境的成熟外,还在于大数据伴随着开源技术成长,基于开源技术的大数据产品已经能够满足要求不高的用户,所以大数据基础软件的商业模式不再是市场的主流。
冯凯说,现在大数据的应用产品比如可视化、资产管理等在保持平稳增长。此外,垂直领域大数据产品例如教育、精准医疗、风险控制等需求增长明显。因为这个领域人工智能与大数据的结合较多。数据资产管理的需求也随着大数据市场的发展而产生,特别是拥有大量数据的企业对于这方面的需求是比较强烈的。
现在新技术不断发展,比如人工智能、物联网等,这对于大数据市场产生了何种影响呢?冯凯表示,新技术与大数据技术是相互促进的,带动了整个大数据市场的发展。
冯凯认为,大数据技术与人工智能技术都是为了解决用户问题,他们针对的客户需求与市场有一定程度的类似,技术上也有有一些共通的地方可以相互借鉴,很多公司都同时拥有大数据和人工智能两个标签“大数据市场与人工智能市场不是此消彼长,他们相互促进,并不是对立的关系。”
既然现在大数据市场越来越成熟,那么是不是用户落地大数据方面就没有障碍了呢?冯凯说,诚如前面所言,肯为大数据基础软件买单的企业越来越少,如何帮助用户从数据中发现价值成为当下大数据玩家需要思考的问题。
数据是否产生价值取决于数据以及数据的挖掘方向。冯凯表示,企业应该鼓励技术人员从产品和业务角度进行尝试,驱动创新。业务人员需要与技术人员如何协调沟通很重要,很多时候技术人员并不能有效洞察数据的业务价值,这也是目前数据科学家受到追捧的原因。因为只有站在业务的角度看数据才能发现更多数据价值,所以企业如果想从数据中获得更大价值,就要实现技术人员与业务人员的有效沟通,打通技术与业务的阻隔。”
另外,大数据技术需要与业务结合,哪些技术能够解决哪些业务问题,这些也需要企业进行思考,而不是跟风,比如现在的深度学习等技术。这些技术的确很领先,但是需要结合企业的业务应用场景。
据冯凯介绍,2010年,由中科院计算所孵化的大数据高新技术企业中科天玑数据科技股份有限公司正式诞生。作为大数据分析系统国家工程实验室的示范应用基地,成立之初,中科天玑以互联网信息挖掘、舆情监测业务起家。而今天,中科天玑已经完成了大数据行业的多元化布局。
冯凯说,依托中科院计算所,中科天玑在技术人才储备和技术视野具备非常大的优势。另外,中科天玑在网信、情报、教育、金融等行业有着深厚的布局。比如2017年5月,互联网金融监管平台上线,提供互联网金融监测、企业征信、企业重点人群管理等功能,可为金融监管部门及对金融领域企业及人群画像、深度关联分析、风险监测等提供技术支撑。
而在大数据人才培养方面, 2017年6月,中科天玑推出了大数据科研平台,覆盖了数据处理、机器学习、数据可视化等领域,可接入各种数据源,实现数据采集、存储、分析挖掘、价值展现的全流程管理,帮助科研工作者简化流程,提升工作效率。同期上市的大数据实验室平台,内置了丰富的大数据课程资源与项目案例包,成为高校大数据教学、实训与人才培养的重要利器。
在过去一年,中科天玑在舆情分析、媒体影响力等业务都有长足的发展,比如中科天玑互联网舆情分析系统是以“天玑大数据处理引擎”为核心,将数据采集获取、智能分析处理、舆情发现处置三层技术服务体系融为一体的大数据舆情监测分析云服务平台。
系统实现对境内、外全媒体热点舆情事件的事前、事中、事后7乘24小时实时采集、抽取、挖掘和分析处理,为政府、企业、媒体机构提供精准舆情检索、负面舆情感知、热点舆情聚合、专项舆情监测、自动舆情预警、智能舆情报告等多维舆情信息服务,为网络安全监管、风险预警、应急处置、舆论引导提供技术支撑。
另外,中科天玑还在企业多维价值分析方面进行探索,帮助相关行业客户分析企业价值,比如投资顾问等。“基于底层的大数据采集、分析、管理平台,中科天玑不断加强数据管理,与客户进行场景化应用探索。”冯凯说,“有明确业务需求的客户,我们会帮助他们降低实施成本,实现快速交付,满足业务需求;而对于哪些没有确认业务需求但是拥有大量数据的客户,中科天玑帮助他们实现有效数据资产管理、逐步实现数据治理的标准化和规范化,最终实现从数据中挖掘价值。”
谈及未来的规划,冯凯表示,中科天玑将不断做大做强底层大数据引擎,从基础平台着手,强化技术投入,帮助企业实现混合数据管理能力。同时,中科天玑也将不断与业界合作伙伴展开积极合作,发挥各自优势,拓展大数据市场。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。