9月27日,第二届中国大数据产业应用协同创新峰会在京召开,来自大数据产业学术研究、技术研发和应用实践领域的众多嘉宾汇聚一堂,就我国大数据领域宏观政策、基础平台建设以及行业应用实践等话题展开深入交流和探讨。作为中国大数据的领军企业中科曙光凭借在大数据技术、研发和应用等层面的明确规划、多年积累和成功实践,为该领域技术产业化贡献了具有高度可操作性的实施路径以及众多优秀案例,荣膺本届峰会评选的“2017中国大数据产业应用10强企业”。
会上,中科曙光大数据产品事业部总工程师宋怀明做了《数据中国,价值引擎》主题演讲,系统阐述了曙光作为大数据领军企业在该领域的整体战略思路和实践成果。他表示,公司多年来在大数据领域潜心探索,积极实践,已形成特色鲜明的差异化行业优势。未来,曙光还将进一步加大投入,发挥在大数据应用领域的领军地位和产业影响力,为推动我国大数据技术发展和产业化落地积极贡献力量。
本届峰会在科技部、国家信息中心和中央网信办的指导下,由中国大数据产业应用协同创新联盟和财经网共同举办。随着大数据行业的发展,峰会关注和探讨重点,已从整体技术趋势的前瞻和畅想,转变为对当前应用的分析和展望。
行业应用脚踏实地
多年来,曙光坚持倡导数据驱动创新,并结合企业自身发展积极制定了“数据中国”战略,将大数据定位为自身发展的战略高地。在“数据中国”战略及随后的“数据中国加速计划”推进实施过程中,以政府、科学、安全和工业等四个领域重点布局,形成了鲜明的行业优势。目前,曙光已在诸多行业出色实施了多个项目,为各个领域的大数据产业化落地建立了多个标杆,得到客户的一致好评和业内的广泛认可。
此外,曙光公司还积极发现和把握市场需求,不断创新,将人工智能融入大数据,形成一批大数据智慧应用,为客户提供更智能化的定制服务。
产业带动效应显著
大数据应用,对于产业和创新来说具有革新的意义,在数据层面打破了供给和应用的界限,也打通了行业之间的藩篱,为企业创新提供了广阔舞台和无限空间。我国市场广阔、用户众多、经济体制协同效应强,这给曙光这样的“国家队”提供了更佳的发挥空间,同时也提出了更高的要求。为此,曙光从多个层面作出了积极部署和努力:
展望未来,我国大数据产业化发展进程前景光明,机会无限,曙光将继续发力大数据方面的技术投入,提升整体技术水平,并将着眼于大数据在产业的实际应用,在大数据市场不断深耕。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。