传感器无处不在——例如,当道路空无一人时关闭高速公路灯时可监测桥梁的健康状况,监测电信网络和电网的复杂信号。这些传感器的每一次闪烁都是一个字节的数据,经过精心记录和存储。随着过去十年数据存储成本的暴跌,我们谈论的是数字仓库中雪崩般的数据。
这些数据中的大部分都在黑暗中,没有经过分析,也看不见。这就是专家们所说的暗数据。现在,随着人工智能进入基础设施领域,这些休眠的数据即将成为人们关注的焦点。
IEEE终身高级会员Raul Colcher表示:“事实上,似乎有大量关于基础设施运营的数据可以更好地用于提高其有效性。”
人工智能因数据而蓬勃发展——数据越多越好。当涉及到训练复杂的人工智能模型时,这些多年来从无数传感器和系统中收集的暗数据可能非常有价值。
那么,揭露这些暗数据有什么大不了的?首先,它改变了基础设施运营的游戏规则。随着人工智能的介入将暗数据带入聚光灯下,我们可以期待效率的飞跃,以及设计和使用我们的基础设施的新方法,以实现数据比人更频繁移动的未来。
字节构建得更好
很多时候,暗数据没有被使用,因为它没有被正确标记,因此很难分析。一些研究表明(https://ieeexplore.ieee.org/document/9740126),使用暗数据可以大大改进在手机网络中分配资源的机器学习算法。在另一个案例中,一家石油和天然气工厂的数据科学家能够使用暗数据在不干扰运营的情况下改进工厂的数字模型。
哪里的影响最大?
分析和建模这些数据的好处是巨大而多样的。从规划到运营、维护等,基础设施的各个方面都可能发生转变。描绘更准确的模型、更好的自动化,以及对我们的系统如何真正工作的更深入理解。
挑战
然而,利用暗数据也面临着一些挑战,暗数据虽然丰富,但并不总是干净或无错误的。数据质量、偏见、数据来源和安全性等问题迫在眉睫。解决这些挑战对于充分发挥人工智能在基础设施领域的潜力至关重要。
正如IEEE会员汪齐齐所言:“数据量的激增并不保证更好的结果。过滤掉干扰或质量低劣的数据提出了重大挑战。” 中国正积极探索利用人工智能技术处理庞大的基础设施数据,以促进其城市建设和发展。
了解更多:2023年是人工智能具有里程碑意义的一年,由于生成人工智能工具的力量,广大公众对人工智能的认识越来越高。IEEE Spectrum深入报道了发展情况。由此可以查看2023年最热门人工智能故事的总结:https://spectrum.ieee.org/ai-news-2023。
好文章,需要你的鼓励
英国Oxford Quantum Circuits公司在曼哈顿数据中心安装了纽约市首台量子计算机,旨在为客户提供更快速高效的AI程序运行服务。该公司计划未来3-5年投资数千万美元,部分用于采购英伟达芯片进行集成。这一"量子-AI数据中心"项目预计将显著提升数据生成效率,特别有利于金融领域应用。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
人形机器人公司Figure AI宣布完成超过10亿美元的C轮融资,资金将用于扩大机器人生产、构建英伟达GPU基础设施以加速训练和仿真,并扩展人类工作生活数据收集。该公司目标是在未来四年内交付10万台人形机器人,其Figure 02机器人搭载Helix AI智能系统,能够理解未见过的物体并做出合理行动。英特尔、英伟达、LG等公司参与投资。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。