制造商面临从工艺问题到设备故障在内的诸多挑战。然而,一个通常被忽视的挑战是,当支持工厂运行的关键软件和服务器出现问题时,人们往往不会注意到,直到出现无法挽回的后果。当一个工艺设备发生故障时,会造成不便,但如果制造执行系统(MES系统)出现故障,整个工厂将陷入瘫痪。
鉴于工厂的正常运行时间至关重要,您很可能已经制定了监控指标来监测工厂运行情况,并且有质量计划来进行改进。确保产品在工厂的各个工序之间连续流动,并得到正确处理,是保证您公司盈利的关键。制造软件系统在提高生产效率和质量方面也发挥着重要作用,无论它们是否正常运行。然而,虽然我们不愿意去面对这一点,但有时服务器会宕机,网络也时而会出现问题。有时,由于附近正在进行设备安装,整个服务器机房的电源会意外关闭,这将导致计划外的停机,甚至可能导致整个工厂停工。这对业务的影响是巨大的。
对于一个规模适中的产量较低的晶圆厂来说,一小时的意外停机就会给公司造成1万美元的损失。对于一个中等产量的晶圆厂来说,损失可能是10万美元。而对于一个先进的、产量较高的晶圆厂来说,损失可能高达100万美元。因此,找到减少甚至避免制造软件系统意外停机的方法至关重要。SmartFactory Monitor可以帮助您实现这一目标。
SmartFactory Monitor是一个实时监控软件解决方案,让您能够及时发现生产系统中的问题,并立即采取纠正措施,以确保生产系统不受影响。在其最基本的形式中,它提供了一个可定制、易于理解的仪表盘,显示您生产系统的当前状态。这样,当出现问题时,几乎可以无缝地查看和发送通知。
其关键特征之一是可定制性,您可以创建自定义视图,以显示随时间变化的性能趋势。其预测分析能力可在性能异常影响生产之前检测出这些异常。
SmartFactory Monitor可在普通硬件设备上运行,进程占用内存空间小,操作系统可任意选择。另外,它与SmartFactory智能工厂解决方案软件产品组合中的其他产品预集成,能够追踪您的所有制造系统——应用程序、数据库以及Windows和Linux服务器。该系统可实时监控系统性能日志、错误日志、事件日志、应用程序日志、系统日志、服务器日志等一切可以反映系统性能和健康状态的信息。
各种来源的数据都被汇总到Splunk软件中,该软件能够捕获、索引和关联实时数据。然后这些数据可以生成自动通知并实现可视化效果,以突出数据的趋势并发现问题。此外,汇总到Splunk的数据还可用作机器学习算法的训练数据,从而实现预测分析,以避免问题在上升为工厂级别的问题之前被识别和解决。
预构建的仪表盘可以让您快速启动和运行,监测所有系统日志。使用Splunk软件,您可以轻松地实现系统性能可视化,并利用应用材料公司工程师开发的复杂预测算法检测出趋势、异常和异常值。
SmartFactory Monitor提供一套全面的生产监控功能,可应对制造商面临的众多关键支持系统挑战。其主要目标是通过缩短发现和解决系统问题的时间,减少工厂意外停机时间。最终,通过性能趋势分析和预测分析,帮助预防对工厂运行产生影响的问题。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。