至顶网服务器频道 07月21日 新闻消息(文/董培欣):
当前公有云上的云主机技术已经基础成熟,无论BAT还是其它公有云厂商,都在对外推广其云主机产品。而云主机所可以提供的网络应用处理能力如何?始终不得而知,各大公有云厂商也从未有相关技术指标公布。云服务商往往会用云计算系统规模庞大,难以进行测试为由进行搪塞。
要想计算出一个粮仓内可以装多少粒米,首先需要先测量出一粒米的体积。要想衡量一个云计算系统的性能,首先需要了解一台云主机可以提供多高的应用处理能力。接下来的问题是用什么方法评估云主机的应用处理能力。对于云计算系统而言,网络、计算、存储都有相应的测试方法和评估指标,但是这些指标有各自不同的侧重,对于云计算系统的整体应用性能而言,并不能直观的去进行反映。这也是目前云计算系统难以进行测试的一个主要原因。但实际上有一个非常直观,而且对网络、计算、存储性能都可以兼顾的测试指标——网络应用性能,可以解决这方面的问题。
因此至顶网将组织一次公有云主机的网络应用性能公开对比测试活动,对当前公有云主机网络应用处理性能进行对比,使用户可以对公有云主机的网络应用性能有一个较清晰的了解。
网络应用性能,就是对网络中应用连接请求的响应能力进行测试。通过网络应用性能测试可以真实的反应出用户发出网络应用请求后,系统的服务的综合处理能力。
早在十多年前,就已经有专用的测试仪表可以对网络应用处理性能进行测试,而且目前正广泛应用在网络及网络安全产品的网络应用性能测试之中。对服务器的网络应用性能,同样也可以用此类方法进行评测。
如今,伴随着网络虚拟化技术的发展,物理的应用性能测试仪表也在向虚拟化测试工具转变,从而适应当前虚拟化网络应用性能的评估需求。这也为云主机的网络应用性能测试,提供了可行的测试办法。下面我们就来看一下通过网络应用性能测试所得到的性能测试指标可以对云主机进行哪些方面的评估:
这个测试是通过测试工具在应用层模拟真实的用户请求,考察云主机或服务器对这些应用请求的处理能力。(当前有很多云计算厂商也在宣传自身可以应对多大多大的并发,但这个说法实际上并不严谨。实际上应该统计的就是这个应用请求的处理速率,也就是每秒种可以处理多少的应用请求。)
通过应用请求处理性能,可以直接对云主机网络应用处理能力进行评估,并且可以在测试过程中,同时对CPU占用率进行查看,从而对云主机CPU处理性能进行分析。
在对应用请求处理速率进行测试的时候,不但可以对应用请求性能进行测试,同时,还可以统计应用请求的响应时延,以及完成应用连接请求的时间。通过这些指标,可以对云主机的虚拟网络处理性能进行分析。
在并发用户数的测试,实际上是考察云主机可以最大保持多少个用户的网络连接不被中断。是对网络性能的另一个考察方向。由于保持连接需要占用部分内存空间,这个测试的成绩会与云主机所提供内存空间大小有很强相关性。
测试云主机可提供的最大网络带宽,如果测试文件足够大的话,还可以附带对云主机存储性能进行一下测试。
通过上述测试指标可以了解,网络应用性能测试,不简单是对云主机的网络性能进行评测,而是对云主机网络、计算、存储能力的综合考察。并且可以对网络应用体验进行直观的反馈。
用对单台云主机网络应用性能做为基础,可以对整个云计算系统的应用处理性能进行一个大体的推断,从而可以了解云计算数据中心这个大仓库到底可以装多少“米”。
当前获得公认的网络应用性能测试方法是:通过专业的网络应用层测试仪表,对网络产品的应用处理能力进行评测。因此,在本次公开评测中,至顶网也会与专业测试仪表厂商进行合作,利用其专业的虚拟化应用性能测试工具,对云主机的网络应用性能进行评测。
测试目标:云主机虚拟网络端口
无论是在公有还是私有的云计算系统之中,均离不开虚拟网络端口对应用数据进行转发。了解在不同配置下,云主机虚拟网络端口应用处理能力,以此做为基准,可以对整套云计算系统应用性能进行分析。
测试方法:
租用三个公有云主机
a) 控制端云主机一台,要求:有两个虚拟网口,其中一个分配固定公网IP,并开放3389端口,另一个内网端口可与测试端云主机互通,内网防火墙最好没有端口阻断设置。Windows操作系统、主机配置 2核4G,10G左右硬盘空间
b) 测试端云主机一台,两个虚拟网口,其中一个内网端口可与测试端云主机互通,内网防火墙最好没有端口阻断设置。另一个内网端口可与被测云主机互通。支持qcow2镜像加载(如不支持,则需安装linux系统,并手动用利avalanche anywhere方式进行安装)、主机配置 4核8G,20G左右硬盘空间
c) 被测云主机一台,单个虚拟网口,安装windows 2003或2008操作系统,开启IIS服务。主机配置1核1G、2核4G、4核8G,测试不同配置下,Http网络应用连接性能。(如果采用Linux + apache,需公有云厂商负责具体调优工作)
测试时间:
计划为:2017年7月11日起至2017年8月18日止
测试厂家
初步选定阿里云、百度云、腾讯云、青云四家进行测试,计划每家测试约一周时间。华为,金山,azure,ucloud等云计算厂商也可以看情况进行安排。
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。