至顶网服务器频道 07月21日 新闻消息(文/董培欣):
当前公有云上的云主机技术已经基础成熟,无论BAT还是其它公有云厂商,都在对外推广其云主机产品。而云主机所可以提供的网络应用处理能力如何?始终不得而知,各大公有云厂商也从未有相关技术指标公布。云服务商往往会用云计算系统规模庞大,难以进行测试为由进行搪塞。
要想计算出一个粮仓内可以装多少粒米,首先需要先测量出一粒米的体积。要想衡量一个云计算系统的性能,首先需要了解一台云主机可以提供多高的应用处理能力。接下来的问题是用什么方法评估云主机的应用处理能力。对于云计算系统而言,网络、计算、存储都有相应的测试方法和评估指标,但是这些指标有各自不同的侧重,对于云计算系统的整体应用性能而言,并不能直观的去进行反映。这也是目前云计算系统难以进行测试的一个主要原因。但实际上有一个非常直观,而且对网络、计算、存储性能都可以兼顾的测试指标——网络应用性能,可以解决这方面的问题。
因此至顶网将组织一次公有云主机的网络应用性能公开对比测试活动,对当前公有云主机网络应用处理性能进行对比,使用户可以对公有云主机的网络应用性能有一个较清晰的了解。
网络应用性能,就是对网络中应用连接请求的响应能力进行测试。通过网络应用性能测试可以真实的反应出用户发出网络应用请求后,系统的服务的综合处理能力。
早在十多年前,就已经有专用的测试仪表可以对网络应用处理性能进行测试,而且目前正广泛应用在网络及网络安全产品的网络应用性能测试之中。对服务器的网络应用性能,同样也可以用此类方法进行评测。
如今,伴随着网络虚拟化技术的发展,物理的应用性能测试仪表也在向虚拟化测试工具转变,从而适应当前虚拟化网络应用性能的评估需求。这也为云主机的网络应用性能测试,提供了可行的测试办法。下面我们就来看一下通过网络应用性能测试所得到的性能测试指标可以对云主机进行哪些方面的评估:
这个测试是通过测试工具在应用层模拟真实的用户请求,考察云主机或服务器对这些应用请求的处理能力。(当前有很多云计算厂商也在宣传自身可以应对多大多大的并发,但这个说法实际上并不严谨。实际上应该统计的就是这个应用请求的处理速率,也就是每秒种可以处理多少的应用请求。)
通过应用请求处理性能,可以直接对云主机网络应用处理能力进行评估,并且可以在测试过程中,同时对CPU占用率进行查看,从而对云主机CPU处理性能进行分析。
在对应用请求处理速率进行测试的时候,不但可以对应用请求性能进行测试,同时,还可以统计应用请求的响应时延,以及完成应用连接请求的时间。通过这些指标,可以对云主机的虚拟网络处理性能进行分析。
在并发用户数的测试,实际上是考察云主机可以最大保持多少个用户的网络连接不被中断。是对网络性能的另一个考察方向。由于保持连接需要占用部分内存空间,这个测试的成绩会与云主机所提供内存空间大小有很强相关性。
测试云主机可提供的最大网络带宽,如果测试文件足够大的话,还可以附带对云主机存储性能进行一下测试。
通过上述测试指标可以了解,网络应用性能测试,不简单是对云主机的网络性能进行评测,而是对云主机网络、计算、存储能力的综合考察。并且可以对网络应用体验进行直观的反馈。
用对单台云主机网络应用性能做为基础,可以对整个云计算系统的应用处理性能进行一个大体的推断,从而可以了解云计算数据中心这个大仓库到底可以装多少“米”。
当前获得公认的网络应用性能测试方法是:通过专业的网络应用层测试仪表,对网络产品的应用处理能力进行评测。因此,在本次公开评测中,至顶网也会与专业测试仪表厂商进行合作,利用其专业的虚拟化应用性能测试工具,对云主机的网络应用性能进行评测。
测试目标:云主机虚拟网络端口
无论是在公有还是私有的云计算系统之中,均离不开虚拟网络端口对应用数据进行转发。了解在不同配置下,云主机虚拟网络端口应用处理能力,以此做为基准,可以对整套云计算系统应用性能进行分析。
测试方法:
租用三个公有云主机
a) 控制端云主机一台,要求:有两个虚拟网口,其中一个分配固定公网IP,并开放3389端口,另一个内网端口可与测试端云主机互通,内网防火墙最好没有端口阻断设置。Windows操作系统、主机配置 2核4G,10G左右硬盘空间
b) 测试端云主机一台,两个虚拟网口,其中一个内网端口可与测试端云主机互通,内网防火墙最好没有端口阻断设置。另一个内网端口可与被测云主机互通。支持qcow2镜像加载(如不支持,则需安装linux系统,并手动用利avalanche anywhere方式进行安装)、主机配置 4核8G,20G左右硬盘空间
c) 被测云主机一台,单个虚拟网口,安装windows 2003或2008操作系统,开启IIS服务。主机配置1核1G、2核4G、4核8G,测试不同配置下,Http网络应用连接性能。(如果采用Linux + apache,需公有云厂商负责具体调优工作)
测试时间:
计划为:2017年7月11日起至2017年8月18日止
测试厂家
初步选定阿里云、百度云、腾讯云、青云四家进行测试,计划每家测试约一周时间。华为,金山,azure,ucloud等云计算厂商也可以看情况进行安排。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。