今年中国股民数量突破1亿,每14人就有一人炒股,炒股从有钱人和投机者的玩物,变成大众的风潮。 对于股市的评说和解读成为股民茶余饭后的焦点,99乐投财经直播间就是为股民提供学习、交流与分享金融投资知识的财经直播平台,并由于其专业和流畅的体验成为此类应用的翘楚。面对平台暴增的用户量,浪潮SA5112M4服务器支撑99乐投的稳定高效运营,在众多财经类直播应用中脱颖而出。
借直播大势,将信息转为价值
目前,网络直播已经逐渐渗入到我们的生活,只要拥有一技之长,普通人在短时间内也能迅速变“网红”。并且随着直播行业从简单的秀场向细分的直播领域迈进,财经垂直领域的网红们靠实力远比靠颜值走得更远。
其实,财经领域很早就实现了网络直播,一些股票解盘、经济形势预测、投资方向等内容,早已通过电视、电脑实现了播报。但是目前市场上的财经直播平台良莠不齐,一方面是主播的专业水平不一,另一方面是视频直播平台不够流畅和清晰。
为此,99乐投财经直播平台一方面对直播内容严格控制,保证受众能够快速获取到实时、准确的股市信息;另一方面也在直播平台的IT基础设施投入更多,提升受众的观看体验。
网络直播难在哪?
网络直播是一个相对新兴的业务,不论是从网络设备、带宽需求,还是服务器的计算、存储等资源的消耗上,直播的要求都更高。从99乐投来看下,困难到底在哪?
视频数据至少每秒50K才能保证流畅,假设一个直播房间有1000人同时观看的话,,那么每秒的总数据则是50*1000=50000K,相当于49MB,大约390Mb。仅仅一个房间,每秒消耗的流量就达到390Mb,这是相当惊人的。
直播相比录播,讲究的就是实时性。比如世界杯直播,网络比电视慢上几秒是正常的,但如果慢几十秒甚至几分钟,那么直播就没有意义了,别人欢呼的时候,你却淡定的看人传球?目前业内主流直播平台的视频延迟在3-6秒之间,保证6s以下的延迟,就能基本保证博主和粉丝间的互动流畅。
数据量大,且要求实时转码传输,这对于整个服务器端的IT架构有着严苛的要求。强调快速和连续性的直播业务,一方面要求每一台服务器的宕机事件尽可能接近于0,另一方面则需要智能DNS、LVS负载均衡等技术来实现快速的故障转移和恢复。
浪潮服务器支撑高效直播平台
那么如何才能破解这些难题?首先,对于数据流量大的特点,99乐投需要更大的网络带宽,以应对极高的同时在线直播人数。第二,需要计算能力较强的服务器集群来进行视频编解码,在压缩数据流量、降低延迟的同时,确保视频质量优秀。第三,要求服务器具备高可用性和可靠性,并能够进行快速的故障定位和修复。
浪潮SA5112M4
从99乐投这类应用的特点来看,由于需要服务器集群来实现并行视频处理和分发,因此对单节点网络带宽没有太大的需求,网络配置的堆砌就显得没有必要。因此浪潮SA5112M4所支持的“双千兆”、“四千兆”、 “SAS+双千兆”等板载网络方案, 就足够满足99乐投直播平台的网络应用, 采用较低成本的千兆网络就足够满足集群对网络的开销。另外,浪潮SA5112M4还能够通过外插形式将网络升级为万兆,避免了网络在未来成为提升系统利用效率的瓶颈。
面对99乐投的业务流量速度快、并行编解码应用多的诉求。浪潮SA5112M4搭载最新的英特尔双路至强处理器E5-2600v4系列CPU,16个DDR4内存插槽,最大内存工作频率2133MHz,保障直播视频处理和分发的高效。
并且,为了保障高速的数据处理和流动,99乐投选择直通模式高速SAS硬盘,不组RAID,而是采用软件形式在上层应用中做容灾和备份,在降低服务器转码负载的同时提供高视频质量的转码和视频输出通道,保证直播的高并发,高可用,高I/O能力充分发挥,实现核心直播业务流畅运行。
而在可用性方面,浪潮SA5112M4背板、电源、风扇、线缆、扩展卡等主要部件实现了免工具维护。主要问题都可通过前面板指示灯进行定位,直观地显示故障部件,实现故障的快速处理。并且支持PTAS功能,通过平台提供功耗、散热和工作负载的智能化来支持动态的资源管理。可以将运营成本降低约20%,,同时恢复高达50%的未使用的散热能力,并最大限度地提高了运营效率。
99乐投相关负责人表示:浪潮SA5112M4可用性和业务兼容性涵盖了99乐投直播平台的综合应用场景,产品应用场景丰富,兼容性优秀,成为支撑99乐投快速发展的重要基石。
浪潮视频编解码解决方案
目前,直播类的应用涉及到多方面的工作,如传输、转码、存储、CDN等,所以业界主流的做法仍以传统双路E5服务器为主流硬件支撑。近期,浪潮针对直播类客户,推出视频编解码解决方案,专门用于视频的处理,能够达到至少10倍的性能提升和64%的TCO降低,配合传统双路服务器组建的直播处理集群,将在在未来将成为直播等视频类业务的主流架构。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。