24支球队、12座球场、51场比赛,谁将最终捧起德劳内杯?四年一个轮回,未来一个月之于中国球迷来说,将是没日没夜的一个月,足球、啤酒、调时差、黑眼圈……
与四年前相比,看球的方式也发生着翻天覆地的变化,越来越多的直播平台都参与了此次欧洲杯的直播之中,满足了各位观众对欧洲杯的所有期待。
手机直播,可以分为两个层面来理解。
一个层面是在手机上看网络电视直播。节目仍来源于官方信号源,除解说人不同,赛事画面来源于同一信号源,球迷看到的比赛实况完全相同,却可以选择自己喜欢足球解说员的频道来一饱耳福。例如有的人喜欢美女主播,有的人喜欢专业的足球解说等等
另一个层面,是对于体育赛事直播的拓展。以映客直播为例,你可以看到的不仅仅是赛事本身,还有诸多花絮,比如入场、球迷看台等等。直播的内容虽然没有电视里的多角度切换,没有高空航拍,也没有慢镜头回放,但是你得到的是亲临现场的感觉。现场观众的独特视角,会让看直播的人感觉什么是LIVE。
从这个意义上来说,手机视频直播,更像是用户的“千里眼”。体育迷们看比赛,有不同的个性视角,甚至还可以跟着主播在比赛间隙参观球场,或者与其他现场球迷进行交流互动。
跟体育赛事有关的直播仅仅是直播平台的一部分内容,可以说人们生活中任何一个方面都可以和直播联系上。目前已经有一些知名的主播粉丝数量超过百万,直播年薪过千万了。互联网给予了每个人展示自我和实现价值的机会,一台带摄像头的智能手机,就可以让用户跟全世界连接。直播平台的发展在未来不可限量。
在这些直播平台动辄会出现几百万人同时观看某一个主播的节目,这对于直播平台的存储设备提出了非常高的要求。(对了小编要开始安利存储了)
高并发,低延时的性能要求
首先,需要提供稳定的带宽和较低的数据延迟。在手机直播的过程中,会涉及上千万级的海量小文件处理,常见的码率有166MB/s、249MB/s码率的HD视频,306MB/s码率的2K视频,1224MB/s码率的4K视频。这就要求存储系统能够提供更高的单流读写带宽,同时还要保证观看者的多路数据流并发时不受影响。
超大的容量要求
其次,需要提供海量共享空间。一场90分钟高清的足球比赛的存储容量达到数GB,甚至10GB以上(加速弹幕和互动)。而随着欧洲杯比赛的后续进行,直播视频的存储容量将会直线上升。这就要求视频直播的存储系统实现高达PB级甚至EB级的灵活扩展。
性能和容量在线弹性扩展的要求
由于在手机直播的过程中,粉丝的数量是处于不断变化的,可能存在某个主播“一夜爆红”的情况,前一天可能才只有几千的观众,到第二天就井喷式的增加到几十万甚至几百万观众。那么在不中断业务的情况下,无缝的增加存储系统的性能和容量就成为手机直播网站非常关注的一点。
非常高的可靠性要求
最后,存储方案需要得到足够的可靠性保障。这是因为,视频直播的稳定性直接影响视频网站的访问量,如果观众在看直播的时候时不时的出现没有画面的情况,那么但肯定就会换到别的直播平台去了。这就要求存储系统具有非常高的稳定性和安全性,保证数据的绝对安全。
浪潮AS13000提供存储“制胜法宝”,手机直播更高效
留给直播平台选择产品的范围非常有限。这是因为, EB级的容量扩展、数百GB的聚合带宽、跨平台共享资源,再加上必须保障的存储系统可靠性对于存储系统提供商提出了很高的要求,真正能够“接单”的厂商寥寥无几。而在制作团队评估了浪潮工程推荐的AS13000海量存储系统,并对以上需求进行分析之后,选型方案基本算是“一锤定音”。
直播网站技术团队的负责人表示:“浪潮工程师为我们推荐的AS13000海量存储系统,在视频应用领域有着较广泛的应用,在广电总局及省级电视台、动画制作公司等都有众多应用,业界认可度也很高。而在后期实际应用中,这套高效的系统完全满足了影片制作对高性能、高扩展、高可靠的要求。”
浪潮海量存储AS13000
性能卓越
浪潮AS13000采用读写缓存分离机制的存储IO机制,保证任一直播业务的性能需求数据并发访问,每个节点同时承担数据/元数据,分担硬件故障风险、消除性能瓶颈;读写缓存分离,消除读写存储资源的争用,保证读性能、写性能。
真正的海量存储
浪潮AS13000最大提供480PB的存储容量和数十亿级海量小文件的读写操作。最大读写带宽1TB,满足了直播网络后续系列对数据容量增长的需要。
非常高的在线扩展能力
浪潮AS13000采用了横向扩展架构,系统最大可扩展至5000个节点,同时,系统支持在线无缝扩展,支持4个节点同时宕机、不影响前端业务,满足了直播网络后续系列对数据容量增长的需要。
以上三点对应了用户“高性能、高容量,高扩展”方面的需求,那么,系统的高可靠性又是如何实现的呢?这可是确保欧洲杯手机直播过程高效、内容安全的关键因素。
AS13000可提供EB级存储空间
安全可靠才能“更专心”
“之前了解到,AS13000系统可以采用多副本的方式可以实现跨节点的冗余保护,为此我们在正式上线前就进行了模拟测试,系统可以自动切换。这项技术有效地避免了因为单点故障引起的数据安全性问题,可以让视频技术团队非常放心,将精力全部投入到视频内容制作上。”视频直播团队的技术保障人员对平台的可靠性表示了肯定。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。