至顶网 08月29日 新闻消息(文/李祥敬):王雨先生,专注在互联网营销、企业数字化营销、数字化转型领域十余年的经验,为医药、零售、家电、保险等企业主导实施过多个大型复杂的数字化营销转型项目,曾就职于IBM、甲骨文、凯捷、格兰斯路、微软、百度、腾讯等知名企业,历任甲骨文的高级顾问,凯捷咨询CRM团队负责人,格兰斯路CIO,百度、腾讯高级产品专家等。在大数据营销领域具有非常丰富的经验。
近日,王雨接受了至顶网的专访,畅谈了他眼中的大数据营销、中美大数据的不同、大数据领域的独角兽等热门话题。
问:目前在中国国内,大数据营销变现目前处在什么阶段与状态,对中国企业在营销领域的影响是怎样的?
王雨:我国从2015年提出了国家大数据战略,大数据已经成为企业品牌应对市场变化和占据市场先机的重要手段。纵观大数据的市场,目前可以分成三类,技术驱动型,搭建底层大数据平台。行业驱动型,如信用评估、广告监测等。数据驱动型,自身采集大量数据服务企业。技术驱动型就是各类底层建设的数据平台公司。而行业驱动型、数据驱动型由于国内信息化水平较低、数据开放不够规范成体系,反而发展的较快。2011年-2017年以来,大数据的百度指数从微弱的不足100点飙升至10435点。意味着大数据已经渗入到各行各业,目前国内大量企业通过大数据来促进营销,典型的如阿里的数据银行,就是大数据营销的经典案例。目前已经有几千家企业入驻使用。
问:在国际上,尤其美国较为发达国家,他们的大数据应用情况如何,是否有值得我们借鉴的地方?
王雨:对比中美市场,我们可以看到美国市场,技术驱动型公司比较多而且体量很大,Palantir估值200亿美金,Cloudera估值50亿美金,Splunk和Tableau都已IPO上市。行业驱动型和数据驱动型公司体量相对较小,多数处于发展早期。主要原因是欧美企业信息化程度高,数据开放程度高于国内且较为规范,国外资本市场更加看重技术实力强的公司。因此造成了美国的技术型公司领先其他国家,能造就出大体量的独角兽。至于说借鉴,我认为目前应该是互相学习的阶段。Copy From China已经成为一个普遍现象。中国由于近些年快速的商业发展,大部分公司的IT建设已经跟不上企业的发展规模,数据量的积淀也在几何级的增长,各种垂类行业的精细化程度愈做愈强,因此造就出大量美国所不具备的营销场景,从而衍生出更多的大数据营销工具,如围绕微信体系,就有大量的、小巧的大数据营销工具。因此我认为早期可以说是从美国学的比较多,而目前已经发展成互相学习借鉴的阶段。再发展下去,我认为某些细分领域一定会超过美国。
问:目前市场上大数据营销变现的主要手段方式有哪些呢?
王雨:目前根据市场的需求的差异化,大数据公司大致可以分为如下三种营销变现方式,技术驱动型利用自身平台变现,如GrowingIO、日志易等,输出技术平台能力,以满足客户需求。这类变现模式通常是以SAAS的能力开发标准产品,客单价低;数据变现主要是数据驱动型公司,如数据堂、聚合数据等,输出自身积累的数据来服务客户,能否对接优质数据源是这类变现模式的最大影响因素。场景化解决方案是行业驱动型公司的主要变现途径,基于客户应用场景,提供整体解决方案。这种变现的特点是定制化程度高,客单价高,比如医药行业的百洋集团。当然还有另外一个大的力量,就是BAT公司,基于大量沉淀的数据,应用于自身的广告推广,每年的广告体量不停的在增大,应该也是业内最成功的数据营销变现的案例。
问:目前中国市场上还是有大量的数据创业公司,对这类企业能选准方向更好的发展,您有什么建议呢?
王雨:目前中国的技术、平台、数据的发展速度惊人,因此我相信在不久的将来,一定会出现BAT之外的大数据独角兽公司,一旦出现也一定会震惊世界。在发展中的公司,希望能从如下几个方面认真思考:
1) 选准细分市场。市场可以分为存量市场与增量市场,增量市场是个变量,难以判断预测。而存量市场比较好评估,例如目前大数据的应用投资还都是属于各个公司的IT投入,因此IT费用的投入多少,决定大数据公司的存活与否,为什么很多公司切入金融领域,就是因为这个每年千亿的市场规模,足以支撑公司存活;
2) 团队组成。大数据大家听起来可能是个技术的工作,但是实际产品一定要接地气,就是产品能真实承接市场的需求,解决市场的需求。因此团队中不仅要有技术的大牛,跟要有合格的产品经理以及能Go To Market的关键角色。能让阶段性的MVP不停的投入市场试水,反馈公司真实的情况,以决定下一步策略;
3) 资源的好坏。俗话说背靠大树好乘凉,创业公司如果能够接入政府、运营商或者BAT的数据,将极高的构建起与其他公司的竞争壁垒。另外的重要的资源是股东,大数据公司往往变现时间不定,因此选准投资人也是非常关键重要,甚至直接决定公司的走向;
其他的公司的运营能力、树立标杆客户、关键时刻强大的PR能力,都决定了初创公司的走向。也希望尽快看到中国数据公司大体量的独角兽尽快出现。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。