值得买科技8月AI进展分享会：“海纳”MCP Server拓宽AI能力边界，多模态探索加速AI协同创新发展-助攻财富

　　8月27日，值得买科技AI进展分享会如期举行。值得买科技CTO王云峰对外分享了“海纳”MCP Server最新进展及对AI行业的深入洞察，同时特别邀请中国人民大学高瓴人工智能学院长聘副教授宋睿华作为对谈嘉宾，就“AI多模态领域发展”话题进行探讨。

　　AI进展分享会是值得买科技自今年5月推出的线上直播活动，持续向外界同步集团AI进展，不仅介绍具体AI成果，也以此与行业保持高频沟通、共建AI时代。在此前的分享中，值得买科技向外界介绍了集团丰富的AI产品及应用，包括面向C端用户的兴趣消费指南“什么值得买”及新一代消费智能体“张大妈”，面向B端品牌和平台的AIUC引擎“火眼”、MCP Server“海纳”及AI全域内容洞察平台“值数”，共建AI生态的同时，也为行业提供AI在消费领域的实践参考。

　　MCP Server“海纳”，是值得买科技今年基于MCP构建的标准化消费数据服务能力平台，在今年推出后就被众多行业伙伴选用，为不同领域的AI应用解决了消费能力增强问题。王云峰表示，“每月向外界同步AI进展是集团对外输出AI实践经验的一种方式，与此同时我们也会秉持学习的心态，听取来自不同视角的意见与建议。此次分享会正是一场结合了行业视角、学术视角、技术落地视角等多维度的交流会，希望获得更多真知灼见，以此推动AI生态高质量发展。”

　　“海纳”MCP Server全新接口上线，为AI装上“智慧罗盘”

　　在此次分享会上，王云峰首先介绍了国内外AI领域的最新进展，从通用大模型、多模态大模型、智能体三个维度分享了最新的产品及特点，“AI发展已经进入到了一个全新的加速周期且方向也更加明晰，当前模型参数不再是唯一的标准，而是更加贴合场景需求；应用形态上从‘对话工具’转向了‘自主智能体’，AI正在逐步成为一个能自主工作的‘虚拟员工’；此外，中国大模型和智能体的发展也在开拓全新的范式，被全世界关注。”

　　基于此判断，“海纳”MCP Server每月也在能力和功能上不断迭代升级，为行业合作伙伴提供更强、更适配的服务，目前“海纳”MCP Server已经开放给了更多大模型、智能终端、智能体应用平台等合作伙伴，并成为众多AI产品选用的消费能力增强服务，8月对外输出量达到2000万，环比增长54%，从4月至今实现了6倍增长。

　　现场，王云峰分享了“海纳”MCP Server8月最新上线的接口——知识图谱，该接口通过将碎片化信息进行结构化、系统化整合，将海量的消费事实和概念以图谱的方式连接起来，从而支持大模型进行深度“理解”与精准“推理”，为用户提供全域视角的真实消费评价。“与传统RAG(检索增强生成相比，基于知识图谱接口的检索，就如同为AI装配了一个智慧罗盘，不仅能实现精准的内容定位，还能深入挖掘信息之间的复杂关系，无论是商品、评价还是多维度的知识内容，都能实现高效、一体化的智能检索与生成。知识图谱检索也像一座智能桥梁，连通 ‘内容搜索’ 与 ‘商品搜索’，就像有了上帝视角，让检索出的内容更加全面，让大模型回答得更精准。”

　　据悉，“海纳”MCP Server知识图谱接口已经开放了3C数码品类，并关联了100万篇文章、150万实体等数据，后续还将在值得买科技海量商品库和内容库的基础上，构建更多品类的知识图谱，让检索更智能，让搜索更懂用户、更贴合实际需求。

　　携手学术界加速多模态探索，推动AI协同创新发展

　　在分享自身AI建设之外，此次分享会上，王云峰还与特邀嘉宾人大高瓴人工智能学院宋睿华教授就“AI多模态领域发展”话题展开了深入探讨，从技术原理到应用前景，深入剖析多模态发展趋势，为行业发展提供来自学术研究前沿与一线产业实践相融合的见解。

　　早在2023年，值得买科技就与宋睿华团队达成合作，在AI内容创作、多模态生成等方面共同开展AI前沿研究，加速技术探索和应用，并取得了一系列研究成果。宋睿华教授在人工智能的文本创作、自然语言的多模态理解和多模态对话系统等领域，有着诸多开创性成果；而值得买科技在助力前沿的学术研究中，提供了集群算力、消费数据和应用场景等综合能力支持，积极推动前沿研究及成果转化。

　　分享会现场，宋睿华教授深入浅出地介绍了与值得买科技合作AI研究课题时发现的两个技术难题：如何为无声视频配音以及如何从图片生成有声视频。在为无声视频配音的工作中，宋睿华教授团队提出了使用低分辨率的梅尔频谱作为“音频布局”，提出一个名叫TiVA的新框架，可以先从视频生成音乐布局再用音乐布局影响最终音频的生成，实验结果表明TiVA显著降低了学习的难度，提高了音频的质量和它与视频的同步性。此外，宋睿华教授还以实际案例进行了补充，“以往工作只能为动物园里叫了几声的白头鹰视频配上其他小鸟的叫声，且与张嘴的时机不匹配，TiVA则可以为白头鹰配上与嘴型基本同步的鹰的叫声。”对此，宋睿华教授梳理了视频到声音的三种框架，并提出一种名为VAFlow的全新框架，用视频先验代替以往方法中采样的高斯噪声，让生成的音频成功率更高，与视频中多个声源更贴合，“我们的创新不止于此，我们还率先提出了从一张图像生成有声视频的问题和新方案JointDiT，无需先生成视频再配音。这种一步到位生成有声视频的场景与谷歌前不久发布的Veo 3形式相似，显然更受用户欢迎。”

　　实际上，值得买科技在推动AI技术在消费领域的应用落地与场景创新的过程中，非常注重AI产学研协同创新发展，与学术界、产业界和研究机构之间积极合作，共建高质量AI生态。当前，值得买科技已与中国人民大学、南开大学、中欧国际工商学院、中央财经大学商学院等高校联合，共同探索AI创新协同新路径，并取得了一系列研究成果。

　　其中，与人大高瓴人工智能学院在多模态领域的多个联合研究成果如《TiVA：时序同步的视频到音频生成》《BSharedRAG：面向电商领域的共享基座检索增强架构》《JointDit：图像转有声视频》等已经面世，并亮相计算机学科领域 ACM MM(国际多媒体会议、IEEE CVPR(国际计算机视觉与模式识别会议、IEEE ICCV(计算机视觉国际会议等顶级国际学术大会，并荣获国家发明专利授权；与南开大学商学院联合研究成果《AI总结用户评论生成摘要对用户决策行为的影响》入选电子商务领域顶级会议 SCECR 2025、信息技术管理领域顶级会议 HICSS 2025(夏威夷国际系统科学大会。此外，与中欧国际工商学院、中央财经大学商学院等高校的 AI 应用联合研究成果也在陆续推出。

　　值得买科技表示，未来公司将积极探索AI进展分享会的更多交流形式，分享集团AI最近进展；并保持交流学习的心态，与AI行业伙伴共同成长。值得买科技也将坚持以消费内容为核心，以AI技术为驱动，永无止境地提升B端与C端的连接效率，创造人人因消费而幸福的美好世界。

值得买科技8月AI进展分享会：“海纳”MCP Server拓宽AI能力边界，多模态探索加速AI协同创新发展

相关推荐