文章编号:31510时间:2024-11-08人气:
近期,机器之心编辑部发布了一系列关于视频生成模型的文章和视频,引发了行业内对于视频生成模型是否能理解物理规律的热烈讨论。
自Sora横空出世以来,业界对于视频生成模型是否具备“世界模型”的潜力一直存在争议。
图灵奖得主Yann LeCun、Keras之父François Chollet等人都对此发表了自己的看法,而最近,字节豆包大模型团队公布的一项系统性研究更是为这一议题划上了不等号。
目前,市面上的视频生成模型已经能够生成一些看似符合常识的视频。
最近的研究表明,这些模型虽然能够通过扩大模型参数和训练数据量来提高生成视频的质量,但它们仍然无法理解物理规律。
基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
为了深入研究视频生成模型是否理解物理规律,字节豆包大模型团队进行了一项系统性实验。
他们通过专门开发的物理引擎合成了多种经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。
实验结果显示,即便依照Scaling Law扩大模型参数与训练数据量,模型依然无法抽象出一般物理规则,甚至连基本的物理现象如牛顿第一定律、抛物线运动都无法领会。
视频生成模型目前的问题在于,它们更像是一个“抄作业”的学生,可以记忆案例,但还无法真正理解物理规律,做到“举一反三”。
因此,当遇到未学习过的场景时,模型会“犯迷糊”,生成结果与物理规则不符。
模型的泛化能力受到了严重的挑战。
即使模型在训练数据上表现良好,但在新的、未见过的数据上,其表现往往不尽如人意。
在组合泛化场景中,豆包大模型团队发现,如果训练视频中的概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如增加物体间的物理交互,通过增加训练数据,模型对物理规律的遵循会越来越好。
对于模板内测试集的表现最佳的是使用较少模板训练的模型,因为每个训练示例被反复展示。
这表明模型容量和组合空间的覆盖范围对组合泛化至关重要。
这也意味着视频生成的Scaling Law应当侧重于增加组合多样性,而不仅仅是扩大数据量。
对于模型如何依赖记忆和案例模仿的问题,豆包大模型团队进行了相关实验。
他们发现视频生成模型更多依赖于记忆和相似案例进行模仿,而非抽象出普遍的物理规则。
模型在颜色和大小等属性上的匹配优于形状和速度。
对于复杂的组合泛化,模型展现出一定的能力,但受限于案例匹配。
在不了解底层规则的情况下,模型可能会生成不符合现实的结果。
当前视频生成模型面临着诸多挑战,如理解物理规律、泛化能力、依赖记忆和案例模仿等问题。
未来,视频生成模型需要进一步提高对底层规律的理解,而不仅仅是依靠记忆和案例模仿。
如何提高模型的泛化能力,使其能够在未见过的场景上表现良好,也是未来的一个重要研究方向。
虽然视频生成模型已经取得了一些令人瞩目的成果,但它们仍然面临着许多挑战。
通过深入研究这些问题,我们有望更好地了解视频生成模型的潜力,并推动其向更广阔的领域发展。
上一篇:百度全新AI眼镜即将发布
下一篇:最新科学期刊发布重大突破
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://www.nazei.cn/shwz/490ea2a245d08470c602.html,复制请保留版权链接!
台州富豪陈柏林的再度困境:和晶科技股权或被拍卖近日,和晶科技(股票代码:300279)披露了一起重要的民事起诉状,其控股股东荆州慧和向深圳市中级人民法院提交了申请,要求拍卖、变卖公司股东陈柏林持有的4485.63万股股票。这一事件标志着陈柏林可能将失去其在和晶科技的全部股权。陈柏林,出生于1967年,来自浙江台州,是和晶科技的创始人。...
互联资讯 2024-11-17 20:14:35
腾讯手游《和平精英》模拟器高清版全面升级:从低配置到高配置,畅享超清画质与流畅射击体验IT之家报道,近日腾讯手游《和平精英》对外宣布了其模拟器高清版的新版本全面优化消息。此次更新不仅为玩家带来了视觉上的震撼升级,更是通过技术优化让游戏体验有了质的飞跃。值得一提的是,这次优化让低配置的笔记本和集显电脑也能开启高帧率的游戏体验,从而惠及了...
互联资讯 2024-11-16 18:10:14
李雪健:书法造诣与绘画技艺的完美结合随着第12届北京国际电影节的落幕,人们的目光不仅仅聚焦于电影的艺术成就,更被评委会主席李雪健的艺术修养所吸引。李雪健不仅在影视领域大放异彩,其书画艺术更是让人惊叹不已。他的书法造诣深厚,风格独特,隶书作品更是独树一帜。更难能可贵的是,他的画作同样充满了生命的味道,让人一见难忘。谈到李雪健的书法艺术,...
互联资讯 2024-11-10 05:48:34
国产手机市场的新繁荣:高端化的挑战与机遇近一个月来,国产手机新品密集发布,其中备受关注的华为Mate70系列手机将于11月发布。随着一年一度的双11购物节的到来,在手机品牌的积极推动下,国内智能手机市场持续保持增长态势。今年以来,国内手机市场已经摆脱了此前连续多年的下滑态势,显示出新的活力。一、市场概况根据最新的数据显示,今年1月至9...
互联资讯 2024-11-08 08:22:28
丰田展示终极户外派对利器:定制版Tundra皮卡惊艳SEMA展XXXX年XX月XX日,IT之家报道,在备受瞩目的2024年SEMA展上,丰田汽车推出了一款引人注目的定制版Tundra皮卡——UltimateTailgateTundra。这款皮卡堪称户外派对利器,它配备了一系列高科技设施,旨在为球迷提供无与伦比的户外观赛体验。一、外观设...
互联资讯 2024-11-07 02:09:56
日本的道路安全与社会秩序一直以来备受重视,然而近期却发生了一系列涉及外国人的交通事故,引发了日本社会的广泛关注与讨论。这些事故不仅给日本社会带来了安全隐患,也引发了对当前政策的反思和担忧。在一个夜晚,日本名古屋港区某街道上的例行检查成为了公众的关注焦点。一辆轻便摩托车骑手无视警察的检查命令,加速逃离现场。这名年仅十七岁的中国籍高中生在...
互联资讯 2024-10-15 19:17:23
《春花焰》:皇权斗争下的爱恨情仇与真相探寻随着《春花焰》的热播,这部电视剧迅速吸引了广大观众的关注。其精彩纷呈的剧情、新鲜的演员阵容以及良好的口碑,无疑成为了当下备受瞩目的影视作品。该剧主要围绕慕容璟和与太子慕容玄烈之间的斗争展开,展现了一场关于权力、仇恨与真相的较量。慕容璟和的双重身份在剧中很快被揭示。他让眉林在宫宴上刺杀自己,似乎...
互联资讯 2024-10-15 13:56:42
林芝市第二高级中学的开学时间及相关政策解析导语,对于想要了解林芝市第二高级中学开学时间以及相关政策的学生和家长来说,本文是一份详尽的指南,我们将为您解析林芝二高的分数线、开学时间以及相关的教育政策,帮助您更好地为孩子规划未来,一、林芝市第二高级中学的分数线林芝市第二高级中学的分数线是根据每年的考试情况和学校招生计划而定的,2019年的...。
互联资讯 2024-10-02 05:20:09
吉林省白城市某公司禁止员工携带苹果设备进公司,提倡使用国产华为电子产品近日,吉林省白城市一家公司在其内部发布了一份引人注目的通知,该通知明确规定了员工的电子产品使用规范,引发了广泛的关注和热议,按照该通知,员工被禁止携带苹果品牌的设备进入公司,包括但不限于苹果手机、平板电脑等,一旦发现有员工违反规定,将立即开除处理,同时,公司提倡员工...。
互联资讯 2024-09-25 18:42:37
龙眼树下的诗意盎然自古以来,龙眼树便在中国文学中占据了一席之地,无数的诗人以龙眼树为题材,抒发出他们内心的情感与对大自然的敬畏,今日,我们就来欣赏一些关于龙眼树的诗句,感受那其中的韵味与意境,一、赞颂龙眼树的诗句开封盘鼓,擂响千年太平,春风一夜吹乡梦,又逐春风到洛城,这是赞美龙眼树的诗句之一,在诗人的笔下,龙眼树仿佛成为了一个富有灵性...。
互联资讯 2024-09-25 15:46:22