产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于启明 +

企业简介 +

企业简介

企业价值 +

企业荣誉

行业地位

资质认证

社会责任 +
企业文化 +
投资者关系 +
麾下企业 +
加入启明 +

业务发展规划

福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入启明

客户留言

710公海寰宇-灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感
2026-04-14 14:14:05

  

快过春节了,来整一个花活儿,想看灭霸及复仇者同盟成员一路放烟花。

这段视频是于 Vidu Q3 中,仅用一段 Prompt 一次天生患上来,不仅可以或许声画同步,高清直出,并且还有能转换多个镜头,完成一个场景叙事。

Sora 以后,AI 视频天生于冒死卷时长。Sora 刚发布的时辰,只能天生 5 秒摆布的视频,而 Vidu 近来发布了全世界首个撑持音视频直出的模子 Vidu Q3 ,能实现16秒声画同出,而且叙事能力更强,于镜头节制、文字衬着、多国语言上都有所冲破。

于国际权势巨子AI基准测试机构Artificial Analysis最新宣布的榜单中,生数科技的 Vidu Q3 依附其于一致性、叙事性及音画同步上的极致体现,位居全世界第2、中国第一。它不仅于评分上硬刚马斯克的 xAI Grok,更是逾越了 Runway Gen-4.五、Google Veo 3.1 及 OpenAI Sora 2,成了领跑视频天生下半场的要害变量。

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

于生数科技的产物生态中,Vidu Q3 聚焦在漫剧、短剧、影视剧行业,其天生能力到底程度怎样,咱们用几个 Prompt 尝尝就知道。

01

16s,完成宫斗剧中的一次死别

已往,AI 视频天生因为压缩能力致使的一年夜深层痛点于在叙事断裂,一次只能天生5-8 秒的时长,这使患上天生内容更像是毫无魂灵的“素材碎片”而非逻辑完备的“叙事内容”。

基在此,创作者为了拼凑出一段30秒的剧情,不能不频仍开盲盒式地天生多个素材,再面临差别批次间光影掉真、人物走形、逻辑庞杂等致命伤举行后期“缝补”。

而 Vidu 不仅将单次天生时长拓展至 16 秒,更要害的是经由过程底层架构的改造,包管了这 16 秒内脚色、场景、光影、声音、画面与叙事逻辑的高度一致性。

16 秒,于影视语言中已经足以构建一个完备的叙事单位,好比一个脚色从迷惑到名顿开的心情改变、一次从安静到冲突的对于话比武,或者是一个要害道具被展现并激发牵挂的经典桥段。

为了验证 Vidu Q3 「16s音视频直出」的功力,咱们重点考查它于繁杂场景中可否把画面情绪、脚色对于白、情况音效这几股线天然地联合于一路。

拿最经典的宫斗场景为例,宫斗剧对于古装场景画面、人物情绪、固按时间内的叙事节拍要求都比力高,是以输入的 prompt 了包罗特写、对于白及详细情况音的提醒词:

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感天生的成果还有算到位,女子眼眶泛红、声音凄厉颤动的诘责,与脸上滑落的泪珠彻底同步,情绪是顶上去的。

配景里,窗外的风声及远方的丧钟声不是简朴的铺底,而是跟着她话音落下才隐约浮现,把悲惨又压制的气氛衬托了出来。对于面男子酷寒的回覆,其声音等语和谐画面里他漠然的心情严丝合缝。

光有剧情还有不敷,咱们想知道它于更写实、信息更嘈杂的情况里会怎样体现。

是以,第二个场景来到「雨夜的伦敦火车站」,这里要求的声音元素多且密:清楚的英语对于白、凸起的火车汽笛、琐屑的雨打顶棚声、还有有作为配景恍惚处置惩罚的播送。

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

天生效果可以说是没有瑕疵,西装男焦虑的脚步声始终连结于最前面且十分清楚,而汽笛声跟着火车驶进站内最先由远和近响起,淅淅沥沥的雨声很轻没有抢戏。而且此中London 站牌的名字竟然都拼对于了,这个也是 Vidu Q3 的主要能力,详细测评衬着能力的案例稍后展示。

这一条视频的细节可以说是使人欣喜的,可以见患上,Vidu Q3 的声音分层与空间感构建能力、主次音源处置惩罚能力、模仿出的真实情况混响能力都很顶。

对于在节拍极快、音画切换频仍的现代音乐内容,咱们采用图生视频的方式测试纽约陌头的说唱。

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

成果天生的视频让人颇有代入感,rapper 鼓动感动的说唱嘴型与鼓点、贝斯的节拍卡患上很是准,每一个重音都砸于了剪辑点上。镜头于手势、心情及脸部特写间的快速切换,也完善踩于了音乐的律动上。

02巨匠级运镜,短剧中巴掌扇患上更丝滑

AI视频天生中,最常碰到的一个穿帮点就是镜头语言。

很多模子能天生一段几秒的不变画面,但一旦触及镜头切换、视角转换、景别变化,问题就会呈现。可能于运镜历程中呈现画面主体扭曲、场景扯破,更常见的是,多镜头之间缺少叙事节拍及情绪联贯性,看起来像几段自力视频的生硬拼接。

可以说,「多镜头运镜」是区别「会动的画」及「有叙事感的视频」的焦点能力,它磨练的是模子对于空间持续性、时间逻辑及视觉叙事语法的综合理解。

先测试看一个快节拍短剧中的镜头切换,选用短剧中常见的咖啡厅决裂戏码: 灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

这个片断最冷艳之处于在节拍感抓患上很准很惬意。特写镜头里戒指的反光细节很真实,切到近景时,男士措辞的口型跟台词对于患上很严,女士站起来后的头发的飞舞很天然,扇巴掌的动作、声音也充足丝滑。

接下来测试最磨练节拍感的动作场景。提醒词明确要求了“特写→前景→中景”的快速切换。 灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

整个片断可以说是趁热打铁了。特写镜头中惊恐的双眼及汗珠极具张力;切至前景时,黑影于巷尾的明灭天然且位置联贯;切回中景时,主角朝向镜头的奔跑与以前的空间瓜葛彻底吻合。

更精彩的是,音效与镜头实现了精准共同:特写时喘气声很近,切前景时声音随之拉远并凸起脚步反响,切回中景时喘气声再次逼近。

第二个场景偏重视角转换,第一人称→全景→特写,也陪同气氛变化的运镜。 灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

从现实体现来看,切换到镜头二的全景时,人物与石门的巨年夜比例对于比震撼,且视角转换无比天然,没有呈现「跳帧」或者场景重置;镜头三对于石门图腾的特写,可以看做是全景镜头的天然推进与聚焦。

03衬着能力精彩,漫剧轻松拿捏

对于在天生式 AI 视频而言,可否不变、精准地天生与画面气势派头交融的文字,往往是其可否胜任“专业级建造”的硬性门坎。

过往许多模子于衬着文字时,轻易呈现笔划庞杂、字符闪耀、气势派头扯破,或者者与画面光影严峻不符的环境,这使患上天生的内容很难直接用在对于细节有要求的贸易短片、漫剧或者剧情向内容。

Vidu Q3 具备较强的文字衬着能力,可精准衬着中、英、日三种文字。先从一个相对于静态但要求极高的场景最先:产物展示,要求天生一架无人机,机翼上需清楚出现具备金属蚀刻感的英文「Vidu Q3」。

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

效果体现中,无人机的极简设计感统统,而机翼侧面的“Vidu Q3”字样并不是简朴“贴”上去,而是真正模仿出了金属蚀刻的质感及深度。跟着无人机缓缓扭转,文字外貌的反光与外壳一同折射出细腻的落日余辉,光影变化天然同一。

接下来,挑战一下气势派头化与动态衬着:一个热血日漫气势派头的场景,包罗动态的日语喊话。

这个案例综合展示了 Vidu Q3 的综合能力,一是对于特定艺术气势派头(日漫)的精准掌握,二是于极限动态场景中,连结画面、音效超高同步性与体现力

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

末了测试一个布满张力的古装武侠场景,包罗中文对于白及激烈的动作戏。

灭霸带着复联放烟花!16秒,让手搓 AI 视频拥有大片即视感

Vidu Q3 的这个画面美感是凌驾预期。于激烈的武感动作中,可以或许很好地连结画面的不变及联贯,证实了其对于中文对于白字幕的专业化处置惩罚能力,而且于这一效果中,字幕成了加强叙事沉浸感的一部门,而非后期生硬的添加。这类天生水平已经经可以运用在短剧、漫剧建造等场景中了。

04结语

2024 年,AI 视频天生行业崭露头角,颠末两年时间的成长,整个行业则会向更成熟的标的目的成长。

Vidu Q3 的意义不单单于在“16秒的音视频直出”及“中国第一”,或许其更广泛的意义于在,于降低视频建造门坎的同时还有增长了精准的节制水平。

「节制」二字好像从未阔别过影视建造行业,从演员对于神志、语言的节制,到导演对于画面、气势派头的节制,再到到摄影师对于镜头、画面的节制,这是贯串视频建造始终的二字。

而要实现内容的完善出现及节制,已往这需要包括导演、摄影师、后期殊效等一个专业团队重复打磨才能精准实现。

此刻来看,Vidu Q3 能让专业的内容创作者直接“调理”脚色姿态、运镜方式、场景细节以致情绪气氛,实现邃密化的“导演级”节制,脑海中抽象的创意可以快速、精准地转化为高质量的视频片断。

除了此以外,影视行业中经常受限在实拍成本、演员档期、殊效预算或者非凡园地。这些传统的问题也能被有用弥合,Vidu Q3 极年夜地降低了高质量视觉内容的建造门坎,作者可以无成当地天生实际中难以拍摄或者造价昂扬的场景。

不仅云云,Vidu Q3 让平凡的外行人,也能建造出有审美、有咀嚼的年夜片。追念其时抖音的呈现,降低了人们举行内容表达的门坎,让纵然受教诲水平不高的人,只需点一下「录制」的圆形按钮,就能自由地利用视频这类去表达本身的不雅点及内容。

而如今的Vidu Q3正于做着近似的工作。 Vidu Q3 再也不是束之高阁的AI玩具,而是有能力真正深切到了漫剧、短剧、影视剧的建造焦点。

Vidu Q3体验地址:https://www.vidu.cn

Vidu API地址:https://platform.vidu.cn

登岸 Vidu.cn 注册,利用 AI 科技评论约请码:AIKJPL,便可得到500积分。

雷峰网(公家号:雷峰网)版权文章,未经授权禁止转载。详情见转载须知。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-710公海寰宇


地址:长春净月高新技术产业开发区百合街1009号

版权所有:启明信息技术股份有限公司

电话:0431-85861717/ 4001182299