不必再追Nano Banana!國產(chǎn)Vidu Q1參考生圖實(shí)現(xiàn)“平替即超越”

AI生圖領(lǐng)域,終于迎來中國力量的高光時刻。

在Google發(fā)布Nano Banana僅10天后,生數(shù)科技旗下視頻大模型Vidu于9月9日正式推出Vidu Q1參考生圖功能,以支持7張參考圖輸入打破國內(nèi)生成上限,并在一致性、還原度等關(guān)鍵指標(biāo)上全面超越Flux.1 Kontext,正面對標(biāo)Nano Banana。

1.PNG

這意味著,一直由國際巨頭主導(dǎo)的AI生圖賽道,首次出現(xiàn)了具備差異化競爭力、甚至局部實(shí)現(xiàn)超越的中國創(chuàng)業(yè)公司。Vidu Q1參考生圖的發(fā)布,不僅是一次技術(shù)迭代,更是一場圍繞AI生圖領(lǐng)域的國產(chǎn)逆襲。

此次Vidu 發(fā)布的Q1參考生圖主要有五大亮點(diǎn):

Vidu Q1參考生圖以“參考夠多,還原夠真”為核心,主要包括五大亮點(diǎn):

1、參考數(shù)量行業(yè)領(lǐng)先

同時支持7張參考圖輸入,可控性強(qiáng)。

2、主體一致性更強(qiáng)

在多人、多場景、多次生成下,依舊保證人物/主體的面貌與特征不跑偏。

3、高還原度,真實(shí)感更強(qiáng)

在保持參考圖特征的同時,還原度高,更貼近用戶原始輸入,真正做到“所見即所得”。

4、創(chuàng)作自由度極高

一張圖 + 一句提示詞,就能自由換裝、換背景、自由合成。支持多人同場景或者多人多場景,滿足復(fù)雜劇情、合影、多角色電商等場景。

5、支持1080P高清分辨率,中文語義理解更強(qiáng)

一、對標(biāo)谷歌Nano Banana,國產(chǎn)AI生圖迎來突破

通過多組案例對比可清晰看出,Vidu Q1參考生圖在生成一致性方面顯著優(yōu)于Flux.1 Kontext,并在部分場景中媲美甚至超越Nano Banana:

在人物拿著電飯煲的案例中,Nano Banana frequently 出現(xiàn)物體懸空、擺放不合理的問題,生成的飯碗并未放置到合理位置,而Vidu生成結(jié)果自然合理,符合物理規(guī)律;

微信圖片_20250909165731.png

微信圖片_20250909165739.png

在上圖的例子中,Nano Banana 并沒有理解提示詞中補(bǔ)全彩虹的意思,彩虹只出現(xiàn)了另外半邊,而Vidu Q1參考生圖則做到了將沒有出現(xiàn)在圖片中的另外半邊彩虹補(bǔ)全,形成了完整掛在天上的雙彩虹景象,表現(xiàn)出了極高的畫面理解能力和一致性。

從第三方評測機(jī)構(gòu)來看,Vidu在AI參考生圖的一致性指標(biāo)上超過了谷歌的Nano Banana 和Kontext ,位居第一。

在一致性、真實(shí)性、清晰度、美學(xué)、語義理解等綜合指標(biāo)評分中位居第二,僅次于谷歌Nano Banana。

值得一提的是,在能力全面對標(biāo)Nano Banana 的同時,Vidu Q1參考生圖對國內(nèi)用戶也更為友好,無需翻墻,操作更為簡單,對于中文理解更強(qiáng)。相對于Nano Banna無法指定輸出圖片比例,Vidu 可支持多種比例圖片輸出,同時Vidu Q1參考生圖支持1080P高清像素,更適合商用場景。

二、三大模式全覆蓋:合成、替換、變換解鎖行業(yè)創(chuàng)新應(yīng)用

除了過硬的一致性,Vidu Q1參考生圖還支持“合成+替換+變換”三大模式,可覆蓋電商、廣告、動漫、影視、設(shè)計(jì)等多行業(yè)場景。

萬物皆可合成

Vidu Q1 參考生圖支持讓不同人物同框或者將某個人物或者商品放入具體場景中,讓想象中的畫面成真,讓不可能成為可能。

1、復(fù)雜場景合成

通過指定某主體在某個場景中做什么,可以生成高大上的雜志封面、商品海報、動漫短劇分鏡。

中秋節(jié)來臨,Vidu Q1參考生圖也能成為電商、設(shè)計(jì)師們的提效神器。

2、人物、商品同框場景

利用Vidu Q1參考生圖功能,即可和你喜歡的明星同框。

比如輸入你和明星的照片和大頭貼框,即可生成你和泰勒斯威夫特在海邊的合影照,融合自然,仿佛是在某個海邊拍的偶遇照片。

3、服裝流行元素合成

Vidu Q1參考生圖在服裝設(shè)計(jì)領(lǐng)域也有廣泛的應(yīng)用場景。

用Vidu Q1參考生圖把裙子換上今年夏天最時髦的碎花花紋,變身最潮達(dá)人。

萬物皆可替

Vidu Q1參考圖中的人物、道具、場景都可以隨意替換,不僅可玩性高,而且也大幅提高創(chuàng)意資產(chǎn)復(fù)用率,不到半小時即可批量產(chǎn)出實(shí)用產(chǎn)品宣傳素材、海報大片。

1、場景替換

十一假期來臨,利用Vidu Q1參考生圖,幫助用戶解鎖熱門旅游地,再也不用”人從眾”中各種找角度拍照,也無需等待黃金拍照時間,即可快速生成完美旅游打卡照。

2、道具替換

同樣的背景,通過道具替換,可產(chǎn)出一系列產(chǎn)品素材圖,適用于TO C 玩法以及產(chǎn)品上新場景。

3、主體替換

還可以通過主體替換的方式實(shí)現(xiàn)影視劇、海報的角色替換。

4、AI虛擬換裝

《穿Prada 的女魔頭2》正在緊鑼密鼓拍攝中,曾經(jīng)《穿Prada的女魔頭》中的女主角安妮.海瑟薇在一天的拍攝中就需要換4套服裝,換裝速度之頻繁令人印象深刻。而現(xiàn)在利用Vidu Q1參考生圖,服裝模特不到5分鐘就可實(shí)現(xiàn)迅速換裝,對于消費(fèi)者來說,也可以通過AI換裝直觀感受試穿效果。

萬物皆可變

Vidu Q1參考生圖不僅僅能實(shí)現(xiàn)替換、合成,而且還可實(shí)現(xiàn)線稿轉(zhuǎn)3D、照片轉(zhuǎn)手辦、轉(zhuǎn)冰箱貼、線稿上色、老照片修復(fù)等酷炫功能。

1、線稿轉(zhuǎn)3D

Vidu Q1參考生圖能將復(fù)雜的建筑設(shè)計(jì)圖,直接轉(zhuǎn)化為3D立體模型圖,建筑細(xì)節(jié)精準(zhǔn)還原,省去復(fù)雜的建模流程。

2、線稿上色

通過指定建筑物替換成木頭材質(zhì),并為周圍的景觀涂色,生成一張上色后的建筑效果圖。

3、變成冰箱貼

Vidu Q1參考生還可以一張普通的平面照片直接變成立體冰箱貼,真實(shí)得如商場售賣的紀(jì)念品。

4、變身手辦

當(dāng)然最近很火的手辦玩法,Vidu Q1參考生圖也能穩(wěn)定發(fā)揮,不僅支持二次元轉(zhuǎn)手辦,還可以讓真人直接變成桌面手辦,與真人簡直神同步。

6.png

5、特效畫面

Vidu 還支持用戶解鎖特效玩法,讓動漫人物自帶特效。

三、從追趕到超越,AI創(chuàng)業(yè)公司的進(jìn)階之路

作為Vidu首款參考生圖產(chǎn)品,Vidu Q1一經(jīng)推出便實(shí)現(xiàn)對谷歌Nano Banana的全面對標(biāo),在AI生圖這一巨頭云集的賽道中展現(xiàn)出中國創(chuàng)業(yè)公司的硬核技術(shù)實(shí)力。

Vidu Q1參考生圖的發(fā)布,是中國AI多模態(tài)領(lǐng)域的一次重要突破。它證明了中國團(tuán)隊(duì)不僅能夠緊跟國際發(fā)展,更能在關(guān)鍵技術(shù)上實(shí)現(xiàn)差異化創(chuàng)新甚至局部超越。在AI生圖走向“生產(chǎn)級”應(yīng)用的關(guān)鍵節(jié)點(diǎn),Vidu終于為中國公司爭得了一席之地。

(本文來源:日照新聞網(wǎng)。本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。對文章事實(shí)有疑問,請與有關(guān)方核實(shí)或與本網(wǎng)聯(lián)系。文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。)

婁底
上一篇:{loop type="arclist" row=1 }{$vo.title}