99久久精品这里只有精品,欧美+日韩精品,国产欧美日韩中文久久,黄 色 成 人 免费网站,久久久噜噜噜久久

用戶登錄

沒有賬號?立即注冊

字節(jié)快手迎來關(guān)鍵對決

來源: 全天候科技 劉寶丹 2025-04-24 08:59

IMG_2271

出品/全天候科技

作者/劉寶丹

AI競賽焦點已經(jīng)開始轉(zhuǎn)向多模態(tài),字節(jié)和快手在AI視頻賽道的競爭也日趨激烈。

近日,快手正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型,將視頻及圖像創(chuàng)作的精準(zhǔn)度帶上一個新高度。同期,字節(jié)Seed團(tuán)隊正式發(fā)布Seedream 3.0 技術(shù)報告,據(jù)第三方榜單Artificial Analysis,Seedream 3.0綜合性能已追平文生圖SOTA模型GPT-4o,進(jìn)入全球第一梯隊。

作為短視頻平臺,字節(jié)和快手被認(rèn)為是AI多模態(tài)領(lǐng)域的有力競爭者。經(jīng)過一年多的技術(shù)追趕,雙方在AI視頻生成領(lǐng)域都取得了不錯的進(jìn)展。

根據(jù)AI產(chǎn)品榜3月數(shù)據(jù),在全球AI產(chǎn)品增速榜(僅APP)上,即夢AI 以173.57%的月活增速位居第5,是增速最快的AI視頻應(yīng)用,其月活規(guī)模約2037萬,而可靈AI的增速僅為36.44%,排名第14。根據(jù)快手公布的數(shù)據(jù),截至目前,可靈AI全球用戶規(guī)模突破2200萬。

不過,AI視頻生成領(lǐng)域尚未涌現(xiàn)類似DeepSeek在大型語言模型(LLM)領(lǐng)域的標(biāo)桿性產(chǎn)品。一位業(yè)內(nèi)人士對華爾街見聞表示,當(dāng)前,AI視頻生成賽道仍處于“技術(shù)突破期”,這也意味著,字節(jié)和快手的競爭仍處于早期階段。

過去十年,快手和抖音相繼崛起,共同開創(chuàng)了中國的短視頻時代。如今,AI時代加速到來,這一次,快手和字節(jié)誰的勝算更大一點?

追趕

AI視頻生成領(lǐng)域還處于產(chǎn)品應(yīng)用爆發(fā)前的階段,業(yè)內(nèi)玩家都在試圖通過持續(xù)的技術(shù)迭代,來實現(xiàn)產(chǎn)品的不斷破圈。

進(jìn)入2025年,快手和字節(jié)都開始推出重大技術(shù)迭代成果。

4月15日,快手正式發(fā)布可靈AI 2.0視頻生成模型及可圖2.0圖像生成模型?伸`AI 2.0的最大亮點在于以技術(shù)革新重新定義AI視頻生成標(biāo)準(zhǔn):從“能生成”到“精準(zhǔn)生成”,從“工具輔助”到“創(chuàng)意伙伴”。

發(fā)布會上,快手發(fā)布了AI視頻生成的全新交互理念Multi-modal Visual Language(MVL),MVL由TXT(Pure Text,語義骨架)和MMW(Multi-modal-document as a Word,多模態(tài)描述子)組成,能從視頻生成設(shè)定的基礎(chǔ)方向以及精細(xì)控制這兩個層面,精準(zhǔn)實現(xiàn)AI創(chuàng)作者們的創(chuàng)意表達(dá)。

基于MVL,快手發(fā)布了全新的可靈AI 2.0大師版,它全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,支持二次編輯和處理。

當(dāng)前,圖生視頻約占到可靈AI視頻創(chuàng)作量的85%,快手發(fā)布的可圖2.0擁有多項核心優(yōu)勢,比如,強(qiáng)大的復(fù)雜語義理解能力、電影級的畫面質(zhì)感等?焓指笨偛、可靈AI負(fù)責(zé)人張迪介紹,可圖2.0文生圖能力迎來全面升級,模型出圖創(chuàng)意和想象力實現(xiàn)大幅躍升。

在快手召開發(fā)布會的次日,字節(jié)旋即披露了其文生圖模型Seedream 3.0的技術(shù)白皮書。

4月16日,字節(jié)發(fā)布 Seedream 3.0 技術(shù)報告,距離字節(jié)公布Seedream 2.0技術(shù)報告僅過去一個月有余。Seedream 3.0的最大亮點包括原生2K直出,而且時間僅用3 秒,大幅提升創(chuàng)作效率。Seedream 3.0 目前已在即夢AI等平臺全量開放。

華爾街見聞獲悉,Seedream 3.0 的研發(fā)始于2024年末,通過調(diào)研設(shè)計師等群體的實際需求,Seedream 團(tuán)隊將圖文匹配、美感等行業(yè)共識性指標(biāo)納入攻堅方向,同時,也將挑戰(zhàn)2K 高清直出、快速圖片生成等業(yè)界難題作為核心目標(biāo)。

無論是可靈AI的二次編輯功能,還是即夢AI的原生2K畫質(zhì),都是通往產(chǎn)業(yè)級應(yīng)用的必經(jīng)之路。事實上,也只有達(dá)到產(chǎn)業(yè)級應(yīng)用狀態(tài),AI視頻生成的價值也才有望體現(xiàn)。

如此緊追不舍的競爭態(tài)勢背后,快手和字節(jié)過去一年持續(xù)對AI視頻生成賽道進(jìn)行布局。

2024年初,Open AI通過Sora正式入局視頻生成領(lǐng)域,引發(fā)全世界關(guān)注。彼時,快手在攻克文生視頻的關(guān)鍵技術(shù),4個月后,快手就發(fā)布了視頻生成大模型可靈,成為國內(nèi)首個對標(biāo)Sora的產(chǎn)品。

字節(jié)2023年才開始在內(nèi)部會議上討論GPT,但追趕速度較快,去年底,字節(jié)的視頻生成模型和產(chǎn)品正式推向了市場。

去年9月,字節(jié)一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,正式宣告進(jìn)軍AI視頻生成。11月,原抖音集團(tuán)CEO張楠轉(zhuǎn)戰(zhàn)剪映近一年后正式亮相,即夢AI推出了“一句話P圖”等能力,大幅提升了圖片中文字生成的準(zhǔn)確率。

即夢AI在字節(jié)內(nèi)部的重要性顯著提升。華爾街見聞獲悉,即夢AI所代表的視覺化產(chǎn)品被看好,字節(jié)試圖將即夢打造成AI時代的“抖音”。2月,原零一萬物 PopAI 產(chǎn)品負(fù)責(zé)人曹大鵬加入即夢AI,負(fù)責(zé)移動端產(chǎn)品。他此前用一年時間將PopAI做到了千萬用戶,且投資回報率(ROI)接近收支平衡點,是一名得力干將。

如今,快手和字節(jié)再次交戰(zhàn),他們都在試圖將模型技術(shù)帶入生產(chǎn)級賽道。

押注

對于AI視頻生成賽道,字節(jié)和快手無疑是國內(nèi)反應(yīng)最快速的科技公司。

原因也很容易理解,他們都依靠短視頻起家,天然更懂視頻創(chuàng)作。更重要的是,字節(jié)和快手都有FOMO(Fear of Missing Out)心理。當(dāng)年,快手和字節(jié)因為降低了普通人制作視頻的門檻,從而構(gòu)建了視頻生態(tài),如今,AI會進(jìn)一步降低視頻生成門檻,更具顛覆性。

本質(zhì)上,字節(jié)和快手想要在AI時代復(fù)制出一個新的“抖音”和“快手”,從而成功跨過新一輪AI技術(shù)周期。

就當(dāng)下而言,字節(jié)和快手對AI視頻賽道的策略各有側(cè)重。

對快手來說,AI是破解公司增長曲線難題的最大抓手。除了C端訂閱用戶,可靈AI也面向B端商家提供API接入等服務(wù),可靈AI已與包括小米、亞馬遜云科技等企業(yè)建立了合作關(guān)系。蓋坤披露,來自世界各地的超1.5萬開發(fā)者,已將可靈AI的API應(yīng)用于不同的行業(yè)場景中。

3月25日,快手科技創(chuàng)始人兼首席執(zhí)行官程一笑在電話會上透露,自商業(yè)化以來截至2025年2月底,可靈AI的累計營業(yè)收入超1億元人民幣。他表示,快手將會在ROI可控的前提下,不斷擴(kuò)大可靈AI的用戶宣傳和品牌影響力。“我們有信心在2025年實現(xiàn)可靈AI營收規(guī)模的跨越式增長!

對字節(jié)來說,即夢AI是整個AI戰(zhàn)略的核心版圖,也是公司通往AGI所必須攻克的難題。

年初,字節(jié)豆包大模型團(tuán)隊已在內(nèi)部組建AGI長期研究團(tuán)隊,代號“Seed Edge”,鼓勵項目成員探索更長周期、不確定的和大膽的AGI研究課題,Seed Edge的目標(biāo)是探索AGI的新方法,鼓勵跨模態(tài)、跨團(tuán)隊合作。

去年底,張楠曾表示,抖音,是一個“真實世界”的相機(jī),借助GenAI技術(shù),即夢希望成為想象力世界的相機(jī),記錄每個人的奇思妙想,幫助每個有想法的人輕松表達(dá)、自由創(chuàng)作。

隨著快手發(fā)布全新2.0模型,業(yè)內(nèi)都在期待字節(jié)的下一步動作,尤其是豆包視頻生成模型1.5版何時會推出,雙方之間的技術(shù)追趕還是持續(xù)進(jìn)行。

不過,對于AI視頻生成賽道的前景,目前仍處于探索階段。

百億私募和諧匯TMT軟件組凌晨對華爾街見聞表示,產(chǎn)業(yè)界對Sora為代表的AI視頻生成產(chǎn)品分歧點主要在于,如果把Sora當(dāng)成AIGC的視頻生產(chǎn)工具,它的價值量不會特別大,可能就顛覆一下創(chuàng)意軟件這些工具,如果Sora是一個通用的視頻武器的話,它的想象力很大,比如,跟機(jī)器人進(jìn)行結(jié)合。

近日,生數(shù)科技產(chǎn)品副總裁、Vidu產(chǎn)品負(fù)責(zé)人廖謙表示,當(dāng)多模態(tài)可以做到實時可控、可交互的時候,它可以是完全個性化的,屆時一定會誕生出帶來新體驗的內(nèi)容平臺,這個技術(shù)將應(yīng)用在社交、游戲、VR、AR等多個領(lǐng)域,會對所有的行業(yè)帶來非常深遠(yuǎn)的影響。

整體來看,相較于大語言模型,AI視頻生成賽道面臨的挑戰(zhàn)會更大,無論是Scaling law還是算力需求消耗,乃至商業(yè)模式的探索,復(fù)雜程度都在上升。

這注定是一個難度更高的賽道,字節(jié)和快手雖然具備視頻平臺基因,但要想跑到最后,還需要持續(xù)創(chuàng)新,才有可能在Veo2 、Runway、Pika等一眾全球競爭對手中占有一席之地。

本文為聯(lián)商網(wǎng)經(jīng)全天候科技授權(quán)轉(zhuǎn)載,版權(quán)歸全天候科技所有,不代表聯(lián)商網(wǎng)立場,如若轉(zhuǎn)載請聯(lián)系原作者。

發(fā)表評論

登錄 | 注冊

你可能會喜歡:

回到頂部