豆包P圖全新升級,Seedream 4.0開始內(nèi)測
谷歌Nano Banana掀起的全球創(chuàng)作狂歡尚未消退之際,字節(jié)跳動又玩了把大的。近日,字節(jié)跳動開始內(nèi)測最新的豆包·圖像創(chuàng)作模型Seedream 4.0。與此前版本相比,Seedream 4.0首次支持多模態(tài)生圖,同一模型可以實現(xiàn)文生圖、圖像編輯、組圖生成,并在核心能力上迎來了顯著提升。
首先,主體一致性增強:無論是文本驅(qū)動還是圖像驅(qū)動,都能穩(wěn)健保持主體特征,避免“失真”與“錯位”。例如輸入提示詞:“將平視視角改為俯視視角,將近景改為中景,并把畫面比例改為 16:9?!盨eedream 4.0給出了如下圖這樣的效果:
其次,多圖靈活創(chuàng)作:支持文本、圖像的多維組合輸入,輕松實現(xiàn)參考生成、融合生成與編輯。例如輸入提示詞:“根據(jù)參考圖中兩個男生的形象,生成一組動作片分鏡,原比例?!鄙傻男Ч缦聢D:
再次,超高清、超高速直出:最高支持4K分辨率輸出,且推理效率大幅優(yōu)化,2K大分辨率圖像生成用時僅需數(shù)秒。
從更長遠的技術(shù)發(fā)展視角來看,多模態(tài)自由創(chuàng)作正成為大勢所趨。無論是文本驅(qū)動、圖像驅(qū)動,還是多圖融合,用戶都期待能以更自然、更隨心的方式與AI協(xié)作。
Seedream 4.0內(nèi)測一出,網(wǎng)友們就把它玩出了花。比如基于多圖融合能力,上傳兩張角色照片,再加上火柴人自拍動作,即可實現(xiàn)同框合影。輸入提示詞:“將圖1男子和圖2女子合進一張畫面,參考圖3姿勢?!毙Ч缦聢D:
或者動動嘴就能給模特一鍵換時尚穿搭,輸入提示詞:“給圖1模特穿上圖2的穿搭?!毙Ч缦聢D:
據(jù)了解,字節(jié)Seedream 4.0模型將很快在豆包、即夢全量上線,并通過火山引擎開放給企業(yè)客戶。
欄目編輯:張鈺蕓 題圖來源:采訪對象提供 圖片來源:采訪對象提供
來源:作者:新民晚報 金志剛