AI 新創(chuàng) Stability AI 以圖像生成軟體 Stable Diffusion 聞名,預(yù)覽22 日發(fā)表下一代 Stable Diffusion 3 預(yù)覽,提高圖像承襲 Stable Diffusion 系列優(yōu)點(diǎn),文字能夠產(chǎn)生更多主題的生成圖像,並提高文字生成的品質(zhì)品質(zhì)和準(zhǔn)確性。Stability AI 雖未公開展示操作,預(yù)覽但已開放想嘗試的提高圖像用戶加入等候名單。
Stable Diffusion 3 參數(shù)從 8 億到 80 億不等,文字適合在各種裝置上(從智慧手機(jī)、生成AI PC 到伺服器)執(zhí)行,品質(zhì)參數(shù)大小與這款模型可以產(chǎn)生多少圖像細(xì)節(jié)的預(yù)覽能力有關(guān),較大模型需要 GPU 加速器有更多 VRAM 才能運(yùn)作。提高圖像
「這是文字使用新型的 diffusion transformer(類似於 Sora),並結(jié)合 flow matching 和其他改進(jìn)」,生成Stability AI 執(zhí)行長 Emad Mostaque 透過個(gè)人 X 帳號(hào)表示。品質(zhì)由於利用 transformer 改進(jìn),不僅可以進(jìn)一步擴(kuò)展並且接受多模態(tài)輸入。
自 2022 年以來,可以看到 Stability AI 推出了一系列圖像生成模型:Stable Diffusion 1.4、1.5、2.0、2.1、XL、XL Turbo,直到現(xiàn)在 Stable Diffusion 3。Stability AI 提供更開放的方案,再到像是 OpenAI DALL·E 3?這樣的圖像生成模型,儘管用到受版權(quán)保護(hù)的訓(xùn)練資料、具有偏見和濫用的可能性而引發(fā)爭(zhēng)議。Stable Diffusion 的模型開放權(quán)重且來源可用,這意味著模型可在本地端執(zhí)行並進(jìn)行微調(diào),使輸出更符合需求。
雖然 Stable Diffusion 3 還未能廣泛開放,但 Stability AI 表示,一旦測(cè)試完成將能免費(fèi)下載並在本地端執(zhí)行。「與之前模型一樣,這個(gè)預(yù)覽會(huì)收集意見,在公開發(fā)表之前提高性能和安全性」,Stability AI 強(qiáng)調(diào)。
- Stability announces Stable Diffusion 3, a next-gen AI image generator
(首圖來源:Stability AI)
延伸閱讀:
- Stability AI 發(fā)表 1.6B 輕量新模型,測(cè)試表現(xiàn)勝過微軟 Phi-2
- Stable Video Diffusion 發(fā)表,可用圖片產(chǎn)生影片
- 開源版 ChatGPT 要來了?AI 做圖神器團(tuán)隊(duì)想讓每個(gè)人都能做出大模型