阿里云AI繪畫創作大模型通義萬相亮相 已開啟定向邀測
中證網訊(記者 王可)繼通義千問之后,阿里云通義大模型家族迎來新成員。7月7日,在2023世界人工智能大會上,阿里云宣布AI繪畫創作大模型通義萬相開啟定向邀測,該模型可輔助人類進行圖片創作,未來可應用于藝術設計、電商、游戲和文創等應用場景。阿里云智能集團CTO周靖人表示,這是阿里云大模型全面掌握多模態能力的關鍵一步,該能力將逐步向行業客戶開放。
據介紹,通義萬相在語義理解和圖片生成上均表現優秀,首批上線3大能力:在基礎文生圖功能中,可根據文字內容生成水彩、扁平插畫、二次元、油畫、中國畫、3D卡通和素描等風格圖像;在相似圖片生成功能中,用戶上傳任意圖片后,即可進行創意發散,生成內容、風格相似的AI畫作;該模型還在業內率先支持圖像風格遷移,用戶上傳原圖和風格圖,可自動把原圖處理為指定的風格圖。
通義萬相基于阿里研發的組合式生成模型Composer,其可通過對配色、布局、風格等圖像設計元素進行拆解和組合,提供高度可控性和極大自由度的圖像生成效果,僅需一個模型即可支持多類圖像生成類任務能力,該研究成果已在國際AI頂會ICML 2023上發表。
阿里云在現場展示了該模型生成圖片的效果,當輸入“沉浸在全頁灰度涂色的迷人世界中,有一只老虎在曼陀羅寧靜的森林中,畫面采用線條、筆畫”后,系統能迅速生成線條細節豐富的老虎圖片,如果繼續使用風格遷移功能,還可隨意切換圖片風格。
在去年的世界人工智能大會上,阿里云“通義”大模型系列首次亮相,在此之后,通義千問、通義聽悟等模型和產品相繼推出,通義萬相的問世意味著阿里云在大模型領域已經具備處理或生成文本、語音和圖片等模態的能力。目前,阿里云大模型正逐步走向千行百業,已有超過30萬企業申請測試通義千問,通義聽悟累計用戶數達到36萬。“多模態是大模型演進的必然路徑,我們希望用不同模態的能力服務千行百業,幫助企業全面擁抱智能化時代。”周靖人表示。