Imagen官网,Google Brain推出的文本生成圖像擴散模型
什么是Imagen?
Imagen AI 是一种文本到圖像的擴散模型,由 Google Research Brain Team 于 2022 年開發。它具有前所未有的逼真度和深層次的语言理解能力。Google Imagen AI建立在大型 Transformer 语言模型理解文本的能力之上,并具有擴散模型在高保真圖像生成方面的優势。简而言之,Imagen 是一个人工智能系統,可以根据输入文本創建逼真的圖像。
Imagen官网: https://imagen.research.google
Imagen怎么样?
谷歌的Imagen AI系統是一种可以將自然文本轉换為圖像的先进模型,类似于OpenAI的DALL-E 2。然而,谷歌目前还未向公眾開放完整版本的文本到圖像AI模型。不过,现在情况正在發生變化,至少有一些變化。谷歌宣布將在其AI Test Kitchen应用程式中添加一个不完全版的Imagen。
AI Test Kitchen是在今年早些时候發布的,它開放了谷歌部分AI技術的测試版。谷歌將在该应用程式中添加Imagen,但会有一些限制。用户可以透過两种方式与Imagen进行互动,称為”城市夢想家”和”摇摆”。
在”城市夢想家”中,用户可以創造一个城市,并選择他们想要的主题。例如,如果你想創建一个”賽博城市”,Imagen的”城市夢想家”將围繞”賽博”主题創建建筑模型。这些設计看起来类似于等距模型,就像The Verge指出的那样,”看起来有点像你在模擬城市遊戏中看到的样子”。
關于”摇摆”功能,它可以让用户創建一个小怪物。用户可以選择怪物的材质,如粘土、毛毡或橡胶,并给它穿上自己選择的衣服。Imagen將根据用户的描述創建出相应的怪物,用户可以為它命名并与之互动。这个功能有一些限制,用户無法創建任何想要的怪物,但是”摇摆”中的所有怪物都將共享一些設计语言。与DALL-E的公開测試版一样,Imagen的互动自由度也是有限的。
谷歌并没有详細說明这些限制是軟體自身的特性,但这些限制對于Imagen的后續调試非常重要。AI Test Kitchen的目的是獲得用户反馈,帮助谷歌發现AI技術方面的問题,用户与系統的互动也是测試的一部分。
随着人工智能技術變得越来越复雜和普及,相關的風险也越来越大。当限制和自由度完全開放时,一小部分用户可能会滥用这项技術。對于像谷歌这样的公司来說,用户滥用其產品可能会帶来嚴重后果,甚至在极端情况下對其他用户或谷歌本身造成嚴重損害。
毫無疑問,Imagen是最先进的人工智能模型之一。然而,能力越大,责任也越大。目前还不清楚Imagen將何时成為完全公開的商業產品,如果会成為商業產品。不过,用户目前可以透過”城市夢想家”和”摇摆”功能进行测試体验。AI Test Kitchen可在Android和iOS平台上免費下载使用。
数据评估
本站ai工具百寶箱提供的Imagen都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ai工具百寶箱实际控制,在2024年12月7日 上午11:41收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ai工具百寶箱不承担任何责任。