详细调试信息 - getPostsByCategory:
当前 cat_name: 未分類
传入的 cat_slugs: uncategorized
当前页码: 1
is_lifetime: false
时间条件: 其他欄目 Default - 2023年1月1日后
查询结果:
找到文章数: 6
最大页数: 1
当前返回文章ID数: 6
文章IDs: 7319860, 6797675, 6733569, 6465919, 6445102, 6400212
第1页第一篇文章日期: 2025-11-05
第1页最后一篇文章日期: 2023-10-06

科技| Gemini推生成圖像編輯功能 修復三眼狗古怪建築

[星島綜合報道] 人工智能可以創作令人印象深刻的圖像,但這些圖像經常會有奇怪的問題,例如擁有太多牙齒的人或奇怪街道佈局的城市景觀。根據科技網站Android Authority 發現的未完成代碼,Google Gemini 正在升級其 AI 圖像生成功能,以修復這些問題。看來即將推出一項微調功能,允許用戶對 AI 生成的圖像進行詳細編輯。

目前,Google Gemini 的「文本到圖像」工具無法在創建圖像後進行編輯。用戶必須提交新的提示,希望新提示能修正任何問題並創建符合他們期望的圖像。根據發現的代碼,Gemini 的微調功能將通過兩種編輯方法來解決這種有限更改的需求。

第一種選項將允許用戶提交有關 AI 生成圖像的提示,並要求對其中一個方面進行更改。例如,如果你喜歡上面的圖像但希望將其設置在城市中,你可以保留機械人和鳥,但更改背景,讓Gemini 將它們移到城市中。代碼中描述的第二種方法是一種更具互動性的方法。用戶可以用手指或觸控筆圈出圖像中想要更改的部分。選定區域後,他們可以描述所需的更改,Gemini 將理解這些指示僅針對圈出的部分。

這些編輯工具可以特別有利於圖形設計、行銷和社交媒體等領域,這些領域需要視覺準確性和快速變更時間。Google Gemini 能夠更好地滿足藝術家、設計師和尋求更高效創建精美視覺內容的普通用戶的需求。雖然這些功能的確切發布日期尚不確定,但代碼中的出現表明它們很快就會推出。這也很好地配合了即將推出的 Ask Photos 圖像搜索功能。

Google 並不是第一個向 AI 圖像創作者部署編輯工具的公司。這些方法在 OpenAI 的 Dall-E AI 圖像創作模型組合中已有所應用。在 ChatGPT 中,用戶可以要求調整已生成的圖像,或者他們可以突出顯示圖像的某些部分並提交新的文本提示,調整該部分的圖片。許多 AI 圖像創作者如 Ideogram.ai 和 Adobe Firefly 也有類似功能。儘管如此,Google 計劃將這些微調工具整合進 Gemini,這對其技術來說是一個跳躍。這標誌著 Google 不斷推動在生成式 AI 工具方面與 OpenAI、Meta 和其他競爭對手匹配甚至超越的努力。

圖片:Google

T10

---------------------------------------------

>>>星島網WhatsApp爆料熱線(416)6775679,爆料一經錄用,薄酬致意。

>>>立即瀏覽【移民百答】欄目:新移民抵埗攻略,老華僑也未必知道的事,移民、工作、居住、食玩買、交通、報稅、銀行、福利、生育、教育。
點擊以下6大平台 接收加拿大新聞及生活資訊

延伸閱讀

延伸閱讀