【生活中心/綜合報導】想製作出擬真公仔嗎?近期許多人使用AI圖像編輯工具生成3D公仔圖,由於細節、擬真程度非常高,在網路上形成風潮,堪比先前OpenAI的吉卜力風格圖片。其實,這股風潮源自於Google近期推出的 Gemini 2.5 Flash Image圖像編輯模型, 代號「奈米香蕉(Nano Banana)」,只要將照片上傳Gemini並下達簡單指令,不到30秒就可生成3D公仔圖,逼真效果堪稱是「3D列印」。

如何生成公仔模型?
打開Gemini,選擇「2.5 Flash」模型,將圖片上傳、下達指令:「將圖片中人物製作成1/7比例,在寫實風格和環境中,創建商業化模型。將模型放置在電腦桌上,使用圓形透明壓克力底座,底座上不帶任何文字。將模型顯示在電腦螢幕上,展示模型的ZBrush建模流程。最後,在電腦螢幕旁,放置一個印有原圖的包裝盒。」不到1分鐘內,便能生成出3D公仔圖,且模樣逼真、細節到位。
多主體物件合成超逼真
除公仔圖像,這款模型也能將多個主體物件合成。社群平台領英(LinkedIn)一篇評論指出,模型令人驚訝的地方並非將2人合成至1張圖片裡,而是它對於光線、人與人在空間中的互動、某種坐姿下的衣服皺褶細節都掌握到位,「完全是另一個層次」。
此外,它還能從不同視角生成照片,畫面呈現符合攝影規則,不會出現拉伸或扭曲。




修復老照片自然不失靈魂
同時,這款工具可以用來修復老照片;例如將黑白照片上傳,下達指令:「將照片重新還原褪去的顏色,但保留住動態模糊和時代感,呈現出自然的感覺,讓照片不至於失去靈魂。」
記者實際以客家紀實攝影大師劉安明1967年拍攝的黑白老照片「衝衝衝」,上傳至Gemini並下達指令,等待約十多秒,黑白照片即變身成彩色照片。儘管色彩不如現今相機所拍攝的鮮豔與銳利,但仍讓人眼睛為之一亮;記者再選擇一張同事家族的老照片測試,該張照片泛黃且模糊失焦,上傳至Gemini修復後,清晰度明顯優於原圖。




Nano Banana引爭議?如何分辨AI製圖
華盛頓郵報指出,這款模型雖然不能稱得上完美無瑕,但速度夠快、有效且易於使用的特性,一般能在30秒內生成圖片,若讓OpenAI的GPT-5處理相同請求,有時需要花超過3倍的時間。
Google Nano Banana模型生成的圖片右下角會有標記,但透過後製便能裁切。Google也表示,使用新模型編輯的圖片,會嵌入特殊浮水印以顯示圖片經過AI操作的痕跡。
領英分享,目前要確認照片是否為AI生成的圖像,檢查文字仍是一個方法;AI仍然無法處理文字,若將圖像中的標誌、招牌放大時,字母會扭曲,單字可能會變成亂碼。此外,也可從圖片來源可信度、逆向圖片搜尋、及多重驗證等方式進行查證。
卡內基美隆大學(Carnegie Mellon University)電腦科學教授康尼澤( Vincent Conitzer)告訴華盛頓郵報,AI工具雖然帶來衝擊,但不會消失、只會越來越強大。