約束,AI創造力的真正源泉
時間:2025-07-23 22:34:12 出處:熱點閱讀(143)
本文來自微信公眾號:奇點漫游者,約束作者:賽先聲,創造原文標題:《如果AI的真正創造力“涌現”是個誤會,那AI怎么幫我們創新?源泉》,題圖來自:AI生成
我們正處在一個由AI驅動的約束“文藝復興2.0”時代。從ChatGPT的創造吉卜力創意熱潮到Veo3生成的爆款短視頻,AI似乎有媲美甚至超越人類的真正創造力。
我們一直以為,源泉這種能力的約束覺醒源于更龐大的數據集、更復雜的創造算法和對人類世界的完美模仿。我們曾堅信,真正通往更強創造力的源泉道路,是約束用天量的數據“喂養”出一個靈感涌現不絕的“創新之神”。
但如果真相恰恰相反呢?創造如果AI的創造力并非源于其“無所不知”,而是真正源于其“一知半解”?如果那些我們一直試圖修復的“技術缺陷”,恰恰是點燃其創意火花的秘密引擎呢?
最近,一篇發表在《Quanta Magazine》上的重磅研究,顛覆了我的認知。斯坦福大學的研究者梅森·坎布(Mason Kamb)和蘇里亞·甘古利(Surya Ganguli)的研究成果表明,AI的創造力并非某種高深莫測的“涌現智能”,而是一個令人意外的、由“不完美”設計所催生的必然結果。
一、揭開創意的面紗:所謂的“靈感涌現”只是美麗的誤會
長期以來,當我們看到AI生成了一幅“宇航員在巴洛克風格的宮殿里騎馬”的圖像時,我們傾向于認為AI“理解”了宇航員、馬和巴洛克風格,并像人類藝術家一樣將它們創造性地結合起來。這是一種令人欣慰的擬人化想象,但研究表明,這是一個美麗的誤會。
真相是,以擴散模型(Diffusion Models)為代表的生成式AI,其創造力的核心并非來自對概念的“高階理解”,而是源于其架構中兩個看似“缺陷”的底層約束。這種對全局的“無知”,恰恰讓AI擺脫了人類思維中的一種經典枷鎖——“功能固著”(Functional fixedness)。
功能固著是一種人類有而AI沒有的認知偏誤,是指人們知道了一些事物的固定的作用和功能之后,就會習慣性地認為這些事物就是用來干這些事情,而忽視了這些事物的其他方面的功能。
在著名心理學家卡爾·鄧克爾(Karl Duncker)的“蠟燭問題”實驗中,人們很難想到用裝圖釘的盒子來做燭臺,因為我們對“盒子”的完整知識(它是容器)限制了想象力。AI則沒有這種“知識的詛咒”,它不“理解”盒子,只“看到”其可以支撐物體的局部屬性,因此這種“無知”反而成全了它的創造力。
AI不是一個全知全能的畫家,更像一個技藝高超的馬賽克藝術家,他雖然看不見整幅壁畫的全貌,但憑借手中有限的彩色瓦片和一套嚴格的拼接規則,卻能創造出令人驚嘆的全新圖案。
二、AI創造力的“黃金鐐銬”:兩大基本原則
那么,這兩副給AI戴上,卻反而讓它舞姿更美的“黃金鐐銬”究竟是什么?
第一副鐐銬:局部性(Locality)。這指的是AI模型在處理信息時,并不是像我們一樣“縱覽全局”,而是一次只能聚焦于一個極小的圖像區塊(patch)。它像一個透過鎖孔看世界的觀察者,視野極其有限。
AI不知道一只完整的貓是什么樣的,但它對“貓的毛發紋理”、“貓耳朵的尖銳輪廓”、“貓眼睛的反光”這些局部特征了如指掌。這種“視野缺陷”迫使它在生成圖像時,無法直接復制一整只記憶中的貓,而必須將無數個它學到的“局部碎片”重新組合。
第二副鐐銬:平移等變性(Translational Equivariance)。這聽起來很專業,但原理卻很直觀。它是一套保證“結構一致性”的鐵律。簡單來說,如果模型在一個局部區塊學會了“磚墻”的紋理,那么當它需要在圖像的另一個位置畫磚墻時,它會運用完全相同的規則和結構。這確保了AI生成的世界不會陷入混亂。
這一思想與AI先驅、圖靈獎得主楊立昆大力倡導的“世界模型”(World Models)不謀而合。兩者的核心都在于,讓AI學習這個世界可預測、可泛化的基本規律,而不是去死記硬背無窮無盡的表象。正是這種對底層規則的遵循,讓AI的“拼貼”顯得真實可信。
當“局部性”將世界打碎成無限重組的可能,而“平移等變性”則像一根無形的線,將這些碎片以一種和諧、連貫、符合邏輯的方式縫合起來,創造力的奇跡便誕生了。
無獨有偶,近年來AI研究者們開發的“等變局部評分”(Equivariant Local Score, ELS)機,正是一個只優化這兩個核心原則的簡化數學模型,它竟然能高度復現復雜擴散模型的輸出,這再次證明了——約束,而非自由,才是AI創造力的真正源泉。
三、化“限制”為“催化劑”:系統性提升AI創新力的3個方法
理解了AI創造力的根本原理,我們提升AI創新能力的方向就變得豁然開朗。我們不再是盲目地擴大模型、堆砌數據,而是可以像一位熟練的工程師一樣,通過“設計約束”來主動引導和激發AI的創造潛力。
這種“擁抱限制”的哲學,在人類的創新史上早已屢見不鮮。史蒂夫·喬布斯畢生信奉“至繁歸于至簡(Simplicity is the ultimate sophistication)”,他對iPhone只保留一個Home鍵的極致約束,恰恰成就了一代產品的革命性體驗。
同樣,在AI的世界里,我們也可以通過以下方法,將限制化為創新的催化劑:
方法一:設計“不完美”的架構。未來的AI模型設計,重點可能不再是單純地追求“更大更強”,而是要戰略性地構建具有特定“創造性缺陷”的架構。我們可以設計出在不同維度上具有不同“局部性”視野的模型,或者引入更多有趣的“等變性”規則(如旋轉、縮放等),就像給樂高玩家提供不同形狀和功能的積木,讓他們能搭建出更富想象力的作品。
方法二:駕馭數據“信息差”。如果我們想讓AI畫出更有創意的椅子,或許我們不應該只給它看成千上萬張椅子的照片。我們可以嘗試一種“信息差”訓練法:給模型看無數物體的局部紋理(木頭、金屬、織物),再給它看無數種結構(四條腿的、單腿的、懸空的),但就是不給它看一張完整的“椅子”。這將迫使模型在其“局部知識庫”中進行前所未有的探索和組合,從而“發明”出我們從未見過的椅子設計。
方法三:將提示工程提升為“約束的藝術”。當我們向AI輸入“一只由水晶構成的蝴蝶,棲息在熔巖流上”時,我們正是在讓模型在嚴格的約束下(水晶質感+蝴蝶結構+熔巖環境),去完成一次前所未有的“創作越獄”。
這讓人想起了傳奇音樂家布萊恩·伊諾(Brian Eno)著名的“傾斜策略(Oblique Strategies)”卡牌。當創作陷入僵局時,他會抽出一張寫有“只用一個音符”或“重復一個動作”這類指令的卡牌,通過這種人為的限制來打破思維定勢,激發全新的靈感。
這一方法也讓提示詞的意義變得更加深刻。一個好的提示詞,本質上就是在施加一種巧妙的“創造性約束”。
四、擁抱“不完美”,我們面臨什么問題?
對AI創造力的研究和探索,或許能讓我們反思對AI“完美”復現人腦的執迷,轉而善用AI的“不完美”。我們手中的創新鑰匙,不再是無窮無盡的數據和算力,而是設計“智慧約束”的能力。
這也引發了兩個更深層次的問題:
既然約束是創造力的引擎,那么是否存在一種“最優約束”的尺度?太多的約束會扼殺創意,太少則會導致混亂,那個激發最大創新的“黃金分割點”在哪里?
如果AI的創造力源于一種與人類截然不同的“認知范式”,那么追求讓AI像人一樣思考的通用人工智能(AGI)道路,是否從一開始就走偏了?
或許這些將是未來AI領域的重點研究方向。
本文來自微信公眾號:奇點漫游者,作者:賽先聲
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 [email protected]
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4605182.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.