在近日舉行的解放日報第79屆文化講壇上,香港科技大學首席副校長郭毅可做了主題演講。他在現場提出了一個有趣的問題——“如果大模型是答案,什么是問題”。他分析了當前大模型發展面臨的技術挑戰、未來大模型發展的必然趨勢,分享了香港打造人工智能生態系統的經驗,并對上海的人工智能發展提出了建議。以下是演講主要內容。
英國皇家工程院院士、香港科技大學首席副校長郭毅可在演講中。 海沙爾攝
郭毅可
英國皇家工程院院士、歐洲科學院院士、IEEE(美國電氣電子工程師學會)會士,香港科技大學首席副校長。作為國際知名的計算機科學家,他的主要研究領域為機器學習與數據挖掘,在機器學習算法及醫學大數據分析系統、人工智能藝術等領域作出了重要貢獻。
大家好!我還是講普通話,講上海閑話交關人聽不懂(上海話)。非常有幸,能夠在家鄉上海的舞臺上演講。我小時候家里訂的報紙就是《解放日報》,所以今天《解放日報》向我發出邀請,我肯定會來(臺下發出笑聲)。
人工智能已經深入人心。我也沒有想到,我原來以為這個世界上有男人和女人就夠了,現在還要加上機器人。我今天演講的主題是:如果大模型是答案,那么什么是問題。我來講一講,人工智能的飛躍現在剛剛開始,它未來會怎么發展。
『人工智能可以做什么』
首先,人工智能得以發展,是因為有了一項偉大的技術,叫作神經元網絡。人工智能主要是通過神經元網絡來模擬人腦。
1942年,奧地利心理學家赫布發表了一篇重要的文章,其中講了大腦神經元的連接原理。當大腦受到刺激以后,大腦中的一些神經元就會發生連接,如果不斷刺激它的話,這些連接會越來越強。神經元的連接實際上是刺激的結果,如果把學習看作一種刺激,那么神經元之間的連接就是學習的表現。神經元網絡就是一種模仿大腦神經元之間連接的計算模型。我們不斷地給它輸入數據,為的是構造不同神經元網絡的連接。神經元網絡的連接由代表連接的強度的參數來表達,在學習的過程中,我們不斷去改變連接的強度,從而使模型的輸出能夠滿足我們的要求??偠灾?,這是一種用神經元網絡來模仿大腦學習過程的機制。
那么,人工智能可以做什么事情呢?簡單來說可以做兩類事情。
第一類是判別。判別就是區分不同,區分不同是預測的基礎。要知道數據是屬于哪一類,先進行數據標注,用標注好的數據來訓練模型。 有了模型,輸入一個不知類別的數據后,模型可以根據特征判定它屬于哪一類,這叫判別。比如,圖象識別就是一種典型的判別。人臉識別,模型看了很多人的臉以后,這個人是男的還是女的、年輕的還是年老的,根據特征就可以進行判別。
另一類是生成。生成的順序和判別正好相反。不需要數據標注,我們把所有的數據都輸入計算機,它自己來總結數據的特征,再把這個數據進行聚類,有了類別以后,我們就可以要求計算機生成某一種類別的東西。比如,我要計算機生成一棵樹,因為模型知道樹的特征,它就可以生成一棵它沒有見過的樹,這就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我們為什么做不到呢?因為以前我們沒有這么大的計算機,那么多的數據,也沒有這么好的算法。今天我們有了這么大的計算機,有了這么多的數據,我們可以把全世界所有的文字輸入計算機,它就會總結出語言的特征,并根據語言的特征生成文字。
有了這個生成式的大模型,人工智能被改變了。原來的人工智能都是解決具體問題的。比如要下圍棋,就做一個下圍棋的模型。比如要研究蛋白質折疊的問題,就做一個相關的模型。而現在,我們做的是一個基礎模型。把所有在互聯網上可以獲得的文字數據、圖象數據、聲音數據都輸入計算機,讓它自己學習這些數據,學完以后,就可以生成各種圖片和語言,這就是一個基礎模型。在這個模型的基礎上,可以形成各種各樣的垂直應用。比如,要生成一幅國畫,要生成中文,要生成一部醫學文獻,要生成一個戲劇劇本,都可以通過輸入特別的樣本,對基礎模型進行微調,來形成相關的應用。
所以,大模型的發展在ChatGPT誕生以后呈現出指數級的上升。國內也產生了很多的大模型,幾乎每天誕生一個,出現了爆發式增長。
『為什么語言模型如此重要』
有人說,ChatGPT不就是一個人工智能的語言對話系統嘛,為什么它如此重要?談到它的重要性,要從兩篇文章講起。
第一篇文章是《計算機械與智能》,其作者是大名鼎鼎的英國計算機科學家、被譽為“人工智能之父”的圖靈。還有一篇是“控制論之父”、美國數學家維納發表的文章《人有人的用處——控制論與社會》。這兩篇文章都是1950年發表的,可以說,它們開啟了人工智能的研究之路。
圖靈說:機器有沒有智能?怎么界定機器的智能呢?一個比較好的界定方法就是,當一個機器跟人對話的時候,你不能分辨對話者是機器還是人,這就表明機器有了智能。這個測試方法被稱為“圖靈測試”。所以,語言是界定人工智能是否具有智能的一個重要標準。
維納在文章中提出了兩個問題。首先,他認為機器一定會具有智能,當機器具有智能以后,人和機器在社會中共存的一個重要形式就是人機互相交流、互相對話。其次,這樣的機器是怎么產生的?維納第一次提出,當復雜度達到一定程度時,機器會“涌現”出這樣的智能。
為什么圖靈會用語言來界定機器是否具有智能呢?奧地利哲學家維特根斯坦有一句名言:“我語言的邊界,就是我世界的邊界。”語言不僅是交流的工具,更重要的是,語言是思想的體現。語言是我們對世界的“表達模型”,語言是對客觀世界的主觀編碼。從這個意義上來講,語言的重要性非同尋常,計算機能夠講人類的語言,就意味著它有了和我們相似的智能。
此外,語言還決定了思維方式。如果語言不同的話,我們的思維方式也會不一樣。有一部著名的科幻電影叫作《降臨》,是根據美國華裔科幻作家姜峰楠的小說改編的。電影講了一個道理,那就是語言對思維具有非常重要的作用。一群外星人乘坐飛船來到地球,跟我們交流,但我們不懂他們的語言。后來有一位語言學家通過學習對方的文字,終于理解了他們。原來,他們的語言是非線性的,因此他們的思維也是非線性的,可以超越時空的限制。所以說,語言非常重要,如果機器學會了人類的語言,也就學會了人類的思維。
還有更重要的一點,人類的語言不僅僅是思維的編碼,人類的語言還有感情,還有能量。比如,我現在跟大家講話,其中就充滿了能量,我想表達我的理念,也希望你們能夠接受我的理念,因此就有一種能量的傳播。人類語言的精髓在于,語言的內涵是信息,語言的外延是能量。
以上就是人工智能的語言模型如此重要的原因。
『大模型未來的發展趨勢』
大模型到底是什么?語言大模型是互聯網的信息壓縮和提煉。它是所有互聯網信息的一個壓縮、一個編碼,通過這個編碼,可以生成語言、文本、圖片等。
隨著大模型的進一步發展,它現在可以做什么呢?我們把各種各樣不同的信息——語言、圖像、文本進行輸入,通過編碼對齊,可以得到多模態的結果。比如,我們給ChatGPT看一張圖,然后問它可以用圖片上的這些原料做什么。它通過判別,發現圖片中有雞蛋、牛奶、面粉等,然后它會告訴你,用這些原料可以做煎餅、吐司、蛋糕、面包、餅干等等。這是一個典型的例子,現在的大模型越來越傾向于多模態,由多種數據協同推理。
未來,大模型的發展趨勢是什么?在我看來,大模型發展的必然趨勢是擬人化,越來越像人。從輸入來說,它不僅會聽,還能看;從模型來講,現在它會理解,慢慢地它還會思辨。思辨和理解是不一樣的,思辨需要有價值觀,它會跟你辯論,它知道什么是對的、什么是錯的,而且會向你證明。不像現在的ChatGPT,你問問題,機器回答你而已,未來發展更重要的一步是,它可以問你問題,甚至反駁你的問題,也就是說它有自己的價值觀,自由意志;從輸出方面來說,它不僅會表達,未來還會有行動。這就是具身智能,它可以行動,比如看見東西要掉下去了,機器知道怎樣把它接住。未來,計算機科學會變成機器行為學,這是我們需要研究的一個重要方向??偠灾?,人工智能會越來越融入我們的生活。
那么,現在的人工智能已經發展到了什么樣的水平?2013年的時候有一部非常有名的電影叫作《她》,講述了人與人工智能相愛的科幻故事。電影中的人工智能不僅能對話,而且還有感情,使得男主角愛上了她?,F實和電影的距離正在拉近。2024年5月14日,OpenAI公司發布了GPT-4o,現在的GPT已經有了情緒對話的能力,它甚至可以打斷你,雖然它還沒有跟人辯論的能力,但它已經能夠打斷你了。它可以在短至232毫秒、平均320毫秒的時間內對音頻輸入做出反應,這幾乎已經跟人一樣了。
『我們現在應該做什么』
我們在香港進行生成式人工智能的研究,但我們的做法跟國內不太一樣。在香港,我們不是做很多模型,我們只做一個基礎模型,主要是為香港的人工智能企業和香港社會服務,各種研究機構、企業、創新公司都可以到這個平臺上進行開發、應用。這個基礎模型叫“香港仔(HKGAI)”。它有語言系統,可以對話;也可以寫作,學生、政府官員都可以用它來進行寫作;還可以做一些多模態的工作,比如用一個人的圖片生成動畫。
最后,我來講講人工智能的技術挑戰。技術挑戰包括三個方面,一個是算法,一個是數據,一個是算力。
從數據來講,最大的問題是我們幾乎已經窮盡了數據,我們把世界上幾乎所有的數據都拿來訓練大模型了,數據總是有限的,但我們需要更多的數據、更多的信息來訓練大模型。
從算力來講,有一個叫作擴展律的概念,就是說能力越大,效能越好,但是算力總是有限的,而且我們目前還受到芯片的制約。
從算法來講,主要有三個問題。首先,我們需要研究怎樣避免重復的學習,怎樣保證大模型對新的數據不進行重復訓練。其次,數據不是沒有了,而是被壓縮了,既然模型是數據的完美壓縮,那么高階的學習將是在模型上的學習。最后,機器智能和人類智能的培養實際上具有兩極性,也就是機器智能和人類智能的培養、訓練方法是相反的。人是怎么培養的呢?我們小時候培養的是童心、好奇心,然后培養價值觀,了解什么是好的、什么是壞的、什么事情是有價值的、什么事情是不能做的。再后來學習書本知識,最后是積累社會經驗。而人工智能是反過來的,一開始,不管三七二十一把所有的數據都給它,訓練一個通用大模型,然后進一步垂直化,微調一個個系統,完了之后發現所有的東西都沒有價值觀,沒有思考的能力,所以再開始學習價值觀,而最難的是把所有的東西抽象成一個個常識和概念。所以,未來算法最具有挑戰性的是,怎樣讓機器學會價值觀,怎樣讓機器學會常識,并且,怎樣讓機器記得住、用得上這些常識。
最后,我想對上海人工智能的發展提幾點建議。我認為,大模型是一個基礎設施,就像地鐵,它是一個公共開發的平臺,只做一個基礎大模型就好,做很多的話會重復。因此,要建設一個上?;A大模型,形成產業生態,可以在這個公共平臺上開發各種不同的垂直應用和社會服務,在教育、政務、醫學、金融、文創等領域做出世界水平的應用實例。更重要的是,以上海豐富的學術資源為基礎,進一步加強基礎研究,研究新的算法。最后,千萬不要忘了,人工智能的治理非常重要,上海作為國際化大都市,應當建立一個開放性的人工智能治理研究機構,以上海的人工智能應用為背景,做出人工智能治理的國際典范。
今天,我們越來越把機器做成人的樣子,未來,我們的社會將會由三種人構成,那就是男人+女人+機器人,而我們的社會還沒有為此做好準備。我想,做好人工智能治理的研究工作,把人工智能融入我們的社會、融入我們的生活,這將是我們為人類所做的很大的貢獻。謝謝?。ㄈ珗稣坡暎?/p>
欄目主編:龔丹韻
文字編輯:徐蓓
本文作者:郭毅可