開源與閉源的紛爭已久,現在或許已經達到了一個新的高潮。
說到開源大模型,Llama 系列自誕生以來就是典型代表,其優秀的性能與開源特點讓人工智能技術的應用性和可訪問性大大提升。任何研究人員和開發者都能夠從中獲益,讓研究和應用變得更加廣泛。
在官方博客中,Meta 表示:「直到今天,開源大語言模型在功能和性能方面大多落后于封閉模型?,F在,我們正在迎來一個開源引領的新時代?!?/p>
與此同時,Meta 創始人、CEO 扎克伯格親自撰寫長文闡述開源對所有開發者、對 Meta、對世界的意義。他表示,開源是 AI 積極發展的必要條件。以 Unix 和 Linux 的發展為例,開源 AI 將更有利于創新、數據保護和成本效益。
他還認為,開源 Llama 模型能夠建立一個完整的生態系統,確保技術進步,并且不會因為競爭而失去優勢。Meta 有著成功的開源歷史,通過開源 AI 模型,扎克伯格希望促進全球技術的平等和安全應用。
原文鏈接:https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/
以下是原文內容:
扎克伯克為 Meta 注入開源基因
在高性能計算的早期,各大主流科技公司都投入大量資金開發各自的閉源 Unix 版本。當時很難想象會有其他方法能開發出如此先進的軟件。
然而,開源的 Linux 逐漸流行起來:最初是因為它允許開發人員自由修改代碼且價格更實惠,而后來它變得更先進、更安全,并且擁有比任何閉源 Unix 更廣泛的生態系統,支持更多的功能。今天,Linux 已成為云計算和運行大多數移動設備的操作系統的行業標準基礎, 大家都因其卓越的產品受益。
我相信人工智能的發展也與其發展軌跡類似。今天,一些科技公司正在開發領先的閉源模型,但開源正在迅速縮小差距。
去年,Llama 2 僅能與一代舊型號相媲美。而在今年,Llama 3 在某些領域已經可以與行業中領先的模型競爭甚至領先。明年開始,我們預計未來的 Llama 模型將成為行業中最先進的大模型。在此之前,Llama 也已經在開放性、可修改性和成本效益方面領先。
今天,我們正邁出下一步 —— 使開源 AI 成為行業標準。我們發布了首個前沿級開源 AI 模型 Llama 3.1 405B,以及改進版的 Llama 3.1 70B 和 8B 模型。較于閉源模型,這些開源模型在成本效益上顯著提升,特別是 405B 模型的開源特性,使其成為微調和蒸餾小型模型的最佳選擇。
除了發布這些模型,我們還與多家公司合作,拓展更廣泛的生態系統。亞馬遜、Databricks 和英偉達正在推出全套服務,支持開發者微調和蒸餾他們自己的模型。像 Groq 這樣的創新者已經為所有新模型構建了低延遲、低成本的推理服務。
這些模型將在包括 AWS、Azure、Google、Oracle 等所有主要云平臺上可用。Scale.AI、戴爾、德勤等公司已經準備好幫助企業采用 Llama 并使用他們自己的數據訓練定制模型。隨著社區的成長和更多公司開發新服務,我們可以共同使 Llama 成為行業標準,并將 AI 的益處帶給每個人。
Meta 致力于開源 AI,以下是我認為開源是最佳開發平臺的原因,為什么開源 Llama 對 Meta 有利,以及為什么開源 AI 對世界有益,并由此將長期存在。
開源 AI 之于開發者
當我與全球的開發者、CEO 和政府官員交談時,通常聽到幾個主題:
我們需要訓練、微調和蒸餾自己的模型。每個組織都有不同的需求,這些需求最好通過使用不同規模并使用特定數據訓練或微調的模型來滿足。設備上的任務和分類任務需要小型模型,而更復雜的任務則需要大型模型?,F在,你可以使用最先進的 Llama 模型,繼續用自己的數據訓練它們,然后將它們蒸餾成最適合你需求的模型規模 —— 無需我們或任何其他人看到你的數據。
我們需要掌控自己的命運,而不是被閉源供應商「鎖死」。許多組織不希望依賴他們無法自己運行和控制的模型。他們不希望閉源模型供應商能夠更改模型、改變使用條款,甚至完全停止服務。他們也不希望被鎖定在擁有模型專有權的單一云平臺上。開源使得兼容工具鏈的廣泛生態系統成為可能,你可以輕松地在這些工具之間切換。
我們需要保護我們的數據。許多組織處理需要保護的敏感數據,無法通過云 API 發送到閉源模型。一些組織則根本不信任閉源模型供應商對其數據的處理。開源解決了這些問題,因為它使你可以在任何你想要的地方運行模型。眾所周知,開源軟件會因為開發過程更加透明,而更安全。
我們需要一個高效且經濟的模型。開發者可以在自己的基礎設施上運行 Llama 3.1 405B,進行推理,成本大約是使用閉源模型(如 GPT-4)的 50%,適用于用戶端和離線推理任務。
我們希望投資于將成為長期標準的生態系統。許多人看到開源的發展速度快于封閉模型,他們希望在能夠長期提供最大優勢的架構上構建自己的系統。
開源 AI 之于 Meta
Meta 的商業模式是為人們構建最佳體驗和服務。為了實現這一目標,我們必須確保始終能夠獲取最佳技術,而不是被鎖定在競爭對手的封閉生態系統中,這樣他們就不能限制我們所開發的內容。
我想分享一個重要經歷:雖然蘋果公司允許我們在其平臺上構建內容,但是當我們構建服務時仍受到了限制。無論是他們對開發者的稅收、他們施加的任意規則,還是他們阻止的所有產品創新,顯而易見,如果我們能夠構建產品的最佳版本,并且競爭對手無法限制我們構建的內容,Meta 和許多其他公司將能夠為人們提供更好的服務。從哲學層面上講,這也是我如此堅信在 AI 和 AR/VR 領域為下一代計算機建立開放生態系統的一個重要原因。
人們常常問我是否擔心因為開源 Llama 而失去技術優勢,但我認為這忽略了大局,原因有以下幾點:
首先,為了確保我們能夠長期保持技術領先,并且不被鎖定在閉源生態系統中,Llama 需要發展成一個完整的生態系統,包括工具、效率改進、硬件優化和其他集成。如果只有我們公司使用 Llama,這個生態系統將不會發展,我們的境況也不會比 Unix 的閉源變種好多少。
其次,我預計 AI 開發將繼續保持高度競爭,這意味著在任何給定時刻,開源某個模型不會使我們在與下一個最佳模型的競爭中失去巨大優勢。Llama 成為行業標準的途徑是通過一代又一代地保持競爭力、高效性和開放性。
第三,Meta 與閉源模型提供商的一個關鍵區別在于,銷售 AI 模型的訪問權限并不是我們的商業模式。這意味著公開發布 Llama 不會削弱我們的收入、可持續性或投資研究的能力,而閉源提供商則會受到影響。(這也是為什么一些閉源提供商一直在游說公共管理者反對開源的原因之一。)
最后,Meta 在開源項目上有著豐富的成功經驗。通過與開放計算項目分享我們的服務器、網絡和數據中心設計,并使供應鏈標準化,我們節省了數十億美元。通過開源 PyTorch、React 等領先工具,我們從生態系統的創新中受益匪淺。這種方法長期以來一直極具效果。
開源 AI 之于世界
我相信開源對于 AI 的未來是有必要的。AI 比任何其他現代技術都更有潛力提高人類的生產力、創造力和生活質量,并且能夠在加速經濟增長的同時推動醫學和科學研究的進步。開源將確保全球更多的人能夠從 AI 的發展中獲得利益和機會,權力不會集中在少數幾家公司手中,并且技術能夠更均勻和安全地在社會中部署。
關于開源 AI 模型的安全性,存在著持續的爭論。我的觀點是,開源 AI 將比替代方案更安全。我認為各國政府最終會得出支持開源的結論,因為這將使世界更加繁榮和安全。
在我理解的安全性框架中,我們需要防范兩類危害:無意和故意。
無意的危害是指 AI 系統可能在運行時非故意地造成傷害。例如,現代 AI 模型可能在無意中給出錯誤的健康建議?;蛘?,在未來場景中,有人擔心模型可能會無意中自我復制或過度優化目標,從而對人類造成損害。
故意的危害是指不良行為者使用 AI 模型以造成傷害為目的。
值得注意的是,無意的危害涵蓋了人們對 AI 的多數擔憂 —— 從 AI 系統對數十億用戶的影響到大多數真正災難性的科幻場景。在這方面,開源所帶來的安全性更加顯著,因為系統更透明,可以被廣泛審查。
歷史上,開源軟件由于這一原因一直更安全。同樣,使用 Llama 及其安全系統如 Llama Guard,可能會比閉源模型更安全和更可靠。因此,大多數關于開源 AI 安全性的討論集中在故意的危害上。
我們的安全流程包括嚴格的測試和紅隊評估,以檢驗我們的模型是否有可能造成實質性傷害,此目標是在發布前減輕風險。由于這些模型是開源的,任何人都可以自行進行測試。我們必須牢記,這些模型是通過互聯網上已有的信息訓練的,所以在考慮危害時,起點應該是模型是否能比從 Google 或其他搜索結果快速獲取的信息造成更多的危害。
通過區分個體或小規模行為者與擁有大量資源的大規模行為者(如國家)所能做的事情,將會有益于推理故意傷害。
在未來的某個時候,個別惡意行為者可能會利用 AI 模型的智能,從互聯網上現有的信息中制造出新型危害。在這一點上,力量的均衡對 AI 安全至關重要。
我認為生活在一個 AI 廣泛部署的世界中會更好,因為這樣可以使大型行為者制衡小型惡意行為者。這也是我們在社交網絡上管理安全的方式,憑借更強大的 AI 系統識別并阻止那些經常使用小規模 AI 系統的不太復雜的行為者。
更廣泛地說,大型機構在大規模部署 AI 時將促進社會的安全和穩定。只要每個人都能訪問類似代際的模型,那么擁有更多算力資源的政府和機構將能夠制衡擁有較少計算資源的惡意行為者。
在考慮未來的機遇時,請記住,今天的大多數領先科技公司和科學研究都是建立在開源軟件之上的。如果我們共同投資于開源 AI,下一代公司和研究就會獲得使用的機會。這包括剛剛起步的初創企業,以及那些可能沒有資源從頭開發 SOTA AI 的大學和國家的人們。
總而言之,開源 AI 代表了在全球范圍內我們可以利用這項技術為所有人創造最大的經濟機會和安全保障。
合作行穩,開源致遠
在過去的 Llama 模型中,Meta 為自身開發發布了這些模型,但并未重點關注建立更廣泛的生態系統。這次發布,我們采取了不同的方式。我們正在內部組建團隊,使盡可能多的開發者和合作伙伴能夠使用 Llama,并且積極建立合作伙伴關系,以便生態系統中的更多公司能夠為他們的客戶提供獨特的功能。
我相信 Llama 3.1 的發布將成為行業的一個轉折點,大多數開發者將開始使用開源技術,我預計這種方式將會以我們的開源為起點。
我希望我們可以共同努力將 AI 的益處帶給全世界。