蘋果釋出在裝置上運行的開源人工智慧模型:OpenELM
突破雲端限制,Apple OpenELM 帶來在裝置上的人工智慧新體驗
蘋果公司近期宣佈釋出一系列名為 OpenELM(Open-source Efficient Language Models)的開源大型語言模型,這些模型專為在裝置上運行而設計,不再依賴雲端伺服器。這些模型可在Hugging Face Hub上找到,一個分享AI代碼的社群平台。OpenELM 的核心特點在於其層級式縮放策略,旨在提升準確性和效率,同時降低對資源的需求。
高效率的OpenELM:層級式縮放策略的魔力
OpenELM 模型利用層級式縮放策略,巧妙地在變換器模型的每一層內有效地分配參數,進而提高準確性。以一個約10億參數的預算為例,OpenELM 相較於 OLMo 在準確性上提升了2.36個百分點,但所需的預訓練標記卻減少了一半。與傳統僅提供模型權重和推理代碼不同,OpenELM 提供了完整的訓練和評估框架,包括訓練日誌、多個檢查點和預訓練配置,以促進更快的進步和更可信的結果。
開源的力量:研究與開發的新契機
釋出OpenELM模型是蘋果對開源研究社區的貢獻,旨在提供最先進的語言模型,讓研究人員能更深入地研究風險、數據和模型偏見。開發者和企業可以使用這些模型,或者根據自身需求進行修改。這種開源分享的模式也成為蘋果吸引頂尖工程師、科學家和專家的重要手段,因為它打破了蘋果以往的封閉政策,為研究論文的發表提供了更多可能。
蘋果的AI未來:隱私與在裝置運行的趨勢
雖然蘋果尚未在其裝置上實現這些AI功能,但據傳iOS 18將引入多項AI新特性。據說,蘋果正計劃將大型語言模型運行在裝置上,以保護用戶隱私。隨著技術的不斷進步,我們可以期待更多強大的AI功能將直接在我們的手持設備上運行,而不必依賴遠端的雲端服務。
總結與展望
蘋果的OpenELM項目揭示了在裝置上運行AI模型的潛力,這不僅能提高效率,還能保護用戶的數據安全。隨著開源社區的參與,我們預期將看到更多創新的應用和改進。作為科技愛好者,我們應關注這些進展,因為它們將塑造我們與技術互動的方式。請繼續關注我們的網站和社群,以獲得更多關於AI和技術發展的最新資訊。
相關連結:
https://github.com/apple/corenet