簡介:大型語言模型在海量資料上進行訓練,幫助人工智慧使用者提示並生成類似人類的響應。 它們為 OpenAI 的 ChatGPT 和谷歌的 Bard 等生成式 AI 工具提供支援。 在幾個典型的大型語言模型中,有五個專案正在測試,這是美國國防部更廣泛的一系列實驗的一部分,旨在開發供美國軍隊使用的資料整合和數字平台。 習會議由五角大樓數字和人工智慧辦公室以及軍方高層組織。
2023 年 7 月,美國空軍人員在第六屆全球資訊優勢 習 (GIDE) 中首次測試了大型語言模型在軍事任務中的使用。
大型語言模型的使用將代表軍隊的重大轉變,軍隊高度數位化或相互關聯,資訊流動緩慢。 目前,向軍方特定部門索取資訊可能需要幾名工作人員數小時甚至數天才能完成,因為他們將四處尋找資訊或急於製作幻燈片。 在一次測試中,其中乙個 AI 工具在 10 分鐘內完成了請求。
在測試期間,美國空軍還為該模型提供了秘密級別的作戰資訊,以解決敏感的軍事問題。
全球資訊優勢實驗(GIDE)聯合習的前四次迭代由Norad和北方司令部執行,但自GIDE V以來一直由五角大樓首席數字和人工智慧辦公室(CDAO)與參謀長聯席會議合作領導。 GIDE V旨在測試軍方的資料共享和整合,評估其對人工智慧系統的使用,並為聯合全域指揮與控制(JADC2)的實施提供見解。 在最近的GIDE軍事習(第六次)中,美國軍方轉向大型語言模型,為軍方計畫一項實驗,以應對不斷公升級的全球危機,假設危機將從小規模開始,然後轉移到印太地區。 還測試了軍事指揮官是否可以利用大型語言模型來生成他們從未考慮過的全新選項。
美國國防部沒有透露正在測試的語言模型的模型,但美國公司Scale AI表示,該公司的Donovan系統是正在測試的平台之一。 Donovan是第乙個部署在機密網路上的大型語言模型,開發人員將其定位為“人工智慧決策平台”,可以處理來自不同來源的情報資料,並向人類提供建議。 它的發展值得關注。
包括Scale AI的Donovan平台在內的五個LLM在為期八周的習期間進行了測試。 其他四種型號**未知,但目前已知,包括Palantir Technologies Inc和 Anduril Industries Inc數十家公司正在為五角大樓開發基於人工智慧的決策平台。 Microsoft 還宣布,Azure** 雲計算機服務的使用者將可以訪問 OpenAI 的 AI 模型。 美國國防部是 Azure 政府的客戶之一。
我們並不確切知道美國空軍正在測試什麼。 但據外媒彭博社報道,**在向Scale AI的多諾萬模型演示了6萬頁的開源資料(包括來自美國和C國的軍事檔案)後,也進行了實驗測試,詢問多諾萬美國是否可以阻止T海峽的衝突,如果戰爭爆發,誰會贏。 一系列帶有解釋的要點在幾秒鐘內返回。 在一次回應中,多諾萬系統表示,“美國對地面、空中和海軍的直接干預可能是必要的”,並在另乙份回應中警告說,美國很難迅速癱瘓C國的軍隊。 該系統的最後一條注釋寫道:“軍事界對C國與美國之間在某個島嶼上發生潛在軍事衝突的結果幾乎沒有共識”。
根據外媒報道的另一起案件,多諾萬在乙個島嶼附近發現了一艘可疑的C國船隻,然後讓軍事指揮官選擇尋找更多資訊,例如派飛機飛越或呼叫最近的衛星影象。 一旦影象可用,影象識別演算法就會識別出大量的輻射,促使資訊向上傳遞指揮鏈和無人機對船隻進行調查。
隨著各種習的進步,美國軍方已經看到了機器幻覺的出現,生成式人工智慧可能會加劇偏見並自信地傳遞錯誤資訊。 這些 AI 也可能以多種方式受到黑客的攻擊,例如“毒害”輸入模型的資料來源。 這些擔憂是五角大樓進行這項習實驗的原因之一,他們強調需要“深入了解資訊”。 美國國防部已與技術安全公司合作,幫助測試和評估他們對人工智慧系統的信任程度。
生成式人工智慧在國防領域顯示出巨大的潛力。 儘管技術尚不完善,但美軍已開始積極探索和推動生成式人工智慧在資訊控制、軍事戰略、情報分析、無人技術等方面的應用,以提高軍事能力和任務效率。 從長遠來看,美國希望人工智慧能夠加強軍事規劃、感測器分析和火力決策。 因此,與大型語言模型的對話只是他們未來十年更廣泛的人工智慧目標的第一步。 (北京藍德資訊科技有限公司***。