當談到大型語言模型 (LLM) 的智慧型時,我們經常聽到這樣的想法,即當 LLM 通過下乙個令牌預測 (NTP) 任務進行訓練時,它們實際上是在對資料進行無失真壓縮。 這種觀點認為,LLM能夠準確地寫出下乙個單詞,從而在不丟失任何資訊的情況下壓縮資料。 但是,這種觀點可能並不完全準確。
首先,讓我們回顧一下無失真壓縮的概念。 在資料壓縮中,無失真壓縮是指壓縮後的資料可以完全恢復到其原始狀態,而不會丟失任何資訊。 對於LLM,這意味著當下乙個單詞被製作時,模型能夠完全準確地恢復到原始文字。
然而,當我們深入挖掘時,我們發現這個“無損”標籤可能有點過於樂觀了。 雖然LLM確實能夠在訓練過程中通過NTP任務學習文字的深層結構,但當模型應用於現實世界時,它並不總是能夠完美地放置乙個單詞。 這個錯誤實際上代表了資訊的丟失,因為原始文字中的某些資訊沒有正確地傳遞給下乙個單詞。
那麼,我們如何解釋這種資訊丟失呢?事實上,LLM在**過程中的這種“有損”壓縮是通過算術編碼來補償的。 算術編碼是一種高效的資料壓縮技術,它通過將連續的實數對映到有限範圍的整數來實現資料壓縮。 在 LLM 過程中,如果出現錯誤,算術編碼會通過額外的編碼來補償這種資訊丟失,從而使整體外觀為無失真壓縮。
所以,當我們說LLM能夠進行“無失真壓縮”時,我們實際上是在說“LLM+算術編碼”系統能夠進行無失真壓縮。 該系統協同工作,通過LLM的能力和算術編碼的補償機制實現無失真壓縮。
總的來說,LLM的資料壓縮能力是其智慧型的乙個重要方面,但在這個過程中,我們需要更準確地理解什麼是“無損”和“有損”。 LLM可以借助算術編碼,在一定程度上補償**誤差造成的資訊丟失,實現資料的有效壓縮。
優質作者名單
相關問題答案
JD 法學博士 和LLM 法學碩士 是兩種不同型別的法律學位,區別主要在於習學習的內容 學位型別和學習習的方式。JD是Juris Doctor的縮寫,是法學學位的一種,是美國本科畢業生申請法學院的主要學位。法學博士課程主要包括法學研究方法 法學理論 法律實務 法律倫理 憲法 訴訟等課程,旨在培養學生...
美國月非農就業人數增長 ,人高於預期,失業率回落至 但考慮到本週宣布的 月 Jolts 職位空缺為 個萬人,為近兩年半以來的最低水平,月就業好於預期,可能主要是由於月罷工影響消除,就業供需緊張格局緩和趨勢維持不變。非農就業人數好於預期,金價 並未改變長期趨勢。此外,月中國外匯儲備繼續增加 外匯儲備為...
展示新的 GPT API 引入了新的漏洞。這些漏洞違反了 GPT 中的安全措施,導致 GPT 協助使用者發出有害請求。此外,這些漏洞可用於自動生成有針對性的和通用的虛假資訊 洩露私人資料 生成惡意 以及與 GPT 整合的攻擊服務。實驗中使用的資料集可供採集。這些結果強調了仔細測試新 API 的必要性...
離合器壓力是駕駛汽車時的一項重要技能,對於駕駛手動變速箱車輛至關重要。以下是離合器穩定的一些技巧 .壓力控制 確保對離合器踏板施加適當的壓力。輕輕均勻地踩下離合器踏板,不要太用力或突然。當您感覺到踏板底部時,感覺離合器完全鬆開,但不要過度踩壓。.執行緩慢 離合器上的壓力需要逐漸釋放。起步或換檔時,慢...
這些建議提高了 LLM 申請的準確性,並包括如何選擇正確的 LLM 的注意事項。翻譯自 Adrien Truille 的 個關鍵技巧,用於構建更好的 LLM 驅動的應用程式,她是 Snowflake 的產品管理總監兼 Streamlit 負責人,負責資料雲的視覺化資料產品和 Streamlit 計畫...