深入了解 Gemini API 的引數,並展示如何在各種應用程式中最大限度地提高生成內容的有效性。
翻譯自 Janakiram MSV 的 Exploring the API of Google's Gemini Language Model。 提示工程是使用 Gemini API 從語言模型生成自定義和有效輸出的乙個關鍵方面。 這種做法涉及設計和完善提示,以指導 LLM 生成所需的內容,無論是用於創意寫作、編碼、資料分析,還是任何其他可以應用自然語言生成的應用程式。 乙個提示專案的成功不僅取決於提示本身的獨創性,還取決於對Gemini API提供的引數的理解和優化temperature
max_output_tokens
top_p
跟top_k
。這些引數在提示工程中的重要性怎麼強調都不為過,因為它們使使用者能夠根據特定需求定製模型的行為,確保生成的內容符合所需的準確性、相關性、創造性和連貫性標準。
本文的目的是詳細了解 Gemini API 引數的細微差別,以及如何利用它們來最大限度地提高各種應用程式中生成內容的有效性。
Gemini API 提供了一組引數來微調文字生成,使使用者能夠有效地在創造力和準確性之間取得平衡。 以下是關鍵引數的概述及其對 LLM 響應的創造力和準確性的影響。
以下程式碼片段提供了用於文字生成和聊天完成的 API 呼叫的基本結構。 有關安裝和配置 Vertex AI Python SDK 的更多資訊,請參閱上一教程“進入 Google Gemini 語言模型”。
from google.cloud import aiplatformimport vertexaifrom vertexai.preview.generative_models import generativemodel, part vertexai.init()model = generativemodel("gemini-pro") response = model.generate_content(“what's the meaning of life?”,max_output_tokens=128,temperature=0,top_p=1,top_k=5)print(response.text)max_output_tokens:此引數設定模型響應的最大長度(以標籤為單位),大致相當於字數。 它控制輸出的細節級別,更高的限制允許更長、更詳細的響應。 選擇這種限制會影響響應的深度和全面性,但不會直接影響其創造性或準確性。
temperature:此引數控制輸出的隨機性。 更高的溫度通過使不太可能的標記更有可能被選擇來增強創造力,從而產生更多樣化和意想不到的輸出。 相反,較低的溫度會導致更容易接受、更保守的輸出。 它是控制模型響應中創造力和確定性之間平衡的關鍵引數。
頂部 P(核取樣)。:此引數(也稱為核取樣)控制標記選擇的累積概率閾值,確保僅考慮最可能的標記(不超過指定的累積概率)。 這允許在創造力和準確性之間取得動態平衡。 較低的閾值(接近 0)將使模型的輸出更加集中且不那麼多樣化,而較高的閾值將增加所用標籤的多樣性,從而可能使輸出更具創意但不太理想。
top_k:此引數將下乙個標記的選擇限制為最有可能的 k 個標記。 較低的 k 值將模型限制在較窄的單詞選擇範圍內,從而產生更理想的輸出,而較高的值允許更廣泛的標籤選擇,從而增加輸出的潛在創造力。 但是,設定得太高可能會降低內容的相關性和準確性。
相比之下,temperature跟top_p與控制模型的創造力更直接相關,更高的值導致更新穎和多樣化的輸出。 top_k引數可以更精細地控制下乙個標記的選擇池,直接影響輸出的多樣性和潛在創造力。 引數max_output_tokens雖然它不會直接影響創造力,但它設定了響應的範圍,影響了模型充分發展想法或提供詳細資訊的能力。
Gemini 引入了高階函式呼叫功能,使開發人員能夠將外部工具和 API 無縫整合到其 AI 驅動的應用程式中。 此功能使模型能夠與外部資料來源和服務進行互動,從而擴充套件其實用性和應用範圍,超出獨立 AI 模型所能實現的範圍。 例如,通過定義模型可以根據接收到的輸入呼叫的函式,開發人員可以建立更動態、響應更靈敏、更有用的 AI 應用程式。 這可以從外部 API 獲取實時資料到基於複雜的外部資料集處理和生成輸出。
Gemini 函式呼叫機制的複雜性證明了其設計為乙個高度互動和可整合的 AI 模型,可以解決廣泛的現實世界用例。 在本系列的後面部分,我將引導您完成通過函式呼叫技術將實時航班跟蹤 API 與 Gemini 整合的步驟。
接地是另一種技術,它通過將特定於上下文的資料納入其處理中,增強了 Gemini 提供相關和準確資訊的能力。 此功能通常由語義搜尋和檢索增強生成模型支援,使 LLM 能夠有效地訪問和使用外部知識庫,使其能夠更好地高精度地回答查詢。 接地具有以下優點:
減少幻覺:接地通過防止非事實內容的產生來最大限度地減少模型幻覺的發生。
錨點響應:接地確保模型響應牢固地錨定在特定資訊上,從而增強其相關性和可靠性。
提高可信度和適用性:接地內容更可信、更有用,從而提高使用者對所生成輸出的滿意度和信心。
Google 已將 Vertex AI Search 與 Gemini 整合,為 LLM 提供接地功能。 與函式呼叫類似,您可以將模型指向搜尋中的資料儲存索引,以檢索上下文資訊。 Gemini API 及其可自定義引數(例如temperature
max_output_tokens
top_p
跟top_k
在根據特定需求定製 AI 生成內容方面提供無與倫比的靈活性,有效平衡創造力和準確性。
此外,Gemini 的接地和函式呼叫功能極大地擴充套件了其實用性,使其能夠將外部資料來源和服務無縫整合到其響應中。 總之,這些功能增強了 Gemini 在廣泛領域提供上下文相關、準確和高度互動的 AI 應用程式的能力。