探索 API FOR GOOGLE 的 GEMINI 語言模型

Mondo 科技 更新 2024-03-06

深入了解 Gemini API 的引數,並展示如何在各種應用程式中最大限度地提高生成內容的有效性。

翻譯自 Janakiram MSV 的 Exploring the API of Google's Gemini Language Model。 提示工程是使用 Gemini API 從語言模型生成自定義和有效輸出的乙個關鍵方面。 這種做法涉及設計和完善提示,以指導 LLM 生成所需的內容,無論是用於創意寫作、編碼、資料分析,還是任何其他可以應用自然語言生成的應用程式。 乙個提示專案的成功不僅取決於提示本身的獨創性,還取決於對Gemini API提供的引數的理解和優化temperaturemax_output_tokenstop_ptop_k。這些引數在提示工程中的重要性怎麼強調都不為過,因為它們使使用者能夠根據特定需求定製模型的行為,確保生成的內容符合所需的準確性、相關性、創造性和連貫性標準。

本文的目的是詳細了解 Gemini API 引數的細微差別,以及如何利用它們來最大限度地提高各種應用程式中生成內容的有效性。

Gemini API 提供了一組引數來微調文字生成,使使用者能夠有效地在創造力和準確性之間取得平衡。 以下是關鍵引數的概述及其對 LLM 響應的創造力和準確性的影響。

以下程式碼片段提供了用於文字生成和聊天完成的 API 呼叫的基本結構。 有關安裝和配置 Vertex AI Python SDK 的更多資訊,請參閱上一教程“進入 Google Gemini 語言模型”。

from google.cloud import aiplatformimport vertexaifrom vertexai.preview.generative_models import generativemodel, part vertexai.init()model = generativemodel("gemini-pro") response = model.generate_content(“what's the meaning of life?”,max_output_tokens=128,temperature=0,top_p=1,top_k=5)print(response.text)
max_output_tokens:此引數設定模型響應的最大長度(以標籤為單位),大致相當於字數。 它控制輸出的細節級別,更高的限制允許更長、更詳細的響應。 選擇這種限制會影響響應的深度和全面性,但不會直接影響其創造性或準確性。

temperature:此引數控制輸出的隨機性。 更高的溫度通過使不太可能的標記更有可能被選擇來增強創造力,從而產生更多樣化和意想不到的輸出。 相反,較低的溫度會導致更容易接受、更保守的輸出。 它是控制模型響應中創造力和確定性之間平衡的關鍵引數。

頂部 P(核取樣)。:此引數(也稱為核取樣)控制標記選擇的累積概率閾值,確保僅考慮最可能的標記(不超過指定的累積概率)。 這允許在創造力和準確性之間取得動態平衡。 較低的閾值(接近 0)將使模型的輸出更加集中且不那麼多樣化,而較高的閾值將增加所用標籤的多樣性,從而可能使輸出更具創意但不太理想。

top_k:此引數將下乙個標記的選擇限制為最有可能的 k 個標記。 較低的 k 值將模型限制在較窄的單詞選擇範圍內,從而產生更理想的輸出,而較高的值允許更廣泛的標籤選擇,從而增加輸出的潛在創造力。 但是,設定得太高可能會降低內容的相關性和準確性。

相比之下,temperaturetop_p與控制模型的創造力更直接相關,更高的值導致更新穎和多樣化的輸出。 top_k引數可以更精細地控制下乙個標記的選擇池,直接影響輸出的多樣性和潛在創造力。 引數max_output_tokens雖然它不會直接影響創造力,但它設定了響應的範圍,影響了模型充分發展想法或提供詳細資訊的能力。

Gemini 引入了高階函式呼叫功能,使開發人員能夠將外部工具和 API 無縫整合到其 AI 驅動的應用程式中。 此功能使模型能夠與外部資料來源和服務進行互動,從而擴充套件其實用性和應用範圍,超出獨立 AI 模型所能實現的範圍。 例如,通過定義模型可以根據接收到的輸入呼叫的函式,開發人員可以建立更動態、響應更靈敏、更有用的 AI 應用程式。 這可以從外部 API 獲取實時資料到基於複雜的外部資料集處理和生成輸出。

Gemini 函式呼叫機制的複雜性證明了其設計為乙個高度互動和可整合的 AI 模型,可以解決廣泛的現實世界用例。 在本系列的後面部分,我將引導您完成通過函式呼叫技術將實時航班跟蹤 API 與 Gemini 整合的步驟。

接地是另一種技術,它通過將特定於上下文的資料納入其處理中,增強了 Gemini 提供相關和準確資訊的能力。 此功能通常由語義搜尋和檢索增強生成模型支援,使 LLM 能夠有效地訪問和使用外部知識庫,使其能夠更好地高精度地回答查詢。 接地具有以下優點:

減少幻覺:接地通過防止非事實內容的產生來最大限度地減少模型幻覺的發生。

錨點響應:接地確保模型響應牢固地錨定在特定資訊上,從而增強其相關性和可靠性。

提高可信度和適用性:接地內容更可信、更有用,從而提高使用者對所生成輸出的滿意度和信心。

Google 已將 Vertex AI Search 與 Gemini 整合,為 LLM 提供接地功能。 與函式呼叫類似,您可以將模型指向搜尋中的資料儲存索引,以檢索上下文資訊。 Gemini API 及其可自定義引數(例如temperaturemax_output_tokenstop_ptop_k在根據特定需求定製 AI 生成內容方面提供無與倫比的靈活性,有效平衡創造力和準確性。

此外,Gemini 的接地和函式呼叫功能極大地擴充套件了其實用性,使其能夠將外部資料來源和服務無縫整合到其響應中。 總之,這些功能增強了 Gemini 在廣泛領域提供上下文相關、準確和高度互動的 AI 應用程式的能力。

相關問題答案

    當谷歌的 Gemini 表現優於 GPT 4 時,這對企業家意味著什麼?

    乙個真正可以與GPT 競爭的AI基礎模型終於出現了。北京時間月日凌晨,谷歌Deepmind發布了Gemini系列AI基礎機型,分為Gemini Ultra Gemini Pro Gemini Nano三個版本,其中Gemini Ultra在次測試中超越了之前的SOTA機型,Gemini Pro將成為...

    谷歌推出基於 Gemini 模型的 AlphaCode 2 程式設計助手

    除了Gemini的生成式AI模型外,谷歌今天早上還發布了AlphaCode ,這是Google Deepmind Labs在大約一年前推出的生成式alphacode的改進版本。Alphacode 實際上是由 Gemini 模型驅動的,或者至少是它的某個變體 Gemini Pro 在程式設計種族資料之...

    谷歌雙子座AI開啟智慧型新時代

    近日,谷歌宣布推出備受期待的雙子座AI系統。作為 Alphabet 最先進的 AI 模型,Gemini 具有處理和理解多種形式資訊的能力,包括文字 影象 和 這項技術的推出不僅標誌著谷歌人工智慧競賽向前邁出了一大步,也預示著我們進入了乙個更智慧型的數字時代。Gemini AI的特點 Gemini A...

    谷歌的“Ellmann Project”人工智慧向你展示生活時刻

    最近,在一次內部峰會上,谷歌提出了乙個大膽的新想法 一項名為 Project Ellmann 的人工智慧功能,它將根據你的谷歌 和搜尋歷史,為使用者提供他們整個生活的快照,或者他們稱之為 鳥瞰圖 從CNBC的演講中,我們對這個專案有了一點了解。谷歌的新寶寶Gemini將為它提供動力。它將使用您的 G...

    谷歌今天推出的 NotebookLM 與 ChatGPT 有什麼不同嗎?

    在技術不斷發展的世界中,隨著 NotebookLM 的推出,Google 又邁出了一大步。這款人工智慧驅動的工具最初在 Google IO 活動中作為 Project Tailwind 首次亮相,旨在徹底改變我們與文件和筆記的互動方式。notebooklm 的誕生。谷歌的 Tailwind 專案,現...