在人工智慧領域,OpenAI 的 ChatGPT 等大型語言模型已經通過 Laion 資料集從網際網絡上獲取大量資料進行訓練,讓它們能夠用自然語言理解和響應。
但是,如果您想利用這些語言模型來處理自己的私有資料,對潛在資料洩露的擔憂可能會讓您猶豫不決。
但是有乙個有趣的想法:
如果您可以在沒有網際網絡連線的情況下與文件進行通訊,請使用人工智慧的力量。 100 個私有,任何時候都沒有資料離開您的本地計算機。PrivateGPT 開源位址:PrivateGPT。
什麼是PrivateGPT?
PrivateGPT 是解決這個問題的革命性技術解決方案。 它使使用 AI 聊天機械人攝取您自己的私人資料成為可能,而無需將其公開。
在這篇文章中,我將詳細介紹在本地機器上設定和執行 PrivateGPT 的過程。
您需要的內容
首先,需要在系統上安裝一些先決條件。
git - 最新原始碼 ** 版本 240.1
Python - 最新 311.3
步驟 1:設定專案
第一步是從 github 專案中轉殖 privategpt 專案。 轉殖後,您應該會看到檔案和資料夾的列表。
第 2 步:必需的依賴項
轉殖專案就位後,下一步是安裝必要的依賴項。 為此,請在專案目錄中開啟終端並執行以下命令:
pip install -r requirements.txt
這將安裝所有依賴項和要求。
步驟 3:語言模型
PrivateGPT 旨在與各種開源語言模型一起使用。 一些可用的選項包括:
駱馬 13B 引數。
考拉 7b 引數。
gpt4all
儘管所有這些型號都很有效,但我建議從 Vicuna 13B 型號開始,因為它具有堅固性和多功能性。
*獲得模型後,將其複製並貼上到 privategpt 專案資料夾中。 您還需要更新。 ENV 檔案來指定 Vikuna 模型的路徑和其他相關設定。
persist_directory=dbmodel_type=llamacppmodel_path=models/ggml-vic13b-q5_1.binembeddings_model_name=all-minilm-l6-v2model_n_ctx=1000
第 4 步:新增文件
將所需的任何文件複製到“源文件”資料夾中。 支援的檔案副檔名如下:
csv:csv
docx:Word 文件。
doc:Word 文件。
enex:evernote
eml:電子郵件。
epub:epub
html:html 檔案。
md:markdown
msg:Outlook 郵件。
ODT:開啟文件文字。
PDF:可移植文件格式 (PDF)。
pptx:PowerPoint 文件。
ppt:PowerPoint文件。
txt:文字檔案(UTF-8)。
要從文件檔案引入資料,請開啟終端並執行以下命令:
python ingest.py如果引入成功,您應該會在終端中看到以下訊息。
步驟 5:執行應用程式
現在您已經完成了所有準備工作,是時候開始聊天了!
在終端中執行以下命令:
python privategpt.py這將載入 LLM 模型並讓您開始聊天。
完善!最後的思考
總的來說,PrivateGPT 不僅是乙個創新工具,而且是乙個變革性工具,旨在徹底改變我們與 AI 互動的方式,解決私隱保護的關鍵要素。
想象一下,您是一位企業主,他認識到 AI 聊天機械人在增強客戶服務、簡化內部溝通和提高整體運營效率方面的巨大潛力。 但是,由於擔心洩露敏感業務資料的風險,您一直不願意實施這些技術。 這就是 PrivateGPT 發揮作用的地方。