在 VS Code 中優化 AI 點數使用
每個 GitHub Copilot 方案都包含每月的 AI 點數額度。不同的操作會根據模型和處理的 Token 數量,以不同比例消耗點數。本指南介紹在 Visual Studio Code 中充分利用 AI 點數的實用方法。
選擇高效模型
能力更強的模型每個 Token 的成本較高,而較輕量的模型則能延長您的使用時間。請根據任務的複雜度選擇合適的模型。
- 使用輕量模型進行快速編輯、產生樣板程式碼以及簡單的問答。
- 使用推理模型進行複雜的重構、架構決策與多步驟除錯。
- 使用自動模型選擇,讓 VS Code 將每個請求路由至在品質與成本之間取得平衡的高效模型。
- 使用具備偏好模型的自訂代理 (Custom Agents),將特定子任務路由至專業且具成本效益的模型。當您將自訂代理作為子代理調用時,它會使用自己設定的模型,而非對話工作階段的模型。
聊天視窗中的模型選擇器會在懸浮選單中顯示成本詳細資訊,包括每種 Token 類型的成本以及通用的成本等級標籤(低、中、高)。請利用這些資訊做出明智的選擇。
如需更多資訊,請參閱選擇與設定語言模型以及模型選擇的最佳實踐。
先規劃,後執行
如果方法錯誤,直接開始產生程式碼可能會導致徒勞無功。這也需要在整個過程中具備足夠推理能力的模型,從而消耗更多點數。建議將規劃與實作階段分開。這樣您可以使用推理模型進行規劃,一旦計畫確定後,再切換至更快速、更高效的模型進行實作。
- 使用規劃代理 (Plan agent) 來研究任務並建立結構化的實作計畫。
- 在代理撰寫任何程式碼之前,請先審閱並完善計畫。
- 將核准後的計畫交給使用較快模型的實作代理來執行。
此工作流程可確保代理在開始產生程式碼前理解需求,減少來回溝通與重工。
如需更多資訊,請參閱先規劃,後執行。
使用預設的思考強度
思考強度 (Thinking effort) 控制模型對每個請求進行推理的深度。較高的強度等級會產生更多思考 Token,這會增加延遲並消耗更多點數。VS Code 根據評估設定了預設強度等級,並啟用了適應性推理,模型會根據每個請求的複雜度動態決定思考程度。
對於大多數任務,預設值已足夠。僅針對真正複雜的問題(如架構規劃或多步驟除錯)才調高思考強度。
如需更多資訊,請參閱設定思考強度。
為新任務開啟新對話
隨著對話進行,它會累積來自先前訊息、工具輸出與檔案內容的上下文。當您在同一工作階段切換至不相關的任務時,模型仍會處理所有這些無關的歷史記錄,這會消耗 Token 卻無法改善結果。
在更換主題時,請開啟新的聊天工作階段(⌘N (Windows, Linux Ctrl+N))。這能為模型提供一個專注於當前任務的乾淨上下文視窗。
善用分叉 (Forking)
當您想探索替代方案或詢問側邊問題時,請分叉對話 (Fork the conversation),而不是從頭開始重新提示。分叉會建立一個繼承現有對話歷史的新工作階段,因此您無需重新建立上下文。
- 在聊天輸入框輸入
/fork,即可將整個工作階段分叉至當前訊息。 - 將滑鼠懸停在先前的訊息上,並選擇分叉對話,即可從特定檢查點進行分叉。
停用不需要的工具與 MCP 伺服器
每次工具呼叫產生的輸出都會消耗上下文視窗的空間並增加點數消耗。請停用當前任務不需要的工具,以避免不必要的呼叫。
- 使用聊天輸入欄中的設定工具 (Configure Tools) 按鈕,為當前請求啟用或停用個別工具或整個 MCP 伺服器。
- 在自訂代理中,僅透過
tools屬性指定代理需要的工具。這可防止代理呼叫與其工作流程無關的工具。
如需更多資訊,請參閱控制可用工具。
將檔案從 Copilot 內容中排除
大型產生的檔案、建置輸出或不相關的目錄可能會被包含在 AI 上下文中,進而增加 Token 使用量卻無法提供價值。排除這些檔案可減少不必要的上下文。
- 使用
.gitignore檔案將檔案排除在工作區索引之外。工作區索引會遵守.gitignore規則。 - 使用 files.exclude 設定來完全隱藏 VS Code 中的檔案,這也會將其從索引中排除。
如需更多資訊,請參閱工作區上下文。
透過壓縮管理對話內容
當對話變長時,請使用 /compact 來總結對話中較舊的部分,並回收上下文視窗的空間。您可以選擇加入指示來引導摘要,例如 /compact 專注於 API 設計決策。
如需更多資訊,請參閱上下文壓縮。
監控您的使用量
您可以在 VS Code 狀態列中開啟 Copilot 狀態儀表板,查看目前的 Copilot 使用量。該儀表板顯示了您每月 AI 點數額度(以及 Copilot 免費版中的行內建議)的使用百分比。
請造訪 GitHub Copilot 文件,以取得更多關於監控使用量與權益的資訊。
您也可以在任何聊天工作階段中執行 /chronicle:cost-tips 指令,根據您最近的活動獲取優化 AI 點數使用的個人化建議。深入了解工作階段洞察與 chronicle 指令。
檢查 Token 使用量與快取
使用代理除錯記錄 (Agent Debug Logs) 來了解工作階段中消耗點數的項目。
- 摘要檢視 (Summary view) 顯示工作階段的累計 Token 使用量,包括總工具呼叫次數與整體持續時間。
- 快取瀏覽器檢視 (Cache Explorer view) 顯示提示詞快取命中率以及重複使用了多少輸入 Token。提示詞快取允許模型提供者重複使用符合先前請求的前綴,從而減少延遲與 Token 成本。
檢閱這些記錄有助於識別消耗過多 Token 的工作階段或工作流程,以便調整您的做法。