使用聊天模型和提示模板构建一个简单的LLM应用
在这个快速入门中,我们将向您展示如何使用 LangChain 构建一个简单的 LLM 应用。该应用将把文本从英文翻译成另一种语言。这是一个相对简单的 LLM 应用——它仅包含一次 LLM 调用和一些提示。尽管如此,这对于开始使用 LangChain 来说是一个绝佳的方式——许多功能只需一些提示和一次 LLM 调用就可以实现!
阅读完本教程后,您将对以下内容有高层次的了解:
让我们开始吧!
设置
安装
要安装 LangChain,请运行以下命令:
- npm
- yarn
- pnpm
npm i langchain @langchain/core
yarn add langchain @langchain/core
pnpm add langchain @langchain/core
有关更多细节,请参阅我们的安装指南。
LangSmith
您使用 LangChain 构建的许多应用将包含多个步骤和多次 LLM 调用。 随着这些应用变得越来越复杂,能够检查您的链或代理内部发生了什么变得至关重要。 实现此目的的最佳方式是使用LangSmith。
在上方链接注册后,请确保设置您的环境变量以开始记录追踪信息:
export LANGSMITH_TRACING="true"
export LANGSMITH_API_KEY="..."
# 如果您不在无服务器环境中,可减少追踪延迟
# export LANGCHAIN_CALLBACKS_BACKGROUND=true
使用语言模型
首先,我们来学习如何单独使用语言模型。LangChain 支持许多不同的语言模型,您可以互换使用它们。有关使用特定模型的详细信息,请参阅支持的集成。
Pick your chat model:
- Groq
- OpenAI
- Anthropic
- Google Gemini
- FireworksAI
- MistralAI
- VertexAI
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/groq
yarn add @langchain/groq
pnpm add @langchain/groq
Add environment variables
GROQ_API_KEY=your-api-key
Instantiate the model
import { ChatGroq } from "@langchain/groq";
const model = new ChatGroq({
model: "llama-3.3-70b-versatile",
temperature: 0
});
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/openai
yarn add @langchain/openai
pnpm add @langchain/openai
Add environment variables
OPENAI_API_KEY=your-api-key
Instantiate the model
import { ChatOpenAI } from "@langchain/openai";
const model = new ChatOpenAI({ model: "gpt-4" });
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/anthropic
yarn add @langchain/anthropic
pnpm add @langchain/anthropic
Add environment variables
ANTHROPIC_API_KEY=your-api-key
Instantiate the model
import { ChatAnthropic } from "@langchain/anthropic";
const model = new ChatAnthropic({
model: "claude-3-5-sonnet-20240620",
temperature: 0
});
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/google-genai
yarn add @langchain/google-genai
pnpm add @langchain/google-genai
Add environment variables
GOOGLE_API_KEY=your-api-key
Instantiate the model
import { ChatGoogleGenerativeAI } from "@langchain/google-genai";
const model = new ChatGoogleGenerativeAI({
model: "gemini-2.0-flash",
temperature: 0
});
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/community
yarn add @langchain/community
pnpm add @langchain/community
Add environment variables
FIREWORKS_API_KEY=your-api-key
Instantiate the model
import { ChatFireworks } from "@langchain/community/chat_models/fireworks";
const model = new ChatFireworks({
model: "accounts/fireworks/models/llama-v3p1-70b-instruct",
temperature: 0
});
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/mistralai
yarn add @langchain/mistralai
pnpm add @langchain/mistralai
Add environment variables
MISTRAL_API_KEY=your-api-key
Instantiate the model
import { ChatMistralAI } from "@langchain/mistralai";
const model = new ChatMistralAI({
model: "mistral-large-latest",
temperature: 0
});
Install dependencies
- npm
- yarn
- pnpm
npm i @langchain/google-vertexai
yarn add @langchain/google-vertexai
pnpm add @langchain/google-vertexai
Add environment variables
GOOGLE_APPLICATION_CREDENTIALS=credentials.json
Instantiate the model
import { ChatVertexAI } from "@langchain/google-vertexai";
const model = new ChatVertexAI({
model: "gemini-1.5-flash",
temperature: 0
});
首先,我们直接使用模型。聊天模型是 LangChain
Runnables的实例,这意味着它们提供了一个标准接口用于与之交互。要简单调用模型,我们可以将一组消息传递给.invoke方法。
import { HumanMessage, SystemMessage } from "@langchain/core/messages";
const messages = [
new SystemMessage("将以下内容从英文翻译成意大利语"),
new HumanMessage("hi!"),
];
await model.invoke(messages);
AIMessage {
"id": "chatcmpl-AekSfJkg3QIOsk42BH6Qom4Gt159j",
"content": "Ciao!",
"additional_kwargs": {},
"response_metadata": {
"tokenUsage": {
"promptTokens": 20,
"completionTokens": 3,
"totalTokens": 23
},
"finish_reason": "stop",
"usage": {
"prompt_tokens": 20,
"completion_tokens": 3,
"total_tokens": 23,
"prompt_tokens_details": {
"cached_tokens": 0,
"audio_tokens": 0
},
"completion_tokens_details": {
"reasoning_tokens": 0,
"audio_tokens": 0,
"accepted_prediction_tokens": 0,
"rejected_prediction_tokens": 0
}
},
"system_fingerprint": "fp_6fc10e10eb"
},
"tool_calls": [],
"invalid_tool_calls": [],
"usage_metadata": {
"output_tokens": 3,
"input_tokens": 20,
"total_tokens": 23,
"input_token_details": {
"audio": 0,
"cache_read": 0
},
"output_token_details": {
"audio": 0,
"reasoning": 0
}
}
}
如果我们启用了LangSmith,我们可以看到此运行记录已发送到LangSmith,并可以查看LangSmith追踪。LangSmith追踪报告了令牌使用情况、延迟、标准模型参数(如温度)以及其他信息。
请注意,聊天模型接收消息对象作为输入并生成消息对象作为输出。除了文本内容外,消息对象还传达对话角色,并包含重要数据,如工具调用和令牌使用计数。
LangChain 还支持通过字符串或OpenAI 格式进行聊天模型输入。以下内容是等效的:
await model.invoke("Hello");
await model.invoke([{ role: "user", content: "Hello" }]);
await model.invoke([new HumanMessage("hi!")]);
流式传输
由于聊天模型是Runnables,它们提供了一个标准接口,其中包括异步和流式调用模式。这允许我们从聊天模型中逐个流式传输令牌:
const stream = await model.stream(messages);
const chunks = [];
for await (const chunk of stream) {
chunks.push(chunk);
console.log(`${chunk.content}|`);
}
|
C|
iao|
!|
|
|
提示模板
目前我们是直接将一组消息列表传递给语言模型。这一组消息来自哪里呢?通常,它是由用户输入和应用逻辑组合构建的。这种应用逻辑通常将原始用户输入转换为准备好传递给语言模型的消息列表。常见的转换包括添加系统消息或使用用户输入格式化模板。
提示模板是 LangChain 中的一个概念,旨在帮助完成这种转换。它们接收原始用户输入并返回准备好传递给语言模型的数据(提示)。
让我们在此创建一个提示模板。它将接收两个用户变量:
language:要将文本翻译成的语言text:要翻译的文本
import { ChatPromptTemplate } from "@langchain/core/prompts";
首先,让我们创建一个字符串,该字符串将用于格式化系统消息:
const systemTemplate = "将以下内容从英文翻译成 {language}";
接下来,我们可以创建提示模板。这将是systemTemplate以及用于放置文本的更简单模板的组合
const promptTemplate = ChatPromptTemplate.fromMessages([
["system", systemTemplate],
["user", "{text}"],
]);
请注意,ChatPromptTemplate支持单个模板中的多个消息角色。我们将language参数格式化到系统消息中,将用户text格式化到用户消息中。
此提示模板的输入是一个字典。我们可以单独使用这个提示模板来查看它的效果
const promptValue = await promptTemplate.invoke({
language: "意大利语",
text: "hi!",
});
promptValue;
ChatPromptValue {
lc_serializable: true,
lc_kwargs: {
messages: [
SystemMessage {
"content": "将以下内容从英文翻译成 意大利语",
"additional_kwargs": {},
"response_metadata": {}
},
HumanMessage {
"content": "hi!",
"additional_kwargs": {},
"response_metadata": {}
}
]
},
lc_namespace: [ 'langchain_core', 'prompt_values' ],
messages: [
SystemMessage {
"content": "将以下内容从英文翻译成 意大利语",
"additional_kwargs": {},
"response_metadata": {}
},
HumanMessage {
"content": "hi!",
"additional_kwargs": {},
"response_metadata": {}
}
]
}
我们可以看到它返回了一个包含两条消息的ChatPromptValue。如果我们想直接访问这些消息,可以这样做:
promptValue.toChatMessages();
[
SystemMessage {
"content": "将以下内容从英文翻译成 意大利语",
"additional_kwargs": {},
"response_metadata": {}
},
HumanMessage {
"content": "hi!",
"additional_kwargs": {},
"response_metadata": {}
}
]
最后,我们可以在格式化后的提示上调用聊天模型:
const response = await model.invoke(promptValue);
console.log(`${response.content}`);
Ciao!
如果我们查看 LangSmith 追踪,可以看到所有三个组件都显示在LangSmith 追踪中。
结论
就是这样!在本教程中,您已经学习了如何创建您的第一个简单的 LLM 应用。您已经学习了如何使用语言模型、如何创建提示模板,以及如何通过 LangSmith 获得对您创建的应用的可观测性。
这仅是成为一名熟练的 AI 工程师所需知识的冰山一角。幸运的是——我们还有许多其他资源!
有关 LangChain 核心概念的进一步阅读,我们提供了详细的概念指南。
如果您对这些概念有更具体的问题,请查看以下如何指南部分:
以及 LangSmith 文档: