Skip to main content

网页加载器

这些加载器用于加载网络资源。它们不涉及本地文件系统。

info

如果您想编写自己的文档加载器,请参阅本教程。如果您希望贡献一个集成实现,请参阅贡献集成

所有网页加载器

NameDescription
Playwright仅适用于 Node.js。
AirtableLoaderAirtableLoader 类提供了从 Airtable 表格加载文档的功能。它支持两种主要方法:
Apify 数据集本指南展示了如何将 Apify 与 LangChain 配合使用,从 Apify 数据集加载文档。
AssemblyAI 音频转录文本本文介绍如何使用 AssemblyAI API 从文件中加载音频(和视频)转录文本作为文档对象。
Azure Blob Storage 容器仅适用于 Node.js。
Azure Blob Storage 文件仅适用于 Node.js。
Browserbase 加载器描述
College Confidential该示例介绍了如何使用 Cheerio 从 College Confidential 网站加载数据。每个页面将生成一个文档。
Confluence仅适用于 Node.js。
CouchbaseCouchbase 是一款屡获殊荣的分布式 NoSQL 云数据库,为您的云、移动、AI 和边缘计算应用提供无与伦比的多功能性、性能、可扩展...
Figma此示例介绍如何从 Figma 文件中加载数据。
FireCrawl本笔记本简要介绍了如何快速开始使用
GitBook本示例介绍如何使用 Cheerio 从任意 GitBook 加载数据。每个页面都会创建一个文档。
GitHub本示例介绍如何从 GitHub 仓库加载数据。
Google Cloud Storage仅适用于 Node.js。
Google Cloud SQL for PostgreSQLCloud SQL 是一项完全托管的关系型数据库服务,提供高性能、无缝集成以及出色的可扩展性,并支持 PostgreSQL 等数据库引擎。
Hacker News本示例介绍如何使用 Cheerio 从 hacker news 网站加载数据。每个页面将生成一个文档。
IMSDB本示例介绍了如何使用 Cheerio 从互联网电影剧本数据库网站加载数据。每个页面将创建一个文档。
Jira仅适用于 Node.js。
LangSmith本笔记本提供了与 LangSmithLoader
Notion API本指南将带您了解如何通过 Notion API 从 Notion 页面和数据库加载文档。
PDF文件本笔记本提供了关于如何快速入门
RecursiveUrlLoader本笔记本提供了RecursiveUrlLoader的快速入门概览。如需了解 RecursiveUrlLoader 所有功能和配置的详细文档...
S3 文件仅适用于 Node.js。
SearchApi 加载器本指南展示了如何在 LangChain 中使用 SearchApi 加载网页搜索结果。
SerpAPI 加载器本指南展示了如何在 LangChain 中使用 SerpAPI 加载网页搜索结果。
站点地图加载器本笔记将介绍如何使用 SitemapLoader 类将站点地图加载为 Document 对象。
Sonix 音频仅支持 Node.js。
区块链数据此示例展示了如何通过 sort.xyz SQL API 加载区块链数据,包括 NFT 元数据和合约地址的交易信息。
SpiderSpider 是速度最快的网络爬虫。它可以将任意网站转换为纯 HTML、Markdown、元数据或文本,同时允许你使用 AI 执行自定义操...
TaskadeTaskade 是一款面向 AI 驱动写作、项目管理和任务自动化的终极工具。它被设计为你的第二大脑,能够从始至终简化项目执行并增强团队协作。
Cheerio本笔记本提供了如何快速入门
Puppeteer本笔记本提供了
YouTube 字幕本文介绍了如何将 YouTube 字幕加载到 LangChain 文档中。

Was this page helpful?


You can also leave detailed feedback on GitHub.