网页加载器
这些加载器用于加载网络资源。它们不涉及本地文件系统。
所有网页加载器
| Name | Description |
|---|---|
| Playwright | 仅适用于 Node.js。 |
| AirtableLoader | AirtableLoader 类提供了从 Airtable 表格加载文档的功能。它支持两种主要方法: |
| Apify 数据集 | 本指南展示了如何将 Apify 与 LangChain 配合使用,从 Apify 数据集加载文档。 |
| AssemblyAI 音频转录文本 | 本文介绍如何使用 AssemblyAI API 从文件中加载音频(和视频)转录文本作为文档对象。 |
| Azure Blob Storage 容器 | 仅适用于 Node.js。 |
| Azure Blob Storage 文件 | 仅适用于 Node.js。 |
| Browserbase 加载器 | 描述 |
| College Confidential | 该示例介绍了如何使用 Cheerio 从 College Confidential 网站加载数据。每个页面将生成一个文档。 |
| Confluence | 仅适用于 Node.js。 |
| Couchbase | Couchbase 是一款屡获殊荣的分布式 NoSQL 云数据库,为您的云、移动、AI 和边缘计算应用提供无与伦比的多功能性、性能、可扩展... |
| Figma | 此示例介绍如何从 Figma 文件中加载数据。 |
| FireCrawl | 本笔记本简要介绍了如何快速开始使用 |
| GitBook | 本示例介绍如何使用 Cheerio 从任意 GitBook 加载数据。每个页面都会创建一个文档。 |
| GitHub | 本示例介绍如何从 GitHub 仓库加载数据。 |
| Google Cloud Storage | 仅适用于 Node.js。 |
| Google Cloud SQL for PostgreSQL | Cloud SQL 是一项完全托管的关系型数据库服务,提供高性能、无缝集成以及出色的可扩展性,并支持 PostgreSQL 等数据库引擎。 |
| Hacker News | 本示例介绍如何使用 Cheerio 从 hacker news 网站加载数据。每个页面将生成一个文档。 |
| IMSDB | 本示例介绍了如何使用 Cheerio 从互联网电影剧本数据库网站加载数据。每个页面将创建一个文档。 |
| Jira | 仅适用于 Node.js。 |
| LangSmith | 本笔记本提供了与 LangSmithLoader |
| Notion API | 本指南将带您了解如何通过 Notion API 从 Notion 页面和数据库加载文档。 |
| PDF文件 | 本笔记本提供了关于如何快速入门 |
| RecursiveUrlLoader | 本笔记本提供了RecursiveUrlLoader的快速入门概览。如需了解 RecursiveUrlLoader 所有功能和配置的详细文档... |
| S3 文件 | 仅适用于 Node.js。 |
| SearchApi 加载器 | 本指南展示了如何在 LangChain 中使用 SearchApi 加载网页搜索结果。 |
| SerpAPI 加载器 | 本指南展示了如何在 LangChain 中使用 SerpAPI 加载网页搜索结果。 |
| 站点地图加载器 | 本笔记将介绍如何使用 SitemapLoader 类将站点地图加载为 Document 对象。 |
| Sonix 音频 | 仅支持 Node.js。 |
| 区块链数据 | 此示例展示了如何通过 sort.xyz SQL API 加载区块链数据,包括 NFT 元数据和合约地址的交易信息。 |
| Spider | Spider 是速度最快的网络爬虫。它可以将任意网站转换为纯 HTML、Markdown、元数据或文本,同时允许你使用 AI 执行自定义操... |
| Taskade | Taskade 是一款面向 AI 驱动写作、项目管理和任务自动化的终极工具。它被设计为你的第二大脑,能够从始至终简化项目执行并增强团队协作。 |
| Cheerio | 本笔记本提供了如何快速入门 |
| Puppeteer | 本笔记本提供了 |
| YouTube 字幕 | 本文介绍了如何将 YouTube 字幕加载到 LangChain 文档中。 |