Redis for AI 文档
Redis for AI 文档概述
Redis 存储在语义上表示非结构化数据(包括文本段落、图像、视频或音频)的向量嵌入并为其编制索引。将向量和关联的元数据存储在哈希或 JSON 文档中,以便进行索引和查询。
向量 | 抹布 | RedisVL |
---|---|---|
![]() |
![]() |
![]() |
概述
此页面分为几个部分,具体取决于您要尝试执行的作:
- 作方法 - 每个功能、API 和设置的综合参考部分。它是支持任何开发级别的详细技术信息的来源。
- 概念 - 基本思想和核心原则的解释,帮助您了解产品功能和设计背后的原因。
- 快速入门 - 简短、重点突出的指南,让您在几分钟内开始使用关键功能或工作流程。
- 教程 - 深入探讨特定使用案例或流程的深入演练。这些分步指南可帮助您掌握基本任务和工作流程。
- 集成 - 帮助您将产品与常用工具、框架或平台连接和使用起来的指南和资源。
- 基准 - 性能比较和指标,用于展示商品在各种情况下的表现。这有助于您了解其效率和功能。
- 最佳实践 - 最大限度地提高效率和避免常见陷阱的建议和指南。本部分使您能够有效且高效地使用该产品。
如何作
- 创建矢量索引:Redis 使用定义的架构(包括矢量字段和元数据)维护数据的二级索引。Redis 支持
FLAT
和HNSW
向量索引类型。 - 存储和更新向量:Redis 将向量和元数据存储在哈希或 JSON 对象中。
- 使用向量搜索:Redis 支持多种带有向量字段的高级查询策略,包括 k 最近邻 (KNN)、向量范围查询和元数据过滤器。
- 在运行时配置向量查询。选择最佳筛选模式以优化查询执行。
概念
了解如何在 AI/ML 项目中执行向量搜索并使用网关和语义缓存。
搜索 | LLM 内存 | 语义缓存 | 语义路由 | AI 网关 |
---|---|---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
快速入门
当您尝试构建特定功能时,快速入门或配方非常有用。例如,您可能希望使用 LangChain 执行 RAG 或为您的 AI 代理设置 LLM 内存。开始使用以下 Redis Python 笔记本。
混合搜索和向量搜索
向量搜索根据高维数字嵌入的相似性检索结果,而混合搜索将其与传统的基于关键字或元数据的过滤相结合,以获得更全面的结果。
抹布
检索增强生成(又名 RAG)是一种增强 LLM 响应用户查询能力的技术。RAG 的检索部分由向量数据库支持,向量数据库可以将语义相关的结果返回给用户的查询,作为上下文信息来增强 LLM 的生成能力。
- 使用 Redis 矢量库从头开始 RAG
- 使用 Redis 和 LangChain 的 RAG
- 使用 Redis 和 LlamaIndex 的 RAG
- 高级 RAG 与 redisvl
- 使用 Redis 和 Nvidia 的 RAG
- 利用 RAGAS 框架评估 RAG 性能
- 使用 Azure 进行向量搜索
- 使用 Spring AI 的 RAG
- 带有 Vertex AI 的 RAG
- 用于提高 RAG 质量的其他提示和技巧的笔记本
代理
AI 代理可以自主行动,为用户规划和执行任务。
LLM 内存
LLM 是无状态的。为了在对话中维护上下文,必须存储聊天会话并将其重新发送到 LLM。Redis 管理聊天会话的存储和检索,以保持上下文和对话相关性。
语义缓存
估计 31% 的 LLM 查询可能是冗余的。Redis 支持语义缓存,以帮助快速降低 LLM 成本。
计算机视觉
使用 Facenet 嵌入模型和 RedisVL 构建面部识别系统。
推荐系统
教程
需要更深入地了解不同的用例和主题?
抹布
- 代理 RAG – 重点介绍使用 LlamaIndex 和 Amazon Bedrock 的代理 RAG 的教程
- Vertex AI 上的 RAG - 以 Redis 和 Vertex AI 为特色的 RAG 教程
- RAG 工作台 - 使用 Redis 探索 RAG 技术的开发游乐场
推荐系统
- 带有NVIDIA Merlin和Redis的推荐系统 - 三个例子,每个都增加了复杂性,展示了使用NVIDIA和Redis构建实时recsys的过程
- Redis 产品搜索 - 使用全文搜索、向量相似性和实时数据更新等功能构建实时产品搜索引擎
生态系统集成
- Amazon Bedrock 设置指南
- LangChain Redis 软件包:具有高级矢量存储和更快缓存的更智能的 AI 应用程序
- Redis 的 LlamaIndex 集成作为向量存储
- Redis Cloud 在 Vercel 上可用
- 使用 Vercel 集成创建 Redis Cloud 数据库
- 使用 Redis 和 Spring AI 构建 RAG 应用程序
- 使用 Redis 和 NVIDIA NIM 更快地部署 GenAI 应用程序
- 使用 Kernel Memory 和 Redis 构建 LLM 应用程序
- Jina AI 将 Redis 作为矢量数据库的 DocArray 集成
基准
了解我们如何与竞争对手抗衡。
最佳实践
了解行业领导者如何构建他们的 RAG 应用程序。