Elasticsearch

Elasticsearch 是一个流行的搜索/分析引擎和 向量数据库。 Elasticsearch 提供了一种有效的方式来大规模创建、存储和搜索向量嵌入。

有关技术细节,请参阅 Elasticsearch 文档

elasticsearch-labs 代码库包含可执行的 Python 笔记本、示例应用程序和用于测试 Elastic 平台的资源。

OpenAI 食谱笔记本 📒

请查看本代码库中有关使用 Elasticsearch 作为向量数据库来处理 OpenAI 的笔记本。

语义搜索

在本笔记本中,您将学习如何:

  • 将 OpenAI Wikipedia 嵌入数据集索引到 Elasticsearch
  • 使用 openai ada-02 模型对问题进行编码
  • 执行语义搜索

检索增强生成

此笔记本在语义搜索笔记本的基础上进行了扩展,通过以下方式:

  • 从语义搜索中选择最佳匹配项
  • 将该结果发送到 OpenAI 聊天补全 API 端点进行检索增强生成 (RAG)