AI创新与洞察18：GARLIC，你了解多少？

这篇文章是这个引人入胜的系列中的第18篇。

从个人兴趣的角度来看，我一直对数据结构非常着迷，正如你在我之前的文章中看到的那样。这也是为什么我会特别关注那些结合了高级数据结构的RAG系统。

今天，我们将讨论GARLIC，它完美地体现了这一特点。

视频中包含了一个思维导图：

想象你在一家图书馆里，试图从一本1000页的书中找到最重要的信息——比如每个角色的旅程和关键情节。传统的方法可能会让你感觉像是在和两个笨拙的助手一起工作：

现在，想象一下像GARLIC这样的“智能图书管理员”：

这种方法帮助GARLIC在更短的时间内给你更准确、全面的答案。

现在，让我们深入了解一下详细的内容。

在长文档问答（QA）领域，检索增强生成（RAG）方法一直占据主导地位。这些方法将长文本分割成较小的块，并检索相关的片段输入到LLM中。

然而，RAG存在一些关键的限制：

None

图1：三种检索方法的比较。绿色阴影的节点是检索到的节点。（a）基于块的检索。（b）基于树的检索，从顶部节点开始，每层选择一个子节点，直到到达底部节点。（c）基于HWDAG的检索。节点搜索是灵活的，允许多条路径从顶层开始，并且搜索可以在任何层级停止。来源。

例如，想象你正在搜索一本1000页小说中的关键事件。传统的RAG方法只能给你孤立的段落，RAPTOR将你的搜索限制在一个固定的故事线上，而将整本小说输入到LLM中会消耗大量的GPU资源。

如果我们能动态地找到最关键的信息，像智能图书管理员一样灵活地导航内容呢？ 这就是GARLIC背后的核心理念。

如图2所示，GARLIC引入了LLM引导的动态进度控制，使用层次加权有向无环图（HWDAG），这是一种基于图的检索方法。

None

图2：层次加权有向无环图的概述，用于摘要。来源。

GARLIC的关键创新点：

这种方法确保需要详细或全局上下文的查询能够高效处理，而无需不必要的计算。

GARLIC的操作分为两个主要阶段：

1. 摘要图构建：

示例：想象一本书被总结为一个层次图。每个要点摘要（IP）是一个节点，而边代表一个摘要与另一个事件的连接强度。

2. 动态图搜索：

None

图3：动态图搜索的概述。[来源]。

从GARLIC的算法中，我有以下见解：

尽管GARLIC具有创新性，但在我看来，仍然存在一些挑战：

最后，如果你对这个系列感兴趣，欢迎探索我的其他文章。

油管。