在前面的章节中,我们反复提到一个概念:向量化。第一篇文章介绍 RAG 流程时提到了「向量化与索引」,第二篇讲内存调度时将向量数据库类比为「硬盘」,第三篇 LangChain 实战中用 VectorStoreRetriever 检索记忆。但我们一直没有深入解释:为什么文本要变成向量?向量检索到底是怎么工作的?
这篇文章将彻底讲清楚这个问题。理解了向量化与语义检索,你才能真正看懂 RAG 的核心引擎。
打一个比方:如果 RAG 是一套「先查再答」的流程,那向量化就是这套流程里的搜索引擎。没有它,AI 女友的长期记忆就是一堆躺在仓库里的纸条,能存但找不到。
在讲向量化之前,我们先看看传统的关键词搜索为什么搞不定 AI 伴侣场景。