感觉主要是图搜,或者结合 embedding 可以做上下文语义搜索这种(embedding其实就是把文本转成多维数组,转的过程中会考虑到前后字符之间的关系,所以向量化的数据会隐含上下文)。
之前这方面感觉主要是多媒体搜索相关,例如图搜——把图片转成多维向量,即浮点数组,然后查询图片相似度;
大模型火了之后,结合 embedding + 知识库的上下文向量搜索的场景多了一些,例如 RAG
单就 embedding + 知识库的场景说,现在很多像dify这种如果做基于知识库的场景,会支持「混合检索」就是关键字全文检索+向量检索,个人感觉各有优劣吧:比如 ① 自然语言提问的时候命中知识库,全文…