返回首页
术语词典 · 向量嵌入
博客术语词典向量嵌入
⚙️ 技术架构高级使用频率 65%· 384 引用

向量嵌入

Embeddings

把文字转成一串数字,让 AI 能计算语义相似度

详细释义

向量嵌入(Embeddings)是将非结构化数据(文字/图片/音频)转换为高维数值向量的技术。每个向量是 384-4096 维的数字数组,语义相近的内容在向量空间中距离更近。Embeddings 是 RAG、推荐系统、语义搜索等高级 AI 应用的基础技术,让 AI 能'理解'内容相似性。

词源
2013 年 Word2Vec 开启,2018 年 BERT 革新,2022 年起广泛商用

实例对比

语义计算
'苹果' 和 'iPhone' 距离近(都是科技产品);'苹果' 和 '香蕉' 距离中等(都是水果);'苹果' 和 '股票' 距离远
应用
RAG 系统用 embeddings 找到最相关的 5 段文档,然后让 AI 基于这 5 段文档回答

全部术语