设为首页
收藏本站
开启辅助访问
切换到窄版
登录
立即注册
只需一步,快速开始
首页
BBS
剑灵怀旧服
Unity
美术资源
UE
全套源码
其他内容
奖励任务
分享
Share
每日任务中心
搜索
搜索
怀旧插件
怀旧脚本数据
怀旧攻略
公益服开服通知
AI工具分享
Unity插件
Unity问题答疑
Unity学习教程
Unity AI算法
Unity源码
其他美术文件
MAY文件
3D Max
FBX模型
UE技术讨论
UE学习视频
UE源码
网站源代码
手机游戏源代码
PC游戏
游戏捏脸
其他插件
OFFER摸吧
魔兽地图
单机游戏
本版
帖子
用户
爱开源网
»
首页
›
数字人
›
人工智能
›
10个最盛行的向量数据库【AI】
返回列表
发新帖
10个最盛行的向量数据库【AI】
[复制链接]
849
|
0
|
2023-8-23 11:55:55
|
显示全部楼层
|
阅读模式
矢量数据库是一种将数据存储为高维向量的数据库,高维向量是特性或属性的数学表示。 每个向量都有肯定数目的维度,范围从几十到几千不等,具体取决于数据的复杂性和粒度。
推荐:用 NSDT场景计划器 快速搭建3D场景。
矢量数据库(Vector Database)和矢量开辟库(Vector Library)都是实现矢量相似性搜索的技能,但它们在功能和可用性上有所不同。 矢量数据库可以存储和更新数据,处置惩罚各种范例的数据源,在数据导入期间实行查询,并提供用户友爱和企业停当的功能。 矢量库只能存储数据,只能处置惩罚矢量,必要在创建索引之前导入全部数据,而且必要更多的技能专业知识和手动设置。
一些矢量数据库创建在现有库之上,比方 Faiss。 这使他们可以或许使用库的现有代码和功能,从而节流开辟时间和精神。
这些矢量数据库和库用于人工智能 (AI) 应用步调,比方呆板学习、天然语言处置惩罚和图像辨认。 它们有一些共同的特点:
支持向量相似性搜索,它会找到与查询向量最近的 k 个向量,这是通过相似性度量来衡量的。 矢量相似性搜索对于图像搜索、天然语言处置惩罚、推荐体系和非常检测等应用非常有用。
使用矢量压缩技能来镌汰存储空间并提高查询性能。 矢量压缩方法包罗标量量化、乘积量化和各向异性矢量量化。
可以实行正确或近似的最近邻搜索,具体取决于正确性和速率之间的衡量。 正确最近邻搜索提供了完美的召回率,但对于大型数据集大概会很慢。 近似最近邻搜索使用专门的数据布局和算法来加速搜索速率,但大概会捐躯一些召回率。
支持不同范例的相似性度量,比方 L2 间隔、内积和余弦间隔。 不同的相似性度量大概适合不同的用例和数据范例。
可以处置惩罚各种范例的数据源,比方文本、图像、音频、视频等。 可以使用呆板学习模型将数据源转化为向量嵌入,比方词嵌入、句子嵌入、图像嵌入等。
1、Elasticsearch
ElasticSearch是一个支持各种范例数据的分布式搜索和分析引擎。 Elasticsearch 支持的数据范例之一是矢量字段,它存储麋集的数值矢量。
在 7.10 版本中,Elasticsearch 添加了对将向量索引到专用数据布局的支持,以支持通过 kNN 搜索 API 举行快速 kNN 检索。 在 8.0 版本中,Elasticsearch 添加了对带有向量场的原生天然语言处置惩罚 (NLP) 的支持。
2、Faiss
Meta的Faiss是一个用于高效相似性搜索和麋集向量聚类的库。 它包罗搜索任意巨细的向量集的算法,直到大概不适合 RAM 的向量集。 它还包罗用于评估和参数调整的支持代码。
3、Milvus
Milvus是一个开源矢量数据库,可以管理万亿矢量数据集,支持多种矢量搜索索引和内置过滤。
4、Weaviate
Weaviate是一个开源向量数据库,答应你存储数据对象和来自你最喜欢的 ML 模型的向量嵌入,并无缝扩展到数十亿个数据对象。
5、Pinecone
Pinecone专为呆板学习应用步调计划的矢量数据库。 它速率快、可扩展,并支持多种呆板学习算法。
Pinecone 创建在 Faiss 之上,Faiss 是一个用于麋集向量高效相似性搜索的库。
6、Qdrant
Qdrant是一个矢量相似度搜索引擎和矢量数据库。 它提供了一个生产停当的服务,带有一个方便的 API 来存储、搜索和管理点——带有额外有用负载的矢量。
Qdrant 专为扩展过滤支持而定制。 它使它可用于各种神经网络或基于语义的匹配、分面搜索和其他应用步调。
7、Vespa
Vespa是一个功能齐备的搜索引擎和矢量数据库。 它支持向量搜索 (ANN)、词法搜索和布局化数据搜索,全部这些都在同一个查询中。 集成的呆板学习模型推理答应你应用 AI 来实时明确你的数据。
8、Vald
Vald是一个高度可扩展的分布式快速近似最近邻麋集向量搜索引擎。 Vald是基于Cloud-Native架构计划和实现的。 它使用最快的 ANN 算法 NGT 来搜索邻人。
Vald 具有自动向量索引和索引备份,以及程度缩放,可从数十亿特性向量数据中举行搜索。
9、ScaNN (Google Research)
ScaNN(Scalable Nearest Neighbours)是一个用于高效向量相似性搜索的库,它找到 k 个与查询向量最近的向量,通过相似性度量来衡量。 矢量相似性搜索对于图像搜索、天然语言处置惩罚、推荐体系和非常检测等应用非常有用。
10、pgvector
pgvector是PostgreSQL 的开源扩展,答应你在数据库中存储和查询向量嵌入。 它创建在 Faiss 库之上,Faiss 库是一个盛行的麋集向量高效相似性搜索库。 pgvector 易于使用,只需一条命令即可安装。
原文链接:10个顶级矢量数据库 — BimAnt
来源:
https://blog.csdn.net/shebao3333/article/details/130438194
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
Unity
银质的叉子
25
主题
0
回帖
75
积分
注册会员
注册会员, 积分 75, 距离下一级还需 275 积分
注册会员, 积分 75, 距离下一级还需 275 积分
积分
75
加好友
发消息
回复楼主
返回列表
Omniverse
人工智能
其他
图文推荐
非绿色-黑鳍自动换角色组队吃药自动没疲劳刷金
2024-09-21
绿色-剑灵怀旧完整主线(10月更新)有韩服
2024-09-12
非绿色-定制AI全自动黑鳍V1.2
2024-09-14
剑灵三系精修端 星术咒3鬼3 T2 饰品属性外观
2023-08-16
Unity 超级马里奥
2023-08-22
热门排行
1
非绿色-黑鳍自动换角色组队吃药自动没疲劳
2
非绿色-定制AI全自动黑鳍V1.2
3
绿色-剑灵怀旧完整主线(10月更新)有韩服
4
剑灵三系精修端 星术咒3鬼3 T2 饰品属性外
5
Unity 超级马里奥
6
AI绘画stable-diffusion-webui指定GPU运行
7
非绿色-武神塔合集
8
非绿色-使用教程攻略
9
非绿色 3号自动切线 黑骑 钓鱼 蓝蛙
10
绿色-黑鳍脚本合集