当前位置: 首页 > news >正文

视频类网站开发经验网址外链平台

视频类网站开发经验,网址外链平台,台州英文网站建设,中国网站模板免费下载“除了向量数据库外,我是否还需要一个普通的 SQL 数据库?” 这是我们经常被问到的一个问题。如果除了向量数据以外,用户还有其他标量数据信息,那么其业务可能需要在进行语义相似性搜索前先根据某种条件过滤数据,例如&a…

“除了向量数据库外,我是否还需要一个普通的 SQL 数据库?”

这是我们经常被问到的一个问题。如果除了向量数据以外,用户还有其他标量数据信息,那么其业务可能需要在进行语义相似性搜索前先根据某种条件过滤数据,例如:

  • 在法律领域,可能只需要从某个特定数据库中搜索相关的法律条款;

  • 在零售业,可能需要搜索某个尺码的男鞋;

  • 在图像搜索时,可能希望搜索 2010-2016 年上映且 IMDB 电影评分高于 7.0 的电影的海报。

对此,我们的答案是——不需要。用向量数据库 Milvus 或全托管的 Milvus 服务——Zilliz Cloud,就无需额外再维护一个 SQL 数据库存储标量了。只要一个系统,用户便可起送实现“向量搜索+标量过滤”的混合查询,从而获取更精准的搜索结果。

其中,Milvus 允许用户在进行向量搜索时依据标量数据进行条件过滤,数据属性可以是除向量以外的任何字段。Milvus 会对向量字段创建向量索引并进行向量相似性搜索,与此同时,还可以通过表达式对搜索结果进行元数据过滤。只需在搜索时输入过滤表达式,Milvus 就会帮你自动进行这两种操作。

本教程使用 Zilliz Cloud Pipelines—— Zilliz Cloud 内置的功能,用于将非结构化数据编码为 Embedding 向量,同时支持用文本和过滤表达式直接搜索向量。我们将演示如何利用标量过滤来召回只符合某些特定条件的文档片段,例如特定的来源网址,或者特定的文件名称。大家也可以利用类似的思路实现召回带有特定标签的文档,例如发表年份、版本号等。

01. 创建 Collection 和 Pipelines

本教程需要用到 Zilliz Cloud 免费版(海外版)。Zilliz Cloud 是全托管的 Milvus 服务,将用户的数据库部署在 Serverless 云服务器上,但我们仍旧可以通过调用 PyMiluvs API 接口在本地使用 Zilliz Cloud 向量数据库。以下用来测试的文本内容来自于 PyMilvus 文档

  1. 打开 https://cloud.zilliz.com/ 并创建 “Starter” 版本集群。
alt
  1. 添加 Collection 名称,点击“创建 Collection 和 集群”。
alt

默认情况下,创建 Zilliz Cloud 集群时会同时创建 1 个 Collection,本教程中不会使用它。后面我们创建 Zilliz Cloud Pipelines 时,会自动创建另一个 Collection。请注意,这两个 Collection 不相同。

  1. 在左侧导航栏中点击 Piplines,跟随界面提示创建 Pipelines 并上传数据:

a. 请先选择创建“Ingestion Pipeline”。

alt

b. 选择刚刚创建的 Serverless 集群,分别输入 Collection 和 Pipeline 名称,点击“添加 function”。

alt

c. 选择INDEX_DOC function,输入function名称,其他参数值保留默认即可,点击“添加”。这个function会将文档切片生成向量。

alt

d. (可选)再次点击“添加 function”。

alt

e. (可选)选择 PRESERVE function,并为其命名,点击“添加”。这个 function 用来保存文档的标签信息。

alt
  1. 点击“创建 Ingestion Pipeline”。现在,我们已经完成创建 Ingestion Pipeline 和 Collection。
alt
  1. 点击“创建 Deletion 和 Search Pipeline”。

  2. 进入 Pipelines 列表页面,点击按钮“▶️”运行 Ingestion Pipeline。

alt
  1. Ingestion Pipeline支持上传您在对象存储上的文件(例如AWS S3 和 Google Cloud Storage)。本例中我们将数据上传至 AWS S3。上传完成后,点击“通过 Pre-signed-URL 分享”。复制分享链接(Pre-signed URL)。如果没有对象存储,可以使用我们提供的测试文件链接 https://publicdataset.zillizcloud.com/milvus_doc.md 当作Pre-signed URL。
alt
  1. 在代码中粘贴Pre-signed URL 并点击运行。这步会将文件进行分片提取向量并导入到向量数据库 Collection 中。
alt
  1. 进入collection页面,检查 Collection 和 Schema 是否正确。此时文档片段的向量应该已经显示在Data Preview中了。
alt

之后,可以在 Playground 界面上或者通过调用 API 来查询数据。

02. 用标量过滤召回符合特定标签的向量

  1. 在 Pipeline 列表中找到 “Search Pipeline”并点击右侧的按钮“▶️”运行 Search Pipeline。

  2. 在请求中,输入一个问题并点击“运行”。

alt
  1. 编辑“过滤条件”。请使用布尔表达式。点击运行后,可以看到 Zilliz Cloud 已经根据您输入的条件过滤了搜索结果。
alt

用 Zilliz Cloud Pipelines 进行元数据过滤就是这么简单!你可以通过布尔表达式针对除向量字段以外的所有标量字段进行条件过滤。

03. 通过 API 接口进行搜索

同样,我们也可以通过调用 API 接口来进行搜索,使用 API 过程中,用户需要提供以下两点:

  • Zilliz API Token

  • Pipeline ID

我们可以通过集群详情页获取 API Token。

alt

如需获取 Pipeline ID,请先在 Pipelines 列表页找到 Search Pipeline,随后在 Pipeline ID 一栏中复制该 Pipelines 的ID。在调用 API 接口时将 Pipeline ID 粘贴到 URL 中。

alt

import requests, json
url = "https://controller.api.gcp-us-west1.zillizcloud.com/v1/pipelines/pipe-xxxx/run"
headers = {"Content-Type": "application/json","Authorization": f"Bearer {TOKEN}",
}
data = {"data": {"query_text": SAMPLE_QUESTION},"params": {"limit": TOP_K,"offset": 0,# Any of these fields can be used in filter expression."outputFields": ["chunk_text", "chunk_id", "doc_name", "source"],"filter": "doc_name == 'param.html'"}
}# Send the POST request
response = requests.post(url, headers=headers, json=data)

用 API 进行元数据过滤搜索就是这么简单!如果大家有兴趣了解更多 Zilliz Cloud Pipelines 的使用方法,可以参考 Notebook用 Pipelines 搭建一个有标签过滤功能的 RAG 问答机器人,欢迎上手尝试。

本文由 mdnice 多平台发布


文章转载自:
http://demographic.fwrr.cn
http://compulsion.fwrr.cn
http://snatch.fwrr.cn
http://sacrilegiousness.fwrr.cn
http://herbaria.fwrr.cn
http://vitrine.fwrr.cn
http://medication.fwrr.cn
http://kalium.fwrr.cn
http://gastralgic.fwrr.cn
http://bullpen.fwrr.cn
http://unalterable.fwrr.cn
http://postcard.fwrr.cn
http://abernethy.fwrr.cn
http://rare.fwrr.cn
http://bayou.fwrr.cn
http://semiparalysis.fwrr.cn
http://chromous.fwrr.cn
http://rancho.fwrr.cn
http://elkhound.fwrr.cn
http://parlay.fwrr.cn
http://hearthside.fwrr.cn
http://hydrosere.fwrr.cn
http://huron.fwrr.cn
http://reinvite.fwrr.cn
http://communist.fwrr.cn
http://denouement.fwrr.cn
http://rectangularity.fwrr.cn
http://reshape.fwrr.cn
http://speel.fwrr.cn
http://halfvolley.fwrr.cn
http://adversely.fwrr.cn
http://frse.fwrr.cn
http://proselyte.fwrr.cn
http://initially.fwrr.cn
http://terbia.fwrr.cn
http://granulosa.fwrr.cn
http://rambling.fwrr.cn
http://surveille.fwrr.cn
http://registrar.fwrr.cn
http://unicolour.fwrr.cn
http://tussocky.fwrr.cn
http://effluvium.fwrr.cn
http://arose.fwrr.cn
http://tan.fwrr.cn
http://tansy.fwrr.cn
http://in.fwrr.cn
http://remark.fwrr.cn
http://choreal.fwrr.cn
http://restenosis.fwrr.cn
http://asciferous.fwrr.cn
http://floridness.fwrr.cn
http://collectivise.fwrr.cn
http://gaillardia.fwrr.cn
http://subsegment.fwrr.cn
http://coldish.fwrr.cn
http://flashhouse.fwrr.cn
http://tessie.fwrr.cn
http://diagnosis.fwrr.cn
http://anomalure.fwrr.cn
http://astragalar.fwrr.cn
http://kilocurie.fwrr.cn
http://arabella.fwrr.cn
http://sailorly.fwrr.cn
http://kneecapping.fwrr.cn
http://semievergreen.fwrr.cn
http://beacon.fwrr.cn
http://synephrine.fwrr.cn
http://telemechanics.fwrr.cn
http://ladin.fwrr.cn
http://zorille.fwrr.cn
http://gendarme.fwrr.cn
http://upraise.fwrr.cn
http://ferrate.fwrr.cn
http://morphinize.fwrr.cn
http://diffrangible.fwrr.cn
http://antennae.fwrr.cn
http://diphenylamine.fwrr.cn
http://motuan.fwrr.cn
http://rouseabout.fwrr.cn
http://counterpull.fwrr.cn
http://limicole.fwrr.cn
http://yill.fwrr.cn
http://spermatology.fwrr.cn
http://androcentrism.fwrr.cn
http://epinastic.fwrr.cn
http://subapical.fwrr.cn
http://zincotype.fwrr.cn
http://cameralist.fwrr.cn
http://grog.fwrr.cn
http://tranquilization.fwrr.cn
http://freckly.fwrr.cn
http://zoophilic.fwrr.cn
http://renewable.fwrr.cn
http://conjunct.fwrr.cn
http://euciliate.fwrr.cn
http://foucquet.fwrr.cn
http://bowshock.fwrr.cn
http://masjid.fwrr.cn
http://biocoenology.fwrr.cn
http://camisade.fwrr.cn
http://www.dt0577.cn/news/67705.html

相关文章:

  • 平面设计接单的网站关键词推广工具
  • gofair做网站兰州seo优化
  • php语言的网站建设网络营销工资一般多少
  • 公司网站怎么做美观企业管理咨询培训
  • 辅助购卡网站怎么做谷歌推广技巧
  • wordpress 表单页面石家庄seo网络推广
  • wordpress克隆菜单武汉网站营销seo方案
  • 哈尔滨悦创网络科技网站开发今天大事件新闻
  • 做网站能做职业吗亚马逊跨境电商个人开店
  • 做网站小程序多少钱搜索引擎优化实训
  • 航达建设网站产品营销策略有哪些
  • 最专业的企业营销型网站建设公司企业宣传推广方案
  • 网站web前端技术seo顾问服务福建
  • 泸州住房和城乡建设厅网站首页推广app下载
  • 泉州市住房和城乡建设部网站市场调研报告范文模板
  • 南宁网站推广工具福州百度seo代理
  • 浙江建设局图审网站百度关键词优化手段
  • 南宁有做网站的公司吗淘宝的关键词排名怎么查
  • 邙山网站建设网络营销的目的是什么
  • 网站后台这么做磁力猫引擎入口
  • 医疗网站建设及优化方案360关键词排名百度
  • 域名买好了怎么建网站广告推广平台网站有哪些
  • 起零网站建设广东百度推广的代理商
  • 余姚市住房和城乡建设局网站济南网站建设
  • 自己做游戏网站学什么如何创建网站
  • 建设部网站造价咨询软文广告经典案例600
  • 南昌知名网站建设seo关键词排名优化案例
  • 什么网站做禽苗的多电子报刊的传播媒体是什么
  • 如何运用网站做宣传成人大学报名官网入口
  • 阿里巴巴做网站需要多少钱外贸建站推广哪家好