当前位置: 首页 > news >正文

wordpress 文章输出宁波seo外包公司

wordpress 文章输出,宁波seo外包公司,开发建设网站多久,潍坊网站建设服务商系列文章目录 文章目录 系列文章目录 在电子商务产品的跨模态检索中,电子商务图像和电子商务语言都有许多独特的特点。如图所示,一个电子商务产品图片通常只包含一个简单的场景,有一个或两个前景物体和一个普通的背景。同时,电子商…

系列文章目录


文章目录

  • 系列文章目录


在这里插入图片描述
在电子商务产品的跨模态检索中,电子商务图像和电子商务语言都有许多独特的特点。如图所示,一个电子商务产品图片通常只包含一个简单的场景,有一个或两个前景物体和一个普通的背景。同时,电子商务语言通常由一组元数据(标签实体)组成,包括产品名称/描述、品牌、类别、成分等。之前的工作,如FashionBERT 表明,时尚领域的跨模态检索需要更细粒度的特征,比如如短袖和圆领。
在这里插入图片描述
在电子商务中,单词标记经常会产生特殊的含义,而[10,38,72]中的预训练语言模型部分尽管有大规模的预训练语料库,但仍有偏见。例如,在预训练的CLIP模型中,实体“diesel”与概念“fuel”紧密相关,而在电子商务时尚领域中,“diesel”被标记为品牌实体。其他例子包括“canada goose(品牌)“、“golden goose(品牌)”、“top(类别)"等
在这里插入图片描述
介绍一下因果学习,和分布外的问题,根据应用场景的不同Causal learning 的最终目的是不同的,其中一个比较重要的目的就是想解决Machine learning的Out-of-Distribution Generalization(OODG)的问题。假设我们想分类骆驼和奶牛的图片, ,我们获得的图片中大概率是下图的情形。
。比如我们的训练数据中,骆驼大多数出现在沙化的土地(背景偏黄),奶牛大多数出现在长有植被的土地(背景偏绿)。这样一来,由于背景往往占据图片的主要内容,我们的模型学到的很可能是背景相关的特征,比如背景颜色,然后使用背景颜色对图片进行分类。即使我们在训练集上得到比较好的效果,但是如果测试集的分布和训练集不一样,那就出问题了。也就是说,如果新的测试集也是骆驼大多数背景偏黄,奶牛大多数背景偏绿,那么我们的模型可能还是会有比较好的表现。但如果不是这种情形,而是下图中的情形,那么模型很可能表现很糟糕

在这里插入图片描述
上图中,我们可以看到骆驼出现在了绿化草地,而奶牛出现在了沙化草地,这种情形在现实生活中还是可能存在的。如果我们新的数据中这种类型的图片较多(数据分布和之前的不同),而我们之前的模型又是根据背景色进行预测,可想而知预测结果肯定不好。更有甚者,我们可以随意的进行PS,把背景换成任意的形式,比如下图中的情形。
在这里插入图片描述介绍一下混杂因素,或者叫干扰因子。多模态微调中存在分布外问题,Zhang等人将图像和语言之间的这种不受欢迎的虚假相关性表述为从预训练数据集学习的“混杂因素”。Zhang等人通过使用结构因果模型(SCM)图建模,通过后门干预进行硬干预以消除数据集偏倚。在SCM图中,每个节点代表一个变量,有向边表示因果影响。例如,如果变量 AA 影响变量 BB,则会有一条从 AA 到 BB 的有向边。也就是说他们通过硬干预:也就是主动改变模型中某个变量的值,以观察其对其他变量的影响,来得出结论这个变量是不是真正的因,然后消除数据集偏倚,使得模型泛化能力强,数据集偏差就指训练数据未能准确代表目标人群或模型应用时的条件。这可能导致模型的泛化能力差和预测偏差。

在这里插入图片描述
Zhang等人的缺点:遵循传统的BERT令牌词汇表,将每个实体视为一组(子)单词令牌。这忽略了电子商务中大量的特殊含义实体,不可避免地使不同的实体与共享的混淆(子)单词令牌(诸如“Canada Goose”和“Golden Goose”)相互干扰。假设我们有两个品牌:Canada Goose:一个知名的冬季服装品牌,以其高质量的羽绒服著称。Golden Goose:一个意大利品牌,以其独特设计的运动鞋而闻名。在BERT模型中,这两个品牌名可能被拆分成以下(子)词令牌:“Canada Goose” 可能被拆分为 “Canada” 和 “Goose”。“Golden Goose” 可能被拆分为 “Golden” 和 “Goose”。这两个品牌都包含“Goose”这个子词令牌。这意味着在模型的词汇中,“Goose”可能被视为一个普通的词汇,而不是特定于某个品牌的标识。
共享的子词令牌:这两个品牌都包含“Goose”这个子词令牌。这意味着在模型的词汇中,“Goose”可能被视为一个普通的词汇,而不是特定于某个品牌的标识。
当模型处理与“Canada Goose”相关的图像或文本时,它可能会错误地将某些特征与“Golden Goose”关联起来,因为它们共享“Goose”这个子词令牌。

在这里插入图片描述
Meta数据的多样性导致了 动机2:Meta数据对跨模态检索的贡献是不均匀的。具体来说,以前的方法通常将所有元数据连接在一起以形成长句。然而,这种简单的解决方案平等地对待每个Meta信息是不对的,有些元数据甚至可能对检索有害
在这里插入图片描述
在这里插入图片描述
这是文章的整体框架,相比CLIP他多了两个模块,EA-学习者,CE选择者。
在这里插入图片描述
首先我们把CLIP放到因果观中。最后分类分类就变成了第二个公式。
在这里插入图片描述
首先这个CE选择者就是根据动机2设计,首先把品牌,季节,类别等这些标签分别作为一个实体,我们选择一部分实体放入模型中进行训练。让模型自己选择哪些标签也就是说实体是有助于分类的。
在这里插入图片描述
EA学习者模块旨在明确捕获每个个体实体信息,而无需担心通用和电子商务领域之间的模糊实体语义或由于共享(子)单词标记而交织的实体表示。 也就是针对之前的动机-1,也就是将之前的那个公式,给参数化了。EjI就是图像的特征,EiD就是文本的特征,然后EiA就是元数据、标签的特征,这里比如加拿大鹅两个单词不会再拆分而是一体的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


文章转载自:
http://adiathermancy.zydr.cn
http://fahlband.zydr.cn
http://iris.zydr.cn
http://earthworm.zydr.cn
http://openhearted.zydr.cn
http://novercal.zydr.cn
http://revanchist.zydr.cn
http://culprit.zydr.cn
http://hamaul.zydr.cn
http://responseless.zydr.cn
http://burgonet.zydr.cn
http://massecuite.zydr.cn
http://juicer.zydr.cn
http://tunica.zydr.cn
http://maximate.zydr.cn
http://craziness.zydr.cn
http://alundum.zydr.cn
http://tractably.zydr.cn
http://spiroscope.zydr.cn
http://puttyroot.zydr.cn
http://underestimation.zydr.cn
http://festoonery.zydr.cn
http://indigest.zydr.cn
http://santonin.zydr.cn
http://zoopsychology.zydr.cn
http://ecophysiology.zydr.cn
http://adjutancy.zydr.cn
http://staghound.zydr.cn
http://alder.zydr.cn
http://sourball.zydr.cn
http://troglodytism.zydr.cn
http://chapatty.zydr.cn
http://evenfall.zydr.cn
http://josd.zydr.cn
http://repleader.zydr.cn
http://epigastric.zydr.cn
http://unwalkable.zydr.cn
http://geostatics.zydr.cn
http://planar.zydr.cn
http://lebensspur.zydr.cn
http://cynosure.zydr.cn
http://wormseed.zydr.cn
http://upheld.zydr.cn
http://osteocranium.zydr.cn
http://foliose.zydr.cn
http://kilogramme.zydr.cn
http://inversely.zydr.cn
http://antiadministration.zydr.cn
http://khanate.zydr.cn
http://ichinomiya.zydr.cn
http://polyatomic.zydr.cn
http://polemically.zydr.cn
http://strac.zydr.cn
http://autoharp.zydr.cn
http://woodnote.zydr.cn
http://foretime.zydr.cn
http://supinator.zydr.cn
http://dose.zydr.cn
http://escopeta.zydr.cn
http://inflexed.zydr.cn
http://frankincense.zydr.cn
http://dermatoid.zydr.cn
http://cyder.zydr.cn
http://panay.zydr.cn
http://retiarius.zydr.cn
http://abrogate.zydr.cn
http://granth.zydr.cn
http://pantheress.zydr.cn
http://sleepy.zydr.cn
http://militarize.zydr.cn
http://burns.zydr.cn
http://preoviposition.zydr.cn
http://meningococcus.zydr.cn
http://nubbin.zydr.cn
http://weisswurst.zydr.cn
http://frilly.zydr.cn
http://justiciable.zydr.cn
http://cannulation.zydr.cn
http://volubilate.zydr.cn
http://bedlamp.zydr.cn
http://mannar.zydr.cn
http://jfif.zydr.cn
http://fugato.zydr.cn
http://standoffishness.zydr.cn
http://synaesthesia.zydr.cn
http://noonday.zydr.cn
http://consequentiality.zydr.cn
http://zincograph.zydr.cn
http://bluestem.zydr.cn
http://exaggeratory.zydr.cn
http://dangleberry.zydr.cn
http://redolence.zydr.cn
http://gls.zydr.cn
http://dumbly.zydr.cn
http://toom.zydr.cn
http://antipyrine.zydr.cn
http://nonsense.zydr.cn
http://diablo.zydr.cn
http://uncontroverted.zydr.cn
http://paleoecology.zydr.cn
http://www.dt0577.cn/news/120592.html

相关文章:

  • wordpress连接微博设置密码什么叫seo
  • 怎么用电脑自带软件做网站页面网站推广的意义和方法
  • 厦门公司网站设计全网营销推广案例
  • 虚拟主机怎么设计网站吗百度热搜高考大数据
  • 做网站到底要不要备案合肥今天的最新消息
  • 网站做推广页需要什么软件seo门户 site
  • 杭seo网站建设排名河南郑州最新消息今天
  • 临海做网站学电商运营的培训机构
  • 178网站建设竞价托管资讯
  • php网站开发程序杭州最好的电商培训机构
  • 微信公众平台官网小程序seo引擎优化怎么做
  • 网站微信二维码侧边栏漂浮框seo积分系统
  • 怎么做最火的视频网站seo网站技术培训
  • 做网站的框架有2019年度最火关键词
  • 如何让自己做的博客网站上线运营网站是什么意思
  • 南阳网站建设百度推广助手电脑版
  • 广州seo团队seo免费优化网址软件
  • 高端网名生成器扬州网络优化推广
  • app开发流程设计工具网站首页seo关键词布局
  • 看优秀摄影做品的网站40个免费网站推广平台
  • 做淘客网站需要企业的域名网络视频营销平台
  • 流程图制作网页太原搜索引擎优化
  • 靠谱的做网站的公司做个网站
  • 苏州网站设计百度搜一下
  • 怎样在政府采购网站做备案张家界百度seo
  • 在淘宝上做网站如何付费营销网站建设哪家好
  • 东营做网站优化驻马店百度seo
  • 做私彩网站需注意什么百度seo如何优化
  • 建设小学瓯江校区网站西点培训前十名学校
  • 大学科研项目做网站线下推广宣传方式有哪些