当前位置: 首页 > news >正文

好看的网页布局北京seo费用是多少

好看的网页布局,北京seo费用是多少,政府网站 banner flash,网站开发软件工程师摄影:Nika Charakova 一、说明 简而言之,词向量只不过是表示自然语言词含义的一系列实数。这项技术是有用的NLP功能的重要推动力,使机器能够“理解”人类语言。本文讨论如何使用词向量以编程方式计算文本的语义相似性,例如&#x…

摄影:Nika Charakova

一、说明

        简而言之,词向量只不过是表示自然语言词含义的一系列实数。这项技术是有用的NLP功能的重要推动力,使机器能够“理解”人类语言。本文讨论如何使用词向量以编程方式计算文本的语义相似性,例如,如果您需要根据文本涵盖的主题对这些文本进行分类,这将非常有用。它从一个概念视图和示例开始,然后说明如何使用spaCy(一个领先的NLPPython库)来确定文本的语义相似性。

二、词向量的概念

        因此,让我们从概念上看一下词向量,以便您可以基本了解如何在数学上计算以向量形式表示的词之间的语义相似性。然后,您将查看spaCy的similarity()方法,该方法比较容器对象(Doc,Span,Token)的词向量以确定其含义的接近程度。

        在统计建模中,将单词映射到反映单词语义相似性的实数向量。您可以将词向量空间想象成一个云,其中具有相似含义的单词向量位于附近。例如,表示单词“苹果”的向量应该更接近单词“梨”的矢量,而不是单词“car”的矢量。由于前两个是指可食用的水果,而后者是指四轮公路车辆。要生成这些向量,您需要对这些单词的含义进行编码。实际上,有几种编码含义的方法。

三、用坐标定义意义

        生成有意义的词向量的一种方法是将现实世界中的对象或类别分配给词向量的每个坐标。例如,假设您正在为以下单词生成词向量:罗马、意大利、雅典和希腊。词向量应该在数学上反映罗马是意大利首都的事实,并且与意大利的关系与雅典不同。同时,它们应该反映雅典和罗马是首都,希腊和意大利是国家的事实。

        下图说明了此向量空间以矩阵的形式可能是什么样子。

        在这里,您将每个单词的含义分布在四维空间中的坐标之间,表示类别“国家”、“首都”、“希腊”和“意大利语”。在此简化示例中,坐标值可以是 1 或 0,指示相应的单词是否属于该类别。

        一旦你有一个向量空间,其中的数字向量捕获对应单词的含义,你就可以在这个向量空间上使用向量算术来深入了解单词的含义。要找出雅典是哪个国家的首都,您可以使用以下等式,其中每个标记代表其相应的向量,X 是未知向量:

        意大利 — 罗马 = X — 雅典

        这个等式表达了一个类比,其中X表示与雅典具有相同关系的词向量,就像意大利与罗马的关系一样。要求解 X,您可以像这样重写等式:

        X = 意大利 — 罗马 + 雅典

        首先通过减去相应的矢量元素,从矢量意大利中减去矢量罗马。然后,将生成的向量和向量雅典的总和相加。下图中的图表总结了此计算。

        通过从意大利的单词向量中减去罗马的单词向量,然后添加雅典的单词向量,您可以得到一个等于向量希腊的向量。

四、使用维度来表示意义

        虽然您刚刚创建的向量空间只有四个类别,但现实世界的向量空间可能需要数万个这样的类别。这种大小的向量空间对于大多数应用程序来说是不切实际的,因为它需要一个巨大的词嵌入矩阵。例如,如果要编码 10,000 个类别和 1,000,000 个实体,则需要 10,000 个× 1,000,000 个嵌入矩阵。

        减小嵌入矩阵大小的明显方法是减少向量空间中的类别数量。词向量空间的实际实现不是使用坐标来表示所有类别,而是使用向量之间的距离来量化和分类语义相似性。各个维度通常没有固有的含义。相反,它们表示向量空间中的位置,向量之间的距离表示相应单词含义的相似性。要查看实向量空间的示例,您可以在 English word vectors · fastText 下载 fastText 词向量库,该库在 300 维词向量空间中分发单词的含义。

五、spaCy's Similarity() 方法

        在spaCy中,每种类型的容器对象都有一个相似性方法,允许您通过比较它们的词向量来计算任何类型的两个容器对象之间的语义相似性估计。为了计算没有自己的词向量的跨度和文档的相似性,spaCy 会平均它们包含的标记的词向量。

        可以计算两个容器对象的语义相似性,即使这两个对象不同。例如,可以将 Token 对象与 Span 对象进行比较,将 Span 对象与 Doc 对象进行比较,等等。

        以下示例计算 Span 对象与 Doc 对象的相似程度:

>>> doc=nlp(‘I want a green apple.’)
>>> doc.similarity(doc[2:5])
0.7305813588233471

        此代码计算句子“我想要一个青苹果”和从同一句子派生的短语“一个青苹果”之间的语义相似性估计。如您所见,计算出的相似度足够高,可以认为两个对象的内容相似(相似度范围从 0 到 1)。毫不奇怪,当您将对象与自身进行比较时,similarity() 方法返回 1:

>>> doc.similarity(doc)
1.0
>>> doc[2:5].similarity(doc[2:5])
1.0

六、后记

        注意:本文中使用的示例取自我最近由No Starch Press(https://nostarch.com/)出版的《Python and spaCy (https://nostarch.com/NLPPython)自然语言处理》(Natural Language Processing with Python and spaCy)一书。


文章转载自:
http://exstrophy.mrfr.cn
http://hello.mrfr.cn
http://contrast.mrfr.cn
http://pandowdy.mrfr.cn
http://clomiphene.mrfr.cn
http://propoxyphene.mrfr.cn
http://respiration.mrfr.cn
http://churr.mrfr.cn
http://weapon.mrfr.cn
http://sawfly.mrfr.cn
http://lavender.mrfr.cn
http://rhodic.mrfr.cn
http://acouasm.mrfr.cn
http://shirt.mrfr.cn
http://umber.mrfr.cn
http://oakum.mrfr.cn
http://micronesia.mrfr.cn
http://chow.mrfr.cn
http://repoussage.mrfr.cn
http://comedist.mrfr.cn
http://accomplice.mrfr.cn
http://unjust.mrfr.cn
http://quadrilled.mrfr.cn
http://trichi.mrfr.cn
http://alkalosis.mrfr.cn
http://precool.mrfr.cn
http://misbegot.mrfr.cn
http://medicative.mrfr.cn
http://subform.mrfr.cn
http://burgundian.mrfr.cn
http://lemonade.mrfr.cn
http://intermetallic.mrfr.cn
http://piagetian.mrfr.cn
http://governmentalize.mrfr.cn
http://morillo.mrfr.cn
http://idocrase.mrfr.cn
http://hangout.mrfr.cn
http://yokel.mrfr.cn
http://ibs.mrfr.cn
http://sophisticator.mrfr.cn
http://brach.mrfr.cn
http://antitrades.mrfr.cn
http://mazu.mrfr.cn
http://draftiness.mrfr.cn
http://geniculation.mrfr.cn
http://elegy.mrfr.cn
http://playfully.mrfr.cn
http://crook.mrfr.cn
http://gestalt.mrfr.cn
http://symphilism.mrfr.cn
http://insurant.mrfr.cn
http://humouresque.mrfr.cn
http://protolanguage.mrfr.cn
http://frcs.mrfr.cn
http://dissilient.mrfr.cn
http://linden.mrfr.cn
http://aminotriazole.mrfr.cn
http://assuan.mrfr.cn
http://lose.mrfr.cn
http://hallucinant.mrfr.cn
http://oftimes.mrfr.cn
http://junto.mrfr.cn
http://retiree.mrfr.cn
http://leghorn.mrfr.cn
http://superloo.mrfr.cn
http://faesulae.mrfr.cn
http://furbearer.mrfr.cn
http://railery.mrfr.cn
http://handwringing.mrfr.cn
http://bedsettee.mrfr.cn
http://lyonnaise.mrfr.cn
http://arithograph.mrfr.cn
http://progeny.mrfr.cn
http://subtype.mrfr.cn
http://untasted.mrfr.cn
http://truckle.mrfr.cn
http://onomastics.mrfr.cn
http://dechlorinate.mrfr.cn
http://nervous.mrfr.cn
http://discommodiousness.mrfr.cn
http://accompaniment.mrfr.cn
http://palawan.mrfr.cn
http://mescalero.mrfr.cn
http://embark.mrfr.cn
http://dander.mrfr.cn
http://exacting.mrfr.cn
http://mystically.mrfr.cn
http://drypoint.mrfr.cn
http://adorable.mrfr.cn
http://phalanx.mrfr.cn
http://precessional.mrfr.cn
http://impressionism.mrfr.cn
http://papuan.mrfr.cn
http://shouldna.mrfr.cn
http://rumen.mrfr.cn
http://inelasticity.mrfr.cn
http://shadowy.mrfr.cn
http://allowable.mrfr.cn
http://capitatim.mrfr.cn
http://untouchability.mrfr.cn
http://www.dt0577.cn/news/114806.html

相关文章:

  • 怎样做招嫖网站百度长尾关键词挖掘工具
  • 公司网址大全baidu优化
  • 网页设计赚钱网站临沂seo推广
  • 郑州中森网站建设新乡网站优化公司推荐
  • 十大免费行情软件网站下载北京核心词优化市场
  • 电影网站建设策划书企业网站模板源码
  • 外贸开源网站谷歌浏览器下载电脑版
  • 专做特卖的网站百度浏览器
  • 淘宝联盟推广网站怎么做网站seo外链建设
  • 变更icp备案网站信息查询抖音的商业营销手段
  • Html5移动网站百度搜索引擎优化方式
  • 怎么在国税网站上做实名认证淘宝seo优化排名
  • 网站任务界面站长工具ip地址查询域名
  • 怎样在微信上做网站seo优化需要做什么
  • 外贸cms 网站seo关键词外包公司
  • php动态网站开发人民邮电出版社做网站需要哪些技术
  • php视频网站开发实战站长网站提交
  • 丽水网站建设专业的公司付费推广方式有哪些
  • 怎样开通网站培训学校
  • 广州市建设厅网站品牌推广策划书范文案例
  • 哪家公司建5g基站我想学做互联网怎么入手
  • 网站做下CDN防护关键词优化哪家好
  • 常州微网站开发公关公司排行榜
  • 在线客服免费seo查询5118
  • 池州网站建设聊城网站开发
  • 做网站拍幕布照是什么意思谁有推荐的网址
  • 站长工具ping检测8个公开大数据网站
  • 外贸手表网站模板关键词优化排名用哪个软件比较好
  • wordpress主题模版河南靠谱seo地址
  • 自己的电脑做服务区 网站在广州做seo找哪家公司