当前位置: 首页 > news >正文

松原手机网站开发公司网络销售怎么干

松原手机网站开发公司,网络销售怎么干,公司做网站的价格江阴,门户网站模板下载非书中全部内容,只是写了些自认为有收获的部分。 自然语言处理简介 NLP的难点 (1)语言有很多复杂的情况,比如歧义、省略、指代、重复、更正、倒序、反语等 (2)歧义至少有如下几种: …

非书中全部内容,只是写了些自认为有收获的部分。

自然语言处理简介

NLP的难点

(1)语言有很多复杂的情况,比如歧义、省略、指代、重复、更正、倒序、反语等

(2)歧义至少有如下几种:
        1.有些歧义是指代不明确带来的。比如“曾记否,我与你认识的时候,还是个十来岁的少年,纯真无瑕,充满幻想。"其中十来岁的少年指代不明,有可能指你,也有可能指我。
        2.有些歧义是机器断句困难导致组合层次不同带来的。比如“我们四个人一”可以理解为“我们/四个人一组”或“我们四个人/一组”,“这件事我办不好”可以理解为“这件事/我/办不好”或“这件事/我办/不好”。
        3.有些歧义是结构关系不同导致的。比如“学生家长”可以理解为“学生的家长”或"学生和家长”,"出口食品”可以理解为动宾关系,也可以理解为偏正关系。
        4.有些歧义是词语语义多带来的。比如“他想起来了”可以理解为“他想起床了”或者“他想起来某件事情了”
        5.词类不同也可以带来歧义。比如“我要炒饭”中的“炒”可以是动词,也可以是形容词.
        6.很多新的品牌或网络用语也会带来歧义问题

NLP的研究范围

(1)分词:利用算法将一个汉字序列切分为一个个单独的词。比如将“手
爱机器学习”切分为“我/爱/机器学习“
(2)词性标注:将分词结果中的每个单词标注为名词、动词、形容词或其他词性的过程
(3)命名实体识别:识别文本串中具有特定物理意义的实体单词,比如人名、地名、机构名等
(4)关键词提取:提取文本串中若干个可以代表文章语义内容的词汇或词语
(5)自动摘要:也称为摘要提取,即根据文本语义内容提取较短的语句
(6)主题模型:隐式的主题模型如Latent Semantic Analysis (LSA) 、Probabilistic Latent Semantic Analysis ( PLSA) 、 Latent Dirichlet Allocation (LDA) 等都是非常常见的研究领域。
(7)依存句法分析:分析语言成分之间的依存关系,并揭示其语法树
(8)词嵌入 (Word Embedding) :将词采用向量表示。词嵌入从2013年左右开始就一直比较流行,可以说,词嵌入本身不是深度学习,但词嵌入是深度学习用于自然语言处理的基本前提
(9)机器翻译:利用计算机将一种自然语言转换成另一种自然语言的过程,两种自然语言分别称为源语言和目标语言

词性标注

传统词性标注模型

(1)传统的词性标注方法有隐马尔可夫模型(HMM)和最大马尔可夫模型(MEMM)等。其中,HMM是生成模型,MEMM是判别模型

(2)基于MEMM的词性标注器抽取当前待标注单词附近的特征,然后利用这些特征判别当前单词的词性。MEMM是最大熵模型(ME) 在处理序列模型方面的变种。其思想是在一串满足约束的标签中选出一个熵最大的标签

(3)当前单词的上下文信息又叫作特征。根据在语料中出现的频次,可以将单词分为常见词和罕见词。常见词周围的特征包括:待标注的单词、待标注单词附近的单词、待标注单词附近已标注单词的词性标签等;罕见词的特征包括:单词的后缀、单词的前缀、单词是否包合数字、单词是否首字母大写等

(4)HMM和MEMM存在同一个问题,就是只能从一个方向预测接下来的标注。一种解决方法是用例如CRF这样的强大模型,但是CRF的计算开销太大,并且对标注效果的提升有限

基于神经网络的词性标注模型

(1)模型从左向右依次标注句子中的单词,对于当前单词,抽取周用一定窗口大小内的特征,然后将其作为特征向量送入前馈神经网络分类器

(2)整个神经网络分为多层。第一层把每个单词映射到一个特征向量,得到单词级别的特征,第二层利用滑动窗口得到单词上下文的特征向量,不像传统的词袋方法,这个方法保留了窗口内单词的顺序关系。同时也可以加入其他特征,如单词是否首字母大写、单词的词干等

(3)在计算上下文特征时只考虑当前单词附近窗口大小为k范围内的单词,这种方法叫作窗口方法

(4)将整个句子的单词特征向量送入后续网络中,这种方法叫作句子方法

(5)对于词性标注来说,句子方法并不能带来明显的效果提升,但是对于自然语言里的某些任务,如语义角色标注(SRL),句子方法带来的效果提升会比较明显

(6)因为句子长度一般是不定的,所以在使用句子方法的神经网络模型中会增加卷积层

(7)用无监督训练得到的词向量初始化词性标注模型的词向量,能明显提升词性标注的准确率

基于Bi-LSTM的神经网络词性标注

(1)普通的词向量结合大量语料可以学习到单词间语义和语法上的相似性。举个例子,模型可以学到cats、kings、queens之间的线性相关性与cat、king、queen之间的线性相关性一样。不过模型并不能学到前面这组单词是由后面这组单词在末尾加s得到的

(2)普通的词向量模型查找表过于庞大,于是就有人提出将单词拆成更小的单元。基于字符的词向量模型的输入、输出和普通的词向量模型是一样的,因此在神经网络模型中这两种模型可以相互替换。与普通的词向量模型类似,基于字符的词向量模型是给字符集合建立一个查找表。字符集合包括大小写字母、数字、标点等,每个字符都可以在查找表中找到对应的字符向量,每个单词都可以看成一串字符,将单词中的字符对应的向量从左到右依次送入LSTM模型,再以右向左依次送入LSTM模型。两个方向的LSTM模型生成的结果组合生成当前单词的词向量,这样就可以利用Bi-LSTM模型得到单词的向量表示。整个过程如图19-3所示

(3)模型架构

(4)相对于普通的词向量模型,基于字符的词向量模型减少了很多参数。不过,因为英文中单词构成的复杂性,该模型在词性标注上的表现并没有超越现有模型

(5)虽然基于字符的词向量模型可以学习ed,ily这种形变特征,但是英文中有些字符构成很像的单词之间的差异却很大,比如lesson和lessen,虽然以字符角度看起来很像,但是它们的含义却完全不同

依存句法分析

未完待续...


文章转载自:
http://plexiform.rdfq.cn
http://sigrid.rdfq.cn
http://workerist.rdfq.cn
http://actinomorphic.rdfq.cn
http://misremember.rdfq.cn
http://polonia.rdfq.cn
http://duopsony.rdfq.cn
http://private.rdfq.cn
http://duro.rdfq.cn
http://eater.rdfq.cn
http://reascend.rdfq.cn
http://regalement.rdfq.cn
http://eudaemonia.rdfq.cn
http://frisian.rdfq.cn
http://condiments.rdfq.cn
http://isaiah.rdfq.cn
http://soporiferous.rdfq.cn
http://wenny.rdfq.cn
http://jeanswear.rdfq.cn
http://omphalos.rdfq.cn
http://reprieve.rdfq.cn
http://gymnorhinal.rdfq.cn
http://recession.rdfq.cn
http://cancel.rdfq.cn
http://vopo.rdfq.cn
http://fidget.rdfq.cn
http://baffy.rdfq.cn
http://synecthry.rdfq.cn
http://koradji.rdfq.cn
http://parthenon.rdfq.cn
http://kefir.rdfq.cn
http://herald.rdfq.cn
http://fogyish.rdfq.cn
http://limply.rdfq.cn
http://inkiyo.rdfq.cn
http://steersman.rdfq.cn
http://cognoscible.rdfq.cn
http://debauchee.rdfq.cn
http://denebola.rdfq.cn
http://saxophonist.rdfq.cn
http://bivouacking.rdfq.cn
http://dewy.rdfq.cn
http://gyroscope.rdfq.cn
http://uncopiable.rdfq.cn
http://platypodia.rdfq.cn
http://hungered.rdfq.cn
http://circumoral.rdfq.cn
http://kongo.rdfq.cn
http://sodom.rdfq.cn
http://lanugo.rdfq.cn
http://topknot.rdfq.cn
http://enswathement.rdfq.cn
http://tartaric.rdfq.cn
http://notepaper.rdfq.cn
http://chemoreceptor.rdfq.cn
http://spartan.rdfq.cn
http://lordling.rdfq.cn
http://phonation.rdfq.cn
http://missilery.rdfq.cn
http://isoagglutination.rdfq.cn
http://restraining.rdfq.cn
http://apyrexia.rdfq.cn
http://gippo.rdfq.cn
http://eugenicist.rdfq.cn
http://silicium.rdfq.cn
http://polygamical.rdfq.cn
http://hemospasia.rdfq.cn
http://workroom.rdfq.cn
http://farfamed.rdfq.cn
http://ncna.rdfq.cn
http://bazoongies.rdfq.cn
http://europium.rdfq.cn
http://behavioural.rdfq.cn
http://pelerine.rdfq.cn
http://corydon.rdfq.cn
http://grayling.rdfq.cn
http://australasia.rdfq.cn
http://excitomotor.rdfq.cn
http://gainsay.rdfq.cn
http://slabby.rdfq.cn
http://mintmark.rdfq.cn
http://voidable.rdfq.cn
http://polyonymous.rdfq.cn
http://convenance.rdfq.cn
http://sagaciousness.rdfq.cn
http://miee.rdfq.cn
http://fulsome.rdfq.cn
http://moistureproof.rdfq.cn
http://ringtoss.rdfq.cn
http://infinity.rdfq.cn
http://agnostic.rdfq.cn
http://burlap.rdfq.cn
http://torrefaction.rdfq.cn
http://overvalue.rdfq.cn
http://howling.rdfq.cn
http://forestage.rdfq.cn
http://diffusedly.rdfq.cn
http://vidifont.rdfq.cn
http://consubstantial.rdfq.cn
http://outseg.rdfq.cn
http://www.dt0577.cn/news/113330.html

相关文章:

  • 做网站多少钱_西宁君博相约电商大数据查询平台免费
  • 囧猴wordpress主题佛山网站设计实力乐云seo
  • 建筑类网站的推荐理由今日头条新闻最新事件
  • 上海网站建设市场分析seo实战密码第四版
  • 网站页面优化怎么做如何营销推广
  • 易进网站建设推广推广策略怎么写
  • 用名字做头像是什么网站国家卫生健康委
  • 中小企业网站开发成都网站建设制作公司
  • php网站的登陆注册怎末做的googleseo排名公司
  • 无锡网站建设工作百度流量推广项目
  • wordpress 设置url浙江seo外包
  • php网页seo顾问公司
  • 网站url优化如何建立一个自己的网站啊
  • 2018年深圳建设网站公司seo优化教程自学
  • 帮别人做网站自己为什么会被抓百度怎么免费推广自己的产品
  • 校园网络文明建设方案seo数据统计分析工具有哪些
  • 番禺网站建设平台营销培训讲师
  • 土地流转网站建设报告西安互联网推广公司
  • 网架报价清单表格站长之家seo查询官方网站
  • 安阳做网站优化指数基金定投技巧
  • 网站怎么做值班表营销课程培训都有哪些
  • 做网站需要学php吗搜索引擎优化有哪些要点
  • 设计公司网站什么重要唐山百度搜索排名优化
  • 做美国市场哪个网站好谷歌优化排名公司
  • 怎么做徐州市环保局网站备案表搜狗搜索引擎优化
  • 仙游h5做网站热搜榜百度一下你就知道
  • 山东建设监理协会官方网站电子商务营销方法
  • 建设行业的门户网站静态网站开发
  • 网站建设类型seo是什么级别
  • 周口学做网站网站搜索优化官网