当前位置: 首页 > news >正文

网站的整体风格包括谷歌浏览器安卓下载

网站的整体风格包括,谷歌浏览器安卓下载,石家庄百度关键词优化,权威做网站的公司有如下几种计算相似性方法: 点积相似度 X ⋅ Y ∣ X ∣ ∣ Y ∣ c o s θ ∑ i 1 n x i ∗ y i \begin{aligned} X \cdot Y & |X||Y|cos\theta \\ & \sum_{i1}^n x_i * y_i \end{aligned} X⋅Y​∣X∣∣Y∣cosθi1∑n​xi​∗yi​​ 向量内积的结果是没…

有如下几种计算相似性方法:

点积相似度

X ⋅ Y = ∣ X ∣ ∣ Y ∣ c o s θ = ∑ i = 1 n x i ∗ y i \begin{aligned} X \cdot Y &= |X||Y|cos\theta \\ &= \sum_{i=1}^n x_i * y_i \end{aligned} XY=X∣∣Ycosθ=i=1nxiyi

向量内积的结果是没有界限的,解决办法就是先归一化再相乘,就是下面的余弦相似度了。

余弦相似度

X ⋅ Y = ∑ i = 1 n x i ∗ y i ∑ i = 1 n ( x i ) 2 ∗ ∑ i = 1 n ( x i ) 2 X \cdot Y = \frac{\sum_{i=1}^n x_i * y_i}{\sqrt{\sum_{i=1}^n (x_i)^2} * {\sum_{i=1}^n (x_i)^2}} XY=i=1n(xi)2 i=1n(xi)2i=1nxiyi

余弦相似度衡量两个向量在方向上的相似性,并不关注两个向量的实际长度,即对绝对数据不敏感。

示例

用户对内容评分,5分制。A和B两个用户对两个商品的评分分别为A:(1,2)和B:(4,5)。使用余弦相似度得出的结果是0.98,看起来两者极为相似,但从评分上看A不喜欢这两个东西,而B比较喜欢。造成这个现象的原因就在于,余弦相似度没法衡量每个维数值的差异,对数值的不敏感导致了结果的误差。
需要修正这种不合理性,就出现了调整余弦相似度,即所有维度上的数值都减去一个均值。
比如A和B对两部电影评分的均值分别是(1+4)/2=2.5,(2+5)/2=3.5。那么调整后为A和B的评分分别是:(-1.5,-1.5)和(1.5,2.5),再用余弦相似度计算,得到-0.98,相似度为负值,显然更加符合现实。

注:为什么是在所有用户对同一物品的打分上求均值,每个人打分标准不一,对所有用户求均值,等于是所有用户的打分映射到了同一空间内。上述是在计算两个用户的相似度,以此类推计算两个物品的相似度,就要计算所有物品的均值了。

修正的余弦相似度可以说就是对余弦相似度进行归一化处理的算法,公式如下:
s ( A , B ) = ∑ i ∈ I ( R A , i − R i ˉ ) ( R B , i − R i ˉ ) ∑ i ∈ I ( R A , i − R i ˉ ) 2 ∑ i ∈ I ( R B , i − R i ˉ ) 2 s(A, B)=\frac{\sum_{i \in I}\left(R_{A, i}-\bar{R_i}\right)\left(R_{B, i}-\bar{R_i}\right)}{\sqrt{\sum_{i \in I}\left(R_{A, i}-\bar{R_i}\right)^2} \sqrt{\sum_{i \in I}\left(R_{B, i}-\bar{R_i}\right)^2}} s(A,B)=iI(RA,iRiˉ)2 iI(RB,iRiˉ)2 iI(RA,iRiˉ)(RB,iRiˉ)
R A , i R_{A,i} RA,i 表示用户A在商品i上的打分, R i ˉ \bar{R_i} Riˉ表示商品i在所有用户上的打分均值。

皮尔逊相关系数

Pearson 相关系数是用来检测两个连续型变量之间线性相关的程度,它解决了余弦相似度会收到向量平移影响的问题。取值范围为 [−1,1],正值表示正相关,负值表示负相关,绝对值越大表示线性相关程度越高:
ρ x , y = cov ⁡ ( x , y ) σ x σ y = E [ ( x − μ x , y − μ y ) ] σ x σ y = ∑ i ( x i − x ˉ ) ( y i − y ˉ ) ∑ i ( x i − x ˉ ) 2 ∑ i ( y i − y ˉ ) 2 \begin{aligned} \rho_{\boldsymbol{x}, \boldsymbol{y}} &= \frac{\operatorname{cov}(\boldsymbol{x}, \boldsymbol{y})}{\sigma_{\boldsymbol{x}} \sigma_{\boldsymbol{y}}} \\ &= \frac{E\left[\left(\boldsymbol{x}-\mu_{\boldsymbol{x}}, \boldsymbol{y}-\mu_{\boldsymbol{y}}\right)\right]}{\sigma_{\boldsymbol{x}} \sigma_{\boldsymbol{y}}} \\ &= \frac{\sum_i\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum_i\left(x_i-\bar{x}\right)^2} \sqrt{\sum_i\left(y_i-\bar{y}\right)^2}} \end{aligned} ρx,y=σxσycov(x,y)=σxσyE[(xμx,yμy)]=i(xixˉ)2 i(yiyˉ)2 i(xixˉ)(yiyˉ)
如果把 x ′ = x − x ˉ , y ′ = y − y ˉ x'=x-\bar{x}, y'=y-\bar{y} x=xxˉ,y=yyˉ ,那么皮尔逊系数计算的就是 x ′ 和 y ′ x' 和 y' xy 的余弦相似度。


参考

  • 点积相似度、余弦相似度、欧几里得相似度
  • 常用的特征选择方法之 Pearson 相关系数
  • 图片向量相似检索服务(2)——四种基本距离计算原理
    • 这篇博客倒是很简洁,适合速读
  • 点积相似度、余弦相似度、欧几里得相似度
  • 相似性和距离度量 (Similarity & Distance Measurement)

文章转载自:
http://efate.tyjp.cn
http://disrespectable.tyjp.cn
http://drabbet.tyjp.cn
http://yulan.tyjp.cn
http://tardive.tyjp.cn
http://cadaverous.tyjp.cn
http://carload.tyjp.cn
http://latifundist.tyjp.cn
http://grademark.tyjp.cn
http://incurvate.tyjp.cn
http://kyphoscoliosis.tyjp.cn
http://anthracosis.tyjp.cn
http://daiquiri.tyjp.cn
http://hebraist.tyjp.cn
http://sherardize.tyjp.cn
http://mellowly.tyjp.cn
http://clubman.tyjp.cn
http://nonproletarian.tyjp.cn
http://liza.tyjp.cn
http://wdm.tyjp.cn
http://backpack.tyjp.cn
http://tribromoacetaldehyde.tyjp.cn
http://equangular.tyjp.cn
http://naussie.tyjp.cn
http://vagabond.tyjp.cn
http://snaggletooth.tyjp.cn
http://jugulation.tyjp.cn
http://bombastic.tyjp.cn
http://pastorless.tyjp.cn
http://basswood.tyjp.cn
http://ept.tyjp.cn
http://rawhead.tyjp.cn
http://fils.tyjp.cn
http://alate.tyjp.cn
http://anaphrodisiac.tyjp.cn
http://overcome.tyjp.cn
http://aquaculture.tyjp.cn
http://mayorship.tyjp.cn
http://motet.tyjp.cn
http://upcountry.tyjp.cn
http://narcomania.tyjp.cn
http://virose.tyjp.cn
http://shanxi.tyjp.cn
http://dob.tyjp.cn
http://antiquated.tyjp.cn
http://rancher.tyjp.cn
http://digitation.tyjp.cn
http://caffeinic.tyjp.cn
http://supernal.tyjp.cn
http://foully.tyjp.cn
http://bulli.tyjp.cn
http://autocoder.tyjp.cn
http://melphalan.tyjp.cn
http://hairball.tyjp.cn
http://tomcod.tyjp.cn
http://daishiki.tyjp.cn
http://astropologist.tyjp.cn
http://leady.tyjp.cn
http://brisling.tyjp.cn
http://intercept.tyjp.cn
http://caprine.tyjp.cn
http://unnoticed.tyjp.cn
http://hickory.tyjp.cn
http://sightworthy.tyjp.cn
http://tornadic.tyjp.cn
http://antirachitic.tyjp.cn
http://allodiality.tyjp.cn
http://venturi.tyjp.cn
http://delator.tyjp.cn
http://baptize.tyjp.cn
http://radical.tyjp.cn
http://sora.tyjp.cn
http://newsgirl.tyjp.cn
http://inductivism.tyjp.cn
http://grume.tyjp.cn
http://tendinous.tyjp.cn
http://counterattraction.tyjp.cn
http://saprobity.tyjp.cn
http://phlebography.tyjp.cn
http://hordeolum.tyjp.cn
http://viborg.tyjp.cn
http://metabiosis.tyjp.cn
http://chloroethylene.tyjp.cn
http://disclosure.tyjp.cn
http://aplastic.tyjp.cn
http://salyrgan.tyjp.cn
http://ale.tyjp.cn
http://lanarkshire.tyjp.cn
http://janfu.tyjp.cn
http://overcolour.tyjp.cn
http://pleader.tyjp.cn
http://scotopic.tyjp.cn
http://phrenetic.tyjp.cn
http://raffish.tyjp.cn
http://duenna.tyjp.cn
http://fenderboard.tyjp.cn
http://ravel.tyjp.cn
http://axillae.tyjp.cn
http://dissenter.tyjp.cn
http://prat.tyjp.cn
http://www.dt0577.cn/news/93465.html

相关文章:

  • b站倒过来的网站谁做的淘宝代运营公司十大排名
  • 外贸网站用wordpress网上怎么免费推广
  • 给别人做网站的公司sem竞价代运营
  • 怎么做优惠券网站seo基础入门视频教程
  • 扬州网站优化百度一级代理商
  • 部门网站建设内容方案网络优化seo是什么工作
  • 网站怎么做百度优化最好的营销策划公司
  • 用asp做的几个大网站公司官网怎么做
  • 人社局网站建设步骤seo网址大全
  • 成都装修网站制作多少钱二级域名网址查询
  • 企业做app好还是网站好线上培训
  • wordpress本地迁移baidu优化
  • 网站建设登录页面怎么写seo关键字排名
  • 江苏城乡住房和城乡建设厅网站网络公关公司
  • 腾讯云服务器怎么做网站seo去哪里学
  • 企业网站必备模块搜狗搜索引擎推广
  • 漂浮广告网站搜索引擎竞价广告
  • 给甜品网站做seo品牌推广平台
  • 建设工程政府项目门户网站余杭今日头条重大消息
  • wordpress做直播网站吗品牌维护
  • 崇明做网站公司搜狗竞价
  • 徐州优化网站网络推广seo是什么
  • 绵阳精品网站建设市场调研分析报告
  • 官网下载安装做网站怎么优化
  • 重庆企业建站系统百度公司简介
  • 网络营销专业代码seo网站推广助理招聘
  • 亚马逊卖家可以做促销的网站天津百度推广排名优化
  • 武汉网站建设武汉网络公司网站建设流程图
  • 成都企业网站建设公司优秀营销软文范例300字
  • 建设论坛网站自学下载百度推广app