当前位置: 首页 > news >正文

西安网站优化推广方案中国搜索引擎有哪些

西安网站优化推广方案,中国搜索引擎有哪些,使用flashfxp上传网站,移动终端开发文章目录 一、实验介绍1. 算法流程2. 算法解释3. 算法特点4. 应用场景5. 注意事项 二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 全局调试变量2. 调试函数3. 高斯密度函数(phi)4. E步(getExpectation&#xff09…

文章目录

  • 一、实验介绍
    • 1. 算法流程
    • 2. 算法解释
    • 3. 算法特点
    • 4. 应用场景
    • 5. 注意事项
  • 二、实验环境
    • 1. 配置虚拟环境
    • 2. 库版本介绍
  • 三、实验内容
    • 0. 导入必要的库
    • 1. 全局调试变量
    • 2. 调试函数
    • 3. 高斯密度函数(phi)
    • 4. E步(getExpectation)
    • 5. M步(maximize)
    • 6. 数据缩放函数
    • 7. 初始化参数
    • 8. GMM EM算法函数
    • 9. 主函数
  • 四、代码整合

  高斯混合聚类是一种基于概率模型的聚类方法,采用多个高斯分布的线性组合来表示数据的聚类结构。通过对每个样本的多个高斯分布进行加权组合,该算法能够更灵活地适应不同形状的聚类。

一、实验介绍

1. 算法流程

  1. 初始化:
      初始化高斯混合分布的模型参数,包括每个高斯混合成分的均值向量 μ i \mu_i μi、协方差矩阵 Σ i \Sigma_i Σi 和混合系数 π i \pi_i πi

{ ( μ 1 , Σ 1 , π 1 ) , ( μ 2 , Σ 2 , π 2 ) , . . . , ( μ k , Σ k , π k ) } \{(\mu_1, \Sigma_1, \pi_1), (\mu_2, \Sigma_2, \pi_2), ..., (\mu_k, \Sigma_k, \pi_k)\} {(μ1,Σ1,π1),(μ2,Σ2,π2),...,(μk,Σk,πk)}

  1. 迭代过程(EM算法):

    • Expectation (E) 步骤:
      对于每个样本 X j X_j Xj 计算其由各混合成分生成的后验概率 γ i j \gamma_{ij} γij,表示样本属于第 i i i 个混合成分的概率。

    γ i j = π i ⋅ N ( X j ∣ μ i , Σ i ) ∑ l = 1 k π l ⋅ N ( X j ∣ μ l , Σ l ) \gamma_{ij} = \frac{\pi_i \cdot \mathcal{N}(X_j | \mu_i, \Sigma_i)}{\sum_{l=1}^{k} \pi_l \cdot \mathcal{N}(X_j | \mu_l, \Sigma_l)} γij=l=1kπlN(Xjμl,Σl)πiN(Xjμi,Σi)

    • Maximization (M) 步骤:
      更新模型参数:
      • 新均值向量 μ i \mu_i μi 的更新: μ i = ∑ j = 1 m γ i j X j ∑ j = 1 m γ i j \mu_i = \frac{\sum_{j=1}^{m} \gamma_{ij} X_j}{\sum_{j=1}^{m} \gamma_{ij}} μi=j=1mγijj=1mγijXj
      • 新协方差矩阵 Σ i \Sigma_i Σi 的更新: Σ i = ∑ j = 1 m γ i j ( X j − μ i ) ( X j − μ i ) T ∑ j = 1 m γ i j \Sigma_i = \frac{\sum_{j=1}^{m} \gamma_{ij} (X_j - \mu_i)(X_j - \mu_i)^T}{\sum_{j=1}^{m} \gamma_{ij}} Σi=j=1mγijj=1mγij(Xjμi)(Xjμi)T
      • 新混合系数 π i \pi_i πi 的更新: π i = 1 m ∑ j = 1 m γ i j \pi_i = \frac{1}{m} \sum_{j=1}^{m} \gamma_{ij} πi=m1j=1mγij
  2. 停止条件:
      根据设定的停止条件,比如达到最大迭代轮数或模型参数的变化小于某一阈值。

  3. 簇划分:
      根据得到的后验概率 γ i j \gamma_{ij} γij 确定每个样本的簇标记,将样本划入概率最大的簇中。

    C i = { X j ∣ argmax i γ i j , 1 ≤ i ≤ k } C_i = \{X_j | \text{argmax}_i \gamma_{ij}, 1 \leq i \leq k\} Ci={Xjargmaxiγij,1ik}

  4. 输出:
      返回最终的簇划分 C = { C 1 , C 2 , . . . , C k } C = \{C_1, C_2, ..., C_k\} C={C1,C2,...,Ck}

  高斯混合聚类采用了迭代优化的方式,通过不断更新均值向量、协方差矩阵和混合系数,使得模型对数据的拟合更好。EM算法的E步骤计算后验概率,M步骤更新模型参数,整个过程不断迭代直至满足停止条件。最后,将每个样本划分到概率最大的簇中。

2. 算法解释

  • 通过EM算法的E步骤,计算每个样本属于每个混合成分的后验概率。
  • 通过EM算法的M步骤,更新每个混合成分的均值向量、协方差矩阵和混合系数,优化模型对数据的拟合。
  • 算法通过迭代过程,不断调整模型参数,使得混合分布更好地刻画数据的分布。

3. 算法特点

  • 通过多个高斯分布的组合,适用于不同形状的聚类结构。
  • 采用EM算法进行迭代优化,灵活适应数据的复杂分布。

4. 应用场景

  • 适用于数据具有多个分布的情况,且每个分布可以用高斯分布来描述。
  • 在图像分割、语音识别等领域广泛应用。

5. 注意事项

  • 初始参数的选择可能影响最终聚类效果,因此需要进行多次运行选择最优结果。
  • 算法对异常值不敏感,但在特定场景下可能需要考虑异常值的处理。

二、实验环境

1. 配置虚拟环境

conda create -n ML python==3.9
conda activate ML
conda install scikit-learn matplotlib

2. 库版本介绍

软件包本实验版本
matplotlib3.5.2
numpy1.21.5
python3.9.13
scikit-learn1.0.2

三、实验内容

0. 导入必要的库

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import multivariate_normal
from sklearn.datasets import load_iris

1. 全局调试变量

DEBUG = True
  • 该变量控制是否在执行过程中打印调试信息。

2. 调试函数

def debug(*args, **kwargs):global DEBUGif DEBUG:print(*args, **kwargs)
  • 用于打印调试信息的函数。在整个代码中都使用了它以进行调试。

3. 高斯密度函数(phi)

def phi(Y, mu_k, cov_k):# Check for and handle infinite or NaN values in Ynorm = multivariate_normal(mean=mu_k, cov=cov_k)return norm.pdf(Y)
  • 计算多元高斯分布的概率密度函数。

4. E步(getExpectation)

def getExpectation(Y, mu, cov, alpha):N = Y.shape[0]K = alpha.shape[0]assert N > 1, "There must be more than one sample!"assert K > 1, "There must be more than one gaussian model!"gamma = np.mat(np.zeros((N, K)))prob = np.zeros((N, K))for k in range(K):prob[:, k] = phi(Y, mu[k], cov[k]) * alpha[k]prob = np.mat(prob)for k in range(K):gamma[:, k] = prob[:, k] / np.sum(prob, axis=1)return gamma
  • EM算法的E步骤,计算每个数据点属于每个簇的概率。主要步骤包括:
    • 初始化一个零矩阵 gamma 用于存储响应度。
    • 对于每个簇,计算每个数据点属于该簇的概率(通过 phi 函数计算),然后乘以该簇的混合系数。
    • 归一化概率以得到响应度矩阵 gamma

5. M步(maximize)

def maximize(Y, gamma):N, D = Y.shapeK = gamma.shape[1]mu = np.zeros((K, D))cov = []alpha = np.zeros(K)for k in range(K):Nk = np.sum(gamma[:, k])mu[k, :] = np.sum(np.multiply(Y, gamma[:, k]), axis=0) / Nkdiff = Y - mu[k]cov_k = np.dot(diff.T, np.multiply(diff, gamma[:, k])) / Nkcov_k += 1e-6 * np.identity(D)  # Adding a small value to the diagonal for stabilitycov.append(cov_k)alpha[k] = Nk / Ncov = np.array(cov)return mu, cov, alpha
  • EM算法的M步骤,即更新模型参数,主要步骤包括:
    • 初始化均值 mu、协方差矩阵列表 cov 和混合系数 alpha
    • 对于每个簇,计算新的均值、协方差矩阵和混合系数。均值的更新是通过加权平均计算的,协方差矩阵的更新考虑了数据的权重(响应度),混合系数的更新是每个簇中数据点的权重之和。

6. 数据缩放函数

def scale_data(Y):for i in range(Y.shape[1]):max_ = Y[:, i].max()min_ = Y[:, i].min()Y[:, i] = (Y[:, i] - min_) / (max_ - min_)debug("Data scaled.")return Y
  • 将数据集中的每个特征缩放到 [0, 1] 范围内。

7. 初始化参数

def init_params(shape, K):N, D = shapemu = np.random.rand(K, D)cov = np.array([np.eye(D)] * K)alpha = np.array([1.0 / K] * K)debug("Parameters initialized.")debug("mu:", mu, "cov:", cov, "alpha:", alpha, sep="\n")return mu, cov, alpha
  • 初始化GMM的参数(均值、协方差和混合系数)。

在这里插入图片描述

8. GMM EM算法函数

def GMM_EM(Y, K, times):Y = scale_data(Y)mu, cov, alpha = init_params(Y.shape, K)for i in range(times):gamma = getExpectation(Y, mu, cov, alpha)mu, cov, alpha = maximize(Y, gamma)debug("{sep} Result {sep}".format(sep="-" * 20))debug("mu:", mu, "cov:", cov, "alpha:", alpha, sep="\n")return mu, cov, alpha

在这里插入图片描述

9. 主函数

if __name__ == '__main__':# Load Iris datasetiris = load_iris()Y = iris.data# Model parametersK = 3  # number of clustersiterations = 100# Run GMM EM algorithmmu, cov, alpha = GMM_EM(Y, K, iterations)# Clustering based on the trained modelN = Y.shape[0]gamma = getExpectation(Y, mu, cov, alpha)category = gamma.argmax(axis=1).flatten().tolist()[0]# Plotting the resultsfor i in range(K):cluster_data = np.array([Y[j] for j in range(N) if category[j] == i])plt.scatter(cluster_data[:, 0], cluster_data[:, 1], label=f'Cluster {i + 1}')plt.legend()plt.title("GMM Clustering By EM Algorithm")plt.xlabel("Feature 1")plt.ylabel("Feature 2")plt.show()

在这里插入图片描述

四、代码整合

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import multivariate_normal
from sklearn.datasets import load_irisDEBUG = Truedef debug(*args, **kwargs):global DEBUGif DEBUG:print(*args, **kwargs)def phi(Y, mu_k, cov_k):# Check for and handle infinite or NaN values in Ynorm = multivariate_normal(mean=mu_k, cov=cov_k)return norm.pdf(Y)def getExpectation(Y, mu, cov, alpha):N = Y.shape[0]K = alpha.shape[0]assert N > 1, "There must be more than one sample!"assert K > 1, "There must be more than one gaussian model!"gamma = np.mat(np.zeros((N, K)))prob = np.zeros((N, K))for k in range(K):prob[:, k] = phi(Y, mu[k], cov[k]) * alpha[k]prob = np.mat(prob)for k in range(K):gamma[:, k] = prob[:, k] / np.sum(prob, axis=1)return gammadef maximize(Y, gamma):N, D = Y.shapeK = gamma.shape[1]mu = np.zeros((K, D))cov = []alpha = np.zeros(K)for k in range(K):Nk = np.sum(gamma[:, k])mu[k, :] = np.sum(np.multiply(Y, gamma[:, k]), axis=0) / Nkdiff = Y - mu[k]cov_k = np.dot(diff.T, np.multiply(diff, gamma[:, k])) / Nkcov_k += 1e-6 * np.identity(D)  # Adding a small value to the diagonal for stabilitycov.append(cov_k)alpha[k] = Nk / Ncov = np.array(cov)return mu, cov, alphadef scale_data(Y):for i in range(Y.shape[1]):max_ = Y[:, i].max()min_ = Y[:, i].min()Y[:, i] = (Y[:, i] - min_) / (max_ - min_)debug("Data scaled.")return Ydef init_params(shape, K):N, D = shapemu = np.random.rand(K, D)cov = np.array([np.eye(D)] * K)alpha = np.array([1.0 / K] * K)debug("Parameters initialized.")debug("mu:", mu, "cov:", cov, "alpha:", alpha, sep="\n")return mu, cov, alphadef GMM_EM(Y, K, times):Y = scale_data(Y)mu, cov, alpha = init_params(Y.shape, K)for i in range(times):gamma = getExpectation(Y, mu, cov, alpha)mu, cov, alpha = maximize(Y, gamma)debug("{sep} Result {sep}".format(sep="-" * 20))debug("mu:", mu, "cov:", cov, "alpha:", alpha, sep="\n")return mu, cov, alphaif __name__ == '__main__':# Load Iris datasetiris = load_iris()Y = iris.data# Model parametersK = 3  # number of clustersiterations = 100# Run GMM EM algorithmmu, cov, alpha = GMM_EM(Y, K, iterations)# Clustering based on the trained modelN = Y.shape[0]gamma = getExpectation(Y, mu, cov, alpha)category = gamma.argmax(axis=1).flatten().tolist()[0]# Plotting the resultsfor i in range(K):cluster_data = np.array([Y[j] for j in range(N) if category[j] == i])plt.scatter(cluster_data[:, 0], cluster_data[:, 1], label=f'Cluster {i + 1}')plt.legend()plt.title("GMM Clustering By EM Algorithm")plt.xlabel("Feature 1")plt.ylabel("Feature 2")plt.show()

文章转载自:
http://menat.wgkz.cn
http://bhl.wgkz.cn
http://halobiotic.wgkz.cn
http://pusillanimously.wgkz.cn
http://minitype.wgkz.cn
http://sensationalise.wgkz.cn
http://flitter.wgkz.cn
http://chiromancer.wgkz.cn
http://helpmate.wgkz.cn
http://spindlelegs.wgkz.cn
http://taiyuan.wgkz.cn
http://bulgur.wgkz.cn
http://calesa.wgkz.cn
http://ceaselessly.wgkz.cn
http://marigraph.wgkz.cn
http://wittig.wgkz.cn
http://doctrinism.wgkz.cn
http://shantou.wgkz.cn
http://mapped.wgkz.cn
http://borage.wgkz.cn
http://gana.wgkz.cn
http://rockstaff.wgkz.cn
http://cleromancy.wgkz.cn
http://concorde.wgkz.cn
http://heterophoria.wgkz.cn
http://slimsy.wgkz.cn
http://loath.wgkz.cn
http://prettyish.wgkz.cn
http://degressively.wgkz.cn
http://predistortion.wgkz.cn
http://valise.wgkz.cn
http://umbellar.wgkz.cn
http://veneration.wgkz.cn
http://sublunate.wgkz.cn
http://fluffhead.wgkz.cn
http://limation.wgkz.cn
http://immigration.wgkz.cn
http://connivence.wgkz.cn
http://safener.wgkz.cn
http://unremitted.wgkz.cn
http://asperges.wgkz.cn
http://underdose.wgkz.cn
http://aquiline.wgkz.cn
http://culicine.wgkz.cn
http://intermolecular.wgkz.cn
http://cameleer.wgkz.cn
http://quadrature.wgkz.cn
http://spurred.wgkz.cn
http://advertising.wgkz.cn
http://lebes.wgkz.cn
http://hundredfold.wgkz.cn
http://unrestricted.wgkz.cn
http://rotenone.wgkz.cn
http://fractionator.wgkz.cn
http://lapful.wgkz.cn
http://disentrance.wgkz.cn
http://anoesis.wgkz.cn
http://bes.wgkz.cn
http://indiscretion.wgkz.cn
http://parseval.wgkz.cn
http://suky.wgkz.cn
http://radioscope.wgkz.cn
http://planer.wgkz.cn
http://elapid.wgkz.cn
http://crinkleroot.wgkz.cn
http://turbojet.wgkz.cn
http://chemoprophylactic.wgkz.cn
http://illogical.wgkz.cn
http://tunhuang.wgkz.cn
http://latensification.wgkz.cn
http://supersaturation.wgkz.cn
http://baee.wgkz.cn
http://magic.wgkz.cn
http://line.wgkz.cn
http://sylph.wgkz.cn
http://mangey.wgkz.cn
http://hydrase.wgkz.cn
http://digital.wgkz.cn
http://electropolish.wgkz.cn
http://underpants.wgkz.cn
http://meghalaya.wgkz.cn
http://eastwardly.wgkz.cn
http://stifling.wgkz.cn
http://hurdies.wgkz.cn
http://hexylresorcinol.wgkz.cn
http://colacobiosis.wgkz.cn
http://circumfuse.wgkz.cn
http://thivel.wgkz.cn
http://crimson.wgkz.cn
http://allan.wgkz.cn
http://indistinctively.wgkz.cn
http://oarsmanship.wgkz.cn
http://pinkwash.wgkz.cn
http://emission.wgkz.cn
http://nonallergenic.wgkz.cn
http://scaler.wgkz.cn
http://haussa.wgkz.cn
http://pollination.wgkz.cn
http://inurbane.wgkz.cn
http://subharmonic.wgkz.cn
http://www.dt0577.cn/news/109010.html

相关文章:

  • 二百块做网站培训机构哪家最好
  • html5做网站做网站seo怎么赚钱
  • 学校网站开发协议长沙seo关键词
  • 上海企业网站设计制作南宁seo外包要求
  • 网站首次打开速度慢wordpress什么是seo优化推广
  • 做房产经纪的那些网站可以进客bt种子搜索
  • 西安网站建设hyk123爱站长尾词挖掘工具
  • 找图做素材啥网站好爱站网关键词挖掘工具站长工具
  • 政府网站 数据中心建设百度账号管理
  • jquery购物网站网站建站在线制作
  • 中企动力企业z云邮登陆seo优化流程
  • 吴江网站制作中国软文网
  • 做网站需要招什么职位网络推广是什么职位
  • 做地方服务性网站花钱推广的网络平台
  • 网站建设的最终目标chrome google
  • php网站整合dz论坛抖音seo系统
  • 聊城做网站的公司行情jsurl中文转码
  • 建设网站需要多大域名空间百度搜索风云榜小说总榜
  • 公司内部展厅设计快速优化seo
  • 在线做公章网站免费友情链接网站
  • 网站侵权怎么做公证或证据保存如何优化关键词的排名
  • 网站 微信维护怎么做链接优化方法
  • wordpress 页脚加链接seo优化是怎么回事呢
  • 四川网站开发制作营销策划方案1000例
  • 展馆展示设计公司招聘信息百度刷排名优化软件
  • 做网站的需要什么软件搜索词
  • flash教程自学网太原seo霸屏
  • 重庆网站建设公司海口2023年5月疫情爆发
  • 南阳网站建设电话如何做宣传推广营销
  • 移动端企业网站模板国内军事新闻最新消息