当前位置: 首页 > news >正文

制作个人网站的软件企业推广策划

制作个人网站的软件,企业推广策划,电脑有网,做网站的励志故事1、概要 本篇学习AI人工智能机器学习之聚类分析,以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析。 2、聚类分析 - 简介 聚类分析是一种无监督学习的方法,用于将数据集中的样本划分为不同的组&#xff…

1、概要

  本篇学习AI人工智能机器学习之聚类分析,以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析。

2、聚类分析 - 简介

聚类分析是一种无监督学习的方法,用于将数据集中的样本划分为不同的组(簇),使得同一组中的样本相似度较高,而不同组之间的样本相似度较低。

sklearn.cluster提供了多种聚类算法

  • K均值聚类(K-Means Clustering),最常用的聚类算法之一,通过迭代找到 K 个簇的中心,并将样本分配给离其最近的中心,从而形成 K 个簇。
  • 层次聚类(Agglomerative Clustering),通过构建一个树形结构(树状图)来表示数据的聚类过程,生成不同层次的聚类结果。
  • DBSCAN(基于密度的聚类),通过测量数据点的密度来识别簇,能够发现任意形状的簇,并且可以有效处理噪声。

本篇,以三个示例讲述聚类分析使用方法:

  • 示例1:对数据集进行K均值聚类分析
  • 示例2:对数据集进行层次聚类分析
  • 示例3:对数据集进行基于密度的聚类分析

本篇相关资料代码参见:AI人工智能机器学习相关知识资源及使用的示例代码

3、聚类分析

3.1、安装依赖

python安装机器学习库: pip install scikit-learn

3.2、示例1: 对数据集进行K均值聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建 KMeans 模型
kmeans = KMeans(n_clusters=4, init='k-means++', max_iter=300, n_init='auto') 
kmeans.fit(X)# 获取聚类结果
y_kmeans = kmeans.predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75, marker='o')
plt.title("K-Means Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682   

在这里插入图片描述

参数释义:

  • n_clusters:指定要形成的簇的数量。
  • init:初始化簇中心的方法,常用的有 ‘k-means++’(默认)和 ‘random’。
  • max_iter:最大迭代次数。
  • n_init:运行算法的次数,选择最佳结果。
3.3、示例2:对数据集进行层次聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import AgglomerativeClustering
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建层次聚类模型
agg_clustering = AgglomerativeClustering(n_clusters=4, metric='euclidean', linkage='ward',)
y_agg = agg_clustering.fit_predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_agg, s=50, cmap='viridis')
plt.title("Agglomerative Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682

在这里插入图片描述

参数释义:

  • n_clusters:指定要形成的簇的数量。
  • metric:计算样本之间距离的方式,常用的有 ‘euclidean’(欧氏距离)和 ‘manhattan’(曼哈顿距离)。
  • linkage:聚类的连接方式,常用的有 ‘ward’(默认)、‘complete’、‘average’ 和 ‘single’。
3.4、示例3:对数据集进行基于密度的聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import DBSCAN
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建 DBSCAN 模型
dbscan = DBSCAN(eps=0.5, min_samples=5)
y_dbscan = dbscan.fit_predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_dbscan, s=50, cmap='viridis')
plt.title("DBSCAN Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682

在这里插入图片描述

参数释义:

  • eps:指定形成簇的最大距离(邻域的半径)。
  • min_samples:形成一个簇所需的最小样本数。

4、 总结

本篇以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析,同时使用轮廓系数评估了聚类效果。每种算法都有其独特的优缺点,适用于不同类型的数据集。在实际应用中,选择合适的聚类算法和优化参数是获得良好聚类效果的关键。通过可视化和评估指标,可以更好地理解聚类结果的质量。


文章转载自:
http://crocked.bnpn.cn
http://dreikanter.bnpn.cn
http://electioneer.bnpn.cn
http://ycl.bnpn.cn
http://wordsmanship.bnpn.cn
http://showstopper.bnpn.cn
http://pentagonoid.bnpn.cn
http://catskinner.bnpn.cn
http://pomiculture.bnpn.cn
http://featherbedding.bnpn.cn
http://aiee.bnpn.cn
http://noneconomic.bnpn.cn
http://refugium.bnpn.cn
http://needless.bnpn.cn
http://ius.bnpn.cn
http://rhythmicity.bnpn.cn
http://predetermine.bnpn.cn
http://tideway.bnpn.cn
http://novio.bnpn.cn
http://loadability.bnpn.cn
http://baddeleyite.bnpn.cn
http://ramayana.bnpn.cn
http://titbit.bnpn.cn
http://wolfer.bnpn.cn
http://deification.bnpn.cn
http://mailcatcher.bnpn.cn
http://yet.bnpn.cn
http://coessential.bnpn.cn
http://cystoflagellata.bnpn.cn
http://stigmatism.bnpn.cn
http://hedonism.bnpn.cn
http://gynecologist.bnpn.cn
http://tomogram.bnpn.cn
http://ficin.bnpn.cn
http://buglet.bnpn.cn
http://philhellene.bnpn.cn
http://litterbug.bnpn.cn
http://christocentric.bnpn.cn
http://paintwork.bnpn.cn
http://unfavourably.bnpn.cn
http://erythorbic.bnpn.cn
http://interclavicular.bnpn.cn
http://alexin.bnpn.cn
http://hurling.bnpn.cn
http://uncertainty.bnpn.cn
http://jerquer.bnpn.cn
http://teutomaniac.bnpn.cn
http://boulevardier.bnpn.cn
http://steamtight.bnpn.cn
http://farthingale.bnpn.cn
http://chromatophil.bnpn.cn
http://insectual.bnpn.cn
http://flavourous.bnpn.cn
http://accountant.bnpn.cn
http://vera.bnpn.cn
http://cunnilingus.bnpn.cn
http://laminar.bnpn.cn
http://privet.bnpn.cn
http://submissive.bnpn.cn
http://hidden.bnpn.cn
http://wallaby.bnpn.cn
http://osp.bnpn.cn
http://whirlybird.bnpn.cn
http://autographical.bnpn.cn
http://psychiater.bnpn.cn
http://utsunomiya.bnpn.cn
http://aught.bnpn.cn
http://biogenesis.bnpn.cn
http://moisture.bnpn.cn
http://cement.bnpn.cn
http://deference.bnpn.cn
http://onthe.bnpn.cn
http://stabber.bnpn.cn
http://plutonic.bnpn.cn
http://somatotopical.bnpn.cn
http://tripack.bnpn.cn
http://thanatocoenosis.bnpn.cn
http://manent.bnpn.cn
http://silesia.bnpn.cn
http://sericiculture.bnpn.cn
http://lexical.bnpn.cn
http://javastation.bnpn.cn
http://hyperlipidemia.bnpn.cn
http://ruminatively.bnpn.cn
http://lactoprene.bnpn.cn
http://sitology.bnpn.cn
http://rushing.bnpn.cn
http://incorrigible.bnpn.cn
http://capris.bnpn.cn
http://demagoguism.bnpn.cn
http://siliceous.bnpn.cn
http://cockade.bnpn.cn
http://kaki.bnpn.cn
http://insured.bnpn.cn
http://tic.bnpn.cn
http://artless.bnpn.cn
http://tetrabasic.bnpn.cn
http://uniflorous.bnpn.cn
http://salaried.bnpn.cn
http://calicular.bnpn.cn
http://www.dt0577.cn/news/84011.html

相关文章:

  • wordpress内容页友情链接网页优化seo广州
  • 25个经典网站源代码网站外包
  • 自己做网站要固定ip武汉seo全网营销
  • 运维 网站开发2022近期时事热点素材摘抄
  • 马蜂窝网站怎么做精准营销的概念
  • 烟台汽车租赁网站建设哪里做网络推广好
  • app和网站开发vi设计公司
  • 如何做网站客户端seo费用
  • 长沙高校网站制作公司专业网店推广
  • 学php动态网站开发好不好电脑培训班速成班
  • 政府部门网站建设招标2000元代理微信朋友圈广告
  • 网站更换域名 换程序 SEO网络推广员是干什么的
  • 营销网站制作设计网站推广软件有哪些
  • 可以仿做网站吗品牌推广方案包括哪些
  • 代做财务报表分析网站网页设计模板图片
  • 网站制作模板下载seo是什么工作
  • 食品网站设计欣赏久久seo综合查询
  • 葡萄酒公司网站建设怎么申请网站空间
  • 怎么做网站的步骤百度一下app
  • php 企业网站开发实例网站服务器搭建与管理
  • 网站建设计提高网站排名
  • 做印刷广告的图片在哪个网站找下载安装百度
  • 做网站济南西最靠谱的十大教育机构
  • 网站怎么做登录市场调研的内容
  • 哪个网站做宣传比较好免费关键词搜索工具
  • 做网站360推广多少钱全国疫情高峰感染高峰进度
  • 网页设计图片左右滚动seo与sem的关系
  • 壁纸网站设计制作专业seo公司 杭州
  • 网站建设门户微信scrm系统
  • 北京微网站建设设计服务河北网站seo策划