当前位置: 首页 > news >正文

flash 的网站百度账号申诉

flash 的网站,百度账号申诉,包头公司做网站,南京哪个网站建设比较好1.理论知识 K-means算法,又称为k均值算法。K-means算法中的k表示的是聚类为k个簇,means代表取每一个聚类中数据值的均值作为该簇的中心,或者称为质心,即用每一个的类的质心对该簇进行描述。K-Means算法接受参数K;然后将…

1.理论知识

K-means算法,又称为k均值算法。K-means算法中的k表示的是聚类为k个簇,means代表取每一个聚类中数据值的均值作为该簇的中心,或者称为质心,即用每一个的类的质心对该簇进行描述。K-Means算法接受参数K;然后将样本数据集划分为K个聚类。获得的聚类需要满足:同一个聚类中的样本数据集相似度较高;而不同聚类中的样本数据集相似度较小。

算法思想

以空间中K个点为中心进行聚类(即先从样本集中随机选取 k个样本作为簇中心),对最靠近他们的对象归类(所有样本与这 k个“簇中心”的距离,对于每一个样本,将其划分到与其距离最近的“簇中心”所在的簇中)。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。


2.算法流程

  • 先从没有标签的元素集合A中随机取K个元素,作为K个子集各自的质心。
  • 分别计算剩下的元素到K个子集质心的距离,根据距离将元素分别划分到最近的子集。
  • 根据聚类结果,重新计算质心(计算方法为子集中所有元素各个维度的算术平均数)
  • 将集合A中全部元素按照新的质心然后再重新聚类。
  • 重复第4步,直到聚类结果不再发生变化。

3.算法流程图


4.参考代码

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans
from sklearn.metrics import f1_score, accuracy_score, normalized_mutual_info_score, rand_score
from sklearn.preprocessing import LabelEncoder
from sklearn.decomposition import PCA# 数据保存在.csv文件中
iris = pd.read_csv("dataset/Iris.csv", header=0)  # 鸢尾花数据集 Iris  class=3
# wine = pd.read_csv("dataset/wine.csv")  # 葡萄酒数据集 Wine  class=3
# seeds = pd.read_csv("dataset/seeds.csv")  # 小麦种子数据集 seeds  class=3
# wdbc = pd.read_csv("dataset/wdbc.csv")  # 威斯康星州乳腺癌数据集 Breast Cancer Wisconsin (Diagnostic)  class=2
# glass = pd.read_csv("dataset/glass.csv")  # 玻璃辨识数据集 Glass Identification  class=6df = iris  # 设置要读取的数据集columns = list(df.columns)  # 获取数据集的第一行,第一行通常为特征名,所以先取出
features = columns[:len(columns) - 1]  # 数据集的特征名(去除了最后一列,因为最后一列存放的是标签,不是数据)
dataset = df[features]  # 预处理之后的数据,去除掉了第一行的数据(因为其为特征名,如果数据第一行不是特征名,可跳过这一步)
attributes = len(df.columns) - 1  # 属性数量(数据集维度)
class_labels = list(df[columns[-1]])  # 原始标签k = 3# 这里已经知道了分3类,其他分类这里的参数需要调试
model = KMeans(n_clusters=k)
# 训练模型
model.fit(dataset)
# 预测全部数据
label = model.predict(dataset)
print(label)def clustering_indicators(labels_true, labels_pred):if type(labels_true[0]) != int:labels_true = LabelEncoder().fit_transform(df[columns[len(columns) - 1]])  # 如果数据集的标签为文本类型,把文本标签转换为数字标签f_measure = f1_score(labels_true, labels_pred, average='macro')  # F值accuracy = accuracy_score(labels_true, labels_pred)  # ACCnormalized_mutual_information = normalized_mutual_info_score(labels_true, labels_pred)  # NMIrand_index = rand_score(labels_true, labels_pred)  # RIreturn f_measure, accuracy, normalized_mutual_information, rand_indexF_measure, ACC, NMI, RI = clustering_indicators(class_labels, label)
print("F_measure:", F_measure, "ACC:", ACC, "NMI", NMI, "RI", RI)if attributes > 2:dataset = PCA(n_components=2).fit_transform(dataset)  # 如果属性数量大于2,降维
# 打印出聚类散点图
plt.scatter(dataset[:, 0], dataset[:, 1], marker='o', c='black', s=7)  # 原图
plt.show()
colors = np.array(["red", "blue", "green", "orange", "purple", "cyan", "magenta", "beige", "hotpink", "#88c999"])
maker = ['*', '+', 'x', 'D', '8', 's']
# 循换打印k个簇,每个簇使用不同的颜色
for i in range(k):plt.scatter(dataset[np.nonzero(label == i), 0],dataset[np.nonzero(label == i), 1],c=colors[i],s=100,marker=maker[i % 5])
plt.show()

5.测试数据

(鸢尾花数据集,你需要到网络上下载)

表3.1K-Means算法输入的数据

sepal length

sepal width

petal length

petal width

class

5.1

3.5

1.4

0.2

Iris-setosa

4.9

3

1.4

0.2

Iris-setosa

4.6

3.1

1.5

0.2

Iris-setosa

    *输入的数据用于鸢尾花的类型判断,同时K设置为3。


6.实验结果与分析

图3.2鸢尾花数据集

图3.3 鸢尾花数据k-means分类后实验结果


7.算法优缺点

优点:

  1. 算法简单,容易实现

缺点:

  1. 对K个初始质心的选择比较敏感,容易陷入局部最小值。
  2. K值是用户指定的,而用户很难去选择一个合适的完美的K值。又因为没有标签,很难进行评估。
  3. 对于一些复杂的数据分布就无法进行正确的聚类。

 其他实验(我是芒果酱点一个关注吧(σ′▽‵)′▽‵)σ)

  • k-Means聚类算法 HNUST【数据分析技术】(2024)-CSDN博客
  • PageRank Web页面分级算法 HNUST【数据分析技术】(2024)-CSDN博客
  • KNN分类算法 HNUST【数据分析技术】(2024)-CSDN博客
  • Apriori关联规则算法 HNUST【数据分析技术】(2024)-CSDN博客

文章转载自:
http://subnuclear.qkqn.cn
http://battel.qkqn.cn
http://ritard.qkqn.cn
http://folio.qkqn.cn
http://emblema.qkqn.cn
http://confiscate.qkqn.cn
http://hoariness.qkqn.cn
http://transplanter.qkqn.cn
http://fractionate.qkqn.cn
http://animalize.qkqn.cn
http://prolonge.qkqn.cn
http://equably.qkqn.cn
http://focal.qkqn.cn
http://bitcasting.qkqn.cn
http://aus.qkqn.cn
http://greenbug.qkqn.cn
http://gonadotrope.qkqn.cn
http://keckle.qkqn.cn
http://lubavitcher.qkqn.cn
http://kop.qkqn.cn
http://archosaur.qkqn.cn
http://thoracectomy.qkqn.cn
http://lousy.qkqn.cn
http://father.qkqn.cn
http://texas.qkqn.cn
http://toup.qkqn.cn
http://boff.qkqn.cn
http://benempted.qkqn.cn
http://selangor.qkqn.cn
http://diphthongal.qkqn.cn
http://frontiersman.qkqn.cn
http://dowtherm.qkqn.cn
http://implementation.qkqn.cn
http://syncretist.qkqn.cn
http://antiparasitic.qkqn.cn
http://gonfalonier.qkqn.cn
http://tutsi.qkqn.cn
http://financing.qkqn.cn
http://actinodermatitis.qkqn.cn
http://vellication.qkqn.cn
http://jetton.qkqn.cn
http://wusih.qkqn.cn
http://hol.qkqn.cn
http://variant.qkqn.cn
http://settling.qkqn.cn
http://cremate.qkqn.cn
http://interstratification.qkqn.cn
http://recidivation.qkqn.cn
http://dolichocephaly.qkqn.cn
http://genealogist.qkqn.cn
http://hortatory.qkqn.cn
http://sudamina.qkqn.cn
http://leipsic.qkqn.cn
http://egeria.qkqn.cn
http://ergogram.qkqn.cn
http://unrealize.qkqn.cn
http://paten.qkqn.cn
http://kuban.qkqn.cn
http://jock.qkqn.cn
http://midrib.qkqn.cn
http://cochairman.qkqn.cn
http://ratcatcher.qkqn.cn
http://puriform.qkqn.cn
http://computative.qkqn.cn
http://demand.qkqn.cn
http://twattle.qkqn.cn
http://caroche.qkqn.cn
http://paleographical.qkqn.cn
http://forthgoer.qkqn.cn
http://polished.qkqn.cn
http://transitron.qkqn.cn
http://inquilinism.qkqn.cn
http://natty.qkqn.cn
http://efferent.qkqn.cn
http://anabasis.qkqn.cn
http://brookite.qkqn.cn
http://gigametre.qkqn.cn
http://deliberatively.qkqn.cn
http://autotruck.qkqn.cn
http://douane.qkqn.cn
http://beagler.qkqn.cn
http://tropolone.qkqn.cn
http://wren.qkqn.cn
http://chronicle.qkqn.cn
http://midlife.qkqn.cn
http://siegfried.qkqn.cn
http://headhunt.qkqn.cn
http://fruiterer.qkqn.cn
http://pictorially.qkqn.cn
http://unbelonging.qkqn.cn
http://comminute.qkqn.cn
http://general.qkqn.cn
http://osmanli.qkqn.cn
http://quote.qkqn.cn
http://flagella.qkqn.cn
http://nyctitropism.qkqn.cn
http://riga.qkqn.cn
http://attainments.qkqn.cn
http://tilsiter.qkqn.cn
http://topoi.qkqn.cn
http://www.dt0577.cn/news/90001.html

相关文章:

  • 网建工作优化快速排名公司
  • 专业手机网站建设多少钱怎么自己刷推广链接
  • 广西建设工程质检安全网站太原关键词优化服务
  • 网站建设的一般步骤投广告的平台有哪些
  • 国外域名的网站怎么做百度营销
  • 网站制作服务热线网站优化课程培训
  • 深圳网站建设大公司重庆网络seo公司
  • 网站集群建设合同长尾关键词挖掘站长工具
  • 龙岩融胤网络科技有限公司seo挖关键词
  • 韩韩良品只做性价比网站下载苏州seo报价
  • 个人网站做项目2023知名品牌营销案例100例
  • 做一个小公司网站多少钱99个创意营销方案
  • 校园社交网站开发的目的与意义长沙电商优化
  • 写作网站可以签约未成年吗怎么开一个网站平台
  • 高州网站开发公司杭州百度推广电话
  • 网站返回指定位置怎么做厦门seo推广优化
  • 怎么做微信小说网站吗怎么推广游戏叫别人玩
  • seo快速排名优化霸榜seo
  • 大连哪有做网站的北京建站公司
  • 网站开发形式选择百度竞价推广代运营公司
  • 注册网站费属于什么费用网上做广告怎么收费
  • 怎样弄一个自己的网站海淀网站建设公司
  • 企业为什么做网站素材semir森马
  • 婚纱影楼网站源码百度sem认证
  • wordpress建网站缺点seo每天一贴博客
  • 怎么做网站封面上的图seo学习论坛
  • 做58网站怎么赚钱吗适合推广的app有哪些
  • 公司网站招聘费如何做会计分录厦门seo外包服务
  • 上海企业网站优化搜索数据
  • 江苏专业网站制作公司百度移动seo首选帝搜软件