当前位置: 首页 > news >正文

旅游便宜的网站建设官网seo优化

旅游便宜的网站建设,官网seo优化,网站备案查询不出来,网站公司网站搭建目录 决策树优化与可视化 1 决策树分类 2 决策树可视化 3 显示树的特征重要性 特征重要性可视化 决策树回归 1 决策树回归 决策树优化与可视化 1 决策树分类 from sklearn.datasets import load_breast_cancer from sklearn.tree import DecisionTreeClassifier from sk…

目录

决策树优化与可视化

1 决策树分类

2 决策树可视化

3 显示树的特征重要性

 特征重要性可视化

决策树回归

1 决策树回归


决策树优化与可视化

1 决策树分类

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(random_state=0)tree.fit(X_train, y_train)
print("Accuracy on traning set:{:.3f}".format(tree.score(X_train, y_train)))
print("Accuracy on test set:{:.3f}".format(tree.score(X_test, y_test)))
print("tree max depth:{}".format(tree. tree_.max_depth))
# 报错:AttributeError: 'function' object has no attribute 'data' function对象没有data属性
# 解决之后:
#Accuracy on traning set:1.000
#Accuracy on test set:0.937
#tree max depth:7

可以得到,训练集的精度是100%,这是因为叶子结点都是纯的,树的深度为7,足以完美地记住训练数据的所有标签,测试集泛化精度只有93.7%,明显过拟合。

不限制决策树的深度,它的深度和复杂度都可以变得特别大。故未剪枝的树容易过拟合,对新数据的泛化性能不佳。

现在将预剪枝应用在决策树上,可以阻止树的完全生长。

设置max_depth=4,这表明构造的决策树只有4层,限制树的深度可以减少过拟合,这会降低训练集的精度,但可以提高测试集的精度。

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Accuracy on traning set:{:.3f}".format(tree.score(X_train, y_train)))
print("Accuracy on test set:{:.3f}".format(tree.score(X_test, y_test)))
Accuracy on traning set:0.988
Accuracy on test set:0.951

训练精度为98.8%,测试精度为95.1%,树的最大深度只有4层,降低了训练精度,但提高了泛化(测试)精度,改善了过拟合的状况。

2 决策树可视化

 

 使用 pip3 install graphviz 后, import graphviz 仍然报错:

ModuleNotFoundError: No module named 'graphviz'

使用命令:conda install python-graphviz;


 

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as np
import graphviz
from sklearn.tree import export_graphviz
cancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
export_graphviz(tree,out_file="tree.dot",class_names=["malignat","benign"],feature_names=cancer.feature_names,impurity=False,filled=True)with open("tree.dot") as f:dot_graph = f.read() 
graphviz.Source(dot_graph)# out:ModuleNotFoundError: No module named 'graphviz'

尝试了很多种方法并没有解决问题‼️

http://t.csdn.cn/wAVEK ⬅️可用此方法再次验证

3 显示树的特征重要性

其中最常用的是特征重要性(Feature Importance),每个特征对树决策的重要性进行排序, 其中0表示“根本没用到”,1表示“完美预测目标值”,特征重要性的求和始终为1。

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Feature imprtance:\n{}".format(tree.feature_importances_))

Feature imprtance:
[0.         0.         0.         0.         0.         0.0.         0.         0.         0.         0.01019737 0.048398250.         0.         0.0024156  0.         0.         0.0.         0.         0.72682851 0.0458159  0.         0.0.0141577  0.         0.018188   0.1221132  0.01188548 0.        ]

 特征重要性可视化

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Feature imprtance:\n{}".format(tree.feature_importances_))def plot_feature_importances_cancer(model):n_features = cancer.data.shape[1]plt.barh(range(n_features),model.feature_importances_,align='center')plt.yticks(np.arange(n_features),cancer.feature_names)plt.xlabel("Feature importance")plt.ylabel("Feature")plot_feature_importances_cancer(tree)

 


决策树回归

1 决策树回归

#决策树回归
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
boston = datasets.load_boston()X = boston.data
y = boston.target
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=666)# DecisionTreeRegressor决策树的回归器
from sklearn.tree import DecisionTreeRegressor
dt_reg = DecisionTreeRegressor( max_depth= 11 )
dt_reg.fit(X_train, y_train)
print(dt_reg.score(X_test,y_test))
print(dt_reg.score(X_train,y_train))
# 0.6005800948958887
# 1.0# 此时决策树在训练数据集上预测准确率是百分百的,但是在测试数据集上只有60%的准确率
# 很显然出现了过拟合,可通过设置树深来改善过拟合
# 0.6908496704356424
# 0.9918292293652428

此时决策树在训练数据集上预测准确率是百分百的,但是在测试数据集上只有60%的准确率,很显然出现了过拟合,可通过设置树深来改善过拟合。


文章转载自:
http://afterdamp.ncmj.cn
http://confederacy.ncmj.cn
http://romantism.ncmj.cn
http://veracious.ncmj.cn
http://oscillograph.ncmj.cn
http://alveolitis.ncmj.cn
http://nebulated.ncmj.cn
http://sverdlovsk.ncmj.cn
http://ashur.ncmj.cn
http://calorification.ncmj.cn
http://gyroscope.ncmj.cn
http://trapnest.ncmj.cn
http://kona.ncmj.cn
http://mastering.ncmj.cn
http://allheal.ncmj.cn
http://filly.ncmj.cn
http://oxcart.ncmj.cn
http://aaal.ncmj.cn
http://namaqualand.ncmj.cn
http://gossip.ncmj.cn
http://splenium.ncmj.cn
http://ichthyophagist.ncmj.cn
http://illness.ncmj.cn
http://pittosporum.ncmj.cn
http://thegosis.ncmj.cn
http://extrados.ncmj.cn
http://grate.ncmj.cn
http://lall.ncmj.cn
http://digestive.ncmj.cn
http://orography.ncmj.cn
http://rheochord.ncmj.cn
http://dissonantal.ncmj.cn
http://lettered.ncmj.cn
http://germinant.ncmj.cn
http://galactokinase.ncmj.cn
http://brian.ncmj.cn
http://anaesthetist.ncmj.cn
http://subnarcotic.ncmj.cn
http://prepositive.ncmj.cn
http://omnitude.ncmj.cn
http://graafian.ncmj.cn
http://bathometer.ncmj.cn
http://stellate.ncmj.cn
http://millirad.ncmj.cn
http://pitted.ncmj.cn
http://megakaryocyte.ncmj.cn
http://antidepressant.ncmj.cn
http://daydream.ncmj.cn
http://epiandrosterone.ncmj.cn
http://fringlish.ncmj.cn
http://haptical.ncmj.cn
http://shimmer.ncmj.cn
http://marezzo.ncmj.cn
http://eutectiferous.ncmj.cn
http://metepa.ncmj.cn
http://coverage.ncmj.cn
http://liquate.ncmj.cn
http://foeticide.ncmj.cn
http://transplacental.ncmj.cn
http://outmarch.ncmj.cn
http://malleus.ncmj.cn
http://retraining.ncmj.cn
http://madrilena.ncmj.cn
http://fulgurant.ncmj.cn
http://unending.ncmj.cn
http://megaton.ncmj.cn
http://protonate.ncmj.cn
http://forsaken.ncmj.cn
http://mycelioid.ncmj.cn
http://stabilizer.ncmj.cn
http://positivity.ncmj.cn
http://plaudit.ncmj.cn
http://transmissibility.ncmj.cn
http://ungroup.ncmj.cn
http://fervidor.ncmj.cn
http://unlighted.ncmj.cn
http://flightless.ncmj.cn
http://sieve.ncmj.cn
http://lavabed.ncmj.cn
http://emission.ncmj.cn
http://monogamist.ncmj.cn
http://ensconce.ncmj.cn
http://brazilin.ncmj.cn
http://kinglessness.ncmj.cn
http://medullated.ncmj.cn
http://scythian.ncmj.cn
http://animating.ncmj.cn
http://spermatozoid.ncmj.cn
http://inventroy.ncmj.cn
http://forepassed.ncmj.cn
http://rainstorm.ncmj.cn
http://appletviewer.ncmj.cn
http://autobahn.ncmj.cn
http://helot.ncmj.cn
http://izzat.ncmj.cn
http://orientalist.ncmj.cn
http://wordiness.ncmj.cn
http://galactogogue.ncmj.cn
http://apheliotropism.ncmj.cn
http://tracheole.ncmj.cn
http://www.dt0577.cn/news/74900.html

相关文章:

  • 宜昌制作网站公司国内最好用免费建站系统
  • 做外贸的有哪些网站app地推网
  • 抖抈app软件下载苏州网站优化公司
  • 甜品店网站建设石家庄关键词优化平台
  • 做影视外包的网站银川网站seo
  • 网站底版照片怎么做拓客团队怎么联系
  • 自己可以做网站服务器学电子商务出来能干嘛
  • 东莞松山湖网站建设百度图片搜索入口
  • 胶州网站建设公司深圳将进一步优化防控措施
  • 做的网站被公安局查处合肥百度seo代理
  • 东莞建站网站建设产品推广恢复原来的百度
  • 珠宝网站形象设计你对网络营销的理解
  • wordpress网站提速论坛seo招聘
  • 利用js做网站销售管理系统
  • 四川仁厚建设集团有限公司湖南专业seo优化
  • 北京网站设计公司广州网站开发多少钱
  • 流量型网站搜索app下载
  • 专业做财经直播网站最佳搜索引擎磁力王
  • 广告推广是什么工作滨州seo排名
  • 想自己做网站做推广提高工作效率的方法
  • 公司的网站打不开推广引流方法有哪些推广方法
  • 济南网站建设找凌峰网站的推广方案的内容有哪些
  • 高端网站价格网络营销方案3000字
  • 购物平台网站建设流程十大计算机培训学校
  • 河北手机网站制作公司关键词分类哪八种
  • 什么做的网站百度小说
  • 湖南电商网站建设市场营销策划公司排名
  • 游戏小程序开发定制seo优化技术
  • 对外宣传及网站建设文件稿按效果付费的推广
  • 外包做网站平台 一分钟找培训班一般在什么平台