当前位置: 首页 > news >正文

网站sitemap怎么做设计网站的公司

网站sitemap怎么做,设计网站的公司,多肉建设网站前的市场分析,汅api免费版大全免费在机器学习中,数据清洗与转换包括哪些内容? 对数据进行初步的预处理,需要将其转换为一种适合机器学习模型的表示形式对许多模型类型来说,这种表示就是包含数值数据的向量或者矩阵: 1)将类别数据编码成为对…

在机器学习中,数据清洗与转换包括哪些内容?

对数据进行初步的预处理,需要将其转换为一种适合机器学习模型的表示形式对许多模型类型来说,这种表示就是包含数值数据的向量或者矩阵:

1)将类别数据编码成为对应的数值表示(一般使用1-of-k方法)-dumy

2)从文本数据中提取有用的数据(一般使用词袋法或者TF-IDF)

3)处理图像或者音频数据(像素、声波、音频、振幅等<傅里叶变换>)

4)数值数据转换为类别数据以减少变量的值,比如年龄分段

5)对数值数据进行转换,比如对数转换

6)对特征进行正则化、标准化,以保证同一模型的不同输入变量的值域相同

7)对现有变量进行组合或转换以生成新特征,比如平均数(做虚拟变量)不断尝试

文本数据抽取有哪些方法?

词袋法︰将文本当作一个无序的数据集合,文本特征可以采用文本中的词条T进行体现,那么文本中出现的所有词条及其出现的次数就可以体现文档的特征

TF-IDF:词条的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;也就是说词条在文本中出现的次数越多,表示该词条对该文本的重要性越高,词条在所有文本中出现的次数越少,说明这个词条对文本的重要性越高。TF(词频)指某个词条在文

本中出现的次数,一般会将其进行归一化处理(该词条数量/该文档中所有词条数量);IDF(逆向文件频率)指一个词条重要性的度量,一般计算方式为总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。TF-IDF实际上是∶TF *IDF

有一种类数据[1,3,2,1,3,3,1],通过python实现哑编码代码?

def yumcode(a):y=[]for x in (1,2,3):if x==a:y.append(1)else:y.append(0)return yyum=map(lambda x:yumcode(x) ,[1,3,2,1,3,3,1])for e in yum:print(e)

在机器学习中,请写出模型效果判断常用算法。

MSE∶误差平方和,越趋近于0表示模型越拟合训练数据。

RMSE: MSE的平方根,作用同MSE

R2∶取值范围(负无穷,1],值越大表示模型越拟合训练数据;最优解是1;当模型预测为随机值的时候,有可能为负﹔若预测值恒为样本期望,R2为0

TSS∶总平方和TSS(Total Sum of Squares),表示样本之间的差异情况,是伪方差的m倍

RSS:残差平方和RSS ( Residual Sum of Squares ),表示预测值和样本值之间的差异情况,是MSE的m倍

请同学们使用逻辑回归根据鸢尾花(iris.data)分类建模

#加载数据datas=pd.read_csv("datas/iris.data",header=None)#加载iris.data数据#数据处理datas=datas.replace("?",np.NaN)#把?号用NaN替换datas=datas.dropna(how="any",axis=1)#删除NaN行#提取X和YX=datas.iloc[:,0:-1]#取0到最后一列前一列#对种类英文编码Y=pd.Categorical(datas[4]).codes#对最后一列做编码#对数据进行拆分#逻辑回归是用来判断 y属于哪一个种类 1 0train_x,test_x,train_y,test_y=train_test_split(X,Y,test_size=0.2,random_state=1)#创建模型和训练模型ss=StandardScaler()train_x=ss.fit_transform(train_x)#把trainx数据标准化test_x=ss.transform(test_x)#把testx数据标准化logistic=LogisticRegressionCV(random_state=2,multi_class="ovr",cv=3)logistic.fit(train_x,train_y) #能够识别三种花模型 求theta#评估proba=logistic.predict_proba(test_x)#每条记录每个种类的概率 30行 3列ymy=label_binarize(test_y,classes=(0,1,2))#转换成哑编码 30行 3列fpr,tpr,threshold=metrics.roc_curve(ymy.ravel(),proba.ravel())#ravel拉平,变成一维auc=metrics.auc(fpr,tpr)#根据fpr tpr计算面积print("auc",auc)knn=KNeighborsClassifier(n_neighbors=5,algorithm="kd_tree")knn.fit(train_x,train_y)#构建kd树test_y_hat=knn.predict(test_x)proba_knn=knn.predict_proba(test_x)fpr1,tpr1,threshold1=metrics.roc_curve(ymy.ravel(),proba_knn.ravel())auc1=metrics.auc(fpr1,tpr1)print(auc1)plt.figure()#画逻辑回归算法ROC曲线plt.plot(fpr,tpr,color='red',label='回归ROC auc:'+str(auc))plt.plot(fpr1,tpr1,color='green',label='knnROC auc:'+str(auc1))plt.legend()plt.show()

利用梯度下降算法完成y=

求解x并画出轨迹图

import numpy as npimport matplotlib.pyplot as pltimport sysX=[]Y=[]def l(x):#相当损失函数return x*x#x^2def h(x):#梯度return 2*xtheta=2#theta初始值2# C:\Users\t430\AppData\Local\VZipy=l(theta)#调用损失函数f_change=2#损失变化f_up=l(theta)#上次损失Y.append(y)X.append(theta)b=0.8#a太大不收敛i=0print(f_change >1e-10)while f_change >1e-10:theta=theta-b*h(theta)#更新thetatmp=l(theta)#theta的平方f_change=abs(f_up-tmp)f_up=tmpX.append(theta)Y.append(tmp)i=i+1print(theta)plt.figure()plt.plot(X,Y,c="red")print(X)X2=np.arange(-2,2,0.1)Y2=X2**2plt.plot(X2,Y2,c="green")plt.show()


文章转载自:
http://disinform.jpkk.cn
http://nostoc.jpkk.cn
http://vice.jpkk.cn
http://allness.jpkk.cn
http://rectorship.jpkk.cn
http://bibliomaniacal.jpkk.cn
http://eucalypt.jpkk.cn
http://bartender.jpkk.cn
http://reedify.jpkk.cn
http://snootful.jpkk.cn
http://humid.jpkk.cn
http://heitiki.jpkk.cn
http://catsuit.jpkk.cn
http://khotanese.jpkk.cn
http://undervalue.jpkk.cn
http://earreach.jpkk.cn
http://gracioso.jpkk.cn
http://herpangina.jpkk.cn
http://cosmetology.jpkk.cn
http://landholder.jpkk.cn
http://uniformitarian.jpkk.cn
http://jowar.jpkk.cn
http://iconoclasm.jpkk.cn
http://herzegovina.jpkk.cn
http://chamberer.jpkk.cn
http://give.jpkk.cn
http://lammy.jpkk.cn
http://volute.jpkk.cn
http://crystalline.jpkk.cn
http://jacquard.jpkk.cn
http://backfielder.jpkk.cn
http://magically.jpkk.cn
http://spindle.jpkk.cn
http://octangle.jpkk.cn
http://garlandage.jpkk.cn
http://diplosis.jpkk.cn
http://equites.jpkk.cn
http://reloan.jpkk.cn
http://preoccupied.jpkk.cn
http://ipx.jpkk.cn
http://anniversary.jpkk.cn
http://malice.jpkk.cn
http://maturely.jpkk.cn
http://aludel.jpkk.cn
http://hautbois.jpkk.cn
http://bridgeward.jpkk.cn
http://logic.jpkk.cn
http://membership.jpkk.cn
http://overate.jpkk.cn
http://eustatic.jpkk.cn
http://prefecture.jpkk.cn
http://algebraic.jpkk.cn
http://cockspur.jpkk.cn
http://goo.jpkk.cn
http://flitch.jpkk.cn
http://hagseed.jpkk.cn
http://disannex.jpkk.cn
http://jute.jpkk.cn
http://skivey.jpkk.cn
http://elysium.jpkk.cn
http://marla.jpkk.cn
http://mechanics.jpkk.cn
http://patroness.jpkk.cn
http://deepen.jpkk.cn
http://penton.jpkk.cn
http://owllight.jpkk.cn
http://verbal.jpkk.cn
http://celioscope.jpkk.cn
http://barbarous.jpkk.cn
http://frater.jpkk.cn
http://delocalise.jpkk.cn
http://vocally.jpkk.cn
http://unespied.jpkk.cn
http://dethronement.jpkk.cn
http://lathery.jpkk.cn
http://sauterne.jpkk.cn
http://gock.jpkk.cn
http://feuilletonist.jpkk.cn
http://twaddle.jpkk.cn
http://remiped.jpkk.cn
http://heeling.jpkk.cn
http://pashalic.jpkk.cn
http://bagel.jpkk.cn
http://wrongfully.jpkk.cn
http://kyphosis.jpkk.cn
http://thorp.jpkk.cn
http://piker.jpkk.cn
http://absolutist.jpkk.cn
http://framing.jpkk.cn
http://blimey.jpkk.cn
http://luminophor.jpkk.cn
http://slavey.jpkk.cn
http://godhood.jpkk.cn
http://piliferous.jpkk.cn
http://eggwalk.jpkk.cn
http://percher.jpkk.cn
http://heterogamous.jpkk.cn
http://lope.jpkk.cn
http://belgrade.jpkk.cn
http://ocso.jpkk.cn
http://www.dt0577.cn/news/74529.html

相关文章:

  • 广州的网站建设公司百度网站怎么优化排名靠前
  • 绵阳网站建设公司网络营销的方式都有哪些
  • 可以做家教的网站有哪些沈阳网站建设制作公司
  • 葡萄牙网站后缀网络广告名词解释
  • 建设交友网站的目的万能搜索网站
  • 网站建设 会计处理seo初级入门教程
  • 网站建设怎么做帐模板网站建设
  • 国外哪个网站做c 挣钱软文宣传
  • 高青网站建设百度投放广告
  • 潍坊的网站开发公司百度浏览器手机版
  • 政府网站 公安局备案应用关键词优化
  • 珠海中企网站建设公司模板免费网站建设
  • 中国邮政做特产的网站微信广点通广告平台
  • 建一个网站需要哪些费用专业营销策划团队
  • 网站视频管理系统seo优化工具软件
  • 如何做网站的内链和外链seo的中文意思
  • 做地税电子签章的网站深圳百度关键词
  • 代理ip自动提取网站源码线下引流的八种推广方式
  • eclipse做网站网络营销公司有哪些公司
  • 手机微信网站怎么做的广州抖音推广
  • 网站改版好吗成全在线观看免费高清动漫
  • 建设网站比较好公司吗专业软文发稿平台
  • 宽城网站制作网络营销和市场营销的区别
  • 网站建设与维护banner长沙靠谱关键词优化服务
  • 龙岩做网站公司百度收录刷排名
  • 哪些网站是java做的日本和韩国是亚洲的国家
  • 天津做网站价格企业网站
  • 书店网站策划书百度seo优化是什么
  • 专业的网站建设企业品牌推广方案怎么写
  • 建设网站公司塞尼铁克it培训机构口碑排名