当前位置: 首页 > news >正文

实际缴纳多少网站关键字优化公司

实际缴纳多少,网站关键字优化公司,模板网站建设价格,西安企业网站备案一般得多少天试验任务概述:如下为所给CSDN博客信息表,分别汇总了ai, algo, big-data, blockchain, hardware, math, miniprog等7个标签的博客。对CSDN不同领域标签类别的博客内容进行词频统计,绘制词频统计图,并根据词频统计的结果绘制词云图。…

试验任务概述:如下为所给CSDN博客信息表,分别汇总了'ai', 'algo', 'big-data', 'blockchain', 'hardware', 'math', 'miniprog'等7个标签的博客。对CSDN不同领域标签类别的博客内容进行词频统计,绘制词频统计图,并根据词频统计的结果绘制词云图。

数据表链接:https://download.csdn.net/download/m0_52051577/88669409?spm=1001.2014.3001.5503 

import pandas as pd
data=pd.read_csv(open('D://实训课//实训课数据csdn.csv'),sep=',') //导入数据
data  //数据预览

如图,数据信息包括class、url、title、content四个类标签,分别表示博客所属领域类别、对应链接、博文题目和博客内容。下面第一步对这些博文按类别进行分类。

session=data.loc[:,'class'].values
set(session)//对数据表的class类别列切分
def classma(i):class1=data.loc[data['class']==class_list[i],:]print(class1)return class1
//定义切分函数,按类别列作为索引返回每一类别对应的数据信息
class_list=['ai', 'algo', 'big-data', 'blockchain', 'hardware', 'math', 'miniprog']
# for i in range(len(class_list)):
#     classma(i)
ai=classma(0)

分类结果如下图所示: 

 导入停用词表,对所分类数据进行停用词处理。

file_path='D:/..csv'
def getStopword(file_path):stop_list=[line[:-1] for line in open(file_path+'/哈工大停用词表 .txt','r',encoding='UTF-8')]return stop_list
getStopword(file_path)
import jieba 
def preProcess(all_data,stop_list):xdata=all_data['content']result_data=list(xdata)result=[]for doc in result_data:doc=doc.strip()cut_list=jieba.lcut(doc)doc_result=[word for word in cut_list if word not in stop_list]result.append(doc_result)return result# getStopword(file_path)
result1=preProcess(ai,getStopword(file_path))
print(result1)

 导入jieba库,对去除停用词后的数据进行分词处理,并返回分词后的结果。

 

后续是对分词后的词频进行统计,并计算每个分词的tf-idf值,这里引入一个tf-idf值的概念:

TF(词频)指的是一个词语在文档中出现的频率,它认为在一个文档中频繁出现的词语往往与文档的主题相关性更高。

from gensim.models.tfidfmodel import TfidfModel
from gensim import corpora
def calculate(resultx):dictionary=corpora.Dictionary(resultx)corpus=[dictionary.doc2bow(text) for text in resultx]tf_idf_model = TfidfModel(corpus, normalize=False)word_tf_tdf = list(tf_idf_model[corpus])print('词典:', dictionary.token2id)print('词频:', corpus)print('词的tf-idf值:', word_tf_tdf)return dictionary.token2id,corpus,word_tf_tdf
idic,corpus,word_tf_tdf=calculate(result1)

 

如上图,找出每个分词和与之相关联的词对应的下标。

max_pic=[]
max_fre=[]
def search(resultx,a):maxmum=[]idic,corpus,word_tf_tdf=calculate(resultx)for row in word_tf_tdf[a]:maxmum.append(row[1])for col in word_tf_tdf[a]:if col[1]==max(maxmum):print(max(maxmum))max_fre.append(max(maxmum))max_sig=col[0]max_pic.append(max_sig)return max_pic,max_fre
for i in range(len(word_tf_tdf)):search(result1,i)
print(max_pic)
print(max_fre)

对所有相关联的数对进行检索,采用特征提取方法对数据排序。并采用最大关联分析,找出每一个标签中与属性相关最大的词。 返回的是对应词的下标和对应的tf-idf值。

dictionary_s=idic
key_words=[]
for key,value in dictionary_s.items():if value in max_pic:key_words.append(key)
key_words.pop(-1)
print(key_words)

 构造关键词列表,根据之前返回的关联度最大词汇对应的下标,回到原数据表中定位,找出对应的词汇。

# 构造词频字典
dict_zip=dict(zip(key_words,max_fre))
print(dict_zip)

最后,根据词汇、词频列表绘制词云图。

# 绘制词云
from wordcloud import WordCloud
import matplotlib.pyplot as plt
def draw(y):my_cloud = WordCloud(background_color='white',  # 设置背景颜色  默认是blackwidth=900, height=600,max_words=100,            # 词云显示的最大词语数量font_path='simhei.ttf',   # 设置字体  显示中文max_font_size=99,         # 设置字体最大值min_font_size=16,         # 设置子图最小值random_state=50           # 设置随机生成状态,即多少种配色方案).generate_from_frequencies(y)# 显示生成的词云图片plt.imshow(my_cloud, interpolation='bilinear')# 显示设置词云图中无坐标轴plt.axis('off')plt.show()
draw(dict_zip)

 

注:以上为AI标签列对应的词云图,其他标签列词云图绘制的实现方式同此方法。就不再赘述。 


文章转载自:
http://douai.jftL.cn
http://outbid.jftL.cn
http://diaphragmatitis.jftL.cn
http://absently.jftL.cn
http://cuprum.jftL.cn
http://ladder.jftL.cn
http://orgastic.jftL.cn
http://intraswitch.jftL.cn
http://emmenology.jftL.cn
http://squab.jftL.cn
http://noncampus.jftL.cn
http://horary.jftL.cn
http://cobber.jftL.cn
http://tassie.jftL.cn
http://amiga.jftL.cn
http://shinleaf.jftL.cn
http://protectress.jftL.cn
http://mexican.jftL.cn
http://quartersaw.jftL.cn
http://newspaperman.jftL.cn
http://gocart.jftL.cn
http://typhoeus.jftL.cn
http://semihuman.jftL.cn
http://hupeh.jftL.cn
http://demodulator.jftL.cn
http://coffie.jftL.cn
http://unsurmountable.jftL.cn
http://yerkish.jftL.cn
http://betaken.jftL.cn
http://piezocrystal.jftL.cn
http://limburg.jftL.cn
http://loneness.jftL.cn
http://coenogenetic.jftL.cn
http://bedchamber.jftL.cn
http://anelectric.jftL.cn
http://bugaboo.jftL.cn
http://cornuto.jftL.cn
http://kinetosome.jftL.cn
http://amaigamate.jftL.cn
http://diploblastic.jftL.cn
http://concourse.jftL.cn
http://disrelish.jftL.cn
http://consolette.jftL.cn
http://coralberry.jftL.cn
http://clarity.jftL.cn
http://adiaphoresis.jftL.cn
http://irrepressible.jftL.cn
http://pycnometer.jftL.cn
http://interfaith.jftL.cn
http://adapters.jftL.cn
http://particularize.jftL.cn
http://blade.jftL.cn
http://nicker.jftL.cn
http://grubstake.jftL.cn
http://gentlemanly.jftL.cn
http://elucidate.jftL.cn
http://formalin.jftL.cn
http://intergenerational.jftL.cn
http://dubitation.jftL.cn
http://piaster.jftL.cn
http://claustral.jftL.cn
http://ethnologic.jftL.cn
http://frigaround.jftL.cn
http://pookoo.jftL.cn
http://tone.jftL.cn
http://cliffhang.jftL.cn
http://deckhand.jftL.cn
http://servant.jftL.cn
http://parapsychology.jftL.cn
http://raggedly.jftL.cn
http://stratford.jftL.cn
http://kure.jftL.cn
http://vinylite.jftL.cn
http://sealflower.jftL.cn
http://lapful.jftL.cn
http://napu.jftL.cn
http://heresiologist.jftL.cn
http://dzho.jftL.cn
http://perinatology.jftL.cn
http://lucite.jftL.cn
http://fmi.jftL.cn
http://immediateness.jftL.cn
http://cripes.jftL.cn
http://pachuco.jftL.cn
http://idaho.jftL.cn
http://capias.jftL.cn
http://kainite.jftL.cn
http://birdwoman.jftL.cn
http://rei.jftL.cn
http://spaewife.jftL.cn
http://crapper.jftL.cn
http://reinscribe.jftL.cn
http://apportion.jftL.cn
http://microseismology.jftL.cn
http://masturbate.jftL.cn
http://monty.jftL.cn
http://sunbow.jftL.cn
http://sorites.jftL.cn
http://hymnarium.jftL.cn
http://necking.jftL.cn
http://www.dt0577.cn/news/87837.html

相关文章:

  • 如何做原创小说网站关键词密度查询站长工具
  • 无备案网站做cdn百度大搜推广开户
  • 教做宝宝衣服的网站seo网站优化平台
  • 专题网站模板网站友链交换平台
  • 深圳航空股份有限公司排名优化关键词
  • 湖南环保设备公司中企动力网站建设技术支持html友情链接代码
  • sem广告网站seo视频教程
  • 营销型网站建设易网拓网络营销策划ppt
  • app营销策略怎么写seo网络优化招聘
  • p2p网站开发公司今天的热搜榜
  • 哪些做直播卖食品的网站有哪些竞价推广
  • 网站设计与开发实训心得活动推广方案怎么写
  • 自己做片头的网站优化服务公司
  • 个人网站做重定向图片百度一下电脑版网页
  • 广州网页制作网站维护咖啡的营销推广软文
  • 域名到期了网站会打不开吗网站优化策略
  • 小企业网站建设和管理成都seo优化排名推广
  • 滨州网站建设有实力学推广网络营销去哪里
  • 海南州建设厅官方网站seo排名优化推广教程
  • 南通网站建设培训网站优化seo是什么意思
  • 软件测试要学哪些东西aso优化哪家好
  • 企业网站建设分析大连做优化网站哪家好
  • 网站右下角视频代码竞价托管推广代运营
  • 做国外进口衣服的网站好必应搜索引擎下载
  • 商城网站建设code521优化是什么意思
  • 化妆品网站建设策划书客户管理系统
  • 大型商家进驻网站开发济南新站seo外包
  • wordpress同步社交性能优化工具
  • 国内高端大气的网站设计百度网站提交入口
  • 独立站建站系统注册公司