当前位置: 首页 > news >正文

美食网站策划书百度关键词seo推广

美食网站策划书,百度关键词seo推广,软件开发培训班有哪些,营销型网站的例子基于论文摘要的文本分类与关键词抽取挑战赛​​​​​​2023 iFLYTEK A.I.开发者大赛-讯飞开放平台 环境需求:Anaconda-JupyterNotebook,或者百度AIStudio 赛题解析: 【文本二分类任务】根据论文摘要等信息理解,将论文划分为0-1两…

基于论文摘要的文本分类与关键词抽取挑战赛
​​​​​​2023 iFLYTEK A.I.开发者大赛-讯飞开放平台

环境需求:Anaconda-JupyterNotebook,或者百度AIStudio

赛题解析:

【文本二分类任务】根据论文摘要等信息理解,将论文划分为0-1两类别之一。
【文本关键词识别任务】从给定的论文中识别和提取出与论文内容相关的关键词。

数据样例:title、author、Abstract、Keywords、[label] 0-1

一键运行的时候先把csv删了(是运行结果)

安装nltk【更换镜像源避免安装出错】

!pip install nltk -i http://mirrors.aliyun.com/pypi/simple/  --trusted-host mirrors.aliyun.com
# 导入pandas用于读取表格数据
import pandas as pd# 导入BOW(词袋模型)
from sklearn.feature_extraction.text import CountVectorizer
#可以替换为TfidfVectorizer(TF-IDF(词频-逆文档频率))
#注意上下文要同时修改,亲测后者效果更佳# 导入LogisticRegression回归模型
from sklearn.linear_model import LogisticRegression# 过滤警告消息
from warnings import simplefilter
from sklearn.exceptions import ConvergenceWarning
simplefilter("ignore", category=ConvergenceWarning)# 读取数据集
train = pd.read_csv('/home/aistudio/data/data231041/train.csv')
train['title'] = train['title'].fillna('')
train['abstract'] = train['abstract'].fillna('')test = pd.read_csv('/home/aistudio/data/data231041/testB.csv')
test['title'] = test['title'].fillna('')
test['abstract'] = test['abstract'].fillna('')# 提取文本特征,生成训练集与测试集
train['text'] = train['title'].fillna('') + ' ' +  train['author'].fillna('') + ' ' + train['abstract'].fillna('')+ ' ' + train['Keywords'].fillna('')
test['text'] = test['title'].fillna('') + ' ' +  test['author'].fillna('') + ' ' + test['abstract'].fillna('')vector = CountVectorizer().fit(train['text'])
train_vector = vector.transform(train['text'])
test_vector = vector.transform(test['text'])# 引入模型
model = LogisticRegression()# 开始训练,这里可以考虑修改默认的batch_size与epoch来取得更好的效果
model.fit(train_vector, train['label'])# 利用模型对测试集label标签进行预测
test['label'] = model.predict(test_vector)
test['Keywords'] = test['title'].fillna('')
test[['uuid','Keywords','label']].to_csv('submit_task1.csv', index=None)

ndarray.finall()方法:填充空值

pandas数据处理常用命令_ndarray fillna_hellosc01的博客-CSDN博客

Basedline的方法:BOW词袋提取特征-LR逻辑回归-进行预测

改进方法:TF-IDF,SVM,epoches

# TfidfVectorizer(TF-IDF(词频-逆文档频率))
from sklearn.feature_extraction.text import TfidfVectorizer
# 导入支持向量机分类器
from sklearn.svm import SVC#创建SVM训练模型 
model = SVC(kernel='linear', C=1)# 利用模型对测试集label标签进行预测
test['label'] = model.predict(test_vector)
test['Keywords'] = test['title'].fillna('')
test[['uuid','Keywords','label']].to_csv('submit_task2.csv', index=None)

by ライト

http://www.dt0577.cn/news/16753.html

相关文章:

  • 开发网站的好处网站流量分析工具
  • 阿里云怎么上传网站东莞网站建设推广哪家好
  • 青海省政府网站建设seo排名平台
  • vs做网站头部的代码自己建立网站步骤
  • 移动端网站建设的方案免费推广平台哪些比较好
  • 网络公司网站设计维护合同谷歌浏览器下载安卓版
  • win 搭建wordpress如何做网站优化seo
  • 网站如何进行网络推广百度云盘网官网
  • 网站css不调用了贵阳百度seo点击软件
  • 中山民众网站建设端口扫描站长工具
  • 木木科技 网站艰涩上海百度搜索优化
  • 玉泉营网站建设百度集团公司简介
  • 织梦cms做网站流程世界杯数据分析
  • WordPress为啥这么慢seo在线培训机构
  • 济南网站建站模板百度关键词搜索量
  • 武汉教育网站下载微信
  • 凡科网站怎么做建站做网络推广
  • 海北公司网站建设价格低抖音seo代理
  • 江苏省职业建设注册管理中心网站培训机构还能开吗
  • 推广普通话作文搜索引擎优化方法总结
  • 沧州wap网站制作教育培训机构推荐
  • 网站建设的论文的参考文献外链群发平台
  • 长沙求职网招聘网郑州粒米seo顾问
  • wordpress鱼seo搜索是什么
  • 网站查询真伪信息流推广主要具有哪两大优势
  • 做网站的首页下拉列表免费制作永久个人网站
  • 顺德网站建设代理商app地推接单平台有哪些
  • app运营站长工具seo综合查询访问
  • 工作证明怎么弄seo一般包括哪些内容
  • 自己做网站代码网上推广app