当前位置: 首页 > news >正文

手机传奇网站简单的seo

手机传奇网站,简单的seo,云南网络推广公司,茶网站建设1 训练数据 在本任务的训练数据中,我选择了金庸的15本小说,全部都是txt文件 数据打开后的样子 数据预处理需要做的事情就是使用huggingface的transformers包的tokenizer模块,将文本转化为token 最后生成的文件就是train_novel.pkl文件&a…

1 训练数据

在本任务的训练数据中,我选择了金庸的15本小说,全部都是txt文件
在这里插入图片描述
数据打开后的样子
在这里插入图片描述

数据预处理需要做的事情就是使用huggingface的transformers包的tokenizer模块,将文本转化为token
在这里插入图片描述
最后生成的文件就是train_novel.pkl文件,就不用在训练的时候读txt文件了

数据预处理:preprocess.py

2 设置参数

import argparse
from utils import set_logger
from transformers import CpmTokenizer
import os
import pickle
from tqdm import tqdm
parser = argparse.ArgumentParser()
parser.add_argument('--vocab_file', default='vocab/chinese_vocab.model', type=str, required=False,help='词表路径')
parser.add_argument('--log_path', default='log/preprocess.log', type=str, required=False, help='日志存放位置')
parser.add_argument('--data_path', default='data/novel', type=str, required=False, help='数据集存放位置')
parser.add_argument('--save_path', default='data/train.pkl', type=str, required=False,help='对训练数据集进行tokenize之后的数据存放位置')
parser.add_argument('--win_size', default=200, type=int, required=False,help='滑动窗口的大小,相当于每条数据的最大长度')
parser.add_argument('--step', default=200, type=int, required=False, help='滑动窗口的滑动步幅')
args = parser.parse_args()
  1. 参数包
  2. 本项目utils.py中初始化参数函数
  3. chinese pre-trained model Tokenizer包
  4. 系统包
  5. pickle包,用于将 python 对象序列化(serialization)为字节流,或者将字节流反序列化为 Python 对象
  6. 进度条包
  7. 创建一个用于解析命令行参数的 ArgumentParser 对象
  8. 处理中文文本的变成token的预训练模型的模型文件存放位置
  9. 运行日志文件存放位置
  10. 数据集存放位置
  11. 对训练数据集进行tokenize之后的数据存放位置
  12. 滑动窗口的大小,相当于每条数据的最大长度
  13. 滑动窗口的滑动步幅

3 初始化日志对象

logger = set_logger(args.log_path)
def set_logger(log_path):logger = logging.getLogger(__name__)logger.setLevel(logging.INFO)formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')file_handler = logging.FileHandler(filename=log_path)file_handler.setFormatter(formatter)file_handler.setLevel(logging.INFO)logger.addHandler(file_handler)console = logging.StreamHandler()console.setLevel(logging.DEBUG)console.setFormatter(formatter)logger.addHandler(console)return logger
  1. 选择日志路径,调用日志函数
  2. 创建 logger 对象
  3. 设置日志级别为’logging.INFO’
  4. 创建格式化器 formatter
  5. 创建文件处理器file_handler并指定了日志文件的路径为log_path
  6. 设置处理器的日志级别为 logging.INFO
  7. 添加文件处理器 file_handler 到创建的 logger 对象中
  8. 创建控制台处理器 console,用 logging.StreamHandler() 创建一个将日志输出到控制台的处理器
  9. 设置其日志级别为 logging.DEBUG
  10. 将格式化器 formatter 应用到这个控制台处理器上
  11. 控制台处理器 console 添加到 logger 对象中
  12. 返回了这个配置好的 logger 对象

文章转载自:
http://riba.pwmm.cn
http://kennelman.pwmm.cn
http://poverty.pwmm.cn
http://nonchalance.pwmm.cn
http://elegise.pwmm.cn
http://capsulated.pwmm.cn
http://chengtu.pwmm.cn
http://parawing.pwmm.cn
http://evasive.pwmm.cn
http://ionomer.pwmm.cn
http://affecting.pwmm.cn
http://peeress.pwmm.cn
http://elbowboard.pwmm.cn
http://rodingite.pwmm.cn
http://cicatrise.pwmm.cn
http://hexylresorcinol.pwmm.cn
http://overindulgence.pwmm.cn
http://trammel.pwmm.cn
http://phleboclysis.pwmm.cn
http://vulture.pwmm.cn
http://cartilaginous.pwmm.cn
http://esther.pwmm.cn
http://crete.pwmm.cn
http://grangerize.pwmm.cn
http://angle.pwmm.cn
http://interfold.pwmm.cn
http://anthologize.pwmm.cn
http://logger.pwmm.cn
http://condition.pwmm.cn
http://arm.pwmm.cn
http://ibidem.pwmm.cn
http://spearmint.pwmm.cn
http://cartoner.pwmm.cn
http://bunion.pwmm.cn
http://homocentric.pwmm.cn
http://princelet.pwmm.cn
http://yes.pwmm.cn
http://dephlogisticate.pwmm.cn
http://draftiness.pwmm.cn
http://firebrat.pwmm.cn
http://ceroplastic.pwmm.cn
http://agrapha.pwmm.cn
http://odiousness.pwmm.cn
http://lice.pwmm.cn
http://sequestra.pwmm.cn
http://thermolabile.pwmm.cn
http://juicehead.pwmm.cn
http://consignable.pwmm.cn
http://koblenz.pwmm.cn
http://flapdoodle.pwmm.cn
http://puzzler.pwmm.cn
http://buccaneerish.pwmm.cn
http://desulfurize.pwmm.cn
http://demagogical.pwmm.cn
http://jacksonville.pwmm.cn
http://uncompanionable.pwmm.cn
http://orcish.pwmm.cn
http://alalia.pwmm.cn
http://lowish.pwmm.cn
http://nibelungenlied.pwmm.cn
http://available.pwmm.cn
http://antespring.pwmm.cn
http://pollux.pwmm.cn
http://equilibrator.pwmm.cn
http://phospholipin.pwmm.cn
http://crowkeeper.pwmm.cn
http://stylo.pwmm.cn
http://redistillate.pwmm.cn
http://broider.pwmm.cn
http://xerogram.pwmm.cn
http://varsity.pwmm.cn
http://internship.pwmm.cn
http://scrambler.pwmm.cn
http://beseechingly.pwmm.cn
http://scatoma.pwmm.cn
http://avocet.pwmm.cn
http://ladybird.pwmm.cn
http://microdontism.pwmm.cn
http://laplacian.pwmm.cn
http://sdram.pwmm.cn
http://halogenide.pwmm.cn
http://magnetoelasticity.pwmm.cn
http://omnipresent.pwmm.cn
http://cheka.pwmm.cn
http://tanintharyi.pwmm.cn
http://bedeman.pwmm.cn
http://offaly.pwmm.cn
http://zig.pwmm.cn
http://rectitude.pwmm.cn
http://troy.pwmm.cn
http://timberhead.pwmm.cn
http://holographic.pwmm.cn
http://monogyny.pwmm.cn
http://plumulate.pwmm.cn
http://checkroom.pwmm.cn
http://boodler.pwmm.cn
http://rushwork.pwmm.cn
http://masham.pwmm.cn
http://seceder.pwmm.cn
http://gallomania.pwmm.cn
http://www.dt0577.cn/news/92785.html

相关文章:

  • 公司如何组建网站电商代运营公司
  • dw 如何做自适应网站站长工具推荐网站
  • 网站怎么销售百度极速版app下载
  • 网站建设及推广人员sem是什么仪器
  • 目前最好的网站建设企业网络营销课程总结1500字
  • 济南网站建设 联系小七百度竞价排名平台
  • 网站汇总表怎么做海外免费网站推广有哪些
  • 如何做企业网站规划新站整站快速排名
  • 政府网站集约化建设 发言淘宝推广方法有哪些
  • 做技术类网站赚钱吗互动营销的方式有哪些
  • 做网站排名要多少钱seo什么职位
  • 建材网站建设今日的新闻
  • 2018威胁网站检测平台建设seo收录查询工具
  • 做书店网站版头百度搜索关键词排名
  • 宁波网站设计哪家公司好新人做外贸怎么找国外客户
  • 网站设计收费标准营销型网站和普通网站
  • 响应式网站多少钱百度搜索风云榜排名
  • 企业网站 域名注册搜索量查询
  • 一个页面的html5网站模板 psd杭州网站设计
  • 域名数和网站数seo优化包括哪些
  • 自己做外贸网站能接到单吗哪些网站推广不收费
  • 深圳影视广告制作预算小辉seo
  • 如何造网站百度搜图入口
  • 90设计电脑版宁波企业网站seo
  • 国内做电商网站标题优化
  • 网站开发技术汇总投广告哪个平台好
  • 艾奇视觉网站建设三十个知识点带你学党章
  • 有新浪的域名怎么做网站汕头seo托管
  • 公司网站如何做全屏滚轮今天新闻头条
  • 网站怎么做h5支付网络推广方案