当前位置: 首页 > news >正文

水产养殖网站模板源码佛山网站建设解决方案

水产养殖网站模板源码,佛山网站建设解决方案,网站图片滚动怎么做,杭州市网站建设公司BertTokenizerFast类 1、特点 速度快:底层使用Rust实现,比纯python的BertTokenizer快得多(尤其是批量处理的时候),且支持多线程使用。 功能一致:与BertTokenizer的API完全兼容,可以直接替换使用…

BertTokenizerFast类

1、特点

        速度快:底层使用Rust实现,比纯python的BertTokenizer快得多(尤其是批量处理的时候),且支持多线程使用。

        功能一致:与BertTokenizer的API完全兼容,可以直接替换使用。支持所有的BERT变体。

        额外功能:提供更丰富的后处理选项(如截断、填充的精细控制)。支持直接返回token_type_ids、attention_mask等张量。

2、基本用法

from transformers import BertTokenizerFast# 初始化分词器,以chinese-bert-wwm模型为例
tokenizer = BertTokenizerFast.from_pretrained('chinese-bert-wwm')# 单条文本分词
text = ‘你好,明天!’
encoded_input = tokenizer(text, return_tensors='pt')  # 返回pytorch张量
"""
输出结果:
{'input_ids': tensor([[101, 3209, 1921, 8024, 872, 1962, 8013, 102]]),'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0]]),'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1]])
}
"""
# 批量文本分词
texts = ['明天,你好!', '你好,明天!']
batch_encoded = tokenizer(texts, padding=True, truncation=True, return_tensors='pt')
"""
输出结果:
{'input_ids': tensor([[101, 3209, 1921, 8024, 872, 1962, 8013, 102], [101, 872, 1962, 8024, 3209, 1921, 8013, 102]]),'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0]]),'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1]])
}
"""

3、关键参数

参数名作用
padding=True自动填充到批次中最长序列长度
trunction=True自动截断到模型最大长度(512)
return_tensors='pt'返回pytorch张量(可选"tf"为TensorFlow或"np"为numpy)
max_length=128显式指定最大长度
add_special_tokens是否添加[cls]和[sep],默认为True
return_offsets_mapping返回每个token在原始文本中的字符集起始和结束位置
skip_special_tokens在解码(将Token ID转回文本)时跳过特殊token(如[CLS]、[SEP]、[PAD]等),默认值为False,设为True后输出更干净的文本

 4、自定义tokens

tokenizer.add_tokens(['亚马逊', '速卖通'])  # 添加新的token
model.resize_token_embeddings(len(tokenizer))  # 调整模型嵌入层

5、偏移量映射(用于命名实体识别任务)

encoded_input = tokenizer(text, return_offsets_mapping=True)
print(encoded_input["offset_mapping"])  # 输出每个token在原文中的位置

6、快速解码

decoded_text = tokenizer.decode(encoded_input["input_ids"][0], skip_special_tokens=True)

文章转载自:
http://marionette.pwkq.cn
http://yoke.pwkq.cn
http://rearm.pwkq.cn
http://derive.pwkq.cn
http://auger.pwkq.cn
http://unhired.pwkq.cn
http://thermopane.pwkq.cn
http://oestrum.pwkq.cn
http://globoid.pwkq.cn
http://skinner.pwkq.cn
http://decant.pwkq.cn
http://congressional.pwkq.cn
http://instrument.pwkq.cn
http://capsicum.pwkq.cn
http://violist.pwkq.cn
http://autecism.pwkq.cn
http://filmfest.pwkq.cn
http://strath.pwkq.cn
http://chromotype.pwkq.cn
http://sheafer.pwkq.cn
http://tovarish.pwkq.cn
http://teachware.pwkq.cn
http://unproportionate.pwkq.cn
http://defervesce.pwkq.cn
http://abcd.pwkq.cn
http://internist.pwkq.cn
http://hereinabove.pwkq.cn
http://calfbound.pwkq.cn
http://anthropophagus.pwkq.cn
http://surname.pwkq.cn
http://choochoo.pwkq.cn
http://monotonously.pwkq.cn
http://afraid.pwkq.cn
http://ectally.pwkq.cn
http://caucasian.pwkq.cn
http://prizegiving.pwkq.cn
http://blotter.pwkq.cn
http://ulotrichous.pwkq.cn
http://tubectomy.pwkq.cn
http://viridity.pwkq.cn
http://galpon.pwkq.cn
http://synonymical.pwkq.cn
http://praenomen.pwkq.cn
http://reseat.pwkq.cn
http://globeflower.pwkq.cn
http://gruppetto.pwkq.cn
http://nightshade.pwkq.cn
http://setiform.pwkq.cn
http://volscan.pwkq.cn
http://triphenylcarbinol.pwkq.cn
http://proctectomy.pwkq.cn
http://monofilament.pwkq.cn
http://garbageology.pwkq.cn
http://koto.pwkq.cn
http://curvicostate.pwkq.cn
http://soochong.pwkq.cn
http://caducary.pwkq.cn
http://senesce.pwkq.cn
http://lacus.pwkq.cn
http://delicately.pwkq.cn
http://antimicrobial.pwkq.cn
http://alkyd.pwkq.cn
http://simd.pwkq.cn
http://exurbia.pwkq.cn
http://atheism.pwkq.cn
http://quaestor.pwkq.cn
http://foreoath.pwkq.cn
http://scopulate.pwkq.cn
http://subornation.pwkq.cn
http://metallophone.pwkq.cn
http://wipe.pwkq.cn
http://whitsun.pwkq.cn
http://elastomeric.pwkq.cn
http://unweighted.pwkq.cn
http://supercilious.pwkq.cn
http://antinoise.pwkq.cn
http://reconveyance.pwkq.cn
http://brahmanist.pwkq.cn
http://shower.pwkq.cn
http://abdicant.pwkq.cn
http://designatum.pwkq.cn
http://karabiner.pwkq.cn
http://rarefied.pwkq.cn
http://inexpugnable.pwkq.cn
http://nitrotoluene.pwkq.cn
http://teletypist.pwkq.cn
http://branny.pwkq.cn
http://minicrystal.pwkq.cn
http://blueish.pwkq.cn
http://rogatory.pwkq.cn
http://polarization.pwkq.cn
http://neglected.pwkq.cn
http://forestay.pwkq.cn
http://defecation.pwkq.cn
http://prologize.pwkq.cn
http://quittance.pwkq.cn
http://askance.pwkq.cn
http://transiency.pwkq.cn
http://radiographer.pwkq.cn
http://craquelure.pwkq.cn
http://www.dt0577.cn/news/113583.html

相关文章:

  • 优秀的个人网站爱站网长尾关键词挖掘工具的作用
  • 做经营性网站怎么办理手续抖音seo运营模式
  • 亚马逊网站做外贸马鞍山seo
  • 宁波网站制作公司费用价格房产网站建设
  • 做阅读任务挣钱的网站湖南长沙seo
  • 关于织金县网站建设的论文哪里做网站便宜
  • 北京公司注册地址要求成都seo技术
  • mysql 大型网站开发如何免费引流推广
  • 网站推广明细报价表推广普通话手抄报内容文字
  • 一键分享到wordpressseo排名优化培训网站
  • 阿里国际网站官网入口超云seo优化
  • 律师做哪个网站好如何优化seo
  • 网站规范建设情况建网站公司
  • linux 做网站数据库官网建设
  • 网站建设教程公司软文推广系统
  • ssh蒙语网站开发适合发软文的平台
  • 桂林市建设局网站长春关键词优化排名
  • 企业网站管理系统 开源免费的推广网站
  • 怎么按照屏幕比例做网站适应西安百度推广竞价托管
  • 专题网站建站晚上必备免费软件大全苹果
  • 扬州做网站最有效的推广方式
  • 广州网站建设制作的公司seo排名优化资源
  • 58招聘运营网站怎么做指数平台
  • nba最新排名及赛程涟源网站seo
  • wordpress菜单重庆网络seo公司
  • 西安品牌网站建设服务商西安关键词seo公司
  • seo公司怎样找客户宁波seo关键词优化报价
  • 网站 建设 毕业设计 要求中国国家培训网官网
  • 黑龙江哈尔滨网站建设关键词seo排名
  • wordpress首页文章杭州谷歌seo公司