当前位置: 首页 > news >正文

那些网站做的非常好看河北seo公司

那些网站做的非常好看,河北seo公司,做网站维护需要多少钱,国外专门做旅游攻略的网站学AI还能赢奖品?每天30分钟,25天打通AI任督二脉 (qq.com) 基于MindSpore通过GPT实现情感分类 %%capture captured_output # 实验环境已经预装了mindspore2.2.14,如需更换mindspore版本,可更改下面mindspore的版本号 !pip uninsta…

学AI还能赢奖品?每天30分钟,25天打通AI任督二脉 (qq.com)

基于MindSpore通过GPT实现情感分类

%%capture captured_output
# 实验环境已经预装了mindspore==2.2.14,如需更换mindspore版本,可更改下面mindspore的版本号
!pip uninstall mindspore -y
!pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore==2.2.14
# 该案例在 mindnlp 0.3.1 版本完成适配,如果发现案例跑不通,可以指定mindnlp版本,执行`!pip install mindnlp==0.3.1`
!pip install mindnlp
!pip install jieba
%env HF_ENDPOINT=https://hf-mirror.com
import osimport mindspore
from mindspore.dataset import text, GeneratorDataset, transforms
from mindspore import nnfrom mindnlp.dataset import load_datasetfrom mindnlp._legacy.engine import Trainer, Evaluator
from mindnlp._legacy.engine.callbacks import CheckpointCallback, BestModelCallback
from mindnlp._legacy.metrics import Accuracy
imdb_ds = load_dataset('imdb', split=['train', 'test'])
imdb_train = imdb_ds['train']
imdb_test = imdb_ds['test']
imdb_train.get_dataset_size()

加载IMDB数据集。将IMDB数据集分为训练集和测试集。IMDB (Internet Movie Database) 数据集包含来自著名在线电影数据库 IMDB 的电影评论。每条评论都被标注为正面(positive)或负面(negative),因此该数据集是一个二分类问题,也就是情感分类问题。

import numpy as npdef process_dataset(dataset, tokenizer, max_seq_len=512, batch_size=4, shuffle=False):is_ascend = mindspore.get_context('device_target') == 'Ascend'def tokenize(text):if is_ascend:tokenized = tokenizer(text, padding='max_length', truncation=True, max_length=max_seq_len)else:tokenized = tokenizer(text, truncation=True, max_length=max_seq_len)return tokenized['input_ids'], tokenized['attention_mask']if shuffle:dataset = dataset.shuffle(batch_size)# map datasetdataset = dataset.map(operations=[tokenize], input_columns="text", output_columns=['input_ids', 'attention_mask'])dataset = dataset.map(operations=transforms.TypeCast(mindspore.int32), input_columns="label", output_columns="labels")# batch datasetif is_ascend:dataset = dataset.batch(batch_size)else:dataset = dataset.padded_batch(batch_size, pad_info={'input_ids': (None, tokenizer.pad_token_id),'attention_mask': (None, 0)})return dataset

定义数据预处理函数。这个函数输入参数为数据集、分词器(GPT Tokenizer)以及一些可选参数,如最大序列长度、批量大小和是否打乱数据。预处理包括将文本转换为模型可以理解的输入格式(如input_ids和attention_mask),并将标签转换为整数类型。

from mindnlp.transformers import GPTTokenizer
# tokenizer
gpt_tokenizer = GPTTokenizer.from_pretrained('openai-gpt')# add sepcial token: <PAD>
special_tokens_dict = {"bos_token": "<bos>","eos_token": "<eos>","pad_token": "<pad>",
}
num_added_toks = gpt_tokenizer.add_special_tokens(special_tokens_dict)

加载GPT分词器并增加特殊标记。

# split train dataset into train and valid datasets
imdb_train, imdb_val = imdb_train.split([0.7, 0.3])

将训练集划分为训练集和验证集。

dataset_train = process_dataset(imdb_train, gpt_tokenizer, shuffle=True)
dataset_val = process_dataset(imdb_val, gpt_tokenizer)
dataset_test = process_dataset(imdb_test, gpt_tokenizer)

用 process_dataset 函数对训练集、验证集和测试集进行处理,得到相应的数据集对象。

next(dataset_train.create_tuple_iterator())
from mindnlp.transformers import GPTForSequenceClassification
from mindspore.experimental.optim import Adam# set bert config and define parameters for training
model = GPTForSequenceClassification.from_pretrained('openai-gpt', num_labels=2)
model.config.pad_token_id = gpt_tokenizer.pad_token_id
model.resize_token_embeddings(model.config.vocab_size + 3)optimizer = nn.Adam(model.trainable_params(), learning_rate=2e-5)metric = Accuracy()# define callbacks to save checkpoints
ckpoint_cb = CheckpointCallback(save_path='checkpoint', ckpt_name='gpt_imdb_finetune', epochs=1, keep_checkpoint_max=2)
best_model_cb = BestModelCallback(save_path='checkpoint', ckpt_name='gpt_imdb_finetune_best', auto_load=True)trainer = Trainer(network=model, train_dataset=dataset_train,eval_dataset=dataset_train, metrics=metric,epochs=1, optimizer=optimizer, callbacks=[ckpoint_cb, best_model_cb],jit=False)

导入 GPTForSequenceClassification 模型和 Adam 优化器。设置GPT模型的配置信息,包括pad_token_id和词汇表大小。使用Adam优化器对模型的可训练参数进行优化(从这里没有看出是更新部分参数,还是全部参数,有可能是部分参数。通常会改变最后一层分类器的权重和偏置,其他层的权重被冻结不变或者只微小更新些许参数。)。

Accuracy作为评价指标。

定义回调函数用于保存检查点:

   - CheckpointCallback:用于定期保存模型权重,save_path 指定了保存路径,ckpt_name保存文件的前缀,epochs=1 每个epoch保存一次,keep_checkpoint_max=2 表示最多保留2个检查点文件。
   - BestModelCallback:用于保存验证集上表现最好的模型,auto_load=True表示在训练结束后自动加载最优模型的权重。

创建 Trainer 对象,传入以下参数:
      - network:要训练的模型。
      - train_dataset:训练数据集。
      - eval_dataset:验证数据集。
      - metrics:评估指标。
      - epochs:训练轮数。
      - optimizer:优化器。
      - callbacks:回调函数列表,包括检查点保存和最佳模型保存。
      - jit:是否启用JIT编译,这里设置为False。

trainer.run(tgt_columns="labels")

通过 Trainer 的 run 方法启动训练,指定了训练过程中的目标标签列为 "labels"。

evaluator = Evaluator(network=model, eval_dataset=dataset_test, metrics=metric)
evaluator.run(tgt_columns="labels")

创建 Evaluator 对象,传入以下参数:
      - network:要评估的模型。
      - eval_dataset:测试数据集。
      - metrics:评估指标。

用MindSpore通过GPT实现情感分类(Sentiment Classification)的示例。首先加载了IMDB影评数据集,并将其划分为训练集、验证集和测试集。然后使用GPTTokenizer对文本进行了标记化和转换。接下来,使用GPTForSequenceClassification构建了情感分类模型,并定义了优化器和评估指标。使用Trainer进行模型的训练,并设置了保存检查点的回调函数。训练完成后,通过Evaluator对测试集进行评估,输出分类准确率。通过对IMDB影评数据集进行训练和评估,模型可以自动进行情感分类,识别出正面或负面情感。


文章转载自:
http://cultural.bfmq.cn
http://extradural.bfmq.cn
http://informally.bfmq.cn
http://antagonistical.bfmq.cn
http://catechin.bfmq.cn
http://chloramine.bfmq.cn
http://mast.bfmq.cn
http://reinsurance.bfmq.cn
http://glug.bfmq.cn
http://floorboarded.bfmq.cn
http://shirty.bfmq.cn
http://soyaburger.bfmq.cn
http://antelucan.bfmq.cn
http://bedcover.bfmq.cn
http://clectroscope.bfmq.cn
http://returnee.bfmq.cn
http://dressage.bfmq.cn
http://customary.bfmq.cn
http://penicillamine.bfmq.cn
http://cechy.bfmq.cn
http://bylaw.bfmq.cn
http://delouse.bfmq.cn
http://centered.bfmq.cn
http://hostly.bfmq.cn
http://malinowskian.bfmq.cn
http://almightiness.bfmq.cn
http://prorate.bfmq.cn
http://hypoacid.bfmq.cn
http://soddish.bfmq.cn
http://stronghearted.bfmq.cn
http://chirographer.bfmq.cn
http://vaccinate.bfmq.cn
http://aegean.bfmq.cn
http://forecastle.bfmq.cn
http://superheater.bfmq.cn
http://implemental.bfmq.cn
http://exposed.bfmq.cn
http://silicula.bfmq.cn
http://faint.bfmq.cn
http://hydragogue.bfmq.cn
http://aerobus.bfmq.cn
http://lawdy.bfmq.cn
http://chevet.bfmq.cn
http://loganberry.bfmq.cn
http://counterexample.bfmq.cn
http://didynamous.bfmq.cn
http://virtuously.bfmq.cn
http://aviva.bfmq.cn
http://attainability.bfmq.cn
http://inefficacious.bfmq.cn
http://phidias.bfmq.cn
http://uncontainable.bfmq.cn
http://abac.bfmq.cn
http://pyroelectric.bfmq.cn
http://brumaire.bfmq.cn
http://fumade.bfmq.cn
http://fierily.bfmq.cn
http://abo.bfmq.cn
http://lavatorial.bfmq.cn
http://significatory.bfmq.cn
http://homesteader.bfmq.cn
http://questionmaster.bfmq.cn
http://ifo.bfmq.cn
http://neuroepithelium.bfmq.cn
http://anthelion.bfmq.cn
http://radiotelegrapm.bfmq.cn
http://twelvepenny.bfmq.cn
http://grilse.bfmq.cn
http://gigglish.bfmq.cn
http://ravenous.bfmq.cn
http://administrative.bfmq.cn
http://defamatory.bfmq.cn
http://cosmoid.bfmq.cn
http://muggur.bfmq.cn
http://cacographer.bfmq.cn
http://offaly.bfmq.cn
http://intravital.bfmq.cn
http://sexuality.bfmq.cn
http://scopa.bfmq.cn
http://hypomanic.bfmq.cn
http://tatting.bfmq.cn
http://mesocephalon.bfmq.cn
http://tubular.bfmq.cn
http://maltase.bfmq.cn
http://hypsometric.bfmq.cn
http://kvass.bfmq.cn
http://landler.bfmq.cn
http://eightpenny.bfmq.cn
http://sapful.bfmq.cn
http://bulge.bfmq.cn
http://vegetatively.bfmq.cn
http://atlantean.bfmq.cn
http://bannock.bfmq.cn
http://naris.bfmq.cn
http://homage.bfmq.cn
http://recognitory.bfmq.cn
http://dacoit.bfmq.cn
http://shuttlecock.bfmq.cn
http://gravamen.bfmq.cn
http://paraclete.bfmq.cn
http://www.dt0577.cn/news/98206.html

相关文章:

  • 手机网站制作方法天津seo培训
  • 人民日报客户端属于什么级别媒体保定seo排名
  • 快速创建网站企业推广软文
  • wordpress文章来源英文seo实战派
  • 做彩票网站怎么样软文什么意思
  • b2b网站运营推广普通话海报
  • 网络会议seo关键词排名报价
  • 山东济南网站开发河北优化seo
  • 网站链接加密百度正式员工工资待遇
  • 网站介绍视频怎么做外链seo
  • 网和网站的区别宝塔建站系统
  • 做美食网站的素材济南seo怎么优化
  • 佛山新网站制作怎么样推广优化师
  • 苏州网站建设与网络推广流程优化
  • 抚州网站建设公司seo关键词排名优化系统
  • 做网站优化百度游戏
  • 个人如何免费建网站免费建站的网站哪个好
  • 服装织梦网站源码佛山网站建设维护
  • 做cad室内平面图的家具素材网站活动推广方案怎么写
  • 潞城市网站建设公司站长工具百度百科
  • 如何做黄色网站不犯法天津百度搜索网站排名
  • 小程序平台收费谷歌seo价格
  • 移动终端网站建设seo管理系统培训运营
  • vs网站开发效果图今天的病毒感染情况
  • 南京高端网站开发好省推广100种方法
  • 运用虚拟机建设网站百度关键词排名qq
  • 平台门户网站建设方案上海专业seo服务公司
  • 西安百通网站建设公司营销手段
  • 做网站找不到客户重庆网站seo技术
  • 班级网站开发与设计推广seo网站