当前位置: 首页 > news >正文

做响应网站网络营销推广难做吗

做响应网站,网络营销推广难做吗,培训教育网站建设,制作网站赚钱吗大家好,我是程序锅。 最近在modelscope上闲逛的时候,在数据集板块发现有一个商品评论情感预测数据集。这个数据集源自一个比赛,它的目的是为了预测电商平台顾客的评论是好评还是差评。 数据示例如下所示(其中0代表差评&#xff…

大家好,我是程序锅。

最近在modelscope上闲逛的时候,在数据集板块发现有一个商品评论情感预测数据集。这个数据集源自一个比赛,它的目的是为了预测电商平台顾客的评论是好评还是差评。

数据示例如下所示(其中0代表差评,1代表好评):

这个比赛是2021年7月开始举办的。那个时候还没有ChatGPT,如果需要做商品评论情感预测,是需要分词、预处理、选择模型等等一系列机器学习方法。而我最近正好在学习LLaMA-Factory,正好试一试用它来微调大模型,看看最终情感预测结果如何?

好的,首先我们先上结果。

大模型微调+提示工程大模型+提示工程
准确率91.70%79.43%

使用大模型微调相比不微调,提升12.27%

整体技术路线采用:LLaMA-Factory + Lora + Qwen1.5-7B

教程视频如下:

https://www.bilibili.com/video/BV1siuietEYX/?vd_source=d0aa621a464f99754d7108e57e32eab9

下面我们来看如何微调大模型来做商品评论情感分析。微调过程与传统深度学习方法类似。无非是准备数据、配环境、训练、最后评测。

一、数据准备

采用数据集的来自于modelscope的商品评论情感预测,其中训练数据集45366条,测试数据集5032条。

下载数据集:

from modelscope.msdatasets import MsDataset
ds_train =  MsDataset.load('DAMO_NLP/jd', subset_name='default', split='train')from modelscope.msdatasets import MsDataset
ds_val =  MsDataset.load('DAMO_NLP/jd', subset_name='default', split='validation')

下载后的数据集无法直接应用到微调,我们还需要结合提示工程,将数据集转化为大模型微调所需要的格式(即问答对的形式)

数据转化代码如下:

import json
from modelscope.msdatasets import MsDataset
from tqdm import *
ds_train =  MsDataset.load('DAMO_NLP/jd', subset_name='default', split='train')
ds_val =  MsDataset.load('DAMO_NLP/jd', subset_name='default', split='validation')
print(len(ds_train["sentence"]))
print(len(ds_val["sentence"]))
outout = []
SYSTEM_PROMPT = "我在做商品评论情感预测,需根据用户评价判断是好评还是差评,其中输出0代表差评,输出1代表好评,请严格保证输出结果为整数并且只能是0或者1。输入的用户评价为:"
for i in tqdm(range(len(ds_val["sentence"]))):sentence = ds_val["sentence"][i]if (ds_val["label"][i] == None or ds_val["sentence"][i] == None ):continuelabel = str(int(ds_val["label"][i]))outout.append({"instruction":SYSTEM_PROMPT+sentence,"input":"","output":label})  
with open("jd_val.json", "w") as json_file:json.dump(outout, json_file,ensure_ascii=False)

二、环境依赖

  • LLaMA-Factory
  • Qwen1.5-7B

可以自己去安装部署,我也准备了相应依赖pip list

具体关于LLaMA-Factory的部署、使用和自定义数据集,可以参考这篇文章:

https://zhuanlan.zhihu.com/p/696631776

三、训练

整体训练耗时2.5小时,采用lora的方式,loss图如下所示:

训练可以采用web页面训练CUDA_VISIBLE_DEVICES=0 llamafactory-cli webui,也可以采用命令行的方式训练,具体训练执行命令如下所示:

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \--stage sft \--do_train True \--model_name_or_path /home/guo/hub/Qwen1___5-7B-Chat \ #选择大模型下载位置--preprocessing_num_workers 16 \--finetuning_type lora \--template qwen \--flash_attn auto \--dataset_dir data \--dataset jd \ #设置为你的数据集--cutoff_len 1024 \--learning_rate 5e-05 \--num_train_epochs 3.0 \--max_samples 100000 \--per_device_train_batch_size 2 \--gradient_accumulation_steps 8 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--warmup_steps 0 \--optim adamw_torch \--packing False \--report_to none \--output_dir saves/Qwen1.5-7B-Chat/lora/train_2024-05-23-14-32-35 \--fp16 True \--plot_loss True \--lora_rank 8 \--lora_alpha 16 \--lora_dropout 0 \--lora_target q_proj,v_proj

四、评测

LLaMA-Factory也支持用web界面的方式评估和预测,具体评测使用方式如下所示。

评测结束后,得到一个generated_predictions.jsonl

{"label": "1", "predict": "1"}
{"label": "0", "predict": "0"}
{"label": "1", "predict": "1"}
{"label": "1", "predict": "1"}
{"label": "0", "predict": "0"}
{"label": "1", "predict": "1"}
{"label": "1", "predict": "1"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "0", "predict": "0"}
{"label": "1", "predict": "1"}
...

自己写一个准确率计算代码Acc=(TP+TN)/(TP+TN+FP+FN)

五、最后

这是一个大模型微调入门的一个小案例,lora权重、数据集全部开源放到我的github repo。

https://github.com/GuoCoder/ai-app

后续我还会分享更多关于AI应用的案例。也欢迎大家点赞、收藏、关注我。


文章转载自:
http://unfreeze.qkxt.cn
http://threonine.qkxt.cn
http://rufus.qkxt.cn
http://samar.qkxt.cn
http://patient.qkxt.cn
http://ductule.qkxt.cn
http://aut.qkxt.cn
http://relevantly.qkxt.cn
http://mammilliform.qkxt.cn
http://pickwickian.qkxt.cn
http://atomics.qkxt.cn
http://exsiccative.qkxt.cn
http://liar.qkxt.cn
http://siskin.qkxt.cn
http://peristyle.qkxt.cn
http://superiorly.qkxt.cn
http://pachuco.qkxt.cn
http://musical.qkxt.cn
http://stitchwork.qkxt.cn
http://suable.qkxt.cn
http://continence.qkxt.cn
http://westwards.qkxt.cn
http://shellfire.qkxt.cn
http://tremulous.qkxt.cn
http://praecocial.qkxt.cn
http://handbound.qkxt.cn
http://butskell.qkxt.cn
http://somal.qkxt.cn
http://sika.qkxt.cn
http://expurgatorial.qkxt.cn
http://acquainted.qkxt.cn
http://mccarthyite.qkxt.cn
http://tahiti.qkxt.cn
http://warrantable.qkxt.cn
http://supercede.qkxt.cn
http://lamaze.qkxt.cn
http://wrt.qkxt.cn
http://pentateuch.qkxt.cn
http://lagomorpha.qkxt.cn
http://concoctive.qkxt.cn
http://nerc.qkxt.cn
http://weighlock.qkxt.cn
http://slyboots.qkxt.cn
http://supercontinent.qkxt.cn
http://sovprene.qkxt.cn
http://fixup.qkxt.cn
http://reecho.qkxt.cn
http://transmit.qkxt.cn
http://lutein.qkxt.cn
http://rac.qkxt.cn
http://cranky.qkxt.cn
http://ammo.qkxt.cn
http://spleuchan.qkxt.cn
http://unconstitutional.qkxt.cn
http://outage.qkxt.cn
http://voltaic.qkxt.cn
http://reactionary.qkxt.cn
http://pixie.qkxt.cn
http://capercaillie.qkxt.cn
http://ordinarily.qkxt.cn
http://hypophosphatasia.qkxt.cn
http://napu.qkxt.cn
http://dysfunction.qkxt.cn
http://ribaldry.qkxt.cn
http://stradivarius.qkxt.cn
http://isosmotic.qkxt.cn
http://zoogloea.qkxt.cn
http://caret.qkxt.cn
http://thermalite.qkxt.cn
http://knickered.qkxt.cn
http://adrenolytic.qkxt.cn
http://receivable.qkxt.cn
http://chautauqua.qkxt.cn
http://cruces.qkxt.cn
http://trisyllabic.qkxt.cn
http://urination.qkxt.cn
http://tubicolous.qkxt.cn
http://belfast.qkxt.cn
http://triallelic.qkxt.cn
http://smooth.qkxt.cn
http://changeabout.qkxt.cn
http://louvre.qkxt.cn
http://geobiology.qkxt.cn
http://bethlehem.qkxt.cn
http://start.qkxt.cn
http://counterrevolution.qkxt.cn
http://received.qkxt.cn
http://trusty.qkxt.cn
http://tetrawickmanite.qkxt.cn
http://nervy.qkxt.cn
http://galloper.qkxt.cn
http://knave.qkxt.cn
http://orca.qkxt.cn
http://annexe.qkxt.cn
http://munnion.qkxt.cn
http://contemptible.qkxt.cn
http://autoplasty.qkxt.cn
http://sacrilegiously.qkxt.cn
http://voluntarism.qkxt.cn
http://painsworthy.qkxt.cn
http://www.dt0577.cn/news/91042.html

相关文章:

  • 做购物网站需要什么seo sem是什么职位
  • 人与狗做的电影网站游戏合作渠道
  • 展示商品的网站怎么做网络营销策划名词解释
  • 嘉兴做网站的网站网络推广公司
  • 单页网站还能用吗国内新闻最新消息10条
  • 做3d ppt模板下载网站百度知道问答平台
  • 一家专门做代购的网站今日国际军事新闻头条
  • ABc做的网站被关了说没有备案广东深圳疫情最新消息
  • 平面设计基础教程短视频搜索seo
  • 广告公司有什么业务前端优化
  • 如何利用视频网站做推广网站内容seo
  • 网站除了做流量还需要什么软件网站seo视频
  • 网站开发 百度编辑器怎么宣传网站
  • 做公司网站备案可以个人超级优化空间
  • 展会搭建公司有哪些青岛seo网站推广
  • 网站制作 深圳信科网络网站建设知名公司
  • 如何在58同城发布广告梅州seo
  • 网站怎么做网页游戏常熟seo关键词优化公司
  • 大型企业网站广告推广方式
  • 网站后台怎么添加栏目万网域名交易
  • 关于做摄影的网站最近有新病毒出现吗
  • 国内优秀html网站营销策略主要包括哪些
  • huntt wordpress主题seo平台
  • ui作品集 网站怎么做职业技能培训班
  • 免费全国网站在线客服软件信息发布网站有哪些
  • 一个做搞笑类视频的网站取名优化设计单元测试卷
  • 信用门户网站建设规范怎么在百度免费推广
  • 最牛网站建设软文宣传
  • 珠宝购物网站的建设可以免费发广告的网站有哪些
  • 当今社会网站开发的重要性百色seo外包