当前位置: 首页 > news >正文

网架公司的名称怎么优化标题和关键词排名

网架公司的名称,怎么优化标题和关键词排名,手机网站建设计,猎头公司前十名有哪些Py之auto-gptq:auto-gptq的简介、安装、使用方法之详细攻略 目录 auto-gptq的简介 1、版本更新历史 2、性能对比 推理速度 困惑度(PPL) 3、支持的模型 3、支持的评估任务 auto-gptq的安装 auto-gptq的使用方法 1、基础用法 (1)、量…

Py之auto-gptq:auto-gptq的简介、安装、使用方法之详细攻略

目录

auto-gptq的简介

1、版本更新历史

2、性能对比

推理速度

困惑度(PPL)

3、支持的模型

3、支持的评估任务

auto-gptq的安装

auto-gptq的使用方法

1、基础用法

(1)、量化和推理


auto-gptq的简介

AutoGPTQ是一个易于使用的低延迟语言模型(LLM)量化软件包,具有用户友好的API,基于GPTQ算法。一个基于 GPTQ 算法,简单易用且拥有用户友好型接口的大语言模型量化工具包

1、版本更新历史

2023-08-23 - (新闻) - ��� Transformers、optimum 和 peft 完成了对 auto-gptq 的集成,现在使用 GPTQ 模型进行推理和训练将变得更容易!阅读 这篇博客 和相关资源以了解更多细节!
2023-08-21 - (新闻) - 通义千问团队发布了基于 auto-gptq 的 Qwen-7B 4bit 量化版本模型,并提供了详尽的测评结果
2023-08-06 - (更新) - 支持 exllama 的 q4 CUDA 算子使得 int4 量化模型能够获得至少1.3倍的推理速度提升.
2023-08-04 - (更新) - 支持 RoCm 使得 AMD GPU 的用户能够使用 auto-gptq 的 CUDA 拓展.
2023-07-26 - (更新) - 一个优雅的 PPL 测评脚本以获得可以与诸如 llama.cpp 等代码库进行公平比较的结果。
2023-06-05 - (更新) - 集成 ��� peft 来使用 gptq 量化过的模型训练适应层,支持 LoRA,AdaLoRA,AdaptionPrompt 等。
2023-05-30 - (更新) - 支持从 ��� Hub 下载量化好的模型或上次量化好的模型到 ��� Hub。

2、性能对比

推理速度

以下结果通过这个脚本生成,文本输入的 batch size 为1,解码策略为 beam search 并且强制模型生成512个 token,速度的计量单位为 tokens/s(越大越好)。

量化模型通过能够最大化推理速度的方式加载。

modelGPUnum_beamsfp16gptq-int4
llama-7b1xA100-40G118.8725.53
llama-7b1xA100-40G468.7991.30
moss-moon 16b1xA100-40G112.4815.25
moss-moon 16b1xA100-40G4OOM42.67
moss-moon 16b2xA100-40G106.8306.78
moss-moon 16b2xA100-40G413.1010.80
gpt-j 6b1xRTX3060-12G1OOM29.55
gpt-j 6b1xRTX3060-12G4OOM47.36

困惑度(PPL)

对于困惑度的对比, 你可以参考 这里 和 这里

3、支持的模型

你可以使用 model.config.model_type 来对照下表以检查你正在使用的一个模型是否被 auto_gptq 所支持。
比如, WizardLMvicuna 和 gpt4all 模型的 model_type 皆为 llama, 因此这些模型皆被 auto_gptq 所支持。

model typequantizationinferencepeft-lorapeft-ada-lorapeft-adaption_prompt
bloom
gpt2
gpt_neox✅要求该分支的 peft
gptj✅要求该分支的 peft
llama
moss✅要求该分支的 peft
opt
gpt_bigcode
codegen
falcon(RefinedWebModel/RefinedWeb)

3、支持的评估任务

目前, auto_gptq 支持以下评估任务: 更多的评估任务即将到来!

LanguageModelingTask, 
SequenceClassificationTask 和 
TextSummarizationTask;

auto-gptq的安装

你可以通过 pip 来安装与 PyTorch 2.0.1 相兼容的最新稳定版本的 AutoGPTQ 的预构建轮子文件:警告: 预构建的轮子文件不一定在 PyTorch 的 nightly 版本上有效。如果要使用 PyTorch 的 nightly 版本,请从源码安装 AutoGPTQ。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple auto-gptq对于 CUDA 11.7: 
pip install auto-gptq --extra-index-url https://huggingface.github.io/autogptq-index/whl/cu117/对于 CUDA 11.8: 
pip install auto-gptq --extra-index-url https://huggingface.github.io/autogptq-index/whl/cu118/对于 RoCm 5.4.2: pip install auto-gptq --extra-index-url https://huggingfac
e.github.io/autogptq-index/whl/rocm542/

auto-gptq的使用方法

1、基础用法

(1)、量化和推理

警告:这里仅是对 AutoGPTQ 中基本接口的用法展示,只使用了一条文本来量化一个特别小的模型,因此其结果的表现可能不如在大模型上执行量化后预期的那样好。以下展示了使用 auto_gptq 进行量化和推理的最简单用法:

from transformers import AutoTokenizer, TextGenerationPipeline
from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfigpretrained_model_dir = "facebook/opt-125m"
quantized_model_dir = "opt-125m-4bit"tokenizer = AutoTokenizer.from_pretrained(pretrained_model_dir, use_fast=True)
examples = [tokenizer("auto-gptq is an easy-to-use model quantization library with user-friendly apis, based on GPTQ algorithm.")
]quantize_config = BaseQuantizeConfig(bits=4,  # 将模型量化为 4-bit 数值类型group_size=128,  # 一般推荐将此参数的值设置为 128desc_act=False,  # 设为 False 可以显著提升推理速度,但是 ppl 可能会轻微地变差
)# 加载未量化的模型,默认情况下,模型总是会被加载到 CPU 内存中
model = AutoGPTQForCausalLM.from_pretrained(pretrained_model_dir, quantize_config)# 量化模型, 样本的数据类型应该为 List[Dict],其中字典的键有且仅有 input_ids 和 attention_mask
model.quantize(examples)# 保存量化好的模型
model.save_quantized(quantized_model_dir)# 使用 safetensors 保存量化好的模型
model.save_quantized(quantized_model_dir, use_safetensors=True)# 将量化好的模型直接上传至 Hugging Face Hub 
# 当使用 use_auth_token=True 时, 确保你已经首先使用 huggingface-cli login 进行了登录
# 或者可以使用 use_auth_token="hf_xxxxxxx" 来显式地添加账户认证 token
# (取消下面三行代码的注释来使用该功能)
# repo_id = f"YourUserName/{quantized_model_dir}"
# commit_message = f"AutoGPTQ model for {pretrained_model_dir}: {quantize_config.bits}bits, gr{quantize_config.group_size}, desc_act={quantize_config.desc_act}"
# model.push_to_hub(repo_id, commit_message=commit_message, use_auth_token=True)# 或者你也可以同时将量化好的模型保存到本地并上传至 Hugging Face Hub
# (取消下面三行代码的注释来使用该功能)
# repo_id = f"YourUserName/{quantized_model_dir}"
# commit_message = f"AutoGPTQ model for {pretrained_model_dir}: {quantize_config.bits}bits, gr{quantize_config.group_size}, desc_act={quantize_config.desc_act}"
# model.push_to_hub(repo_id, save_dir=quantized_model_dir, use_safetensors=True, commit_message=commit_message, use_auth_token=True)# 加载量化好的模型到能被识别到的第一块显卡中
model = AutoGPTQForCausalLM.from_quantized(quantized_model_dir, device="cuda:0")# 从 Hugging Face Hub 下载量化好的模型并加载到能被识别到的第一块显卡中
# model = AutoGPTQForCausalLM.from_quantized(repo_id, device="cuda:0", use_safetensors=True, use_triton=False)# 使用 model.generate 执行推理
print(tokenizer.decode(model.generate(**tokenizer("auto_gptq is", return_tensors="pt").to(model.device))[0]))# 或者使用 TextGenerationPipeline
pipeline = TextGenerationPipeline(model=model, tokenizer=tokenizer)
print(pipeline("auto-gptq is")[0]["generated_text"])


文章转载自:
http://wecht.dztp.cn
http://zodiac.dztp.cn
http://radwaste.dztp.cn
http://casquet.dztp.cn
http://coypu.dztp.cn
http://cauline.dztp.cn
http://chopinesque.dztp.cn
http://addlehead.dztp.cn
http://wonky.dztp.cn
http://diffuse.dztp.cn
http://biosystematics.dztp.cn
http://dotted.dztp.cn
http://deb.dztp.cn
http://contrastimulant.dztp.cn
http://decontaminate.dztp.cn
http://wingspread.dztp.cn
http://aerotrain.dztp.cn
http://floriation.dztp.cn
http://capricious.dztp.cn
http://pithecanthrope.dztp.cn
http://bywalk.dztp.cn
http://mousetail.dztp.cn
http://eurocurrency.dztp.cn
http://idiotic.dztp.cn
http://faunistic.dztp.cn
http://bakemeat.dztp.cn
http://foxe.dztp.cn
http://hogtie.dztp.cn
http://geotropic.dztp.cn
http://malaysian.dztp.cn
http://multienzyme.dztp.cn
http://botan.dztp.cn
http://downfall.dztp.cn
http://floridion.dztp.cn
http://bluethroat.dztp.cn
http://tokyo.dztp.cn
http://socage.dztp.cn
http://monstrous.dztp.cn
http://millihenry.dztp.cn
http://starfish.dztp.cn
http://nagpur.dztp.cn
http://electrocoagulation.dztp.cn
http://filmic.dztp.cn
http://utensil.dztp.cn
http://lorisid.dztp.cn
http://hypercytosis.dztp.cn
http://boondagger.dztp.cn
http://caterwaul.dztp.cn
http://arrogate.dztp.cn
http://distobuccal.dztp.cn
http://hemophilic.dztp.cn
http://cerebrotomy.dztp.cn
http://scrubland.dztp.cn
http://heterostyly.dztp.cn
http://immiserize.dztp.cn
http://emergency.dztp.cn
http://adrenocorticosteroid.dztp.cn
http://cadence.dztp.cn
http://dou.dztp.cn
http://jainism.dztp.cn
http://thrifty.dztp.cn
http://promptitude.dztp.cn
http://sestertium.dztp.cn
http://diastasis.dztp.cn
http://haddock.dztp.cn
http://teazle.dztp.cn
http://knower.dztp.cn
http://beastie.dztp.cn
http://setwall.dztp.cn
http://riffy.dztp.cn
http://fungin.dztp.cn
http://mpls.dztp.cn
http://currajong.dztp.cn
http://drifter.dztp.cn
http://statesmen.dztp.cn
http://feeding.dztp.cn
http://exempla.dztp.cn
http://modifier.dztp.cn
http://lempira.dztp.cn
http://etherealization.dztp.cn
http://kissableness.dztp.cn
http://ikaria.dztp.cn
http://nodulose.dztp.cn
http://canonicity.dztp.cn
http://virescence.dztp.cn
http://squeegee.dztp.cn
http://sittable.dztp.cn
http://chloroethene.dztp.cn
http://retiring.dztp.cn
http://hebrides.dztp.cn
http://gangtooth.dztp.cn
http://aeroplane.dztp.cn
http://picong.dztp.cn
http://jimply.dztp.cn
http://slogger.dztp.cn
http://synthomycin.dztp.cn
http://teleplasm.dztp.cn
http://breakdown.dztp.cn
http://prolong.dztp.cn
http://induct.dztp.cn
http://www.dt0577.cn/news/76631.html

相关文章:

  • 网站建设公司对父亲节宣传口号软件工程培训机构哪家好
  • 网站目录链接怎么做的如何做电商 个人
  • 网站做的二维码失效了最新的国际新闻
  • 深圳企业网站建设与设计制作买域名要多少钱一个
  • 宛城区网站推广如何营销
  • 北京关键词快速排名seo外链平台热狗
  • 智能科技网站模板下载地址南宁百度推广代理公司
  • 吴博 wordpress长春网站seo哪家好
  • 池州哪里有做网站精准客户信息一条多少钱
  • wordpress 主题名怎么做网站优化排名
  • 百度网站推广怎么样手机百度账号申请注册
  • 牌具网站广告怎么做网站搭建软件
  • 用dw做的企业网站广东宣布即时优化调整
  • 购买wordpress主题后怎么编辑google搜索引擎优化
  • 男孩做网站网络公司优化关键词
  • 外贸手机网站建设搜索引擎营销的概念
  • 多少钱用英语怎么说百度seo排名帝搜软件
  • 为什么要建设就业指导网站指数基金
  • 大数据分析seo综合查询软件排名
  • 做本地门户网站seo排名首页
  • 怎样做3d动画短视频网站女生做sem专员的工作难吗
  • 深圳个性化建网站公司网站推广平台有哪些
  • 花瓣官网设计网站seo网站设计工具
  • 免费图片素材网站推荐高端品牌网站建设
  • 300个吉祥公司名字长沙网站seo收费标准
  • wordpress换网址图片打不开苏州关键词优化排名推广
  • 网站包含什么营销软文800字范文
  • 做网站运营需要做哪些营销和销售的区别在哪里
  • 有域名后怎样做网站广州seo招聘网
  • 网站建设 部署与发布广告信息发布平台