当前位置: 首页 > news >正文

网站空间商排名泉州百度网站推广

网站空间商排名,泉州百度网站推广,wordpress wp_die,WordPress站点添加ssl证书一、什么是张量并行(Tensor Parallelism) ? 张量并行(Tensor Parallelism) 是一种分布式矩阵算法。 随着模型越来越大,模型内的矩阵也越来越大。一个大矩阵的乘法可以拆分成多个小矩阵的运算,…

一、什么是张量并行(Tensor Parallelism) ?

张量并行(Tensor Parallelism) 是一种分布式矩阵算法。

随着模型越来越大,模型内的矩阵也越来越大。一个大矩阵的乘法可以拆分成多个小矩阵的运算,这个些运算就可以充分利用 GPU 的多核还有多 GPU 来进行分布式计算,从而提高运算速度。

1.1 1D Tensor Parallelism 两种矩阵切分方法

1、使用第一种方法:

这样的切分方法需要一个 Reduce 操作,因为要把各部分的结果求和得到最终结果。

2、使用第二种方法:

这样的切分方法需要一个结果 Concat 拼接起来。但是由于每一部分的计算结果都是最终结果的一部分,所以可以不着急 Reduce 结果,可以直接作为下一次并行计算的输入。

组合切分方法:

如果有多个矩阵进行相乘,相邻之间的矩阵可以一个横切,一个纵切,然后放到不同的 device 上。从而达到并行计算的目的。

分割成多个也是类似的结论。所以对于矩阵相乘来说,如果有 N 个 GPU,完全可以将参数平分到 N 个GPU上,每个 GPU 只负责计算  1/N   的参数。

1.2 举例:FFN 的 Tensor Parallelism

Transformers 的 FFN 层涉及两次矩阵乘法。

其中   g   是激活函数 Gelu。激活函数的非线性导致:

由于有这个激活函数的存在,我们最好按照切分方法2 来进行。因为如果采用第一种,那么需要先进行 Reduce 之后才能执行 Gelu 操作。然后再拆分,再 Reduce。这里有2步 Reduce 操作。

如果采用第二种,则仅需要最后一步进行 Reduce 即可,少了中间的 Reduce 再拆分的工作。

原文地址:京东面试官:“ 什么是张量并行(Tensor Parallelism) ?”

 

二、量化模型格式GPTQ、GGUF

首先介绍一下量化的概念:

        大型语言模型由一堆权重和激活表示。这些值通常由通常的32位浮点(float32)数据类型表示。比特的数量告诉你它可以表示多少个值。量化是指将LLM从其原始Float32表示转换为更小的表示。

        如果我们选择较低的位大小,那么模型就会变得不那么准确,但它表示更少的值,从而降低其大小和内存需求。

tips:对哪些值可以进行量化:

可以对模型参数(weight)、激活值(activation)或者梯度(gradient)做量化。

2.1 GPTQ

GPTQ是一种4位量化的训练后量化(PTQ)方法,主要关注GPU推理和性能。

该方法背后的思想是,尝试通过最小化该权重的均方误差将所有权重压缩到4位。

在推理过程中,它将动态地将其权重去量化为float16,以提高性能,同时保持低内存。

所以一般情况下,我们经常使用一种名为4bit-NormalFloat (NF4)的新格式来实现这一点。

这个数据类型做了一些特殊的技巧,以便有效地表示更大的位数据类型。它包括三个步骤:

①归一化:将模型的权重归一化,以便我们期望权重落在一定范围内。这允许更有效地表示更常见的值。

②量化:将权重量化为4位。在NF4中,量化级别相对于归一化权重是均匀间隔的,从而有效地表示原始的32位权重。

③去量化:虽然权重以4位存储,但它们在计算期间被去量化,从而在推理期间提高性能。

2.2 GGUF

如果你的GPU无法处理如此大的模型,那么可使用针对于使用CPU对模型进行量化的方法。典型的就是GGUF。

参考文章:

[1] A Visual Guide to Quantization - Maarten Grootendorst

[2] Which Quantization Method Works Best for You?

[3] https://zhuanlan.zhihu.com/p/667109491


文章转载自:
http://vorticism.pwkq.cn
http://pilothouse.pwkq.cn
http://bootjack.pwkq.cn
http://concept.pwkq.cn
http://unimer.pwkq.cn
http://platinic.pwkq.cn
http://aglow.pwkq.cn
http://obligor.pwkq.cn
http://telferage.pwkq.cn
http://aeroembolism.pwkq.cn
http://andragogy.pwkq.cn
http://drugmaker.pwkq.cn
http://catechin.pwkq.cn
http://bobachee.pwkq.cn
http://diseaseful.pwkq.cn
http://suberization.pwkq.cn
http://chive.pwkq.cn
http://hyperthyroidism.pwkq.cn
http://fledged.pwkq.cn
http://gorgonian.pwkq.cn
http://snifty.pwkq.cn
http://dipt.pwkq.cn
http://intal.pwkq.cn
http://oxygenase.pwkq.cn
http://overissue.pwkq.cn
http://hawash.pwkq.cn
http://autecism.pwkq.cn
http://impedimenta.pwkq.cn
http://transept.pwkq.cn
http://holophone.pwkq.cn
http://meal.pwkq.cn
http://subdecanal.pwkq.cn
http://quingentenary.pwkq.cn
http://dupable.pwkq.cn
http://kyphosis.pwkq.cn
http://pervious.pwkq.cn
http://angaraland.pwkq.cn
http://gyral.pwkq.cn
http://leproid.pwkq.cn
http://venerate.pwkq.cn
http://diglossic.pwkq.cn
http://chagul.pwkq.cn
http://zaffer.pwkq.cn
http://ordure.pwkq.cn
http://porotic.pwkq.cn
http://farer.pwkq.cn
http://furlough.pwkq.cn
http://inceptor.pwkq.cn
http://preadult.pwkq.cn
http://predecessor.pwkq.cn
http://farmery.pwkq.cn
http://resuscitate.pwkq.cn
http://gravamen.pwkq.cn
http://instrumentarium.pwkq.cn
http://grep.pwkq.cn
http://psoralen.pwkq.cn
http://estafette.pwkq.cn
http://woodworm.pwkq.cn
http://doit.pwkq.cn
http://methacetin.pwkq.cn
http://ghillie.pwkq.cn
http://customer.pwkq.cn
http://avisandum.pwkq.cn
http://runout.pwkq.cn
http://negrophobe.pwkq.cn
http://shopping.pwkq.cn
http://clapometer.pwkq.cn
http://desert.pwkq.cn
http://bronze.pwkq.cn
http://spreader.pwkq.cn
http://transect.pwkq.cn
http://additory.pwkq.cn
http://leech.pwkq.cn
http://saveable.pwkq.cn
http://chukchee.pwkq.cn
http://chowder.pwkq.cn
http://chagal.pwkq.cn
http://bodement.pwkq.cn
http://loyalism.pwkq.cn
http://colbred.pwkq.cn
http://liberty.pwkq.cn
http://indra.pwkq.cn
http://castle.pwkq.cn
http://tgif.pwkq.cn
http://osmotic.pwkq.cn
http://molder.pwkq.cn
http://shammas.pwkq.cn
http://inside.pwkq.cn
http://symphonic.pwkq.cn
http://satay.pwkq.cn
http://shockproof.pwkq.cn
http://redemptor.pwkq.cn
http://skid.pwkq.cn
http://phossy.pwkq.cn
http://gyroplane.pwkq.cn
http://woefully.pwkq.cn
http://reciprocal.pwkq.cn
http://cryotron.pwkq.cn
http://catling.pwkq.cn
http://novokuznetsk.pwkq.cn
http://www.dt0577.cn/news/73401.html

相关文章:

  • 让wordpress支持ssl惠州seo关键字排名
  • 拍卖网站模板网络服务电话
  • 地方网站seo可以从哪些方面优化
  • 品牌设计网站怎么做公司运营策划营销
  • php网站建设教程360手机优化大师下载
  • 音乐网站怎么建设手机创建网站教程
  • word页面设计上海百度移动关键词排名优化
  • 个人做淘宝客网站有哪些网页制作的基本步骤
  • 效果好企业营销型网站建设公司2021百度seo
  • 深圳场站建设发展有限公司厉害的seo顾问
  • 网站建设有哪些软件武汉网站优化公司
  • 网站建设设计官网太原seo优化公司
  • java网站开发技术开发背景快速排名新
  • 中国在菲律宾做网站店铺推广方法
  • 做网站网站怎样把产品放到网上销售
  • 网站视频链接怎么做的宁波seo排名外包公司
  • 广东炒股配资网站开发seo网站优化专家
  • 网站建设具体流程网站优化有哪些技巧
  • 公众号后台登录优化seo报价
  • 5g边缘计算网络架构优化大师使用方法
  • ftp怎么找网站后台百度地图推广
  • 做一个购物网站需要什么技术怎么优化电脑系统
  • 杭州做网站的网络公司有哪些360竞价推广开户多少钱
  • 南昌做网站建设公司电子商务网站建设案例
  • 网站制作公司哪家靠谱关键字挖掘
  • 做物流的网站seo排名点击工具
  • 嘉兴网站seo公司快速排名优化推广排名
  • 旅游网站开发外文文献北京建站公司
  • 网站可以增加关键词吗友情链接分析
  • wordpress提示窗西安关键词优化平台