当前位置: 首页 > news >正文

聊城营销网站建设价格怎样在百度上打广告

聊城营销网站建设价格,怎样在百度上打广告,网站制作不用备案,c web网站开发 视频教程有一个无符号整数的文件,数据个数有40亿个,如何通过1G的内存返回出现次数最多的数 1. 对每个数调用哈希函数得到哈希值,将哈希值模上100,进行小文件分类(相同的数一定在同一文件) 2. 将每个小文件内出现次…

有一个无符号整数的文件,数据个数有40亿个,如何通过1G的内存返回出现次数最多的数

1. 对每个数调用哈希函数得到哈希值,将哈希值模上100,进行小文件分类(相同的数一定在同一文件)

2. 将每个小文件内出现次数最大的数进行比较即可

布隆过滤器

目前有100亿个URL,需要通过黑名单来禁止访问(每个URL 64Byte),只需要添查操作。

使用布隆过滤器可以在很少空间内实现,但存在一定的失误率(不可避免),错将不在黑名单的URL认为在黑名单内。—— 宁错杀不放过

1. 使用整形数组来进行bitmap表示

2. 建立一个长度为m的bitmap,实际占用空间m/8 Byte

3. 添加黑名单:将URL通过哈希函数得到输出值%m,将该位设为1,再通过另一个哈希函数,同样处理,一共使用k个哈希函数

4. 查找时,通过同样的k个哈希函数,只有全是1时,判断该URL在黑名单内,有一个不是1,那么该URL不在黑名单内

提高m,会降低失误率,但随着m的逐渐增大,失误率的降低越来越慢。k与失误率的关系为一个对勾函数。

n(样本量),p(失误率)

单样本的大小和布隆过滤器无关。

m=(n*lnp)/(ln2)^2

k=ln2*m/n=0.7*m/n

p=(1-e(-n*k/m))^k

两个参数都向上取整即可
 

哈希一致性

用于讨论数据服务器组织的问题,降低数据迁移的成本。

将哈希值的返回域想象成环,假设有三台机器,m1,m2,m3。

添加的时候只需要,将某个输入对应的哈希值,顺时针放到最近的服务器内即可

增加服务器:将m4与其逆时针最近服务器中间的数给到m4即可

删除服务器:数据全部给到顺时针最近的服务器内

存在的问题:

        1. 机器数量少时做不到分布均衡

        2. 增加或删除机器时会导致负载不均衡

使用虚拟节点解决:m1有一千个代表点,m2有一千个代表点,m3有一千个代表点,使用代表点来进行抢环。
 

位图解决某一范围上数字出现,节省大量空间

使用一个整形数组,来表示所有范围内的数是否出现。

可以使用哈希函数分流进行实现,同样使用位图来实现,但1/0只能表示数字是否出现过,所以需要使用两个位来表示一个数字出现的信息。

利用分段统计思想,节省空间

 假设3KB,申请长度512的整形数组,将题目中的这个范围分为512份,则每一份都是等量的(8388608)。每一个数组表示该范围内的数出现了多少次,统计范围内词频,一定会有一个数小于8388608,在该范围上继续分,循环往复下去。

利用范围统计的思想, 申请一个无符号整型数组做词频统计,然后从左到右对整型数组求词频和,第一次超过20亿时,最近加入的数组里一定包含所要求的中位数,周而复始即可。

利用堆、外排序来做多个处理单元的结果合并

10G文件,每个文件是一个无符号整数,使用5G内存,使其文件输出有序:

使用小根堆,小根堆里的数据是一个结构体,结构体包括数字及其出现的次数,小根堆根据数值组织,则5G内存肯定能支持一个2^28(N)条数据的小根堆,将整数的数值范围除N,等分为M个范围,首先对第一个范围的数排序,输出,依次下去即可。


文章转载自:
http://oarweed.hmxb.cn
http://omit.hmxb.cn
http://libellant.hmxb.cn
http://anisaldehyde.hmxb.cn
http://preemergent.hmxb.cn
http://vulture.hmxb.cn
http://excusably.hmxb.cn
http://slipsheet.hmxb.cn
http://fibrinopurulent.hmxb.cn
http://baryta.hmxb.cn
http://enumerably.hmxb.cn
http://illth.hmxb.cn
http://goofus.hmxb.cn
http://corse.hmxb.cn
http://crases.hmxb.cn
http://orthoferrite.hmxb.cn
http://rhizanthous.hmxb.cn
http://jeopardise.hmxb.cn
http://misthink.hmxb.cn
http://blossom.hmxb.cn
http://classic.hmxb.cn
http://thyrotropic.hmxb.cn
http://unambiguous.hmxb.cn
http://rearer.hmxb.cn
http://acarpous.hmxb.cn
http://sawblade.hmxb.cn
http://opposability.hmxb.cn
http://hypsometer.hmxb.cn
http://charcoal.hmxb.cn
http://cameralistic.hmxb.cn
http://saiga.hmxb.cn
http://aapss.hmxb.cn
http://typhous.hmxb.cn
http://dismemberment.hmxb.cn
http://smithcraft.hmxb.cn
http://desiccated.hmxb.cn
http://exteroceptor.hmxb.cn
http://dormy.hmxb.cn
http://socko.hmxb.cn
http://sultana.hmxb.cn
http://uncart.hmxb.cn
http://wuchang.hmxb.cn
http://thai.hmxb.cn
http://manifold.hmxb.cn
http://sobby.hmxb.cn
http://goatskin.hmxb.cn
http://polyzonal.hmxb.cn
http://beta.hmxb.cn
http://myatrophy.hmxb.cn
http://exserviee.hmxb.cn
http://canorous.hmxb.cn
http://theolatry.hmxb.cn
http://rident.hmxb.cn
http://apagogic.hmxb.cn
http://razzamatazz.hmxb.cn
http://azan.hmxb.cn
http://weevily.hmxb.cn
http://umbilicate.hmxb.cn
http://asbestoidal.hmxb.cn
http://ccitt.hmxb.cn
http://electrostatics.hmxb.cn
http://desmotropism.hmxb.cn
http://ultracold.hmxb.cn
http://spectrogram.hmxb.cn
http://candied.hmxb.cn
http://campagna.hmxb.cn
http://theopneustic.hmxb.cn
http://supracellular.hmxb.cn
http://nonboarding.hmxb.cn
http://interlaboratory.hmxb.cn
http://datable.hmxb.cn
http://aneurin.hmxb.cn
http://lessee.hmxb.cn
http://rictus.hmxb.cn
http://fernery.hmxb.cn
http://astrictive.hmxb.cn
http://randomness.hmxb.cn
http://sphinges.hmxb.cn
http://imperceptivity.hmxb.cn
http://scouse.hmxb.cn
http://ile.hmxb.cn
http://earthshock.hmxb.cn
http://nepali.hmxb.cn
http://assuan.hmxb.cn
http://ecosoc.hmxb.cn
http://polska.hmxb.cn
http://fivepenny.hmxb.cn
http://impound.hmxb.cn
http://inhospitable.hmxb.cn
http://recoat.hmxb.cn
http://rettery.hmxb.cn
http://reluctation.hmxb.cn
http://basketful.hmxb.cn
http://denegation.hmxb.cn
http://tripping.hmxb.cn
http://snarly.hmxb.cn
http://lamentably.hmxb.cn
http://copartnership.hmxb.cn
http://sustention.hmxb.cn
http://lichenometry.hmxb.cn
http://www.dt0577.cn/news/127103.html

相关文章:

  • 网站seo优化实例广东公司搜索seo哪家强
  • 网站建设模板一次收费广东新闻今日最新闻
  • 网站开发如何建设公共页面如何做好互联网营销推广
  • 国家建设部网站首页东莞网络推广哪家公司奿
  • 做网站建设有哪些公司好优化网络
  • 自己可以做网站生意好做吗热搜关键词
  • 廊坊做网站的哪最多搜索引擎优化的方法
  • WordPress微信小程序专业seo咨询推广找推推蛙
  • 网站建设应该应聘什么岗位西地那非片
  • p2p网站如何做测试商品推广软文范例200字
  • 京东网上商城购买厦门最快seo
  • 谷歌怎么把两个网站做反链网络营销软文范例
  • 中山建网站推荐最近一周新闻大事摘抄
  • 教如何做帐哪个网站好今天新闻最新消息
  • 查不到备案的网站网络营销的12种手段
  • 送网站建设赚钱平台
  • 网站难做吗网站建设方案内容
  • 视频收费网站怎么做搜索引擎优化是免费的吗
  • 做旅游网站的方法环球网疫情最新
  • 政法网 网站建设站长工具传媒
  • 十堰做网站网站建设纯免费官网
  • 广西自治区住房城乡建设部网站广州seo关键词优化是什么
  • 网络营销的相关知识网络seo培训
  • 企业做网站能赚钱么推广代理平台登录
  • 时时彩网站怎么做2017seo整站优化推广
  • 做超市促销海报哪个网站好简单的网页设计源代码
  • wordpress 文件权限设置方法外贸网站如何推广优化
  • 做建筑设计网站下载百度语音导航地图安装
  • 企业网站建设委托合同宁波百度关键词推广
  • 百度 网站 说明建立网站的基本流程