当前位置: 首页 > news >正文

WordPress电影公司网站主题软文营销模板

WordPress电影公司网站主题,软文营销模板,四川省人民政府2022年森林防火命令,在线网站代码生成器时隔一个多月,终于想起来写大数据算法基础的实验报告,主要是快截止了,hh 这两天加急把这个报告写完了~ 接下来,写一写证明过程(参考书籍:高等教育出版社《数据科学与工程算法基础》)主要代码以…

时隔一个多月,终于想起来写大数据算法基础的实验报告,主要是快截止了,hh

这两天加急把这个报告写完了~

接下来,写一写证明过程(参考书籍:高等教育出版社《数据科学与工程算法基础》)主要代码以及总结体会o(* ̄▽ ̄*)ブ


本次实验主要设计三块内容,分别是水库抽样算法(当水库大小为1时),水库抽样算法(当水库大小为k>1时)以及分布式水库抽样算法


水库抽样算法

主要证明过程

主要Python代码 
水库抽样算法(返回一个)
import randomdef sampling_single(stream):reservoir = stream[0]i = 1for i, item in enumerate(stream):j = random.randint(0, i)if j < 1:reservoir = itemreturn reservoir F = [i for i in range(100)]H = sampling_single(F)
print(f"Randomly sampled element: {H}")
水库抽样算法(返回多个) 
import randomdef reservoir_sampling(stream, k):reservoir = []for i, item in enumerate(stream):if i < k:reservoir.append(item)else:j = random.randint(0, i)if j < k:reservoir[j] = itemreturn reservoirdata_stream = [i for i in range(100)]sampled_data = reservoir_sampling(data_stream, 10)

分布式水库抽样算法 

 主要证明过程

  一个Hadoop任务Sample由 n 个 Map 组成,其中每个 Map 都接受到一个数据流 Substream,当这些数据无法完全保存在内存时,如何随机地抽取一个含有 k 条记录的样本(每条记录被抽中的概率相同),于是,这就引出了分布式水库抽样算法(分层水库抽样 + 重抽样 = 分布式水库抽样算法)

  先在每个 Map 上独立运行水库抽样算法,之后对 n 个子样本就行重抽样,获得满足要求的最终结果。 

主要 Python 代码 
import randomdef reservoir_sampling(stream, k):reservoir = []for i, item in enumerate(stream):if i < k:reservoir.append(item)else:j = random.randint(0, i)if j < k:reservoir[j] = itemreturn reservoirdef distributed_sampling(n, k, stream):N = []F = []H = []for i in range(n):F.append(reservoir_sampling(stream, k))N.append(len(F[i]))total_N = sum(N)for j in range(k):p = random.random()m = 0cumulative_N = 0while cumulative_N < p * total_N :cumulative_N += N[m]m += 1H.append(random.choice(F[m-1]))return Hn = 15
k = 10
data_stream = [i for i in range(100)]
H = distributed_sampling(n, k, data_stream)
print("Final Sample H:", H)   

总结 

  水库抽样技术归根到底就是在总体容量未知的情况下,仅通过单遍扫描数据集便能生成等概率抽样集合的一种均匀抽样技术。

  代码或许很简单,但是其中的数学知识以及思想方法是很值得学习的!

http://www.dt0577.cn/news/11831.html

相关文章:

  • 计算机网站建设易观数据
  • 嘉兴网络项目建站公司sem培训班培训多少钱
  • 微信导航网站 dedecms淘宝关键词怎么优化
  • 软件园做网站优化防控措施
  • 工作室 网站备案如何注册百度账号
  • 用asp做网站课程游戏推广怎么找玩家
  • 微企点网站建设广告策划案优秀案例
  • 同学录网站建设百度在线使用
  • 手机上怎么查看网站设计互联网广告价格
  • 做网站推广的安卓优化大师下载安装到手机
  • 网站建设流程周期热门关键词排名查询
  • 商丘河南网站建设东营网站seo
  • 网站运营的具体工作包括哪些搜索引擎优化的实验结果分析
  • 做阿里巴巴网站费用吗seowhy
  • 网站文章只被收录网站首页推广普通话手抄报内容简短
  • 网站建设 荆州网络营销师主要做什么
  • wordpress站内私信西昌seo快速排名
  • 大连做网站优化微信seo是什么意思
  • wordpress页面数据库seo点击排名软件哪里好
  • 网站建设与网页设计可行性分析报告百度seo快排软件
  • wordpress 版本号宁波seo自然优化技术
  • 为什麼建网站要先做数据库最有创意的广告语30条
  • 优化生育政策北京seo优化公司
  • 软件ui设计培训学校seo免费系统
  • dw做网站 如何设置转动推广引流方法与渠道
  • 家居网站源码上海网站建设服务
  • 2018做网站企业seo关键字优化
  • 微信淘宝购物券网站是怎么做的营销公司排行
  • 邯郸网站设计制作一键优化免费下载
  • 合肥效果好的网站推广自己做网站设计制作