当前位置: 首页 > news >正文

西安网站维保公司全球搜钻

西安网站维保公司,全球搜钻,网站搬家图片怎么做,网络网站制作技巧前处理: DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction (1)几何矫正 给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取&#xf…

前处理

DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction

(1)几何矫正

给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取,并降低特征图分辨率至输入图像的1/8尺度,以保证网络的推理效率。然后,我们将提取的特征图展平后,输入至Transformer编码器,解码器,以及我们设计的可学习的上采样模块,得到坐标位移矩阵。最后,我们用对坐标位移矩阵对输入的图像进行几何矫正(即基于双线性插值的在输入图像上按坐标进行像素重采样)。

(2)光照恢复

给定一张几何矫正输出的高分辨率图像,我们首先将其切分成相互之间有1/8重叠的图像块。然后,我们将每一个图像块输入至卷积特征提取器,Transformer编码器,解码器,以及卷积输出头,从而输出光照恢复的图像块。最后,我们将每一个恢复的图像块进行空间上的拼接,完成文档图像的光照恢复。

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集:

英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别。

中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像

2、文本分析

文本检测:改进了基于分割的DBNet (Differentiable Binarization)

数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)

数据集:

 

 3、表格

1. 文字检测模型:用于检测表格里的文本

2. 文字识别模型:用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

数据集:

PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

参考来源: GitHub - PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR

http://www.dt0577.cn/news/31250.html

相关文章:

  • dux主题4.0 wordpressseo百度发包工具
  • 成都网站建设公司创新互联seo课程
  • 有专门做ppt的网站有哪些市场调研报告总结
  • 日本的广告网站谷歌seo网站推广怎么做
  • 如何用excel来做网站后台株洲网站建设
  • 上海哪家网站建设公司好百度推广多少钱
  • 长春净月潭建设投资集团网站微信5000人接推广费用
  • 做家装壁纸的网站网站秒收录
  • 做网站的接口是意思seo优化平台
  • wordpress搭建下载站点会员卡营销策划方案
  • 广州专业网站开发湖北百度seo
  • jsp网站开发要求国内永久免费云服务器
  • vs网站开发平台中国优化网
  • 餐馆网站怎么做的湖南网站推广公司
  • 美国一级a做爰片免费网站适合推广的app有哪些
  • 自己做有趣的网站百度指数峰值查询
  • 郑州旅游网站设计销售怎么做
  • wordpress footer插件无锡百度关键词优化
  • 什么网站上面能接点小活做网站排名靠前的方法
  • 如何做网站平台班级优化大师官网
  • 西安二手房seo流程
  • 没有营业执照可以建设网站网站首页的优化
  • 网站改版做301是啥意思 换域名经营管理培训课程
  • 淘宝里网站建设公司可以吗网站运营专员
  • 提卡网站要怎么做seo自动优化软件安卓
  • java开发网站如何做今天最新军事新闻视频
  • php网站的客服窗口怎么做链友咨询
  • wordpress修改鼠标厦门关键词优化seo
  • 网站功能调研千锋教育培训机构怎么样
  • wordpress官网中文seo技术团队