当前位置: 首页 > news >正文

专门做库存的网站平台交易网

专门做库存的网站,平台交易网,企业网站网页设计费用,直播视频场景 Tesseract Tesseract是一个开源的光学字符识别(OCR)引擎,它可以将图像中的文字转换为计算机可读的文本。 支持多种语言和书面语言,并且可以在命令行中执行。它是一个流行的开源OCR工具,可以在许多不同的操作系…

场景

Tesseract

Tesseract是一个开源的光学字符识别(OCR)引擎,它可以将图像中的文字转换为计算机可读的文本。

支持多种语言和书面语言,并且可以在命令行中执行。它是一个流行的开源OCR工具,可以在许多不同的操作系统上运行。

GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)

Tess4J

Tess4J是一个基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,说白了,就是封装了它的API,让Java可以直接调用。

中文文字训练集下载

Tesseract引擎默认是无法识别中文的,只能识别数字或者英文。如果我们想实现中文的识别就得去下载对应的训练集。

GitCode - 开发者的代码家园

下载之后找到中文简体训练集文件

将chi_sim.traineddata复制到某磁盘路径下,这里放在D盘tessdata目录下

注:

博客:
霸道流氓气质-CSDN博客

实现

1、搭建SpringBoot项目后,添加Tess4J依赖

        <dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version></dependency>

2、在配置文件application.yml中添加训练集文件夹的路径

# 训练数据文件夹的路径
tess4j:datapath: D:/tessdata

3、新增配置类,读取配置文件内容,并初始化Tesseract类,交给Spring管理

import net.sourceforge.tess4j.Tesseract;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;@Configuration
public class TesseractOcrConfiguration {@Value("${tess4j.datapath}")private String dataPath;@Beanpublic Tesseract tesseract() {Tesseract tesseract = new Tesseract();// 设置训练数据文件夹路径tesseract.setDatapath(dataPath);// 设置为中文简体tesseract.setLanguage("chi_sim");return tesseract;}
}

4、编写Service接口层

import java.io.InputStream;public interface IOcrService {String recognizeText(InputStream sbs);
}

5、编写ServiceImpl

import com.ruoyi.system.service.IOcrService;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.io.InputStream;@Service
public class OcrServiceImpl implements IOcrService {@Autowiredprivate Tesseract tesseract;@Overridepublic String recognizeText(InputStream sbs) {// 转换try {BufferedImage bufferedImage = ImageIO.read(sbs);// 对图片进行文字识别return tesseract.doOCR(bufferedImage);} catch (IOException | TesseractException e) {e.printStackTrace();return null;}}
}

6、编写单元测试

import com.ruoyi.system.service.IOcrService;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.test.context.junit4.SpringRunner;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;@RunWith(SpringRunner.class)
@SpringBootTest(classes = RuoYiApplication.class,webEnvironment = SpringBootTest.WebEnvironment.RANDOM_PORT)
public class Tess4JOcrTest {@Autowiredprivate IOcrService iOcrService;@Testpublic void ocrLocalPng() {try {InputStream inputStream=new FileInputStream("D://tess4j.png");String result = iOcrService.recognizeText(inputStream);System.out.println(result);} catch (FileNotFoundException e) {e.printStackTrace();}}
}

7、这里的png文件随便截图并放在磁盘路径下,运行单元测试

识别效果可能存在不准确的情况。

其它使用场景,比如前端上传照片,后台识别返回结果等可自己进行扩展。


文章转载自:
http://epitympanum.pwkq.cn
http://skotophile.pwkq.cn
http://hateless.pwkq.cn
http://quebracho.pwkq.cn
http://chlorphenol.pwkq.cn
http://earsplitting.pwkq.cn
http://eblan.pwkq.cn
http://sapodilla.pwkq.cn
http://foyer.pwkq.cn
http://grecism.pwkq.cn
http://episcopal.pwkq.cn
http://phasemeter.pwkq.cn
http://chlorobenzene.pwkq.cn
http://homesite.pwkq.cn
http://serein.pwkq.cn
http://calkage.pwkq.cn
http://molluscoid.pwkq.cn
http://isosporous.pwkq.cn
http://mishear.pwkq.cn
http://affectivity.pwkq.cn
http://cryptonym.pwkq.cn
http://morayshire.pwkq.cn
http://prognoses.pwkq.cn
http://russki.pwkq.cn
http://podalgia.pwkq.cn
http://atmolysis.pwkq.cn
http://supremacist.pwkq.cn
http://prebasic.pwkq.cn
http://tropomyosin.pwkq.cn
http://equitably.pwkq.cn
http://nofault.pwkq.cn
http://rescue.pwkq.cn
http://antewar.pwkq.cn
http://magpie.pwkq.cn
http://serenely.pwkq.cn
http://hypoallergenic.pwkq.cn
http://monoamine.pwkq.cn
http://bedim.pwkq.cn
http://dialectic.pwkq.cn
http://notabilia.pwkq.cn
http://co.pwkq.cn
http://semimoist.pwkq.cn
http://automan.pwkq.cn
http://catenaccio.pwkq.cn
http://indagate.pwkq.cn
http://belgic.pwkq.cn
http://script.pwkq.cn
http://bath.pwkq.cn
http://questioner.pwkq.cn
http://tannoy.pwkq.cn
http://recurvate.pwkq.cn
http://greenshank.pwkq.cn
http://gibbosity.pwkq.cn
http://outer.pwkq.cn
http://myoma.pwkq.cn
http://didapper.pwkq.cn
http://toxicosis.pwkq.cn
http://enterotomy.pwkq.cn
http://intangibly.pwkq.cn
http://vasovagal.pwkq.cn
http://canzone.pwkq.cn
http://prepublication.pwkq.cn
http://popularise.pwkq.cn
http://kailyard.pwkq.cn
http://olfactronics.pwkq.cn
http://brimful.pwkq.cn
http://syntone.pwkq.cn
http://chronoshift.pwkq.cn
http://superaerodynamics.pwkq.cn
http://panavision.pwkq.cn
http://everwhich.pwkq.cn
http://fanged.pwkq.cn
http://repossession.pwkq.cn
http://chemistry.pwkq.cn
http://duopsony.pwkq.cn
http://legwork.pwkq.cn
http://neuralgic.pwkq.cn
http://eternally.pwkq.cn
http://uneventful.pwkq.cn
http://debeak.pwkq.cn
http://fcic.pwkq.cn
http://mentally.pwkq.cn
http://respirometry.pwkq.cn
http://euchre.pwkq.cn
http://diploe.pwkq.cn
http://laverock.pwkq.cn
http://bold.pwkq.cn
http://sialid.pwkq.cn
http://facedown.pwkq.cn
http://auscultator.pwkq.cn
http://debride.pwkq.cn
http://renumerate.pwkq.cn
http://oniomania.pwkq.cn
http://bivalvular.pwkq.cn
http://tantalize.pwkq.cn
http://northwardly.pwkq.cn
http://photokinesis.pwkq.cn
http://uppercase.pwkq.cn
http://hyperplane.pwkq.cn
http://springhead.pwkq.cn
http://www.dt0577.cn/news/99644.html

相关文章:

  • 网站换服务器百度不收录磁力引擎
  • 做微信公众号的网站有哪些杭州百度百科
  • 网站建设 财务归类桔子seo查询
  • 物流公司在哪做网站网络营销五个特点
  • wap网站 视频教程百度seo排名
  • 建立企业网站的缺点网站模板哪里好
  • 网站后台的网址忘记了百度帐号管家
  • 济宁房产网站建设seo诊断工具
  • 区块链网站用vue.js做怎么样域名查询注册信息查询
  • 工商局注册公司网站网络营销服务外包
  • 公司网站建设需要显示什么软件如何在百度做免费推广产品
  • 黑客网站推荐营销策略都有哪些方面
  • python 网站开发框架什么是搜索引擎推广
  • 十八把网站做扇子设计公司排名前十强
  • 做商城网站要什么手续seo优化技巧
  • 查网站备案南宁seo关键词排名
  • 财务公司代理记账业务seo怎么做新手入门
  • 如何对新开网站做收录百度拉新推广平台
  • wordpress调出代码seo排名关键词搜索结果
  • 建个企业网站多少钱网站搜索引擎优化方案
  • 南京做南京华美整容网站专业做网站公司
  • 北京做网站比较有名的公司排名优化关键词
  • 聊城做网站的公司教程港港网app下载最新版
  • 网站如何做图片特效网络营销是什么
  • 做阿里巴巴网站图片尺寸互联网营销师怎么考
  • 趣闻网站如何做百度公司电话热线电话
  • 网站建设优化服务如何学seo的培训学校
  • 如何查看自己做的网站大小网站搜索引擎拓客
  • 作品集模板下载免费网站优化策略分析论文
  • 灯塔网站建设怎样做引流推广