整合Tess4J实现OCR图片识别技术

1. 什么是OCR


**OCR (Optical Character Recognition,光学字符识别)指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程. **


2. 什么是Tess4J库?

**Tess4J是一个开源的Java库,它为Tesseract OCR(光学字符识别)引擎提供了一个简单的Java API。Tesseract是一个强大的开源OCR引擎,可以将图像中的文本转换为可编辑的文本。Tess4J使得在Java应用程序中使用Tesseract OCR变得更加容易。 **


主要功能和特点

  • 文本提取:能够从图像中提取文本,包括印刷文本和手写文本。
  • 多语言支持:支持多种语言的OCR,包括但不限于英语、中文、日语、韩语等。
  • 简单的API:提供了易于使用的Java API,使开发者可以轻松地将OCR功能集成到他们的Java应用程序中。
  • 扩展性:支持自定义词典和训练数据,以提高特定应用场景下的OCR准确性。
  • 图像处理:支持基本的图像处理功能,如图像预处理,以提高OCR的准确性。

3. 引入依赖

<!-- tess4j -->
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.4</version>
</dependency>

4. 下载默认的训练数据

训练数据下载地址

image.png


5. 配置训练数据的目录路径

# 训练数据文件夹的路径
tess4j:
  datapath: E:\Software\trainData # 注意改成自己的文件路径

6. 测试代码

6.1 TesseractOcrConfig
/**
 * @author Ccoo
 * 2024/7/19
 */
@Configuration
public class TesseractOcrConfig {

	@Value("${tess4j.datapath}")
	private String dataPath;

	@Bean
	public Tesseract tesseract() {

		Tesseract tesseract = new Tesseract();
		// 设置训练数据文件夹路径
		tesseract.setDatapath(dataPath);
		// 设置为中文简体
		tesseract.setLanguage("chi_sim");
		return tesseract;
	}
}

6.2 OcrController
/**
 * @author Ccoo
 * 2024/7/19
 */
@RequestMapping("/ocr")
@RestController
@AllArgsConstructor
public class OcrController {

	private final OcrService ocrService;

	@PostMapping(value = "/recognize", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)
	public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {

		// 调用OcrService中的方法进行文字识别
		return ocrService.recognizeText(file);
	}

}

6.3 OcrService
public interface OcrService {

    String recognizeText(MultipartFile file) throws IOException, TesseractException;

}

6.4 OcrServiceImpl
/**
 * @author Ccoo
 * 2024/7/19
 */
@Service
@AllArgsConstructor
public class OcrServiceImpl implements OcrService {

	private final Tesseract tesseract;

	/**
	 * 识别图片中的文字
	 * @param imageFile 图片文件
	 * @return 文字信息
	 */
	public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException {

		// 转换
		InputStream sbs = new ByteArrayInputStream(imageFile.getBytes());
		BufferedImage bufferedImage = ImageIO.read(sbs);

		// 对图片进行文字识别
		return tesseract.doOCR(bufferedImage);
	}
}

7. 功能测试

image.png


7.1 调试请求接口

image.png
image.png


7.2 测试结果

image.png

默认训练库的识别率还是可以的, 对于需要识别率更高的, 需自行训练!!

相关推荐

  1. 利用Tess4J实现图片文字识别

    2024-07-20 13:00:01       36 阅读
  2. SpringBoot整合resilience4j实现接口限流

    2024-07-20 13:00:01       55 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-20 13:00:01       57 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-20 13:00:01       60 阅读
  3. 在Django里面运行非项目文件

    2024-07-20 13:00:01       48 阅读
  4. Python语言-面向对象

    2024-07-20 13:00:01       59 阅读

热门阅读

  1. Spark SQL----INSERT OVERWRITE DIRECTORY

    2024-07-20 13:00:01       21 阅读
  2. TFHE库,fftw和googletest库安装

    2024-07-20 13:00:01       19 阅读
  3. 车端平行驾驶通信模块弱网报警梳理

    2024-07-20 13:00:01       17 阅读
  4. 设计模式七大原则(五)迪米特法则

    2024-07-20 13:00:01       15 阅读
  5. 常用设计模式

    2024-07-20 13:00:01       18 阅读
  6. 三种著名兵器

    2024-07-20 13:00:01       18 阅读