基于机器视觉的OCR自动识别系统的研发

作者:沈臻;韩震宇; 刊名:科技与创新 上传者:马永忠

【摘要】研发了一种基于机器视觉的OCR识别技术,以满足某半导体芯片公司的批量生产的需求,极大地提高了其生产线的自动化、无人化程度。使用工业相机对芯片料盒的字符部分进行采图,得到了原始图像后,对图像进行二值化、图像分辨率更改以适应显示器、膨胀腐蚀等操作。预处理完成后,利用已训练完成的yml格式的文件进行字符的识别,并对识别结果进行控制。在现场使用后表明,该OCR识别技术具有很高的响应速度和可靠性,综合检测成功率高达99%.

全文阅读

科技与创新┃Science and Technology & Innovation ·144· 2019 年 第 08 期 文章编号:2095-6835(2019)08-0144-02 基于机器视觉的 OCR 自动识别系统的研发 沈 臻,韩震宇 (四川大学 制造科学与工程学院,四川 成都 610065) 摘 要:研发了一种基于机器视觉的 OCR 识别技术,以满足某半导体芯片公司的批量生产的需求,极大地提高了其生产线的自动化、无人化程度。使用工业相机对芯片料盒的字符部分进行采图,得到了原始图像后,对图像进行二值化、图像分辨率更改以适应显示器、膨胀腐蚀等操作。预处理完成后,利用已训练完成的 yml 格式的文件进行字符的识别,并对识别结果进行控制。在现场使用后表明,该 OCR 识别技术具有很高的响应速度和可靠性,综合检测成功率高达 99%. 关键词:机器视觉;OCR;图像二值化;机器学习 中图分类号:TP391.41 文献标识码:A DOI:10.15913/j.cnki.kjycx.2019.08.063 1 前言 1.1 背景 OCR(光学字符识别)技术的概念是在 1929 年由德国科学家 Tausheck 首次提出的,20 世纪六七十年代,世界各国开始有 OCR 技术的研究,研究初期,多以文字识别方法为主[1]。随着我国改革开放后生产力的快速发展,计算机已成为必不可少的物品,OCR 技术也逐渐发展到了实际应用阶段。一个 OCR 系统的好坏由以下几个指标组成,包括字符识别的准确率、识别的速度、识别的稳定性和上手难度等,其中字符识别的准确率是最重要的指标。目前,OCR 技术得到了极大的发展,国内外都有一些比较成熟的商用 OCR 识别软件,比如 abbyy、汉王等。此系统并没有采用 Google 的 Tesseract 开源 OCR 引擎,而是独自制作了标签与样本,主要考虑的是此系统需要识别的字符比较简单和单一,不需要 Tesseract 也能满足系统需求。 1.2 设计需求 某半导体芯片公司为了提高生产线的自动化程度和减少操作员的人数,需要一套识别芯片料盒的 OCR 系统。芯片料盒上通过激光打标标注出此次需要加工的芯片批号的索引码,此索引码和芯片批号是一一对应的。生产线分为上料位和下料位;在使用此 OCR 识别系统之前,在上料位,操作员通过文字记录下芯片料盒的索引码,再去数据库中寻找此索引码对应的芯片批号;在下料位,操作员与数据库交互,此批次加工完成。原先的工作方式工作效率低下、繁杂,且因为操作员长时间工作的原因,错误频发,很有必要研发一项 OCR 自动识别的技术,以适应公司的自动化发展要求。 此系统在上料位通过工业相机获取芯片料盒上的索引码,直接传递给数据库,从数据库中得到此批次芯片的批号。在下料位,同样进行一次字符识别,以保证上、下工位之间 加工的是一个批次的芯片;同时将此批次的索引码和批号解除绑定。 2 系统设计 2.1 系统的硬件选择 本系统采用大华华睿的 12MG-E 工业相机,此相机体积较小,长时间的工作对其性能的影响很小,大华公司提供的SDK 开发包也便于二次开发。工业镜头为 MH1220M,工作距离为 250 mm;因为涉及到对两个相机的控制,采用了一块 intel 的 LREC9224PT 的双路网卡,以满足相机的高速传输需求。光源采用的是 JA-RL180-A30-W 的环形 LED 光源,颜色采用为红色。 2.2 系统软件的整体设计 此系统加装在原芯片加工的机器平台之上,相机的外触发源为控制芯片加工平台的 PLC,当运送芯片料盒

参考文献

引证文献

问答

我要提问