一、基于神经网络的多识别器在字符识别中的应用(论文文献综述)
吴湘平[1](2021)在《图像文本识别的关键技术研究》文中进行了进一步梳理图像文本识别主要利用机器学习算法对图像上出现的印刷体或者手写体进行识别,然后转录为计算机能读取识别的文字。图像文本识别在机器自动化、人机交互、自动驾驶等领域具有广泛的应用,一直是计算机视觉领域的研究热点。近年来,随着深度学习的发展,深度神经网络在场景文本识别和手写识别等方面取得了巨大的成功。然而,图像文本识别仍是一个棘手的问题,主要面临以下挑战:1)对于复杂场景的字符识别,现有方法容易丢失字符结构信息和引入背景噪声;2)对于词识别,现有模型大多依赖词典驱动,难以应用到资源匮乏的语言上;3)对于文本行识别,存在序列过长导致识别性能下降的问题;4)对于具有大字符集的语言,模型复杂、参数庞大,难以应用到存储和计算受限的设备中。本文针对以上问题,主要从图像文本识别的关键技术:识别技术和压缩技术开展研究,其中识别技术包括图像中不同粒度的文本即字、词、句子的识别,最后使用压缩技术对识别模型进行优化,主要研究内容包括以下几个方面:第一,针对复杂场景字符识别中,容易丢失字符结构信息和引入背景噪声等问题,提出了基于语义分割的复杂场景字符识别方法。为了减少字符类标数量,该方法首先设计了一种基于五笔汉字编码的新类标编码方法,将汉字的字形和结构信息编码为140位类标,从而大大减轻了对大字符集类别进行识别的计算和存储需求。其次,采用有效的语义分割模型进行逐像素预测,并利用条件随机场模块来学习类五笔编码的约束规则。最后,在三个公开评测数据集上的实验结果表明,该方法在复杂场景字符识别任务达到了最新水平,并且对于遮挡、超低分辨率、超低对比度等复杂的场景具有鲁棒性。第二,针对词识别模型依赖词典驱动和外部语言资源的问题,提出了基于位置向量的无约束手写单词识别方法。该方法首先生成位置向量,并将位置向量作为单词相对应的字符序列的索引;接着,将提取到图像特征与每个位置向量相结合,送入序列识别网络用于识别相应的字符。最后,在两个国际公共语料库上均取得了最佳结果。实验结果表明,在没有任何语言资源的情况下,该方法的性能与集成丰富语言资源的模型相近,证明了该方法对其他资源匮乏语言识别的有效性和潜在能力。第三,针对文本行识别模型存在序列过长导致识别性能下降的问题,提出了基于自适应超图神经网络的手写文本行识别方法。该方法通过一种基于标签向量的自动超图学习机制来自动建模字符间的关系。首先,将字符标签当做超图的节点,一条超边连接两个或多个节点,表示字符之间的某种关系,使用标签向量来构造自适应超图。其次,使用语义解耦模块和超图神经网络来探索特征与语义之间的相互作用,以提高文本行识别性能。最后,为了验证模型的泛化性,将自适应超图神经网络扩展到多标签图像分类任务上。结果证明,提出的自适应超图神经网络具有建模语义依赖关系的能力。第四,针对大字符集的识别模型参数庞大,难以应用到资源有限设备上的问题,提出了图像文本识别模型的全连接层压缩方法。该方法引入压缩因子来压缩全连接层的神经元,这不仅可以消除特征冗余,而且可以共享分类神经元。它打破了输出神经元数量必须与分类网络中类别数量相一致的局限性,在一定程度上缓解了大类别分类的问题。与其他需要预训练模型和微调的方法相比,该方法可以直接在基线模型上构造和压缩网络以实现端到端的训练。最后,在手写汉字识别,复杂场景字符识别和图像分类等多个任务的实验结果表明,所提出的方法可以大大减少模型参数,同时保持最新的识别性能,特别是对于大类别分类任务。综上所述,本文围绕图像文本识别的关键技术进行深入研究和讨论。针对图像中不同粒度的文本即字、词、句子存在的问题,分别提出基于语义分割的复杂场景字符识别方法,基于位置向量的无约束手写单词识别方法和基于自适应超图神经网络的文本行识别方法。最后针对共同存在的大字符集识别问题,提出基于全连接层的参数共享方法对图像文本识别模型进行参数压缩。本文将所提出的方法在多个国际公开数据集上进行实验,最终均取得优异的性能。
熊柏桥[2](2021)在《基于深度学习的文本检测和识别系统的研究与实现》文中指出文本检测和识别技术是计算机视觉领域的一种基础技术,被广泛应用于各类图像处理系统之中,具有较强的研究和应用价值。然而,当前的各类文本检测和识别系统仍存在一些问题:1)针对开放场景的文本检测算法通常无法同时解决多形态文本建模和重叠实例的检测问题,少数二阶段文本检测算法虽然可以缓解该问题,但是速度表现较差;2)当前大部分文本检测算法通常修改于通用目标检测算法,没有充分的利用文本实例的固有特征;3)针对受限场景的文本检测和识别系统尚未充分利用具体场景的先验信息,常引入过多用户约束,降低系统的可用性。针对以上问题,本文基于深度学习方法进行了相应的改进,具体研究内容如下:1)在开放场景下的文本检测任务中,本文提出了一个单阶段融合回归与分割的文本检测算法。在单阶段目标检测框架的基础上,算法额外引入了动态卷积参数生成分支以及图像分割子网络,实现了单阶段的多形态文本分割定位。该算法在保留二阶段方案优点的基础上,具有更简洁的网络结构以及更快的推理速度,在IC17MLT数据集上,算法较二阶段方案可以在F值上提高0.7%,推理速度提升22.6%。2)在开放场景下的文本检测任务中,本文针对当前方案没有充分利用文本先验特征的问题,提出了一种基于标签分配和质量预测的文本检测算法。算法通过一种基于中心线区域约束的标签分配方案,缓解了通常方案中建模方式和文本实例不匹配的问题;通过增加质量预测分支,使后续合并算法可以同时考虑到结果的分类得分和定位得分,缓解了原方案中结果合并不准的问题;通过增加反向的特征融合分支,增强了网络多尺度建模的能力。在IC17MLT数据集上,算法相较先前算法在F值上提升了 2.0%,同时仅带来约9%的额外推理开销。3)在受限场景下的文本检测和识别系统的研究中,本文重点关注卡证识别场景内存在的高用户输入限制的问题,提出并实现了一个高用户自由度的卡证识别OCR系统。系统提出了一种基于分割的卡证区域定位模块,增强系统针对复杂图像的处理能力;提出了一种针对噪声敏感的本文识别模块,提高系统在高自由度输入场景下的识别能力。所提出系统在不限制用户输入背景、姿态、角度的基础上,可以获得可靠的识别结果。
成思齐[3](2021)在《基于深度学习的发票识别方法研究》文中进行了进一步梳理发票实现智能识别可以帮助银行和单位降低工作投入的成本,减少人工失误造成的问题。本课题针对增值税发票这种特殊与复杂的发票识别进行了深入研究,设计基于深度学习的发票识别方案,方案首先针对发票数量不平衡问题采用改进深度卷积生成对抗网络方法扩充数据库,针对传统算法特征提取盲目问题采用卷积神经网络对发票进行特征提取和分类,针对AlexNet网络在发票识别率不够的问题采用通道洗牌等进行针对性改进,用深度学习框架Tensorflow完成改进算法的仿真实验,验证本文所提方法满足设计要求。主要研究内容与创新点归纳为以下几个方面:1、发票智能识别方法研究的方案设计分析增值税发票版面,分析深度学习在发票识别上可行性,将卷积神经网络作为增值税发票识别模型,设计发票识别方案。首先对发票图像进行灰度化等预处理将发票切割为单个信息字符图像构建字符数据库,接下来对受损发票进行扩充来平衡数据库,提高数据集置信度,用卷积神经网络算法在发票字符据集进行仿真选择算法,最后对所选算法进行针对性改进,并对改进算法仿真验证。2、不平衡数据库问题研究本课题污损发票的样本数量少导致数据集不平衡,影响网络识别效果。针对这一问题提出一种改进深度卷积生成对抗神经网络方法,通过训练改进DCGAN(Deep Convolutional GAN)逼近样本数据的真实分布,再利用训练好的生成模型生成与训练数据服从相似分布的图像,完成对少量受损发票数据的扩充。仿真实验表明,经过改进DCGAN平衡样本后,所训练的卷积神经网络模型较原始不平衡数据集平滑,有效提升了模型表现。3、卷积神经网络算法研究由于深度学习对海量数据的超强特征提取能力,本文选取卷积神经网络作为发票字符识别算法。对卷积神经网络的三种经典网络进行搭建训练,分别在高质量和受损发票数据集上进行仿真,经过比较发现AlexNet网络无论是在识别精度和训练时间上都有很大的优势,选定AlexNet作为发票识别基础模型,为后续研究的开展打下基础。4、改进AlexNet网络算法研究分析AlexNet网络应用在发票识别存在不足的原因,针对这些问题,提出在网络中加入SE模块提高重要特征权重、用通道洗牌模块打乱网络单一的特征映射方式提高网络鲁棒性,用小卷积核提高网络对细微特征的提取,对改进后的算法仿真验证,结果表明该方法在有效提升受损发票识别率的同时避免了过拟合的发生。
曾久晟[4](2021)在《面向场景文本识别的图像超分辨率算法研究》文中指出场景文本识别是计算机视觉领域的热门方向,它在自动导航、图像检索、人机交互等领域有着许多应用。随着手机、相机等拍照设备的普及,人们对自然场景图像的获取越来越便捷,对图像中文本信息正确识别的需求也越来越强烈。近年来,虽然深度学习的快速发展大大推动了场景文本识别技术的发展,但对低分辨率的模糊场景文本图像的识别一直是该领域的难点和痛点。针对这一难题,本文结合图像超分辨率技术对低分辨率文本图像进行重建,在放大图像尺寸的同时保持文本特征,让文本图像更清晰更易识别。具体研究内容如下:(1)根据场景文本识别模型的四阶段框架,对各先进的模型进行全面的分析和分类,选出8个具有代表性的模型。这8个模型基本包含目前已有的场景文本识别模型的各种结构组合,代表了该领域不同水平的算法,在速度、识别准确率、参数量、计算复杂度等方面都各有优劣,有着极大的丰富性和多样性。所选出的这些模型适合对超分后的场景文本图像的识别效果进行全面客观的评估。(2)在图像超分辨率领域较经典和先进的EDSR模型的基础上,结合场景文本图像的特点,对超分网络进行了针对性的优化和改进,设计了STR-SR网络。网络在特征提取前引入二值掩码和基于TPS变换的校正对齐模块,前者对图像中的文本区域和背景区域进行了有效区分,后者缓解了采集真实场景文本图像时的错位问题;随后在残差块中加入Bi LSTM,增强其对序列特征的表达能力;最后在训练时,在L1损失函数中结合梯度轮廓先验损失构成新的重构损失函数,增强了图像中文本的边缘轮廓,缓解了伪影现象。在真实场景数据集Text Zoom上对模型进行训练和测试,结合训练的8个文本识别器测试识别精度,证明了STR-SR模型的有效性和相对其他超分模型在场景文本图像重建上的优越性。(3)通过大量对比实验和消融实验找到了STR-SR模型上使场景文本识别准确率最高的组合结构和最佳参数,并从主观视觉效果和客观识别精度两方面验证了所做出的改进的有效性和优越性。通过PSNR和SSIM这两个指标对STR-SR模型进行评估,进一步证明了其重建生成的图像有较高的质量。
李莉莉[5](2021)在《基于深度学习的集装箱编号识别技术研究与实现》文中进行了进一步梳理随着我国经济的发展,越来越多的国际贸易、货物运输依赖于集装箱。集装箱减少了货物运输的成本,从而推动世界经济的发展,但其广泛应用导致港口的吞吐量增速加快,容易造成各大港口拥堵,杂乱不堪,给港口的管理造成巨大的压力。为了对集装箱实行更好的管控,集装箱编号识别系统应运而生。传统集装箱编号识别技术容易受到复杂环境包括光照、字符倾斜、扭曲、破损等影响。近年来,由于深度学习具有快速准确的优点而成为模式识别重要的研究领域,因此,本文提出了一种基于深度学习的集装箱编号识别算法。该算法主要分为三部分,分别为:集装箱编号区域定位、集装箱编号字符分割、集装箱编号字符识别。本文的主要工作如下:(1)集装箱编号区域定位传统集装箱编号定位方法一般采取数学形态学、字符边缘、字符结构定位法,容易受复杂环境的影响,如污渍、锈迹,门锁杆,瓦楞等。针对以上问题,本文提出基于YOLOv4的集装箱编号检测算法。本文利用拍摄的图像进行数据增强,生成集装箱图像数据集,且结合集装箱编号的特点对图像进行标注,利用CSPDarknet53网络训练提取编号特征,生成适合检测集装箱编号的模型对集装箱编号区域进行定位。实验证明本文提出的定位方法速度快且准确率高。(2)集装箱编号字符分割针对集装箱编号倾斜、有干扰物、破损等问题,本文采用基于连通域的集装箱编号分割法。此方法通过深度遍历种子点的8邻域,从而确定分割的位置,对其进行筛选并分割。但因字符周围有其他的干扰,对于分割后的单个图像根据编号字符的先验知识进行筛选,从而保证编号字符的正确分割,为字符的识别奠定了基础。(3)集装箱编号字符识别针对集装箱编号相似字符干扰、字符破损等问题,本文采用识别效率和准确率都比较高的模板匹配算法。为了提高模板匹配识别的精度,本文根据集装箱编号的特点,将字母和数字分开识别,避免了由于有些字母和数字相似而导致识别错误,且缩短了单个字符的匹配时间,从而提高整个识别的速度。实验结果证明本文识别方法提高了识别的正确率。
杨云婷[6](2021)在《基于深度学习的货运列车字符识别方法研究》文中提出深度学习近年来被广泛应用在字符识别、图像识别、语音识别及其他领域中,而且都取得了显着的成效。而卷积神经网络作为深度学习里重要的一个算法,因其良好的特征表现能力而备受关注。字符识别因实际需求,也变得越来越热门,更多的人开始进行字符识别方法的研究,如车牌字符识别、芯片字符识别、身份证号字符识别、自然场景文本识别等。货运列车作为我国运输业中经常使用的运输方式,其自动化管理必将越来越受到重视。而货运列车字符识别作为其中重要的一环,也面临着更大的困难和挑战。本文对于实际场景中的货运列车字符,基于深度学习方法,通过构建不同的深度神经网络来进行字符识别研究,主要工作如下:(1)设计了基于Inception网络的货运列车字符识别方法。分析了Inception网络的结构和性能,设计了基于Inception网络的字符识别模型,在特征提取网络加入多尺度特征提取模块和Inception模块。在前部网络层加入大小不同的卷积来进行多尺度特征提取,并进行特征融合,然后借鉴Inception网络模块多支路能够学习不同尺度特征的优点,设计了新的网络结构。再将提取的特征输入blstm层进行序列预测,最后使用CTC进行字符转录。实验结果证明,基于Inception网络的识别模型显着提高了货运列车字符的识别率。(2)设计了基于Densenet-Inception网络的货运列车字符识别方法。为了获取更多的底层信息和图像特征细节,提高特征提取能力,本章采用了Densenet,分析了Densenet在特征提取上的优越性。在保留Densenet特征重用的优点上,引入Inception网络模块,将Densenet和Inception网络结合,构成新的DensenetInception网络。实验结果证明,改进后的网络模型对于货运列车字符数据集的识别率有所提高。(3)搭建并实现了货运列车字符识别系统。该系统使用C++语言和Qt5图形界面设计工具,将East字符检测定位算法和本文设计的字符识别模型相结合,对货运列车字符图像进行字符识别。
李宇霞[7](2020)在《粘连字符识别技术在手写票据中的应用研究》文中进行了进一步梳理光学字符识别是计算机视觉领域的一个热门研究方向,尤其是近年来随着深度学习的不断发展,场景文本识别的研究被推至高潮。银行票据作为一种特殊的场景,它的广泛使用使得字符识别技术在票据中的应用具有非常重要的研究意义,能够大大提高工作效率。票据中分为手写体和印刷体两种,前者一般手写不规范,字符的大小、间隔等差异也较大,而且有时伴随噪声的干扰,这些因素都会增加识别的难度。本文主要针对票据中的手写字符进行识别,根据汉字和数字的特点以及实际票据中遇到的困难分别采取不同的解决方法。本文的主要研究内容和成果如下:(1)针对基于过分割-识别方法中的集束搜索模块在字符失真票据中容易受到模糊字符干扰的缺点,提出了一种基于CNN图像识别和Bi-gram语义的可靠性优先的路径搜索算法RFBS(Reliable First Beam Search),通过优先搜索可靠性更高的区间提高了手写公司名识别的准确率。此外,根据公司名的结构特点提出了一种前后缀推断策略,有效解决了前后缀识别错误的问题。最后,利用结巴中文分词和字符位置信息检查识别结果中的错误字符,并在传统的字形相似度基础上引入了汉字部件相似度,再结合LSTM语言模型进行纠错。实验结果表明,结合RFBS算法和纠错方法的公司名的字符识别准确率达到了93.08%,相比传统的集束搜索算法提升效果显着。而且,通过消融实验也验证了加入汉字部件相似度对纠错效果的有效性。(2)针对现有方法在识别票据中较长的手写数字串图像存在的局限性,提出了一种基于预分割的端到端手写数字串识别方法。分割阶段使用Mask差值匀光法去除图像背景后,根据连通区分割、组合得到的坐标在原始RGB图像上分割出多个子图像。识别阶段采用以Res Net、Bi-LSTM、CTC为核心搭建的模型,具有很强的特征表示和学习能力。另外,为了训练端到端识别模型,通过提取实际票据的背景和字体颜色,再结合多种数据增强技术合成了大量不同长度的模拟票据数字串图像。实验结果表明,所提出的方法能够将识别结果与真实标签的平均编辑距离降低至0.088,其效果优于分割-识别方法和一般的端到端识别方法。
张忍[8](2020)在《基于OCR技术的光滑金属工件表面字符检测与识别研究》文中提出随着光学字符识别(Optical Character Recognition,OCR)技术的发展,很多字符识别算法如SVM、CNN也渐渐应用到字符检测和识别之中。光滑金属表面字符的作用是用来标识生产厂商、产品序列号等重要信息。目前,光滑金属表面的字符检测采用的是传统的人工目检法。这种方法不仅检测效率低下,而且很容易发生漏检,造成错误率很高。因此,开展光滑金属表面字符的自动化检测技术研究,具有十分重要的科研价值和现实意义。首先,针对光滑金属表面易反光,设计出低角度环形光源照明、CCD面阵相机、视清物方远心镜头组成的光学系统。在光学系统设计阶段,首先使用COMSOL多物理场仿真软件进行了光滑金属表面的光线反射分析。接着根据检测指标要求进行了光学系统硬件部件的分析选型。最后设计出光滑金属表面字符检测的光学系统。其次,针对光滑金属表面字符的分布特点,提出了一种光滑金属表面图像的字符检测算法。在字符检测算法设计阶段,首先根据光滑金属表面图像特点进行光滑金属工件图像的预处理分析。接着针对字符的粘连、缺失或断裂等情况的分割,提出了一种水平投影法和改进的连通域算法相结合的分割算法。最后,提出了光滑金属表面字符检测算法,并进行了算法流程设计和字符检测结果分析。最后,针对光滑金属表面字符识别当中识别率高和识别速度快这两个特点,提出了一种基于改进的CNN算法模型,通过降低网络的复杂程度、增加输出层中神经元的数目,有效提高了算法模型的识别正确率和识别速度。接着对改进的网络进行训练、测试和字符识别结果分析。
汪子锐[9](2020)在《中文连续手写识别中若干问题研究》文中研究表明中文连续手写识别是利用计算机对输入的中文手写文本信息进行自动识别,提取出相应的文字内容。在随着以人工智能等为核心驱动力的第四次工业革命到来,手写识别在许多人机交互场景中都扮演着重要角色:如快递自动分发、智能阅卷、信息录入等等。特别地,我们国家人口众多且在世界上占据越来越重要的地位,研究中文这种特定的文字识别就显得尤为重要。然而相对于孤立字识别而言,连续文字识别隶属于序列求解问题的一种,如何进行有效建模本身就是研究的一个难点。自20世纪以来,研究者们便基于统计建模的方法提出了许多解决思路。这些方法按照是否需要对图片进行显示地预切分可以分为过切方法和非切分方法。一方面,准确地寻找分割点往往成为过切分方法的性能瓶颈;另一方面,受限于传统分类器的表征能力,不同方法的识别性能一直没有取得很大的进展。近年来,随着可利用的海量数据的获得以及深度学习技术的突飞猛进,无论对以预切分为代表的过切法还是对无显示分割的方法,连续手写识别的性能都有了极大的提升。尽管基于深度学习的已有方法相比传统方法获得了明显性能的改进,但是仍然有一些值得进一步研究的地方。第一是如何将传统序列模型与深度学习技术更有效结合来实现对训练数据,特别是大量孤立字符数据的充分利用;第二是中文字符本身种类繁多、相似度高,如何通过数学模型来自动侦测、聚类这些字符间的相似基本单元从而提高神经网络的建模能力以及减小解码器在字符识别中的模糊性问题;第三是考虑到写字人在无约束书写环境下千变万化的书写风格,如何利用自适应技术来实现写字人自适应,进一步提升识别性能;最后,如何通过设计更紧凑的网络模型,实现高类别数下的低存储消耗、低运算量分类器。因此,针对中文连续手写识别问题中的以上几点挑战,本论文研究新的解决思路。值得一提的是,针对某些问题所研究的新方法具备一定普适性,可以自然扩展到其他领域。首先,针对以往主流序列模型中分类器能力有限、训练集数据利用率不足的缺点。本论文提出运用神经网络和隐马尔可夫模型相结合的方式来处理中文连续手写文本识别。本论文从特征提取、分类器设计、训练准则、语言模型选择四个方面详细讨论所提出方法的有效性。基于隐马尔可夫的建模方法能充分利用训练集的孤立字符样本,提高数据利用率,缓解训练集中连续文本行不足带来的压力。同时,结合建模能力强的神经网络分类模型和语言模型,识别率可以优于其他主流方法。其次,在前一个研究搭建的最优系统基础上,针对中文字符类别多、相似度高的问题,本论文引入状态绑定技术将中文字符中相似部件聚类,从而减少总的状态数,提高卷积神经网络的可训练性和区分能力以及降低解码过程中因相似部件得分不一致带来的解码歧义。针对写字人风格多变的难点,通过在卷积神经网络中引入自适应层,将状态绑定与无监督自适应技术结合,降低写字风格带来的性能损失,使得识别性能能够进一步提升。进一步地,为了降低前述自适应技术带来的时延问题,本论文提出一种新颖的基于辅助的写字人风格抽取网络,通过将提取到的风格信息导入基线识别网络,实现快速自适应的目的。最后,针对高类别数的卷积神经网络存储消耗大、计算量高的缺点,本论文提出一种结构与知识相结合的蒸馏流程。所提出的方法,通过结构分析、紧致卷积开发、知识蒸馏三个环节的有机结合,在性能基本不损失的前提下,有效构建了一个更加紧致的分类模型。该方法不仅在本论文关注的中文连续手写识别任务中得到较好应用,也在其他主流分类模型、任务上得到较好的验证。
曾诚[10](2020)在《视频流环境下车牌识别系统研究与实现》文中研究说明近年来,随着全国机动车保有量的日益剧增,车牌识别技术在智能交通领域的应用需求也随之增加。传统车牌识别采用软硬件协助的方式,通过预先在识别路段铺设车辆传感器等硬件检测车辆经过,在其经过时拍照获取车辆图像并对图像进行识别。由于光照、前车遮挡后车等问题,通过拍照获取的车辆信息存在不完整性和失真性,且需预设硬件感应车辆成本较高。因此,本文针对这一原因设计一套基于视频流环境下车牌识别系统。本系统实时的检测识别道路监控视频中车辆车牌信息,相较传统的拍照识别系统,用户可高效获知目标车辆车牌信息,直观获取目标车辆行驶轨迹,系统具有良好的用户友好度。本文的主要研究工作如下:(1)本论文分析了传统感应拍照车牌识别与视频流坏境下车牌识别的优劣势,介绍了我国车牌所包含的字符,分析了我国车牌的特征,并介绍了车牌识别的流程。结合我国车牌特征以及车牌识别流程介绍了本文设计的视频流环境下车牌识别系统中所使用到的相关技术。(2)权衡视频流处理中计算量与识别率,本文通过对基于SIFT特征的关键帧提取算法的改进来提取包含车辆车牌完整信息的关键帧。该算法汲取了背景差分与SIFT特征匹配的思想,并将视频帧划分为突变帧与未突变帧两类,分别对其处理判别是否为关键帧,最终根据哈希算法判别其相似度去除冗余帧。将改进的SIFT特征的关键帧提取算法与传统的背景差分法和SIFT运动特征算法对比实验进行分析,实验结果表明,改进的SIFT特征的关键帧提取算法在关键帧提取方面具有更低的漏帧率,实时性较好。(3)在传统感应拍照车牌识别的基础上,结合视频流处理的特点以及对本课题的需求,提出了该课题的总体系统体系结构和功能模块划分。将视频流坏境下车牌识别系统按照功能要求分为单路段车牌识别、多路段车牌识别与车辆信息统计三大部分,并且分别对每部分内容进行详细地介绍,对本文系统核心功能单路段车牌识别进行了需求详细地分析以及概要设计。(4)将改进的算法应用于视频流车牌识别中,实现单路段车牌识别功能,并用监控视频对其测试,最终完成系统核心识别功能,并验证系统可行性。
二、基于神经网络的多识别器在字符识别中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于神经网络的多识别器在字符识别中的应用(论文提纲范文)
(1)图像文本识别的关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题的研究背景及意义 |
1.2 图像文本识别方法研究现状 |
1.2.1 字符识别研究现状 |
1.2.2 单词识别研究现状 |
1.2.3 文本行识别研究现状 |
1.2.4 模型压缩研究现状 |
1.3 论文的研究内容及创新点 |
1.3.1 研究内容概述 |
1.3.2 主要创新点 |
1.4 论文的组织结构 |
第2章 基于语义分割的复杂场景字符识别方法 |
2.1 引言 |
2.2 相关技术简介 |
2.2.1 语义分割方法 |
2.2.2 类标编码方法 |
2.3 基于语义分割的字符识别模型 |
2.3.1 FCN-ResNet50模块 |
2.3.2 类五笔类标编码模块 |
2.3.3 CRF模块 |
2.3.4 损失函数 |
2.4 实验与分析 |
2.4.1 数据集 |
2.4.2 实验设置 |
2.4.3 对比的方法 |
2.4.4 CTW数据集的实验结果和分析 |
2.4.5 ICDAR2019-ReCTS数据集的实验结果和分析 |
2.4.6 HIT-OR3C数据集的实验结果和分析 |
2.5 本章小结 |
第3章 基于位置向量的无约束手写单词识别方法 |
3.1 引言 |
3.2 相关技术简介 |
3.2.1 长短期记忆网络 |
3.2.2 位置向量 |
3.3 基于位置向量的无约束单词识别模型 |
3.3.1 特征提取模块 |
3.3.2 位置向量 |
3.4 实验与分析 |
3.4.1 手写单词数据集 |
3.4.2 模型训练 |
3.4.3 实验结果 |
3.4.4 消融实验 |
3.4.5 识别样例分析 |
3.5 本章小结 |
第4章 基于自适应超图神经网络的手写文本行识别方法 |
4.1 引言 |
4.2 相关技术简介 |
4.2.1 图神经网络简介 |
4.2.2 超图神经网络简介 |
4.3 基于自适应超图神经网络的文本行识别模型 |
4.3.1 自适应超图的构建 |
4.3.2 通过HGNN进行特征-语义交互 |
4.3.3 序列识别 |
4.4 手写文本行识别的实验 |
4.4.1 手写文本行数据集与评价指标 |
4.4.2 实验设置 |
4.4.3 对比方法 |
4.4.4 实验结果 |
4.4.5 识别样例分析 |
4.5 多标签图像分类的扩展实验 |
4.5.1 优化 |
4.5.2 评价指标 |
4.5.3 多标签数据集 |
4.5.4 实验设置 |
4.5.5 对比方法 |
4.5.6 实验结果 |
4.5.7 消融实验 |
4.5.8 可视化与分析 |
4.6 本章小结 |
第5章 图像文本识别模型的全连接层压缩方法 |
5.1 引言 |
5.2 相关技术简介 |
5.3 基于参数共享的全连接层压缩方法 |
5.3.1 顺序分支结构 |
5.3.2 混洗分支结构 |
5.3.3 紧凑型网络参数压缩分析 |
5.4 实验与分析 |
5.4.1 模型压缩实验数据集 |
5.4.2 实验设置 |
5.4.3 实验对比方法 |
5.4.4 实验结果及分析 |
5.4.5 不同压缩模型结果对比 |
5.5 消融实验与分析 |
5.5.1 分支效果 |
5.5.2 压缩因子效果对比 |
5.5.3 训练和测试阶段的速度表现 |
5.5.4 PSFC和传统FC层的训练收敛性比较 |
5.5.5 可视化分析 |
5.6 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)基于深度学习的文本检测和识别系统的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 文本检测国内外研究现状 |
1.2.2 文本识别国内外研究现状 |
1.2.3 卡证OCR系统国内外研究现状 |
1.3 本文主要研究内容 |
1.4 本文组织结构 |
第二章 文本检测与识别系统相关技术分析 |
2.1 自然场景文本检测相关技术 |
2.1.1 基于回归和基于分割的文本检测方法: |
2.1.2 融合回归和分割的文本检测算法 |
2.1.3 文本检测评价指标 |
2.2 卡证OCR识别系统相关技术 |
2.2.1 卡证OCR识别框架 |
2.2.2 文本识别相关技术 |
2.2.3 文本识别评价指标 |
2.3 本章小结 |
第三章 单阶段融合回归与分割的文本检测算法 |
3.1 二阶段文本检测算法的缺陷 |
3.2 网络结构 |
3.2.1 基于FCOS的单阶段区域检测回归框架 |
3.2.2 基于动态卷积的单阶段文本分割结构 |
3.3 优化目标定义 |
3.4 实验与分析 |
3.4.1 实验数据集 |
3.4.2 评价标准与实验设置 |
3.4.3 实验比较与分析 |
3.5 本章小结 |
第四章 基于标签分配与质量预测的文本检测算法改进 |
4.1 当前算法存在的缺陷 |
4.2 文本检测算法优化 |
4.2.1 基于中心线区域约束的标签分配策略优化 |
4.2.2 基于质量预测分支的合并算法优化 |
4.2.3 基于双向特征金字塔的多尺度建模网络优化 |
4.3 实验与分析 |
4.3.1 实验比较与分析 |
4.4 本章小结 |
第五章 基于深度学习的高用户自由度卡证识别OCR系统的研究与实现 |
5.1 系统整体解决方案 |
5.2 基于语义分割的区域定位模块设计 |
5.2.1 语义分割模型与二次分割算法 |
5.2.2 角点搜索算法与区域畸变校正 |
5.3 基于跨层连接的序列文本识别方法设计 |
5.4 系统内其他模块的设计与实现 |
5.5 实验与分析 |
5.5.1 实验数据集 |
5.5.2 评价标准与实验设置 |
5.5.3 实验比较与分析 |
5.6 系统的部署与实现 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间取得的研究成果 |
(3)基于深度学习的发票识别方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 传统方法识别 |
1.2.2 智能方法识别 |
1.3 本文主要研究内容及安排 |
2 基于深度学习的发票识别方案研究 |
2.1 引言 |
2.2 发票版面分析 |
2.3 总体方案设计 |
2.3.1 设计思路 |
2.3.2 总体框架 |
2.3.3 可行性分析 |
2.4 发票数据库构建 |
2.4.1 数据来源 |
2.4.2 数据预处理 |
2.5 本章小结 |
3 发票数据库扩充算法研究 |
3.1 引言 |
3.2 发票字符特征分析 |
3.3 传统数据增强算法研究 |
3.3.1 数据增强算法 |
3.3.2 仿真结果与分析 |
3.4 改进深度生成对抗网络算法研究 |
3.4.1 生成对抗网络 |
3.4.2 深度卷积生成对抗网络 |
3.4.3 改进深度生成式对抗网络 |
3.4.4 仿真结果与分析 |
3.5 数据增强算法仿真与对比 |
3.5.1 实验环境配置 |
3.5.2 生成样本性能评价 |
3.5.3 扩充后更新数据集 |
3.6 本章小结 |
4 基于深度学习的发票字符识别算法分析 |
4.1 引言 |
4.2 卷积神经网络的算法研究 |
4.3 基于卷积神经网络的发票识别方法 |
4.3.1 基于AlexNet网络的发票识别训练 |
4.3.2 基于VGGNet网络的发票识别训练 |
4.3.3 基于ResNet网络的发票识别训练 |
4.4 发票数据集识别仿真验证 |
4.4.1 实验环境配置 |
4.4.2 算法仿真结果及对比 |
4.5 本章小结 |
5 基于改进AlexNet的发票字符识别算法研究 |
5.1 引言 |
5.2 改进AlexNet算法研究 |
5.2.1 卷积核尺寸改进 |
5.2.2 特征映射通道改进 |
5.2.3 特征权重方式改进 |
5.3 网络参数训练 |
5.3.1 Batch size选取 |
5.3.2 学习率选取 |
5.3.3 Dropout选取 |
5.4 发票数据集识别仿真验证 |
5.4.1 改进AlexNet性能仿真分析 |
5.4.2 传统AlexNet的受损数据集仿真 |
5.4.3 改进AlexNet的受损数据集仿真 |
5.5 本章小结 |
6 结论与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文及成果 |
致谢 |
(4)面向场景文本识别的图像超分辨率算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状和发展趋势 |
1.2.1 图像超分辨率重建算法 |
1.2.2 场景文本识别算法 |
1.2.3 超分辨率算法在场景文本识别上的应用 |
1.3 本文研究内容与主要工作 |
1.4 本文结构与安排 |
第二章 图像超分辨率和场景文本识别的相关理论及技术 |
2.1 图像超分辨率 |
2.2 卷积神经网络 |
2.2.1 卷积层 |
2.2.2 池化层 |
2.2.3 激活层 |
2.3 损失函数 |
2.4 优化算法 |
2.4.1 随机梯度下降法 |
2.4.2 Ada Delta优化算法 |
2.4.3 Adam优化算法 |
2.5 本章小结 |
第三章 场景文本识别模型的选取 |
3.1 场景文本识别模型的四个阶段 |
3.1.1 校正转换阶段 |
3.1.2 特征提取阶段 |
3.1.3 序列建模阶段 |
3.1.4 预测阶段 |
3.1.5 STR模型的分类和选择 |
3.2 模型训练 |
3.2.1 实验环境介绍 |
3.2.2 数据集 |
3.2.3 训练参数设置 |
3.2.4 实验结果及数据分析 |
3.3 本章小结 |
第四章 面向STR 的基于改进EDSR 的图像超分辨率算法 |
4.1 EDSR模型 |
4.2 STR-SR的网络结构 |
4.2.1 二值掩码 |
4.2.2 校正对齐模块 |
4.2.3 改进残差块 |
4.3 重构损失函数 |
4.4 实验内容及数据分析 |
4.4.1 数据集介绍 |
4.4.2 实验环境及训练参数设置 |
4.4.3 Text Zoom数据集相关实验 |
4.4.4 STR-SR与其他SR方法的对比 |
4.5 本章小结 |
第五章 STR-SR网络的最优性能探究 |
5.1 残差块对比实验 |
5.1.1 隐层状态维度 |
5.1.2 残差块数量 |
5.1.3 小结 |
5.2 消融实验 |
5.2.1 二值掩码 |
5.2.2 校正对齐模块 |
5.2.3 损失函数 |
5.3 图像质量评价指标 |
5.3.1 峰值信噪比 |
5.3.2 结构相似性 |
5.3.3 实验结果及数据分析 |
5.4 本章小结 |
第六章 全文工作总结与展望 |
6.1 全文总结 |
6.2 未来展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(5)基于深度学习的集装箱编号识别技术研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 字符定位研究现状 |
1.2.2 字符分割研究现状 |
1.2.3 字符识别研究现状 |
1.3 本文研究内容 |
1.4 本文结构安排 |
2 深度学习的相关理论 |
2.1 深度学习简介 |
2.2 卷积神经网络 |
2.2.1 卷积层 |
2.2.2 池化层 |
2.2.3 激活函数 |
2.2.4 全连接层 |
2.3 本章小结 |
3 集装箱编号识别的总体设计 |
3.1 集装箱基础知识 |
3.1.1 集装箱特点及编号编写规则 |
3.1.2 集装箱编号字符特点 |
3.2 难点分析 |
3.3 本文采用的技术路线 |
3.3.1 编号区域检测 |
3.3.2 编号字符分割与识别 |
3.4 本章小结 |
4 基于YOLOv4 的集装箱编号定位 |
4.1 本文设计思想 |
4.2 基于YOLOv4 的集装箱编号检测算法 |
4.2.1 本文的集装箱编号区域定位流程设计 |
4.2.2 主干特征提取网络 |
4.2.3 多尺度预测设计 |
4.3 基于YOLOv4 集装箱编号检测的实验结果与分析 |
4.3.1 集装箱编号数据集制作 |
4.3.2 环境配置 |
4.3.3 模型训练 |
4.3.4 实验结果及分析 |
4.4 本章小结 |
5 集装箱编号字符分割与识别 |
5.1 技术路线 |
5.2 字符预处理 |
5.2.1 灰度化 |
5.2.2 滤波去噪 |
5.2.3 二值化 |
5.2.4 形态学图像处理 |
5.3 集装箱编号字符分割 |
5.4 集装箱编号字符识别 |
5.4.1 归一化处理 |
5.4.2 轮廓检测去除字符留白 |
5.4.3 模板匹配识别编号字符 |
5.5 实验结果及分析 |
5.5.1 分割结果及分析 |
5.5.2 识别结果及分析 |
5.6 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读学位期间的研究成果目录 |
致谢 |
(6)基于深度学习的货运列车字符识别方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 课题来源 |
1.1.2 课题背景和意义 |
1.2 国内外研究现状 |
1.2.1 列车字符识别研究现状 |
1.2.2 深度学习字符识别算法研究现状 |
1.3 研究内容和组织结构 |
第2章 相关理论基础和技术支撑 |
2.1 货运列车字符图像介绍与分析 |
2.1.1 数据集来源 |
2.1.2 列车自重信息数据分析 |
2.1.3 列车车号数据分析 |
2.2 深度学习理论 |
2.2.1 深度学习 |
2.2.2 卷积神经网络 |
2.2.3 循环神经网络 |
2.2.4 长短期记忆网络 |
2.2.5 残差网络 |
2.3 字符识别算法 |
2.3.1 字符识别基本流程 |
2.3.2 常用字符识别框架 |
2.4 本章小结 |
第3章 基于Inception网络的列车字符识别算法研究 |
3.1 引言 |
3.2 Inception网络结构 |
3.3 基于Inception网络的字符识别模型设计 |
3.3.1 基于Inception的字符特征提取 |
3.3.2 BLSTM的序列预测 |
3.3.3 CTC字符转录 |
3.4 实验与结果分析 |
3.4.1 实验设置 |
3.4.2 数据预处理 |
3.4.3 网络训练 |
3.4.4 评估指标 |
3.4.5 算法对比分析 |
3.4.6 算法模型测试 |
3.5 本章小结 |
第4章 基于Dense Net-Inception网络的列车字符识别方法研究 |
4.1 引言 |
4.2 Dense Net网络 |
4.2.1 Dense Net网络概述 |
4.2.2 Dense Block模块 |
4.2.3 Transition Layer转换层 |
4.3 基于Dense Net-Inception网络的字符识别算法设计 |
4.4 实验与结果与分析 |
4.4.1 网络训练配置 |
4.4.2 算法对比分析 |
4.4.3 算法模型测试 |
4.5 本章小结 |
第5章 货运列车字符识别系统设计与实现 |
5.1 引言 |
5.2 系统开发环境 |
5.3 货运列车字符识别系统框架 |
5.3.1 货运列车字符识别系统的软件架构 |
5.3.2 货运列车字符识别系统框架 |
5.3.3 货运列车字符识别系统的总流程 |
5.4 系统结果演示 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(7)粘连字符识别技术在手写票据中的应用研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 手写中文文本识别现状 |
1.2.2 手写数字串识别研究现状 |
1.3 主要工作 |
1.4 组织结构 |
1.5 小结 |
2 相关工作介绍 |
2.1 手写中文文本识别 |
2.1.1 基于过分割-识别的手写中文文本识别方法 |
2.1.2 基于深度学习的端到端手写中文文本识别方法 |
2.1.3 基于检错与纠错的中文拼写检查方法 |
2.2 手写数字串识别 |
2.2.1 基于分割-识别的手写数字串识别方法 |
2.2.2 基于多个分类器的手写数字串识别方法 |
2.2.3 基于深度学习的端到端识别方法 |
2.3 小结 |
3 基于可靠性优先搜索算法的手写公司名识别研究 |
3.1 过分割算法及识别过程 |
3.1.1 过分割算法 |
3.1.2 过分割项组合 |
3.1.3 单字符分类器 |
3.2 基于区间可靠性优先的路径搜索算法 |
3.2.1 基于图像识别的可靠性分析 |
3.2.2 基于语义的区间可靠性分析 |
3.2.3 可靠性优先的集束搜索(RFBS) |
3.3 公司名检错纠错方法 |
3.3.1 前后缀推断 |
3.3.2 行业信息检错纠错 |
3.4 实验结果与分析 |
3.4.1 数据集与评价指标 |
3.4.2 Beam Search与 RFBS算法的识别效果对比 |
3.4.3 检错纠错方法对识别结果的影响 |
3.5 小结 |
4 基于预分割的端到端手写数字串识别研究 |
4.1 基于预分割的端到端识别方法 |
4.1.1 背景预处理 |
4.1.2 Res Net提取特征 |
4.1.3 Bi-LSTM预测序列 |
4.1.4 CTC转录 |
4.2 模拟票据手写数字串数据集的合成 |
4.2.1 数据集分析 |
4.2.2 模拟票据数据集的合成 |
4.3 实验结果与分析 |
4.3.1 数据集与评价指标 |
4.3.2 不同方法的识别效果对比 |
4.3.3 不同模型对识别效果的影响 |
4.3.4 不同深度的ResNet对识别效果的影响 |
4.4 小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(8)基于OCR技术的光滑金属工件表面字符检测与识别研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状分析 |
1.2.1 OCR技术的研究现状 |
1.2.2 缺陷检测的研究现状 |
1.2.3 字符识别算法的研究现状 |
1.3 课题研究目标及内容 |
1.4 本文结构安排 |
1.5 本章小结 |
第二章 光滑金属表面光学成像系统设计 |
2.1 概述 |
2.1.1 机器视觉系统概述 |
2.1.2 光学系统设计概述 |
2.2 光滑金属表面光学特性分析 |
2.3 光学系统分析与设计 |
2.3.1 光学系统硬件选型分析 |
2.3.2 光学系统设计 |
2.4 本章小结 |
第三章 光滑金属表面字符检测算法 |
3.1 概述 |
3.2 光滑金属表面字符检测算法设计 |
3.2.1 倾斜校正 |
3.2.2 二值化 |
3.2.3 图像滤波 |
3.2.4 形态学运算 |
3.2.5 字符分割及归一化 |
3.2.6 字符检测算法设计 |
3.3 字符检测实验结果 |
3.4 本章小结 |
第四章 光滑金属表面字符识别算法 |
4.1 概述 |
4.1.1 基于图像匹配的字符识别方法概述 |
4.1.2 基于CNN的字符识别方法概述 |
4.2 字符识别算法模型设计及训练过程 |
4.2.1 字符识别算法模型设计 |
4.2.2 字符识别算法模型训练过程 |
4.3 字符识别算法实验分析与测试结果 |
4.3.1 字符识别算法实验分析 |
4.3.2 字符识别算法测试结果 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 课题展望 |
参考文献 |
攻读学位期间本人出版或公开发表的论着、论文 |
致谢 |
(9)中文连续手写识别中若干问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 中文连续手写识别 |
1.2.1 中文连续手写识别的定义 |
1.2.2 中文连续手写识别的分类 |
1.2.3 中文连续手写识别的研究意义 |
1.3 中文手写识别的发展历史和研究概况 |
1.4 本论文的主要内容和创新点 |
1.5 本论文的组织结构 |
第2章 中文连续手写识别中若干问题综述 |
2.1 中文连续手写识别的数学模型 |
2.2 中文连续手写识别的主流解法 |
2.2.1 过切法 |
2.2.2 基于CTC的方法 |
2.2.3 基于Encoder-Decoder的方法 |
2.2.4 基于检测的方法 |
2.2.5 基于HMM的方法 |
2.3 手写识别自适应方法综述 |
2.3.1 传统有监督写字人自适应技术 |
2.3.2 深度有监督写字人自适应技术 |
2.3.3 传统无监督写字人自适应技术 |
2.3.4 深度无监督写字人自适应技术 |
2.4 卷积神经网络加速与压缩 |
2.4.1 低秩分解 |
2.4.2 参数裁剪 |
2.4.3 参数量化 |
2.4.4 基于蒸馏的网络加速与压缩 |
第3章 基于深度神经网络-隐马尔可夫模型的中文连续手写识别 |
3.1 基于DNN-HMM的中文连续手写识别 |
3.2 基于DNN-HMM的训练-识别方案 |
3.2.1 特征提取 |
3.2.2 分类器设计 |
3.2.3 训练准则 |
3.2.4 语言模型 |
3.3 实验 |
3.3.1 实验设置 |
3.3.2 实验结果与分析 |
3.4 本章总结 |
第4章 基于紧致自适应卷积神经网络的中文连续手写识别 |
4.1 中文连续手写文字的固有特点 |
4.2 紧致自适应卷积神经网络 |
4.3 实验 |
4.3.1 实验设置 |
4.3.2 实验结果与分析 |
4.4 本章总结 |
第5章 针对CNN的结构与知识蒸馏 |
5.1 结构与知识蒸馏算法总体流程 |
5.2 关键模块介绍 |
5.2.1 瓶颈特征 |
5.2.2 简约卷积 |
5.2.3 多损失的知识蒸馏 |
5.3 实验 |
5.3.1 实验设置 |
5.3.2 针对中文连续手写识别中的CNN加速与压缩 |
5.3.3 在MNIST中的实验 |
5.4 本章总结 |
第6章 总结 |
6.1 本文的主要贡献与创新点 |
6.2 后续的研究工作 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(10)视频流环境下车牌识别系统研究与实现(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景与研究意义 |
1.2 国内外研究现状与发展趋势 |
1.2.1 视频关键帧提取的研究现状与发展趋势 |
1.2.2 车牌识别的研究现状与发展趋势 |
1.3 本文的研究内容 |
1.4 论文的组织结构 |
2 车牌识别相关理论与基础概述 |
2.1 车牌特征与车牌识别流程 |
2.1.1 车牌特征 |
2.1.2 车牌所含字符 |
2.1.3 传统车牌识别流程 |
2.2 Celery |
2.2.1 Celery的应用场景 |
2.2.2 Celery的优点 |
2.3 OpenCV库 |
2.3.1 应用场景 |
2.3.2 OpenCV的优点 |
2.4 TensorFlow |
2.4.1 TensorFlow关键词 |
2.4.2 TensorFlow中神经网络实现过程 |
2.5 CUDA和 cuDNN |
2.6 本章小结 |
3 KSIFT车辆目标关键帧提取算法 |
3.1 运动目标SIFT概述 |
3.1.1 SIFT特征 |
3.1.2 混合高斯建模 |
3.1.3 感知哈希 |
3.1.4 汉明距离 |
3.2 传统关键帧提取算法 |
3.2.1 算法原理 |
3.2.2 优缺点分析 |
3.3 改进的KSIFT算法 |
3.3.1 视频流数据下采样 |
3.3.2 计算帧熵值 |
3.3.3 混合高斯处理熵值未突变帧 |
3.3.4 计算帧间特征点距离 |
3.3.5 计算车辆目标占比 |
3.3.6 感知哈希与汉明距离去除冗余 |
3.4 实验验证对比分析 |
3.4.1 评价标准 |
3.4.2 实验结果 |
3.5 本章小结 |
4 基于视频流的车牌识别系统设计 |
4.1 系统的需求分析 |
4.2 系统总体架构 |
4.2.1 系统架构设计 |
4.2.2 系统功能模块划分 |
4.3 系统功能 |
4.3.1 单路段车牌识别 |
4.3.2 多路段车牌识别 |
4.3.3 车辆信息统计 |
4.4 系统功能模块设计 |
4.4.1 系统业务流程设计 |
4.4.2 系统数据存储设计 |
4.4.3 系统主要技术架构 |
4.5 单路段车牌识别设计 |
4.5.1 视频流中车辆关键帧提取 |
4.5.2 车牌定位 |
4.5.3 车牌字符分割 |
4.5.4 车牌字符识别 |
4.6 本章小结 |
5 KSIFT算法在车牌识别系统中的应用 |
5.1 车牌识别系统中关键帧提取的意义 |
5.2 KSIFT算法在车牌识别中的应用 |
5.3 基于视频流KSIFT算法的车牌识别的实现与测试 |
5.3.1 实现环境 |
5.3.2 系统功能测试 |
5.4 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
四、基于神经网络的多识别器在字符识别中的应用(论文参考文献)
- [1]图像文本识别的关键技术研究[D]. 吴湘平. 哈尔滨工业大学, 2021(02)
- [2]基于深度学习的文本检测和识别系统的研究与实现[D]. 熊柏桥. 北京邮电大学, 2021(01)
- [3]基于深度学习的发票识别方法研究[D]. 成思齐. 西安工业大学, 2021(02)
- [4]面向场景文本识别的图像超分辨率算法研究[D]. 曾久晟. 电子科技大学, 2021(01)
- [5]基于深度学习的集装箱编号识别技术研究与实现[D]. 李莉莉. 东华大学, 2021(09)
- [6]基于深度学习的货运列车字符识别方法研究[D]. 杨云婷. 东北师范大学, 2021(12)
- [7]粘连字符识别技术在手写票据中的应用研究[D]. 李宇霞. 北京交通大学, 2020(03)
- [8]基于OCR技术的光滑金属工件表面字符检测与识别研究[D]. 张忍. 苏州大学, 2020(02)
- [9]中文连续手写识别中若干问题研究[D]. 汪子锐. 中国科学技术大学, 2020(01)
- [10]视频流环境下车牌识别系统研究与实现[D]. 曾诚. 西安工业大学, 2020(04)