一、基于Rough集的机器学习方法(论文文献综述)
郭雨薇[1](2017)在《基于超像素表征和模糊特征学习的图像分类与识别》文中指出随着计算机科学的发展与互联网的普及,实际生活中可获取的图像越来越多。海量的图像数据带来了更加丰富与直观的信息,但也引出了一系列的问题,其中一个重要问题是如何区分不同的图像数据。该问题推动了图像分类与识别技术的研究热潮,目前不仅仅是各大高校,包括研究所和公司等都针对图像分类与识别问题展开研究。图像预处理与特征提取是影响图像分类性能的两大关键技术。超像素通常作为图像处理技术的预处理步骤,由于超像素保留了图像的局部特征并且提高了算法的计算效率,因此相比基于像素的分类方法,基于超像素的图像分类方法受到越来越多的关注。Rough集理论作为一种特征提取技术,可以直接对数据进行分析和推理,提高后续分类算法的性能。本论文主要从两方面深入研究图像分类与识别问题:(1)超像素技术;(2)特征提取技术。本论文的主要贡献概括为以下几个方面:1.Rough集理论是公认的一种非常好的数学工具,它可以用于特征选择。由于基于Rough集理论得到的特征子集不唯一,因此它可以和集成学习相结合。在机器学习领域,集成学习是一个热门研究方向,集成学习系统由多个基本分类器构成。一个好的集成系统需满足两点,第一,基本分类器的分类准确率高于随机猜想;第二,基本分类器之间应具有多样性。本文提出一个基于动态子空间选择的集成学习算法。基于Rough集理论选取的特征子集具有原始数据的分辨能力,因此,利用这些特征子集训练的基本分类器性能优于随机猜想,满足第一点。为了满足第二点,需选择不同的特征子集。在提出的算法中,分析Rough子空间中特征之间的关系,利用特征之间的最大依赖度缩减特征子集搜索空间,以增加选择的特征子集之间的多样性。同时利用准确-多样性准则从动态特征子集搜索空间中选择合适的特征子集。最后利用选择的特征子集训练基本分类器构建集成分类系统。该算法在UCI数据集,人脸数据集和手写体数据集上验证了它的有效性,并证明了它在处理分类问题时的优势。2.由于经典Rough集理论框架的局限性,其约减后的特征子集表征能力有限。因此,可将它作为预处理工具,并和其他软计算方法或者机器学习方法相结合。本文针对单幅人脸图像分类问题,提出一个两层局部到全局的特征学习框架。该框架将模糊Rough集算法与稀疏自编码器相结合。模糊Rough集算法对原始特征进行选择,以提高后续稀疏自编码器的运算速度;稀疏自编码器能进一步挖掘特征的内在结构,提升基于Rough集学习到的特征的表征能力。该框架第一层利用基于模糊Rough集的特征选择策略提取以目标为导向的图像局部特征。该局部特征不仅对于图像变化鲁棒,还具有原始图像块的分辨能力。该框架第二层利用稀疏自编码器提取收集到的局部特征的全局特征,减少人脸图像中非信息区域的影响。另外,该框架是一个浅层网络,避免了深层网络处理单幅图像人脸识别时产生的过拟合问题。在十组人脸数据集上的实验结果验证了提出的两层特征学习框架在处理单样本人脸识别问题上的优势。3.基于超像素的图像处理技术在很多方面优于基于像素的图像处理技术,这促进了超像素技术的发展和研究。每一种超像素算法都有其优点,不同的超像素算法适用于不同的问题。目前并没有一种针对图像分类问题的超像素算法。在图像分类问题中认为同一个超像素内的所有像素具有相同的类标,然而,在实际应用中,生成的超像素包含纯超像素和混合超像素。纯超像素中的像素具有相同类标;混合超像素由不是同一类的像素组成。由于混合超像素的存在会影响图像分类性能,因此针对于图像分类问题,本文提出一个新的超像素概念,模糊超像素。根据模糊超像素的概念,图像中的像素分为超像素部分和待定像素部分,对于不确定的像素,宁可选择忽略它,也不将其划分到一个不合适的超像素中。基于模糊超像素的概念,针对极化SAR图像分类问题,提出一个模糊超像素算法,该算法利用空间距离和极化SAR性质生成模糊超像素。在三幅极化SAR图像上的实验表明,该算法在用于极化SAR图像分类时优于现有的超像素算法。4.本文针对极化SAR图像分类问题,提出一个基于模糊等价关系的模糊超像素算法。模糊等价关系是Rough集理论中常用的一个概念,它用来衡量特征之间的依赖度。本文利用模糊等价关系衡量极化SAR图像中特征之间的关系,发现同类像素的特征之间具有较高依赖度。另外,根据模糊等价关系,该算法可以自适应调整待定像素比例。该算法首先初始化聚类中心,并根据聚类中心和期望的超像素数量确定重叠搜索区域和非重叠搜索区域。其次,将非重叠搜索区域中的像素归为对应的超像素;将模糊等价关系引入模糊C均值中,判断重叠搜索区域的像素是否属于某个特定的超像素,并根据模糊等价关系自适应确定待定像素比例。最后,进行后处理步骤,生成模糊超像素。该算法在三幅极化SAR图像上的结果表明,其以边界依从性为代价,减少了生成的混合超像素的数量,提高了纯超像素的数量。
周鑫[2](2012)在《基于Rough集理论改进的HOG特征行人检测》文中进行了进一步梳理本论文提出了一种基于Rough集理论改进的HOG特征行人检测方法,目的是提高检测精度的同时加快行人检测的速度。原HOG特征是在64*128像素的检测窗口中提取105个Block,每个Block由2*2个cell组成,每个cell为9个通道(bin)的直方图,那么原HOG特征就是一个3780维(105*4*9=3780D)的特征向量。这一特征已经可以对行人检测作出较为正确地判断,但需要计算的Block数量过多,维度过大,导致特征计算和分类器预测时间过长,不利于一些高实时性的检测要求。本文通过利用Rough集的相关理论来对HOG特征中的Block进行筛选,并按照Block的分类能力,对其进行重要度排序,越重要的Block代表着越强的分类能力,对分类所起的作用越大。为了提高检测精度,本论文还对HOG特征进行了扩展,从原HOG特征105个Block增加到236个,并对这236个Block建立重要度排序。并以此建立一个级联的分类器,按照Block的重要度顺序,每层分类器以逐层增加Block的方式训练得到,分类器采用线性SVM。经过筛选并训练,最终的特征向量只有108到1800维之间。本文的级联的每层分类器不仅用来进行负判断,还通过设置正阂值来进行正判断,而通常的拒绝式级联分类器每层只用来排除负样本。在实现上述方法的过程中,本文还利用了基于信息熵的离散化方法来对特征维进行离散化,并提出了两种利用Rough集相关理论来评价属性重要度的方法,一种是利用条件属性区分决策属性产生的边界域的大小,边界域越小,重要度越高;另一种是利用改进的区分矩阵的方法来评价属性的重要度,在改进的区分矩阵中,出现次数越多的属性越重要。本文的行人检测过程采用滑动窗口的模式,对滑动窗口检测后的重叠窗口合并问题,总结了三种方法。同时为了加速在视频流中的行人检测,还采用了背景擦除的方式来进行预处理。本文最后还设计制作了一个行人检测系统,对行人检测部分实现细节做了探讨,并对检测结果做了分析。实验结果证实,本文的方法在检测速度上得到了大幅度的提高,并且在检测精度上也有一定的提升。
胡峰[3](2011)在《基于分治法的Rough集高效数据挖掘方法研究》文中提出在诸多数据挖掘方法中,Rough集理论是一种新型的智能信息处理方法,它采用确定的方法处理不确定问题,已是处理模糊、不精确和不完备问题的重要数学工具Rough集通过数据预处理、离散化、知识约简(属性约简、属性值约简)等过程,对数据进行去粗取精、去伪存真,逐步地从原始数据集中获取知识。使用Rough集,可以对原始数据进行离散化、降维和知识约简等处理,逐步降低问题的复杂性,它是进行数据挖掘的一条有效途径。但是,作为数据挖掘研究中的一个重要课题,现有的Rough集与方法仍然存在着一些没有解决好的问题。例如,基于Rough集的高效数据挖掘方法、基于Rough集的海量数据挖掘理论与方法、基于Rough集的动态数据处理方法、Rough集的强泛化能力问题、云计算环境下的Rough集数据挖掘方法等。这些问题的存在,有待于我们对Rough集理论与方法进行更深入地研究,并提出更好的解决方案。分治法是一种有效处理复杂问题的方法,它也是一种简单的粒计算方法。分治法的思想就是将整个问题分成若干个问题后分而治之。当求解的问题规模较大时,直接求解往往是非常困难的,有的甚至根本没法直接求出,采用分治法可以将规模较大的问题分解为多个规模较小的问题,然后分别递归求解,最后将解合并,从而实现对原问题的求解。如果能将分治法应用到Rough集数据挖掘方法的研究中,则有可能设计出高精度、高效率的数据挖掘方法。本文分析了现有的Rough集理论与应用研究现状,以基于分治法的Rough集数据挖掘方法为研究主线,对多维表快速排序的复杂度分析、基于Rough集的高效离散化方法、基于分治法的Rough集的知识约简方法的抽象控制过程、Rough集的快速知识约简方法等方面进行了较为深入的研究。归纳起来,本文的主要研究工作和创新内容表现在以下几个方面:(1)将多维数据快速排序的时间复杂度改进为O(nx(m+log n)),提高了Rough集数据挖掘方法的海量数据处理能力。基于分治法原理,将多维数据快速排序的时间复杂度从O(nxmxlogn)降低到O(nx(m+logn))(其中,m为数据维数,n为数据记录数),并应用于改进传统的知识约简方法,在属性核和知识约简研究中取得了很好效果。这一成果,对实现快速、高效的海量数据挖掘,具有重要作用。(第2章)(2)提出了一个两步处理策略的高效离散化算法,解决了Rough集理论中海量数据的离散化问题。在基于Rough理论的数据挖掘过程中,离散化是一个重要的环节,现有的全局离散化算法很难兼顾高精度的离散化效果和高效率,它已成为使用Rough集处理海量数据的一个瓶颈,其主要原因在于候选断点太多造成了计算量和辅助存储空间太大。为克服这一问题,本文提出了“先在单个属性上进行候选断点的动态聚类;然后在所有属性上进行断点选择”的两步处理思路,实验结果表明,使用本方法得到的离散化结果和Skowron教授提出的贪心算法接近,但是运行效率更高。本文提出的离散化算法更适合海量数据的处理,特别是样本数量大的浮点决策表的离散化处理。(第3章)(3)提出了基于分治法的高效属性约简算法和值约简算法,有效地解决了海量数据的知识约简问题。分治法是一种有效处理复杂问题的方法,在Rough集知识约简算法的设计过程中,如果能有效结合分治法,则有可能设计出高效的算法。针对此问题,本文首先介绍了等价关系下基于分治法的决策表分解方法,该方法可用于正区域、属性核、属性约简的计算以及分辨矩阵的操作;其次,介绍了容差关系下基于分治法的决策表分解方法,该方法可用于决策表的值约简;再次,提出了基于分治法的Rough集知识约简方法的抽象控制过程,该控制过程对于设计高效的知识约简方法具有一定的参考意义。在此基础上,通过在属性空间上对论域对象进行快速分解和操作分辨矩阵,给出了基于分治法的知识约简方法。首先,改进了王珏教授提出的属性约简算法,提出了一个新的快速属性约简算法,其次,提出了一个基于分治法的高效值约简算法。实验结果表明,采用文中提出的基于分治法的Rough集高效数据挖掘方法,可以在普通PC机上进行300万网络入侵检测数据(KDDCUP99)的数据挖掘,并保持较高的正确识别率,有效地提升了基于Rough集的数据挖掘方法的数据处理能力。(第4、5章)
陈志辉[4](2009)在《一体化反应堆冷却剂系统故障诊断方法研究》文中提出一体化反应堆冷却剂系统主要设备集成于一体化反应堆内。这种简化的布置,对提高反应堆的固有安全性、可靠性都具有重要意义,但设备的检修比较困难。因此,有必要对一体化反应堆核动力装置反应堆冷却剂系统的典型故障及故障诊断方法进行分析、研究。本课题将反应堆冷却剂系统作为一个系统级的研究对象,将主泵作为设备级研究对象,从系统和设备两个层面进行故障诊断方法的研究。通过对各种智能诊断方法的分析,针对不同层面的诊断要求采用相应的诊断方法。建立了基于专家系统(Expert System, ES)的一体化反应堆冷却剂系统智能故障诊断综合平台,该综合平台集Rough集理论、小波包分析于一体,可以实现数据采集、报警、诊断、自学习等功能。对于一体化反应堆冷却剂系统的典型故障诊断,目前在无法得到试验数据的情况下,利用国际上公认的热工水力分析软件relap5/mod3对一体化反应堆冷却剂系统的典型故障,如接管破裂、主泵断电等故障进行分析,得出压力、温度、水位等重要参数的变化趋势,得到属性表,对属性表进行预处理得到决策表,即训练样本集,利用基于可辨识矩阵和布尔逻辑的约简算法对温度、水位、压力等参数进行约简,得出反映故障特性的特征参量,并提取出诊断规则。根据以上步骤构筑相应的知识获取模块,与专家系统集成,应用Rough集理论解决专家系统知识获取的“瓶颈”问题。论文将可辨识矩阵和布尔逻辑相结合,避免了诊断规则的遗漏,减少了误诊、漏诊的概率。对设备级的故障诊断主要是针对主泵的开裂纹、不对中、转子初始弯曲、转速不匹配等典型故障进行振动信号处理,利用Simulink进行仿真,并在仿真过程中加入“白噪声”使仿真结果更接近于实际情况,从中提取故障的特征频谱,并将提取的故障特征与专家系统进行融合,建立主泵典型故障的故障特征库。通过对一体化反应堆冷却剂系统及主冷却剂泵的典型故障及诊断方法的研究发现:(1)小波分析对振动信号分析具有很好的“数学显微”特性可以有效地提取振动信号中的故障特征量,达到识别故障、诊断故障的目的;(2)小波包具有更精细的识别功能,具有更强的适应性,尤其是对于频率特征较复杂、振动信号微弱的故障特征;(3)基于属性特性的可辨识矩阵约简算法,可以保证实时性的要求,因此可以用于故障诊断的在线学习;(4)通过将可辨识矩阵和布尔逻辑进行融合,建立基于可辨识矩阵和布尔逻辑的约简算法,利用其对一体化反应堆冷却剂系统的故障信息进行约简,得到较全面的诊断规则。但在自学习时由于算法的原因实时性较差,因此可以用于离线学习,并对在线学习的规则进行补充、完善,从而提高故障诊断的实时性和可靠性。由于一体化反应堆核动力装置对安全的特殊要求,本文探讨的方法在核动力故障诊断中具有非常大的发展潜力,但核动力装置结构和技术的复杂性,故障信息中具有不确定因素,本文研究成果用于实际系统的故障诊断还需要做大量的工作。
刘后胜[5](2008)在《基于不确定理论和机器学习的知识发现研究》文中研究说明随着计算机、通信和网络技术的发展,数据呈指数级增长,这些数据已经远远超出了人的能力,如何在海量的数据中发现有用的或感兴趣的知识,是一个迫切需要解决的问题。知识发现便应运而生。知识发现是从数据集中抽取和精化的新模式。本文的数据集是基于农业知识背景。期望通过知识发现研究来获取新的农业知识模式或改善传统的农业知识,从而更好地为农业生产服务。本文首先综述了知识发现的发生发展以及知识发现的方法。随之针对农业生产中存在的问题,运用不同知识发现的方法加以解决。本文知识发现的方法有不确定性理论和机器学习方法。不确定性理论主要是粗糙集理论和证据理论;机器学习方法主要是神经网络方法和支持向量机方法。鉴于植物病害诊断涉及的植物属性很多,包括植物的根、茎、叶、花、果,症状纷繁复杂,不同的病害之间的症状且有相似之处,非专业人员有时很难区分。为此本文分别给出基于粗糙集的酥梨病害知识发现系统构建与基于神经网络的酥梨病害分类器设计,解决非专业人员难以根据复杂相似病害症状进行诊断的问题。传统的植物营养诊断方法如DRIS,M-DRIS,DOP,各有所长,在进行诊断时会出现不同的诊断结果,致使用户难以做出决策。证据理论是信息融合技术中一种非常有效的不确定理论方法,根据其证据合成公式可以融合不同的专家知识,为用户做出决策提供良好的途径。本文基于证据理论的优势,构造了营养诊断方法融合模型,对三种诊断方法DRIS、MDRIS、DOP进行融合处理,结果表示该模型是切实可行的。针对现有的作物水分生产函数模型拟合精度低,本文提出基于支持向量回归机的方法拟合作物水分生产函数,并与现有的模型进行比较,拟合结果显示,基于支持向量机的模型拟合明显优于现有模型。通过对已有的不完备信息系统粗集扩展模型进行分析,并针对王国胤的限制容差模型存在条件限制宽松和严格的不足,对其加以改造,提出了改进的α限制容差关系模型,通过实例比较,验证其更具有实用性,在划分容差类时更具合理性有效性。其农业应用有待进一步研究。
李凡[6](2008)在《Rough集理论及其应用中若干问题的研究》文中认为Rough集理论是Pawlak教授在20世纪80年代初提出的一种用于不确定和含糊数据分析的有效数学方法。在其后的20年中,Rough集理论在其理论研究和实际应用两方面都取得了长足的进展。目前,作为软计算方法的重要分支,Rough集理论涉及的领域包括模式识别、机器学习、决策分析、数据库中的知识发现、专家系统等。本文对Rough集理论及其应用中的一些问题进行了研究,主要的工作和取得的成果概括如下:●不一致决策表的知识约简方法.目前计算不一致决策表的分布约简、最大分布约简和分配约简的方法均基于区分矩阵,在大数据集下将耗费较多计算时间。对此提出了一种转换算法,将原不一致决策表上述三种约简的计算转换为对三种导出的一致决策表Pawlak约简的计算,进而利用针对Pawlak约简的高效启发式知识约简算法降低计算的开销。●不完备决策表的启发式知识约简算法.基于容差关系的Rough集模型是描述不完备决策表最常用的一种模型。在该模型下,广义决策约简是最常见的一种知识约简。目前一般是通过基于区分矩阵的方法计算这种约简,同样不适合数据量较大的情况。对此,在对与广义决策约简相关的性质进行分析的基础上定义了属性重要性,并以此作为启发式信息提出了一种完备的属性约简算法。●变精度Fuzzy Rough集的新定义.Fuzzy Rough集和Rough集类似,容易受到噪音数据的影响。针对这个缺点,研究者们受到变精度Rough集模型的启发,提出了变精度Fuzzy Rough集的概念。但现有的变精度Fuzzy Rough集模型并没有继承一些Rough集,变精度Rough集和Fuzzy Rough集所共有的基本性质。针对这一问题,提出了Fuzzy近似空间中某一Fuzzy集的β-下近似和β-上近似的新定义方式。该定义能够满足上述基本性质。●基于Rough集理论的交叉算子.根据人类DNA研究结果的启示,提出了一种基于Rough集理论的交叉算子,以克服传统交叉算子易于破坏定义长度较长、阶数较高的优良模式的缺点。利用这种交叉算子可以发现有效模式,同时保证这些有效模式即使在其定义长度较长、阶数较高时也不易在基因重组过程中被破坏。●基于Rough集理论的两阶段禁忌搜索算法.基于Rough集理论,提出了一种多样性搜索和集中性搜索分开进行的两阶段禁忌搜索算法,用于以TSP为代表的组合优化问题。该算法与大多数自适应禁忌搜索算法不同,没有采用动态调整禁忌搜索参数的方式平衡集中性搜索和多样性搜索,而是采用了两阶段搜索策略。第一阶段为多样性搜索。此阶段主要通过激励搜索过程远离起点,对解空间进行相当程度的探索。在此基础上构造希望区域决策表,继而求解其知识约简并构造希望区域。第二阶段为集中性搜索。此阶段以希望区域包含的最佳解为起点进行集中性搜索。在搜索过程中,参照希望区域的信息对当前解的选择进行有条件的限制,以灵活利用多样性搜索得到的关于路径的有用信息。●基于Rough集理论的聚类有效性指数.综合了目前常见的两类聚类有效性指数的基本思路,提出了一种针对Fuzzy c-均值算法的聚类有效性指数。该指数用类中心的距离和类的重叠程度两方面的信息来衡量模糊类之间的差异程度,并利用Fuzzy Rough集中的相关概念度量划分的一致性。在此基础上可以找到较为合理的划分。●基于Rough集理论的指代消解方法.提出了一种结合Fuzzy Rough集的基于实例学习方法,应用于中文文本中人称代词消解的研究。该方法的第一步是预处理,得到候选实例集合,然后按照仅涉及浅层语法和语义知识的属性集对其中的每个名词短语进行标记。第二步选择代表性较强的实例,并对其进行属性值约简以提高这些实例的泛化能力。这两个任务均利用Fuzzy Rough集中的相关概念来完成。以上两步为学习阶段。第三步即可根据这些实例判断新输入的名词短语是否为代词的先行语。
袁芳[7](2007)在《基于Rough集理论的数据约简研究与应用》文中认为近年来,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,企业的数据库中积累的数据越来越多。然而激增的数据背后隐藏着许多重要的信息,想要把所有的信息都进行分析和挖掘,是不明智也是不必要的。我们着重要做的,就是找到合适的算法,约简冗余的知识,提炼重要的数据。Rough集理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,即知识,找出其内部数据的关联关系和特征。近年来,Rough集理论和应用取得了很大的成功,已成为软计算方法的重要分支。本文的主要研究工作如下:首先,本文介绍了Rough集理论的基本情况、Rough集的基本概念和Rough集模型的扩展。其次,对Rough集理论的数据约简进行了进一步的研究,提出了一种不一致决策表的划分方法;接着结合概率统计知识对不一致决策表进行决策规则提取,该方法是在满足决策规则力度、肯定因子和覆盖因子的基础上对规则进行筛选,从而提高了决策的准确性和合理性;随后根据Rough集的属性重要性和约简理论提出教学质量的综合评价方法,它解决了教学质量评价指标的约简以及各评价指标权重的确定的问题。该方法有效消减了指标体系规模和削弱了设置权重的主观性。最后,将Rough集约简理论与神经网络进行结合,给出Rough集神经网络约简模型以及该模型的应用。
林丽清[8](2007)在《Rough集和云理论在空间数据挖掘中的应用》文中进行了进一步梳理随着现代科技和数据获取设备的迅速发展,空间数据库的数量和大小日益丰富,使得空间数据挖掘和知识发现变得越来越重要。而在数据挖掘过程中,存在大量冗余数据影响我们的决策,Rough集理论在得到决策规则和分类方面是最有利的根据。它不但可以在不影响数据表达信息的前提下使原来的数据量大为减少(数据约简),而且还可以产生决策规则,从而挖掘出数据中的有效模式。其次,Rough集理论不同于其他处理不确定性问题的理论,如概率方法、模糊集方法等,它无需提供任何所需处理数据集合之外的先验信息。然而Rough集理论要求所处理的决策表中的值必须用离散数据表达,因此在使用Rough集理论对数据挖掘前必须先对数据进行离散化处理。本文首先介绍了数据挖掘,空间数据挖掘的意义、使用的主要方法、获得的知识类型和过程,接着又介绍了Rough集的基础知识,为随后的深入研究做铺垫。其次开始深入研究Rough集在数据挖掘过程的核心问题—属性约简,对目前基于Rough集的属性约简算法展开分析,并比较了各种算法的性能。本文提出一种FAE算法,用于在属性约简前进行优化属性的选择,并在此基础上又建立了一个基于Rough集分析的分类器模型—FAERS模型,通过实验证明了这个算法的分类效果很好。而针对Rough集在挖掘一般决策表的最简规则或者所有规则是一个NP-hard问题,本文又引入蚁群算法,提出一种新的属性约间算法—ACR算法,将蚁群算法用于在对寻找约简属性的过程中指导搜索的方向,通过具体的例子证明了这个算法的有效性。随后,本文又介绍了云理论的相关知识,并具体研究一种基于云模型的离散化算法。在前面理论研究的基础上,本文提出一种基于GIS的空间数据挖掘原型系统,并通过具体的例子说明该系统的运行步骤。最后,在总结本文研究成果和不足之处的基础上阐述了空间数据挖掘的前景。
邓琨[9](2007)在《基于Rough集的Web文本分类及其信息抽取研究》文中认为当前网络正在深度和广度方面飞速地发展着,Internet上包含了大量的信息资源,如何在这些大量、异构的海量信息资源中,快速有效的发掘蕴含具有巨大潜在价值的有用知识和信息,是当今信息发展和信息处理领域的主流技术。Web文本分类是一种有效的数据挖掘技术,它能够合理地、有效地组织海量信息资源,向用户提供简单有效的检索服务,被广泛应用于自动标引、文本过滤和词歧义切分等文本自动处理技术。本文阐述的Web文本分类技术以Rough集理论为基础,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。本文分析了Web文本分类的特点,比较完整地描述了Web文本分类的过程,包括Web文本表达,训练和分类过程;研究和分析常用的Web文本分类的算法以及各自的特点,并提出将Rough集应用到Web文本分类的必要性和优势;深入研究和分析了Rough集的基本理论在Web文本分类中的应用问题,尤其是属性约简问题,它能删除冗余属性,提高系统潜在知识的清晰度,降低发现规则的时间复杂性;详细阐述了基于Rough集理论的Web文本分类技术,并提出一种新的属性约简方法——同类属性约简,此方法能极大减少运算量,加快分类训练的速度,提高了分类性能;阐述了利用Rough集理论对Web文本进行信息抽取,主要是抽取分类规则;提出将同类属性约简方法应用于Web信息抽取,可获得各类信息的关键字,并可计算出各个关键字的重要性。
陈泽华[10](2007)在《粒计算及人工选择算法理论研究》文中进行了进一步梳理本论文主要进行了粒计算和人工选择算法的理论研究,属于智能信息处理和进化计算等学科的交叉范畴。作为一种新的智能信息处理技术,粒计算受到国内外学者的广泛关注。生物进化、人工生命与计算方法的不断融合也一直是各国学者的研究热点。本文主要研究成果包括以下四部分:提出了基于粒计算的Rough集模型,提出了基于粒计算的知识发现算法,提出了基于粒计算的工程建模新方法,提出了基于粒计算的人工选择算法(Artificial Selection Algorithm,ASA)。主要创新成果如下:1.在二进制粒的基础上定义了二进制粒矩阵,提出了基于粒计算的Rough集模型,将Rough集理论中所有的概念和运算都统一在该模型中,提供了计算Rough集边界的简单直观的粒矩阵计算方法。2.将现有的经典Rough集模型、基于概率的Rough集模型和基于包含度的Rough集模型都统一在基于粒计算的Rough集模型之上。3.定义了Rough关系矩阵,从集合论的角度完善了粗糙集的定义。证明了Pawlak教授提出的关于Rough包含、Rough相等的代数定义和隶属度函数定义在本质上是等价的,关于Rough包含和Rough相等的隶属度函数定义并非充要条件,仅仅是必要条件。4.提出了基于粒计算的知识发现算法。该算法通过二进制粒矩阵的简单运算,既能处理相容决策系统,也能处理不相容决策系统,既能进行属性约简,也能进行属性值约简。为粒计算的工程应用提供了简单的算法模型。证明了Rough集理论中传统的代数约简、信息约简都可以归结为粒矩阵的数值运算。5.提出了基于粒计算的工程建模新方法,对某火电厂600MW直流锅炉的高温过热器在喷水扰动下的汽温动态特性进行了机理建模。对传统的加热炉模型进行了模糊建模。从工程应用角度验证了基于粒计算的知识发现算法的有效性。6.提出了进化信息系统、粒度进化空间、人工选择算子、种子等概念和基于粒计算的人工选择算法。利用粒化思想对进化空间进行均匀粒化,形成多种群进化;通过基于粒计算的知识发现算法分析进化规律确定人工育种空间;然后在个体进化层次上求取种子完成人工选择过程。通过人工选择算子实现了在群体个体和基因三个不同粒度层次的进化和跳转。在相同条件下,同传统GA相比,ASA具有人工选择定向性、快速性和智能性的特点,提高了算法的收敛能力。对单调函数、多模态问题、某些类型的欺骗问题能有效求解。本文通过对测试函数的详细分析和比较,论证了算法的有效性。
二、基于Rough集的机器学习方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于Rough集的机器学习方法(论文提纲范文)
(1)基于超像素表征和模糊特征学习的图像分类与识别(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 图像分类与识别的研究背景及意义 |
1.2 超像素的发展历史及研究现状 |
1.2.1 超像素相关介绍 |
1.2.2 超像素生成算法 |
1.2.3 基于超像素的图像分类面临的问题 |
1.3 图像特征学习 |
1.3.1 基于Rough集和模糊Rough集的特征学习 |
1.3.2 基于多层学习的特征学习 |
1.3.3 特征学习面临的挑战 |
1.4 本文主要工作与内容安排 |
第二章 基于动态Rough子空间选择的集成分类算法 |
2.1 引言 |
2.2 一种基于动态Rough子空间选择的集成分类算法框架 |
2.2.1 多组特征子集 |
2.2.2 特征依赖度 |
2.2.3 约减特征子集搜索空间 |
2.2.4 准确-多样评估准则 |
2.2.5 基于动态Rough子集的集成分类算法总结 |
2.3 实验结果与分析 |
2.3.1 特征子集性能分析 |
2.3.2 多样性指标 |
2.3.3 集成系统规模 |
2.3.4 整体性能对比 |
2.4 本章小结 |
第三章 基于模糊稀疏自编码器的图像人脸识别算法 |
3.1 引言 |
3.2 基于模糊稀疏自编码器框架的单幅图像人脸识别算法 |
3.2.1 稀疏自编码器 |
3.2.2 基于图像块的模糊Rough集特征选择算法 |
3.2.3 基于稀疏自编码器的全局特征学习 |
3.2.4 基于模糊稀疏自编码器的人脸识别算法总结 |
3.3 实验结果与分析 |
3.3.1 数据描述与实验设置 |
3.3.2 块尺寸取值分析 |
3.3.3 特征数比率取值分析 |
3.3.4 单幅人脸图像分类算法比较 |
3.3.5 TLFL算法与CNN算法比较 |
3.4 本章小结 |
第四章 基于模糊超像素表征学习的极化SAR图像分类 |
4.1 引言 |
4.2 基于模糊超像素的图像分类算法 |
4.2.1 模糊超像素的概念 |
4.2.2 模糊超像素算法 |
4.2.3 基于模糊超像素的极化SAR图像分类算法 |
4.3 实验结果与分析 |
4.3.1 极化SAR数据集介绍 |
4.3.2 参数分析 |
4.3.3 模糊超像素算法性能分析 |
4.3.4 基于模糊超像素的图像分类性能 |
4.4 本章小结 |
第五章 基于FER模糊超像素表征学习的极化SAR图像分类 |
5.1 引言 |
5.2 基于模糊等价关系的模糊超像素算法 |
5.2.1 极化SAR图像中的模糊等价关系 |
5.2.2 基于模糊等价关系的模糊C均值聚类 |
5.2.3 自适应确定待定像素比例 |
5.2.4 后处理与分类 |
5.3 实验结果与分析 |
5.3.1 像素依赖度分析 |
5.3.2 平衡参数分析与设置 |
5.3.3 超像素质量评价 |
5.3.4 分类结果 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
(2)基于Rough集理论改进的HOG特征行人检测(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 本文的研究目标 |
1.4 本论文的组织 |
第2章 相关背景理论介绍 |
2.1 基于HOG的行人检测方法综述 |
2.1.1 HOG行人检测介绍 |
2.1.2 HOG理论描述 |
2.1.3 HOG行人检测算法的实现 |
2.2 Rough集理论 |
2.2.1 信息系统 |
2.2.2 不可区分关系 |
2.2.3 上下近似集 |
2.2.4 约简 |
2.2.5 分类 |
2.3 SVM支持向量机 |
2.3.1 SVM产生的动机 |
2.3.2 SVM的原理 |
2.3.3 SVM的特征 |
2.3.4 SVM工具 |
第3章 基于Rough集理论改进的HOG特征行人检测方法 |
3.1 介绍 |
3.2 方法 |
3.2.1 训练过程 |
3.2.2 检测过程 |
3.3 行人数据源 |
3.4 HOG特征的扩展及提取 |
3.5 基于信息熵的HOG特征维离散化 |
3.6 基于Rough集理论的属性重要度计算 |
3.6.1 方法一:边界域比例 |
3.6.2 方法二:改进的区分矩阵 |
3.7 Block的重要度排序 |
3.8 SVM级联分类器的训练 |
3.9 实验结果 |
3.10 本章提出的行人检测方法总结 |
3.10.1 总结本章的主要方法 |
3.10.2 实验中的额外尝试 |
第4章 检测过程中的一些其他处理 |
4.1 背景擦除 |
4.2 滑动窗口检测 |
4.2.1 基于窗口重叠法的方法 |
4.2.2 基于加权集合覆盖问题的方法 |
4.2.3 基于Mean-Shift的方法 |
第5章 行人检测系统设计 |
5.1 系统功能模块介绍 |
5.2 行人检测结果与分析 |
5.3 本章总结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(3)基于分治法的Rough集高效数据挖掘方法研究(论文提纲范文)
摘要 |
Abstract |
缩略语表 |
第1章 绪论 |
1.1 数据挖掘概述 |
1.1.1 数据挖掘的概念 |
1.1.2 数据挖掘的理论基础 |
1.1.3 数据挖掘方法的分类 |
1.1.4 数据挖掘的发展状况 |
1.2 Rough集理论及应用研究现状 |
1.2.1 Rough集理论研究背景及意义 |
1.2.2 Rough集理论基本概念 |
1.2.3 基于Rough集的数据挖掘方法研究 |
1.2.4 基于Rough集的不确定性度量 |
1.2.5 面向领域的数据驱动的数据挖掘 |
1.2.6 基于Rough集的海量数据挖掘 |
1.2.7 Rough集理论及应用待解决的关键问题 |
1.3 本文的主要研究内容及成果 |
1.4 本文的组织结构 |
第2章 多维表快速排序的复杂度分析 |
2.1 引言 |
2.2 多维表快速排序的递归算法 |
2.3 时间复杂度和空间复杂度分析 |
2.3.1 时间复杂度分析 |
2.3.2 空间复杂度分析 |
2.4 仿真实验 |
2.4.1 测试一 |
2.4.2 测试二 |
2.5 本章小节 |
第3章 决策表快速离散化算法 |
3.1 引言 |
3.2 Rough集离散化算法分析 |
3.3 基于断点重要性的动态聚类算法 |
3.4 结合动态聚类和断点重要性的快速离散化算法 |
3.5 仿真实验 |
3.5.1 实验一 (UCI数据集测试) |
3.5.2 实验二 (候选断点数目较大的数据集测试) |
3.5.3 实验三 (记录数较多的数据集测试) |
3.6 本章小节 |
第4章 基于分治法的Rough集知识约简方法的抽象控制过程 |
4.1 引言 |
4.2 等价关系下的分治方法 |
4.3 容差关系下的分治方法 |
4.4 基于分治法的Rough集知识约简的抽象控制过程 |
4.5 基于分治法的Rough集知识约简方法的时间复杂度分析 |
4.6 本章小节 |
第5章 基于分治法的Rough集高效知识约简方法 |
5.1 引言 |
5.2 属性序的相关概念 |
5.3 基于分治法的高效属性约简算法 |
5.3.1 属性序下结合分治法的快速约简算法 |
5.3.2 算法有效性分析 |
5.4 基于分治法的高效值约简算法 |
5.4.1 快速确定性规则获取算法 |
5.4.2 快速确定性规则获取算法的复杂度分析 |
5.4.3 实例分析 |
5.5 知识约简算法实验 |
5.5.1 属性约简算法测试实验 |
5.5.2 值约简算法测试实验 |
5.6 本章小节 |
第6章 数据挖掘实验测试及结果分析 |
6.1 UCI数据集上的实验测试 |
6.2 入侵检测实验测试 |
6.2.1 KDDCUP99数据集介绍 |
6.2.2 KDDCUP99数据集测试 |
6.3 本章小节 |
第7章 总结与展望 |
7.1 本文工作总结及创新点 |
7.2 进一步研究工作与展望 |
致谢 |
参考文献 |
攻读博士学位期间发表的论文及科研成果 |
读博期间论文发表情况 |
读博期间参编的着作章节 |
读博期间所获的科研奖励 |
读博期间参与的科研项目 |
(4)一体化反应堆冷却剂系统故障诊断方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 概述 |
1.2 研究现状 |
1.2.1 故障诊断技术研究现状 |
1.2.2 核能领域故障诊断研究现状 |
1.3 本课题主要研究内容 |
1.4 本课题研究过程及预期结果 |
第2章 一体化反应堆核动力装置简介 |
2.1 一体化反应堆的发展现状及特点 |
2.2 反应堆结构及主要设备 |
2.2.1 反应堆堆芯 |
2.2.2 蒸汽发生器 |
2.2.3 反应堆冷却剂系统及主泵 |
2.2.4 反应堆的压力容器 |
2.2.5 稳压方式 |
2.2.6 安全壳 |
2.3 本章小结 |
第3章 基于专家系统的故障诊断平台研究 |
3.1 专家系统简介 |
3.2 故障诊断系统平台及诊断流程 |
3.3 知识的表示及推理 |
3.4 开发工具的选择 |
3.5 本章小结 |
第4章 主泵故障诊断系统研究 |
4.1 主泵结构简介 |
4.2 一体化主泵典型故障描述 |
4.2.1 开裂纹故障 |
4.2.2 不对中故障 |
4.2.3 转子弯曲故障 |
4.2.4 转速不匹配故障 |
4.3 基于小波分析的主泵故障诊断系统 |
4.3.1 小波分析理论 |
4.3.2 基于小波包分析的主泵故障诊断流程 |
4.4 主泵典型故障诊断 |
4.4.1 开裂纹诊断结果 |
4.4.2 不对中诊断结果 |
4.4.3 转子初始弯曲诊断结果 |
4.4.4 转速不匹配诊断结果 |
4.5 分析 |
4.6 本章小结 |
第5章 基于Rough集理论的知识获取系统研究 |
5.1 简述 |
5.2 Rough集理论简介 |
5.2.1 Rough集理论及知识的表达 |
5.2.2 Rough集方法的应用和发展前景 |
5.2.3 Rough集理论与专家系统 |
5.2.4 Rough集理论的特点 |
5.3 基于Rough集理论的故障诊断方法研究 |
5.3.1 基于Rough集理论的知识获取 |
5.3.2 一体化反应堆冷却剂系统典型故障选择 |
5.3.3 Rough集理论知识约简方法的选择及应用 |
5.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
(5)基于不确定理论和机器学习的知识发现研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第1章 绪论 |
1.1 知识发现 |
1.1.1 知识发现的任务 |
1.1.2 知识发现的对象 |
1.2 知识发现的方法 |
1.2.1 不确定性理论的方法 |
1.2.2 机器学习方法 |
参考文献 |
第2章 基于粗糙集的酥梨病害知识发现系统构建 |
2.1 粗糙集理论的产生和发展 |
2.1.1 粗糙集理论的发展概况 |
2.1.2 粗糙集理论的研究现状 |
2.1.3 粗糙集试验系统 |
2.2 粗糙集理论的基本概念 |
2.2.1 知识与知识库 |
2.2.2 不精确范畴、近似及粗糙集 |
2.2.3 知识约简 |
2.2.4 知识的依赖性 |
2.2.5 知识表达系统 |
2.2.6 决策表 |
2.2.7 区分矩阵与区分函数 |
2.3 酥梨病害知识系统构建 |
2.3.1 系统结构 |
2.3.2 知识表示 |
2.3.3 属性约简 |
2.3.4 规则提取 |
2.4 酥梨病害系统应用实例 |
2.5 结束语 |
参考文献 |
第3章 基于限制容差关系的粗糙集模型拓展 |
3.1 不完备信息系统的研究现状 |
3.2 已有扩展的不完备信息系统粗集模型 |
3.2.1 容差关系模型 |
3.2.2 非对称相似关系模型 |
3.2.3 限制容差关系模型 |
3.3 改进的限制粗集模型—α限制容差关系模型 |
3.4 α限制容差关系模型性能比较分析 |
3.5 结论 |
参考文献 |
第4章 基于D—S理论营养诊断方法融合模型构建 |
4.1 证据理论的最新进展 |
4.1.1 理论完善 |
4.1.2 证据理论的应用 |
4.1.3 证据理论存在的问题 |
4.2 证据理论的基本知识 |
4.2.1 识别框架 |
4.2.2 基本可信度分配 |
4.2.3 信度函数 |
4.2.4 众信度函数 |
4.2.5 似真度函数 |
4.2.6 合成规则 |
4.3 营养诊断技术问题分析 |
4.4 基于D-S理论营养诊断融合模型构造 |
4.5 营养诊断融合模型结果分析 |
4.6 结束语 |
参考文献 |
第5章 基于神经网络的酥梨病害分类器设计 |
5.1 人工神经元模型 |
5.1.1 神经元的建模 |
5.1.2 神经元的数学模型 |
5.1.3 神经元的转移函数 |
5.2 人工神经网络模型 |
5.3 神经网络学习 |
5.3.1 最速下降法 |
5.3.2 LMS算法 |
5.4 BP神经网络 |
5.4.1 三层BP网络模型 |
5.4.2 BP学习算法 |
5.5 BP网络设计 |
5.5.1 训练样本集的准备 |
5.5.2 BP网络结构设计 |
5.6 基于BP网络设计的酥梨病害分类器 |
5.6.1 酥梨病害分类器学习样本的获取及预处理 |
5.6.2 酥梨病害分类器网络设计 |
5.6.3 酥梨病害分类器结果分析 |
5.7 结束语 |
参考文献 |
第6章 基于支持向量机水分生产函数研究 |
6.1 机器学习的模型 |
6.2 经验风险最小化原则 |
6.3 统计学习理论 |
6.3.1 VC维 |
6.3.2 学习机器推广的界 |
6.3.3 结构风险最小化 |
6.4 支持向量机 |
6.4.1 二值分类 |
6.4.2 最优分类超平面 |
6.4.3 线性支持向量机 |
6.4.4 近似线性可分支持向量机 |
6.4.5 非线性支持向量机 |
6.4.6 线性支持向量回归机 |
6.4.7 近似线性支持向量回归机 |
6.4.8 非线性支持向量回归机 |
6.4.9 ν-支持向量回归机 |
6.5 基于SVM的水分生产函数回归拟合 |
6.5.1 样本数据及其处理 |
6.5.2 进一步比较研究 |
6.5.3 结果分析 |
6.6 结束语 |
参考文献 |
第7章 总结与展望 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(6)Rough集理论及其应用中若干问题的研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 Rough集理论发展概述 |
1.2 Rough集理论的基本思想 |
1.3 Rough集理论及其应用的研究现状 |
1.3.1 Rough集理论研究的现状 |
1.3.2 Rough集理论应用研究的现状 |
1.4 本文的研究内容及意义 |
1.5 本文的创新点 |
1.6 本文的章节安排 |
第二章 Rough集理论的基本概念 |
2.1 信息系统与决策表 |
2.2 不可分辨关系与近似空间 |
2.3 集合近似 |
2.4 Rough集的基本性质 |
2.5 知识约简 |
2.6 属性值约简 |
2.7 区分矩阵与区分函数 |
2.8 本章小结 |
第三章 不一致决策表和不完备决策表的知识约简研究 |
3.1 不一致决策表和不完备决策表 |
3.2 不一致决策表知识约简的高效算法研究 |
3.2.1 不一致决策表的知识约简 |
3.2.2 不一致决策表的知识约简高效算法 |
3.2.3 算法时间复杂度分析 |
3.3 不完备决策表的启发式知识约简算法 |
3.3.1 不完备决策表的知识约简问题概述 |
3.3.2 不完备备决策表的容差关系模型中的基本概念 |
3.3.3 基于容差关系的Rough集模型的知识约简及相关性质 |
3.3.4 基于容差关系的Rough集模型的知识约简启发式算法 |
3.3.4.1 属性重要性的度量 |
3.3.4.2 知识约简算法 |
3.3.4.3 算法时间复杂度分析 |
3.4 实验及结果分析 |
3.5 本章小结 |
第四章 变精度Fuzzy Rough集的一种新定义 |
4.1 基本概念 |
4.1.1 变精度Rough集模型 |
4.1.2 Fuzzy集 |
4.1.3 Fuzzy Rough集模型 |
4.2 变精度Fuzzy Rough集模型的相关工作 |
4.3 变精度Fuzzy Rough集应具备的基本性质 |
4.4 变精度Fuzzy Rough集模型的新定义 |
4.5 新定义的基本性质 |
4.6 本章小结 |
第五章 Rough集理论在现代优化算法中的应用 |
5.1 Rough集理论在遗传算法中的应用 |
5.1.1 遗传算法概述 |
5.1.2 基本概念 |
5.1.3 基于Rough集理论的交叉算子 |
5.1.3.1 模式及模式定理 |
5.1.3.2 生物学上的启示 |
5.1.3.3 具体实现 |
5.1.4 实验及结果分析 |
5.2 Rough集理论在禁忌搜索算法中的应用 |
5.2.1 禁忌搜索算法概述 |
5.2.2 禁忌搜索算法中的集中性和多样性搜索策略 |
5.2.3 基于Rough集理论的两阶段禁忌搜索算法 |
5.2.3.1 第一步:多样性搜索 |
5.2.3.2 第二步:希望区域的确定 |
5.2.3.3 第三步:集中性搜索 |
5.2.3.4 算法中的若干技术细节 |
5.2.4 算法的收敛性分析 |
5.2.5 实验及结果分析 |
5.2.5.1 实验方法 |
5.2.5.2 测试实例及参数设置 |
5.2.5.3 测试结果 |
5.3.本章小结 |
第六章 Rough集理论在聚类有效性分析中的应用 |
6.1 FCM算法的基本概念 |
6.2 基于Fuzzy Rough集的聚类有效性指数的定义 |
6.2.1 聚类有效性指数设计中涉及到的概念 |
6.2.2 基于Fuzzy Rough集的聚类有效性指数的定义 |
6.3 实验及结果分析 |
6.3.1 实验采用的数据集 |
6.3.2 实验采用的方法 |
6.3.3 实验及结果分析 |
6.4 小结 |
第七章 Rough集理论在自然语言处理中的应用 |
7.1 自然语言处理 |
7.1.1 自然语言处理的内涵及其意义 |
7.1.2 自然语言处理的研究方法 |
7.1.3 Rough集理论在自然语言处理中的应用 |
7.2 指代消解研究的意义及其研究现状 |
7.3 基本概念 |
7.3.1 与指代相关的语言学概念 |
7.3.2 基于任意Fuzzy关系的Fuzzy Rough集 |
7.4 基于Fuzzy Rough集的汉语人称代词消解方法 |
7.4.1 汉语人称代词消解研究面临的难点 |
7.4.2 基于实例的学习 |
7.4.3 基于Fuzzy Rough集的汉语人称代词消解方法描述 |
7.4.3.1 语料预处理 |
7.4.3.2 实例选择 |
7.4.3.3 属性值约简 |
7.4.3.4 判断新输入文本中的NP是否为代词先行语 |
7.4.4 实验及结果分析 |
7.4.4.1 实验所用语料及其处理细节 |
7.4.4.2 实验结果及分析 |
7.5 本章小结 |
第八章 全文总结及进一步的工作 |
8.1 全文总结 |
8.2 今后的工作 |
致谢 |
参考文献 |
攻读博士学位期间取得的研究成果 |
(7)基于Rough集理论的数据约简研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
引言 |
第1章 Rough集理论概述 |
1.1 Rough集理论的提出背景 |
1.2 Rough集理论的研究对象 |
1.3 Rough集理论的特点 |
1.4 Rough集的应用现状 |
1.5 Rough集的基本概念 |
1.5.1 知识与知识库 |
1.5.2 知识约简 |
1.5.3 信息系统与决策表 |
1.6 Rough集模型的扩展 |
第2章 Rough集理论的数据约简 |
2.1 决策表中的数据约简 |
2.2 一种不一致决策表划分的方法 |
2.3 基于Rough集的概率统计方法的决策规则提取 |
2.3.1 支持度,力度,肯定因子和覆盖因子 |
2.3.2 决策规则提取实例 |
2.4 属性的重要性 |
2.5 基于Rough集理论的数据约简综合应用实例 |
2.5.1 教学质量综合评价指标体系 |
2.5.2 评价指标权重的确定方法 |
2.5.3 教学质量综合评价步骤 |
2.5.4 模拟实例 |
第3章 Rough集约简理论在神经网络中应用的研究 |
3.1 神经网络理论 |
3.2 BP神经网络的基本原理 |
3.3 BP网络的算法实现 |
3.4 Rough人工神经网络约简模型 |
3.5 Rough人工神经网络约简模型的应用 |
第4章 总结与展望 |
致谢 |
参考文献 |
在学期间撰写的论文 |
(8)Rough集和云理论在空间数据挖掘中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 数据挖掘 |
1.1.1 数据挖掘的提出 |
1.1.2 数据挖掘的定义 |
1.1.3 数据挖掘的过程 |
1.1.4 数据挖掘的三步曲 |
1.1.5 数据挖掘的方法 |
1.1.6 数据挖掘的对象 |
1.1.7 数据挖掘的任务 |
1.1.8 数据挖掘的发展现状和前景 |
1.2 空间数据挖掘 |
1.2.1 空间数据挖掘和知识发现的定义和特点 |
1.2.2 空间数据仓库与空间数据挖掘 |
1.2.3 从空间数据库可发现的知识类型 |
1.2.4 空间数据挖掘的方法 |
1.2.5 空间数据挖掘系统的体系结构和开发策略 |
1.3 本论文的组织结构 |
第二章 Rough集合 |
2.1 Rough集的提出 |
2.2 Rough集的基本概念和性质 |
2.2.1 Rough集的基本概念 |
2.2.2 Rough集下近似和上近似的基本性质 |
2.2.3 Rough集中的成员关系 |
2.2.4 不精确性的数字特征 |
2.2.5 不精确性的拓扑特征化 |
2.2.6 分类的近似 |
2.2.7 集合的粗略相等和粗略包含 |
2.3 属性值系统 |
2.4 属性的依赖 |
2.5 属性的简化与属性系统的核 |
2.6 属性的重要性 |
2.7 决策表的分析和简化 |
2.7.1 决策表的定义与性质 |
2.7.2 决策表的简化与最小决策算法生成 |
2.8 举例说明 |
2.8.1 例一 |
2.8.2 例二 |
2.9 小结 |
第三章 基于 Rough集的属性约简算法的研究 |
3.1 数据约简的现状 |
3.1.1 数据约简 |
3.1.2 属性约简 |
3.1.3 基于 Rough集的属性约简算法 |
3.2 FAE方法——一种优化属性选择方法 |
3.2.1 信息熵的相关知识 |
3.2.2 属性选择 |
3.2.3 FAERS分类器模型 |
3.2.4 实验研究 |
3.2.5 结论 |
3.3 蚁群算法在属性约简中的应用 |
3.3.1 蚁群算法 |
3.3.2 具体算法流程 |
3.3.3 实验与结果分析 |
3.3.4 结论 |
3.4 小结 |
第四章 云理论 |
4.1 云理论 |
4.1.1 云理论的提出 |
4.1.2 云理论的基本概念 |
4.1.3 云模型 |
4.1.4 云发生器 |
4.1.5 虚拟云 |
4.2 云理论在数据挖掘中的应用 |
4.2.1 基于云模型的概念和知识表达 |
4.2.2 云理论与Rough集的结合 |
4.3 基于云模型的离散化算法 |
4.3.1 不确定程度 |
4.3.2 峰值法云变换算法 |
4.3.3 基于云理论的离散化算法 |
4.4 小结 |
第五章 基于 Rough集和云理论的空间数据挖掘系统 |
5.1 空间数据挖掘系统的模型 |
5.2 空间数据挖掘原型系统的具体运用 |
5.2.1 目标数据集的选择 |
5.2.2 数据预处理 |
5.2.3 数据转换 |
5.2.4 空间数据分类 |
5.2.5 对挖掘结果的分析与应用 |
5.3 小结 |
第六章 总结 |
6.1 工作总结 |
6.2 进一步需要做的工作 |
参考文献 |
附录1 |
附录2 |
致谢 |
研究成果及发表的学术论文 |
作者简介 |
硕士研究生学位论文答辩委员会决议书 |
(9)基于Rough集的Web文本分类及其信息抽取研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 问题的描述 |
1.2 研究背景和意义 |
1.3 国内外的现状及发展趋势 |
1.3.1 国外文本分类研究 |
1.3.2 国内文本分类研究 |
1.4 研究内容 |
1.5 本文的内容组织和结构 |
1.6 本章小结 |
第二章 Web 文本分类 |
2.1 Web 文本分类的定义 |
2.2 Web 分类的特点 |
2.3 Web 文本分类的过程 |
2.3.1 Web 文本表达 |
2.3.2 维数约简 |
2.4 常用的分类算法 |
2.4.1 Rocchio 算法 |
2.4.2 K 近邻算法 |
2.4.3 支持向量机 |
2.4.4 朴素贝叶斯方法 |
2.4.5 决策树 |
2.4.6 神经网络 |
2.5 分类性能评价 |
2.6 本章小结 |
第三章 Rough 集理论简介 |
3.1 概述 |
3.2 知识与分类 |
3.3 不精确范畴,近似与 Rough 集 |
3.4 知识约简与知识的依赖性 |
3.5 知识表达系统与决策表 |
3.6 将 Rough 集理论应用于 Web 文本分类 |
3.7 本章小结 |
第四章 基于 Rough 集的 Web 文本分类及信息抽取 |
4.1 基于 Rough 集的 Web 文本分类概述 |
4.2 基于 Rough 集的 Web 文本分类的属性约简 |
4.2.1 常见的属性约简方法 |
4.2.2 同类属性约简方法 |
4.3 基于 Rough 集的 Web 文本分类的决策规则 |
4.3.1 标准决策规则 |
4.3.2 近似决策规则 |
4.4 基于 Rough 集的 Web 文本分类的规则匹配 |
4.4.1 完全匹配 |
4.4.2 部分匹配 |
4.5 基于 Rough 集的 Web 信息抽取 |
4.6 本章小结 |
第五章 结论与展望 |
5.1 结论 |
5.2 进一步工作的方向 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(10)粒计算及人工选择算法理论研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 人工选择算法的提出 |
1.1.1 复杂系统和人工生命 |
1.1.2 自然选择和人工选择 |
1.2 粒计算与人工选择算法 |
1.2.1 基于粒计算的智能信息处理技术 |
1.2.2 粒计算在人工选择算法中的应用 |
1.3 人工选择算法的哲学基础 |
1.4 论文工作安排及主要创新 |
1.5 论文各章节关系 |
参考文献 |
第2章 粗糙集中的粒定义和粒运算 |
2.1 Crisp集合与Fuzzy集合 |
2.1.1 Crisp集合的基本概念 |
2.1.2 Fuzzy集合的基本概念 |
2.2 经典Rough集模型 |
2.2.1 经典Rough集的基本定义 |
2.2.2 经典Rough隶属函数的定义 |
2.2.3 经典Rough包含与Rough相等 |
2.3 基于概率的Rough集模型 |
2.3.1 概率Rough集的基本定义 |
2.3.2 概率Rough隶属函数的定义 |
2.4 基于包含度的Rough集模型 |
2.4.1 基于包含度的Rough集的基本定义 |
2.4.2 基于包含度的Rough隶属函数定义 |
2.5 基于粒计算的Rough集模型 |
2.5.1 Rough集合的粒定义 |
2.5.2 基于粒矩阵的Rough集的基本定义 |
2.5.3 基于粒矩阵的Rough隶属函数定义 |
2.5.4 基于粒矩阵的Rough关系矩阵定义 |
2.5.5 基于粒矩阵的Rough包含 |
2.5.6 基于粒矩阵的Rough相等 |
2.6 几种Rough集模型定义的等价性 |
2.6.1 粒模型与经典Rough集模型的等价性 |
2.6.2 粒模型与概率Rough集模型的等价性 |
2.6.3 粒模型与基于包含度的Rough集模型的等价性 |
2.7 算例 |
2.7.1 算例1 |
2.7.2 算例2 |
2.8 小结 |
参考文献 |
第3章 基于粒计算的知识发现算法 |
3.1 知识发现的基本概念 |
3.2 Rough集知识约简的代数表示 |
3.2.1 Rough集知识约简的基本概念 |
3.2.2 Rough集知识约简的代数表示 |
3.3 Rough集知识约简的信息表示 |
3.4 Rough集知识约简的粒矩阵表示 |
3.5 Rough集知识约简的常规算法描述 |
3.6 Rough集知识发现的粒矩阵算法描述 |
3.7 两个计算实例 |
3.7.1 几种常见算法的比较实例 |
3.7.2 一个完整的粒计算约简实例 |
3.8 小结 |
参考文献 |
第4章 基于粒计算的工程建模 |
4.1 直流锅炉过热汽温的机理建模 |
4.1.1 过热器的结构和动态特性 |
4.1.2 主要影响因素分析 |
4.1.3 利用粒计算方法建立系统最优模型 |
4.2 建立加热炉的模糊预测模型 |
4.2.1 问题的提出 |
4.2.2 模糊关系模型的几个基本概念 |
4.2.3 基于模糊关系模型的建模方法 |
4.2.4 利用粒计算方法建立加热炉的模糊预测模型 |
4.3 结论 |
参考文献 |
第5章 基于粒计算的人工选择算法 |
5.1 人工选择算法综述 |
5.1.1 人与自然 |
5.1.2 自然进化与人工进化 |
5.1.3 自然选择与遗传算法 |
5.1.4 人工选择与人工选择算法 |
5.2 人工选择算法的基本概念 |
5.2.1 进化信息系统 |
5.2.2 GA解空间的粒度划分 |
5.2.3 人工育种空间 |
5.2.4 人工育种空间示意图 |
5.2.5 种子和人工选择算子 |
5.3 人工选择算法的主要步骤 |
5.3.1 人工选择算法描述 |
5.3.2 人工选择算法流程图 |
5.4 人工选择算法实例分析 |
5.4.1 单调函数种子的选择 |
5.4.2 一个欺骗函数的例子 |
5.4.3 非单调复杂多峰问题的求解 |
5.5 仿真实验及结果分析 |
5.5.1 仿真实验 |
5.5.2 结论 |
5.6 本章小结 |
参考文献 |
第6章 结论与展望 |
6.1 结论 |
6.2 展望 |
6.3 结束语 |
致谢 |
攻读博士学位期间已发表和录用的学术论文 |
科研项目 |
四、基于Rough集的机器学习方法(论文参考文献)
- [1]基于超像素表征和模糊特征学习的图像分类与识别[D]. 郭雨薇. 西安电子科技大学, 2017(01)
- [2]基于Rough集理论改进的HOG特征行人检测[D]. 周鑫. 南昌大学, 2012(01)
- [3]基于分治法的Rough集高效数据挖掘方法研究[D]. 胡峰. 西南交通大学, 2011(10)
- [4]一体化反应堆冷却剂系统故障诊断方法研究[D]. 陈志辉. 哈尔滨工程大学, 2009(02)
- [5]基于不确定理论和机器学习的知识发现研究[D]. 刘后胜. 中国科学技术大学, 2008(06)
- [6]Rough集理论及其应用中若干问题的研究[D]. 李凡. 电子科技大学, 2008(04)
- [7]基于Rough集理论的数据约简研究与应用[D]. 袁芳. 南昌大学, 2007(06)
- [8]Rough集和云理论在空间数据挖掘中的应用[D]. 林丽清. 北京化工大学, 2007(05)
- [9]基于Rough集的Web文本分类及其信息抽取研究[D]. 邓琨. 南昌大学, 2007(06)
- [10]粒计算及人工选择算法理论研究[D]. 陈泽华. 太原理工大学, 2007(04)