基于粗糙集理论的数据挖掘方法研究

一、基于粗糙集理论的数据挖掘方法的研究（论文文献综述）

韩浪^[1]（2021）在《高速铁路调度集中系统硬件可靠性分析方法研究》文中指出调度集中系统作为铁路运输的核心技术装备,在保证列车安全、高速、正点运行方面发挥着举足轻重的作用。硬件设备是调度集中系统的重要组成部分,其可靠性水平直接决定着系统能否安全、可靠、平稳的运行,对硬件进行可靠性分析,研究硬件的故障模式和失效机理,对于提升调度集中系统的可靠性,保证高铁的客运服务质量十分重要。我国调度集中系统硬件组成结构复杂、种类及数量众多,利用既有可靠性数据分析方法对其进行建模研究时存在计算难度大、数据利用不充分等缺点。铁路数字化的发展,使得调度集中系统积累了大量的现场可靠性数据,为数据挖掘技术应用于硬件可靠性分析提供了数据支撑。论文主要工作如下:首先介绍调度集中系统的体系结构和硬件设备,阐述调度集中系统硬件结构复杂、设备种类及数量众多的特点;基于调度集中系统的硬件结构,阐述数据挖掘技术在调度集中系统硬件可靠性分析工作中的实现方案,设计调度集中系统硬件可靠性分析模块的功能和架构;结合数据挖掘的基本步骤和既有可靠性数据分析方法的基本流程,阐述基于数据挖掘的可靠性分析方法的基本流程。其次以车站自律机硬件设备为例,分析自律机硬件故障特性、失效因素特性以及两者之间的不确定性关系;基于调度集中系统体系结构和硬件组成特点,分析车站自律机硬件现场可靠性数据的采集方式;基于铁路大数据应用框架,设计并阐述现场可靠性数据的预处理逻辑框架;通过对比同一型号同一批次自律机硬件设备在京张高铁和京雄高铁上的不同故障表现情况,发现两条线路的自律机硬件设备在设计水平、制造工艺、运行设备状态、安装与调试人员等失效因素相似的条件下,在运行环境因素上存在巨大差异,因此构建了基于环境失效因素的自律机硬件现场可靠性数据集,为基于数据挖掘的自律机硬件故障失效因素分析提供数据支撑。最后根据聚类分析和基于近似不可分辨关系的粗糙集理论之间的联系,结合两者建立车站自律机硬件故障失效因素分析决策模型,选取环境失效因素作为条件属性集,自律机硬件故障次数作为决策属性,对基于环境失效因素的自律机硬件现场可靠性数据集进行等价类划分,从单一环境因素和耦合环境因素两个角度,验证分析环境失效因素与自律机硬件故障的部分近似依赖程度,并给出提升自律机硬件可靠性的施工建议;通过完成基于数据挖掘的可靠性分析方法的所有基本流程,验证基于数据挖掘的调度集中系统硬件可靠性分析方法的可行性和适用性。

张玉婷^[2]（2021）在《基于邻域粗糙度量的离群点检测方法研究》文中研究指明离群点分析是数据挖掘技术中的一个重要研究分支,其目的是发现一些与一般行为或模式不一致的少数类数据对象。在大部分数据挖掘研究中,离群点会被看作噪声而被丢弃。然而,在欺诈检测、医疗检测、入侵检测、公共安全和图像处理等应用研究中,这种少数类事件的出现可能比正常出现的那些事件更加令人感兴趣。粒计算是一种信息处理的智能计算范式,它将信息粒化机制应用于人类解决实际问题的推理过程。邻域粗糙集理论是一类重要的粒计算模型,已经被证明是数值或混合属性数据分析中进行特征选择、规则提取和知识发现的有效工具。最近,基于邻域粗糙集理论的离群点检测已经被提出。但是,这些方法并未涉及邻域粗糙近似精度和邻域粗糙距离进行离群点检测。而邻域粗糙近似精度和邻域粗糙距离是邻域粗糙集中有效的不确定性度量方法,可以用来构建针对混合属性数据建立离群点检测模型。为此,针对混合属性离群点检测问题,本课题将重点研究基于邻域粗糙度量的离群点检测方法。主要研究内容如下:首先,以优选异构邻域关系度量和统计邻域半径构建邻域信息系统。然后,针对基于粗糙重叠度量的离群点检测方法的不足,提出了基于邻域粗糙重叠度量的离群点检测方法。该方法在邻域粗糙集中定义了两种面向混合属性数据的重叠距离度量方式并分别定义了相应的离群因子来检测混合属性数据的离群点。通过理论分析和UCI数据的对比实验验证了所提新方法的有效性。进一步,基于邻域近似精度的概念,提出了一种以邻域近似精度为基础的离群点检测方法。该方法以邻域近似精度离群因子来表征数据对象的离群度。UCI数据对比实验结果表明,该方法可以适于各种属性类型组合的数据的离群检测。

刘斓乾^[3]（2020）在《多元线性回归和粗糙集聚类在疫情数据分析中的应用》文中研究表明2020年,新型冠状病毒呈现并流行。自2020年1月至2020年3月,湖北省是全国最严重的疫情地区。新冠疫情对我国的教育行业产生了很大的影响,学生停课但不停学,开展网上教学。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,包含有多种算法,例如聚类、预测等。本文使用到的数据挖掘算法有多元线性回归分析算法、粗糙集属性约简算法、主成分分析算法和K均值聚类分析算法等。本文的数据来源包括两部分,第一部分是湖北省卫健委官方网站统计数据,第二部分是通过某教育机构发放调查问卷,得到样本数据。学生层次覆盖全面,所研究的各个因素均有分布,因此数据研究具有可行性。本文主要涉及以下三种算法:（1）通过使用多元线性回归算法分析湖北省疫情数据;（2）通过使用粗糙集属性约简算法分析疫情期间学生学习的影响因素;（3）本文将主成分分析算法、粗糙集算法和K均值聚类分析算法相结合,使用一种综合性的聚类分析算法来对数据进行聚类。其中,第三种算法是本文提出的一种综合性算法,该算法将多种数据挖掘算法相结合,综合利用主成分降维和粗糙集能够解决不确定问题的优势,对数据进行聚类,并与传统的K均值聚类分析算法相对比,验证了该算法的优越性。本文实现了以下三个模型应用:一是建立多元线性回归模型。针对官方网站发布的湖北省疫情数据,具体从2020年1月20日至2020年5月31日的数据,通过建立多元线性回归算法进行研究累计确诊数据与其他数据之间的线性关系,尤其通过建立的线性回归模型分析累计确诊数据和累计治愈数据形成的线性关系,并分析原因。二是建立粗糙集属性约简算法模型。针对疫情期间的学生进行问卷调查,分析影响学生学习的因素。本文通过发放调查问卷,形成样本数据,建立粗糙集属性约简算法模型,来分析疫情期间学生学习的影响因素,本文还采用了因子分析算法进行数据对比分析,通过因子分析算法进一步验证了粗糙集属性约简算法的正确性。三是建立基于主成分分析的粗糙集聚类综合模型。针对疫情期间学生学习进行调查问卷,得到样本数据,从而将学生进行聚类。本文将主成分分析算法、粗糙集算法和K均值聚类分析算法相结合,提出一种基于主成分分析的粗糙集聚类综合算法,对样本进行粗糙集聚类分析,与传统的K均值聚类分析对比,验证了该算法的优越性,并对不同类学生提出对应的建议。

张静驿^[4]（2020）在《贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用》文中提出目的:建立《伤寒论》阳明病篇的中药、方剂、症状的贝叶斯网络模型,结合中医理论知识推理得出《伤寒论》阳明病篇方药及证治的相关规律,为《伤寒论》方证知识的系统研究提供一个新的切入点。方法:本研究首先对《伤寒论》阳明病篇的中药、方剂、症状进行规范化处理,统计中药、方剂、症状的频次、频率,并录入Microsoft Excel软件建立数据库;随后采用SPSS 23.0软件包及R3.4.3软件初步构建贝叶斯网络关系图;再用Netica软件绘制得到贝叶斯网络模型;之后统计贝叶斯网络模型中研究变量的节点度;最后根据图表特征结合中医理论知识分析总结相关规律。结果:（1）方药方面:在《伤寒论》阳明病篇中,仲景使用最多的中药是大黄,使用最多的方剂是承气汤,与其他药物组成药对最多的是甘草和大枣。仲景在阳明病篇中强调阳明实证、阳明变证及阳明热证的治疗,其中用承气汤治疗阳明实证;小柴胡汤、茵陈蒿汤和抵当汤治疗阳明变证;栀子豉汤和猪苓汤治疗阳明热证。仲景亦对表证做了论述,所用方剂为麻黄汤和桂枝汤。（2）证治方面:仲景在阳明病篇中对“发热”做了鉴别,分别指出“发热”相兼“脉浮”为“表热证”、“发热”相兼“便秘”为“里热证”,其中“表热证”用麻黄汤和桂枝汤治疗,“里热证”用承气汤治疗。仲景对“喘”也做了鉴别,指出喘伴恶寒、发热和汗出,用桂枝汤治疗;喘伴潮热、腹胀和便秘,用大承气汤治疗;喘伴发热、汗出和腹胀,用白虎汤治疗。仲景用通利小便的方法治疗发黄,所用方剂为猪苓汤。除此之外,仲景用厚朴治疗谵语、潮热和便秘,栀子治疗身黄、发热和心烦,桂枝治疗恶寒和脉浮,芒硝治疗喘和腹胀,人参治疗潮热;用大承气汤治疗便秘、喘和潮热,栀子豉汤治疗心烦和发热,小承气汤治疗便秘,茵陈蒿汤治疗身黄,小柴胡汤治疗潮热,麻黄汤治疗脉浮,桂枝汤治疗汗出。结论:本研究采用贝叶斯网络和频次、频率统计方法,对《伤寒论》阳明病篇的中药、方剂、症状的知识进行梳理,分析得出方药、证治两方面的规律。研究结果显示:应用贝叶斯网络得到的模型图简洁、清晰、可视化效果好,实现了对《伤寒论》阳明病篇中的方药、证治规律的深入理解,对学习仲景用药和辨证规律有着十分重要的意义,贝叶斯网络是系统研究《伤寒论》的有效方法。

刘国强^[5]（2020）在《基于粗糙集和优化DAG-SVM的船舶主机故障诊断研究》文中认为随着机舱自动化与智能化程度的发展,机舱机械设备的故障产生机理复杂多变。船舶主机作为机舱内的核心设备,对船舶的安全航行起着重要的作用。船舶主机包含的众多子系统之间呈复杂的非线性关系,且主机上众多测点在短时间内采集的大量数据,若不加处理将大大增加诊断系统的运算开销,传统的故障诊断方法难以高效地完成任务。本文以船舶主机的燃油系统为研究对象,提出一种基于粗糙集理论和优化有向无环图—支持向量机（DAG-SVM）的故障诊断方法。首先,将数据挖掘中的粗糙集理论引入传统的支持向量机（SVM）诊断模型,并通过差别矩阵对离散化数据进行降维,在每2种故障之间建立支持向量机分类器,从而构建DAG-SVM拓扑网络;然后,以类间的分类精度为依据,优化有向无环图中根节点和其他叶节点的位置,从而有效避免“误差累积”;最后,基于某超大型油轮模拟器,开展数值实验分析,在相同条件下,对四种典型的分类模式进行仿真实验,分别是1-vs-1 SVM、1-vs-a SVM、DAG-SVM 和本文方法。仿真结果表明,粗糙集与优化DAG-SVM相结合的故障诊断方法可以对船舶主机故障进行有效的诊断决策,其分类精度比传统的DAG-SVM方法提高了3.4%,而时间消耗也降低了2.42s,本文方法在诊断精度和时间消耗上也远优于1-vs-1 SVM和1-vs-a SVM。该诊断方法对船舶主机的故障诊断研究具有一定的参考价值,也可为SVM在其他小样本分类中的应用提供数据支撑。

刘嵩楠^[6]（2020）在《ANFIS数据挖掘模型研究及其应用》文中研究说明信息爆炸时代的到来表示着大数据正在给我们的生活带来巨大的改变,因此数据挖掘的工作就显得尤为重要。数据挖掘,从字面上理解就是从大量的数据中挖掘到其中有规律的并且有价值的、能够理解并且应用的的信息与知识,而应用于数据挖掘的模型有很多种,神经网络模型就是其中一种。自从神经网络技术第一次被提出来到发展至今,各种类型的神经网络兴起并被逐渐应用到各个领域,而模糊神经网络这项技术自被提出以来至今已经给很多的科学问题提供了新的解决方案与思路。ANFIS模型就是一种自适应的模糊神经网络,它将传统神经网络和模糊逻辑有机的结合在一起,弥补了传统神经网络的不足。从上个世纪90年代以来,就开始有学者开始了用神经网络对气象预测进行建模以及气候分析等研究的工作,然而随着研究的深入,各种各样的难题也开始慢慢浮现出来,在用神经网络模型对气象要素进行预测的时候,神经网络的初始权值以及网络结构和学习系数都很难确定,所以要经过大量的训练来确定网络结构和网络的学习参数,但是这样的话又会发生过拟合的情况,模型的泛化能力会受影响。并且目前的天气预报的预测时间较短（最多15天）,所以本文尝试了用ANFIS模型来解决较长期的气象预测的问题。本文旨在对一些气象要素（气温、降水、蒸发量等）进行较长时间的预测。本文完成了以下几项工作:1)基于当前国内外的研究现状对模糊控制理论进行研究,并将其与传统神经网络进行结合;2)通过对ANFIS神经网络模型进行深入的研究,实现ANFIS网络模型;3)探索ANFIS神经网络模型在气象要素预测领域的可能性,并设计实现网络系统,用收集到的地面气象实测数据进行实验。4)将气象数据进行预处理并提取特征,然后从气温、降水、蒸发量三个方面分别建立模型,并对得出的结果进行评估,进而论证ANFIS在对长时间气象预测领域的可行性。

张森^[7]（2020）在《基于粗糙集理论和最小二乘支持向量机的区域物流需求预测研究》文中研究表明“十三五”期间我国经济保持稳定增长,伴随着经济的增长和产业结构的调整,现代物流行业对于区域经济的发展,提高区域经济整体竞争力,所发挥出来的作用越来越凸显。从宏观产业经济发展的角度来看,各种区域物流发展政策的制定、区域物流设施的规划与设计以及产业布局都离不开对区域物流需求进行定量分析。因此,对区域进行物流需求预测是一项基础性且必要性的工作。通过对区域物流需求进行定量分析,有助于地区物流经济主管部门制定地区未来物流发展的科学发展战略规划以及提供相关经济决策必要的数据支撑。本文在深入分析已有物流需求预测理论相关资料的基础上,针对目前区域物流需求预测普遍存在的影响因素选择偏主观性以及缺乏对物流需求影响因子进行对比实证分析等问题,选取代表我国西部地区的四川省和代表东部区域的浙江省作为采集数据样本,构建出完整且较为全面的区域物流需求影响因素指标体系。为了筛选出能代表各自区域物流需求的重要影响因素,引入粗糙集理论,将其中的属性约简数据挖掘算法进行对重要影响因素的提取,并将属性约简结果与最小二乘支持向量机预测模型相结合,构建出区域物流需求RS-LSSVM预测模型。为了验证粗糙集和最小二乘支持向量机结合的有效性和必要性,对属性约简前后的LSSVM模型的预测精度和泛化能力进行前后对比分析,结果表明引入粗糙集理论消除冗余属性,降低输入维度能有效提高LSSVM模型的泛化能力,提高了LSSVM的预测性能,证明了采用粗糙集理论的合理性和有效性。最后,为了更进一步提高区域物流需求的预测精度,决定采用改进的PSO算法AIWPSO来对LSSVM模型进行参数寻优,并将RS-AIWPSO-LSSVM模型的预测精度和预测误差,与RS-PSO-LSSVM模型、RS-BP模型以及采用交叉验证法的LSSVM模型进行比较,实验结果表明RS-AIWPSO-LSSVM的预测精度最佳,学习泛化能力最好,预测误差最小,并将其作为最终的区域物流需求预测模型分别对四川省、浙江省2019年的货运量进行了预测。此外,本文为了实现对四川省和浙江省未来3年的货运量进行预测,运用二次指数平滑法对四川省、浙江省各影响因素未来3年的值做了预测并将其作为AIWPSO-LSSVM模型输入,实现了四川省和浙江省未来3年货运量的预测,并给出了区域相应的发展建议。可以看到,将粗糙集与最小二乘支持向量机引入到区域物流需求预测当中,降低了预测模型的复杂度和难度,具有一定的创新性,这对于区域物流需求预测问题提供了新的方法和思路。

陈军亚^[8]（2020）在《中医辅助诊疗关键技术研究》文中进行了进一步梳理中医药是中华民族的瑰宝,是我国独特的卫生资源,对我国社会经济发展具有重要作用。随着计算机和互联网技术的发展,“互联网+医疗”为中医药发展提供了动力。结合“互联网+”技术,根据中医看病和开药方过程构建中医辅助诊疗系统,该系统能够帮助中医减少对各种药材、处方的记忆和查找,提高中医的医疗水平和效率,且能够有效解决中医药资源不足问题。中医诊疗包括两个阶段,分别是诊断和治疗,两者相互紧密关联。首先中医通过四诊合参全面了解患者病情,然后根据患者的症状体征,依据自己的临床经验知识对患者作出诊断,最后在诊断结果的基础上为患者制定合理的治疗方案。因此,辅助诊疗是中医辅助诊疗系统中的关键技术难题。针对中医辅助诊疗系统的关键技术难题,本文提出基于粗糙集的集成树的医学辅助诊断方法以及基于本体知识库的用药和处方推荐方法,并初步构建了中医辅助诊疗平台。主要研究内容有:1.基于粗糙集的集成树医学辅助诊断方法。为了降低医疗数据的冗余度,快速提取有用的医疗价值,提高医学诊断精度,首先采用基于粗糙集信息熵的属性约简算法对医疗数据进行属性约简,再采用基于C4.5决策树的Bagging集成树算法对经过属性约简产生的病例集进行训练学习。最后试验结果表明该方法不仅能够降低医疗数据的冗余度,同时能够提高医疗诊断的精度。2.基于本体知识库的用药和处方推荐方法。采用七步法构建中医领域本体知识库,以提高知识的共享性和重用性。并据此构建基于Apriori算法的用药推荐方法和基于协同过滤的处方推荐方法。最后试验结果表明基于Apriori算法的用药推荐方法能够有效地向中医推荐中药材,而基于本体的协同过滤处方推荐方法具有较高的准确性。3.中医辅助诊疗平台构建。运用“中医辨证论治系统”结合计算机应用和信息网络技术,使用Java编程语言初步构建了中医辅助诊疗平台,实现了辅助中医疾病诊断、推荐经典方剂和名老中医验方以及中医知识检索和学习功能。本文采用基于粗糙集信息熵属性约简的集成树方法来辅助中医进行疾病诊断分类。采用基于本体知识库的用药和处方推荐方法为中医进行用药和处方推荐。初步构建的中医辅助诊疗平台实现了辅助中医对患者的诊疗。

王晨曦^[9]（2019）在《粗糙集理论在属性约简及模糊聚类中的应用研究》文中研究说明粗糙集理论作为可以用来处理不确定性问题的一种重要数据分析方法,能够根据数据对象间的不可分辨关系获取知识而不需要任何先验知识。粗糙集理论为解决软计算问题提供了新的理论框架,在数据挖掘中具有广泛的应用空间。本文在详细阐述粗糙集理论的基础上,深入探讨粗糙集理论在属性约简及模糊聚类中的应用。属性约简和聚类一直是数据挖掘领域中的研究重点。随着计算机技术和通信技术的发展,数据集变得愈加复杂,数据集内部存在着大量的冗余属性和噪声数据。属性约简可以有效降低数据集的维度,减少属性冗余。模糊聚类是一种应用广泛的软聚类方法,但在应对噪声数据的时候缺乏有效的处理方式,常导致聚类效果不够理想。将粗糙集理论应用于属性约简和模糊聚类中,能够促进粗糙集理论与数据挖掘的融合发展,提升数据挖掘的效果。本文主要的工作有:1)在粗糙集理论的拓展模型中,介绍了一种基于属性重要度的属性约简算法,并指出该算法在约简中忽视了条件属性之间的相关性,常导致约简结果不理想。为此,本文提出了一种基于属性最大重要性和最小相关性的属性约简算法,该算法在进行属性选择时,充分考虑了属性的重要性和属性之间的相关性,能够有效降低属性的数量,提升约简的质量。2)为了应对模糊C均值聚类算法对噪声点敏感和收敛速度过慢的问题,提出了基于粗糙集的抑制模糊聚类算法。该算法根据粗糙集理论的相关概念,重新定义了模糊C均值算法的隶属度公式以提高聚类的效果;此外,该算法还设置了一个抑制因子,在保证聚类效果的前提下,提升了算法的收敛速度。

魏悦亮^[10]（2010）在《粗糙集在数据挖掘不确定性问题中的研究》文中指出数据挖掘中面临大量的不完备信息系统,即可能存在部分对象的一些属性值未知的情况。不完备的数据可能使挖掘过程陷入混乱,导致不可靠的输出。其所表现出来的不确定性也更加显着,这将大大增加数据挖掘的难度。本文以一种处理不精确、不确定和模糊知识的数学方法—粗糙集理论为主要工具,逐步深入展开对不完备信息系统下数据挖掘的研究,以期减少数据挖掘研究与实际应用之间的差距。本文首先对粗糙集理论与数据挖掘展开阐述,包括粗糙集的理论基础、研究方向和研究领域;数据挖掘的概念、特点、任务、分类、要求及数据挖掘中的不确定性;重点说明粗糙集理论可作为数据挖掘方法的依据以及粗糙集应用于数据挖掘的几种常用方法。然后在粗糙集理论不完备信息系统的数据挖掘理论基础上,重点围绕粗糙集与其他方法相结合,阐述了粗糙集-决策树在数据挖掘中的应用;基于粗糙集和遗传算法的数据挖掘方法;粗糙集神经网络算法在数据挖掘中的应用。最后将理论应用于实践以解决实际问题,以高校学生成绩分析为例,提出了基于粗糙集理论的数据挖掘技术在成绩分析中应用的解决方案,表明数据挖掘技术在分析影响高校学生学习成绩因素中具有好的作用,将数据挖掘技术应用在高校教学的各个方面,应该会得到大量的有现实意义的结果,从而制定相应的措施来提高教育教学质量。

二、基于粗糙集理论的数据挖掘方法的研究（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于粗糙集理论的数据挖掘方法的研究（论文提纲范文）

（1）高速铁路调度集中系统硬件可靠性分析方法研究（论文提纲范文）

致谢

摘要

ABSTRACT

1 绪论

1.1 研究背景及意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究现状

1.2.1 调度集中系统硬件可靠性分析研究现状

1.2.2 数据挖掘可靠性分析研究现状

1.3 研究内容及技术路线

1.3.1 技术路线

1.3.2 研究内容

2 基于数据挖掘的调度集中系统硬件可靠性分析方法

2.1 调度集中系统的体系结构及硬件设备

2.2 调度集中系统的硬件可靠性分析方法

2.3 基于数据挖掘的可靠性分析方法的基本流程

2.4 本章小结

3 车站自律机硬件故障的失效因素和现场可靠性数据

3.1 车站自律机硬件故障的失效因素

3.1.1 硬件故障和失效因素

3.1.2 硬件故障可靠性问题说明

3.1.3 硬件故障和失效因素间的不确定性关系

3.2 车站自律机硬件现场可靠性数据

3.2.1 数据采集

3.2.2 数据预处理

3.3 基于环境失效因素的自律机硬件现场可靠性数据集

3.4 本章小结

4 基于聚类分析的自律机硬件故障失效因素分析决策模型

4.1 理论基础

4.1.1 聚类分析

4.1.2 粗糙集理论

4.1.3 基于近似不可分辨关系的粗糙集理论和聚类分析的联系

4.2 自律机硬件故障失效因素分析决策模型

4.2.1 基于聚类分析的等价类划分

4.2.2 基于近似不可分辨关系的粗糙集决策模型

4.3 环境失效因素分析

4.3.1 单一因素分析

4.3.2 耦合因素分析

4.3.3 验证分析

4.4 本章小结

5 结论与展望

5.1 研究结论

5.2 研究展望

参考文献

图索引

表索引

作者简历及攻读硕士学位期间取得的科研成果

学位论文数据集

（2）基于邻域粗糙度量的离群点检测方法研究（论文提纲范文）

摘要

ABSTRACT

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 邻域粗糙集研究现状

1.2.2 离群点检测研究现状

1.3 研究内容及结构安排

1.3.1 研究内容

1.3.2 结构安排

2 相关知识概述

2.1 经典粗糙度量

2.2 邻域粗糙度量

2.3 离群点检测

2.4 本章小节

3 基于邻域加权重叠度量的离群点检测

3.1 检测原理

3.2 检测方法

3.3 检测算法

3.4 演算实例

3.5 算法有效性对比实验分析

3.5.1 实验设置

3.5.2 实验结果及分析

3.5.3 参数敏感性分析

3.6 本章小节

4 基于邻域近似精度的离群点检测

4.1 检测方法

4.2 检测算法

4.3 演算实例

4.4 算法的有效性对比实验分析

4.4.1 实验环境设置

4.4.2 实验结果及分析

4.4.3 参数敏感性分析

4.5 本章小节

5 总结与展望

5.1 总结

5.2 展望

参考文献

在校期间的科研成果

致谢

（3）多元线性回归和粗糙集聚类在疫情数据分析中的应用（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景

1.2 疫情期间发展形势

1.3 数据挖掘

1.4 数据来源

1.5 本文的主要工作和目的

1.6 本文的主体结构

1.7 本章小结

第2章基本理论部分介绍

2.1 数据挖掘

2.2 多元线性回归

2.3 粗糙集属性约简算法

2.4 因子分析

2.5 本章小结

第3章使用多元线性回归算法分析湖北省疫情数据

3.1 湖北省疫情数据

3.2 建立多元线性回归模型

3.3 分析湖北省疫情数据特点

3.4 累计确诊数据和累计治愈数据正相关

3.5 本章小结

第4章使用粗糙集属性约简分析影响学生成绩因素

4.1 疫情给教育行业带来影响

4.2 调查问卷来源

4.3 调查问卷研究可行性

4.4 建立粗糙集属性约简算法模型

4.5 建立因子分析模型得到影响因素

4.6 分析影响学生成绩因素

4.7 本章小结

第5章基于主成分分析的粗糙集聚类综合算法

5.1 K均值聚类分析算法

5.2 主成分分析算法

5.3 粗糙集理论

5.4 基于主成分分析的粗糙集聚类综合算法

5.5 基于主成分分析的粗糙集聚类综合算法研究意义

5.6 本章小结

第6章基于主成分分析的粗糙集聚类综合算法应用

6.1 调查问卷分析数据

6.2 将数据进行K均值聚类分析

6.3 将数据进行主成分分析

6.4 将主成分数据进行粗糙集聚类

6.5 两种聚类分析算法对比

6.6 根据粗糙集聚类结果对不同类学生提出建议

6.7 本章小结

第7章总结及展望

7.1 全文总结

7.2 展望

参考文献

作者简介及在学期间所取得的科研成果

致谢

（4）贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用（论文提纲范文）

中文摘要

Abstract

前言

1 绪论

1.1 研究背景

1.2 研究目的及意义

1.3 国内外研究现状

1.3.1 贝叶斯网络技术应用于中医诊断的研究

1.3.2 贝叶斯网络技术应用于方剂的研究

1.3.3 贝叶斯网络技术应用于中药的研究

1.3.4 贝叶斯网络技术应用于中医证候的研究

1.4 论文的组织结构

2 《伤寒论》的相关知识

2.1 《伤寒论》一书的介绍

2.2 《伤寒论》阳明病篇的介绍

3 贝叶斯网络的介绍

3.1 贝叶斯网络的定义

3.2 贝叶斯网络的结构

4 研究的材料与方法

4.1 数据收集

4.2 数据的整理与规范

4.2.1 方剂的规范化与频次计数说明

4.2.2 中药的规范化与频次计数说明

4.2.3 症状的规范化与频次计数说明

4.3 质量控制及数据挖掘方法

5 结果

5.1 中药、方剂频次和贝叶斯网络模型

5.2 症状频次和贝叶斯网络模型

5.3 中药与症状间的贝叶斯网络模型

5.4 方剂与症状间的贝叶斯网络模型

6 讨论

6.1 方药分布规律

6.2 症状分布规律

6.3 中药与症状间的分布规律

6.4 方剂与症状间的分布规律

6.5 小结

7 结论与展望

参考文献

综述

参考文献

致谢

个人简介

（5）基于粗糙集和优化DAG-SVM的船舶主机故障诊断研究（论文提纲范文）

摘要

Abstract

1 绪论

1.1 选题背景及意义

1.2 故障诊断的研究现状及发展趋势

1.2.1 研究现状

1.2.2 发展趋势

1.3 课题理论在故障诊断中的应用

1.3.1 粗糙集理论

1.3.2 支持向量机

1.4 主要研究内容

2 主机的故障分析和数据采集

2.1 主机工作原理及常见系统

2.2 主机的工作参数及故障特点

2.2.1 主机的工作参数

2.2.2 主机的故障特点

2.3 主机燃油系统数据采集

2.3.1 燃油系统故障分析

2.3.2 喷油器故障数据采集

2.4 故障样本数据处理

2.4.1 标准化处理

2.4.2 离散化处理

2.5 本章小结

3 基于粗糙集理论的属性约简方法

3.1 粗糙集理论

3.1.1 粗糙集的基本概念

3.1.2 属性约简的基本定义

3.2 属性约简方法

3.2.1 基于属性重要性的约简

3.2.2 基于差别矩阵的约简

3.3 实例分析

3.4 本章小结

4 基于支持向量机的故障诊断方法

4.1 统计学习原理概述

4.1.1 VC维理论

4.1.2 推广性的界

4.1.3 结构风险最小化原理

4.2 SVM故障诊断模型设计

4.2.1 构造最优分类超平面

4.2.2 核函数的选取

4.2.3 松弛变量

4.3 SVM多类故障诊断模型分析

4.3.1 1-vs-1 SVM故障诊断模型分析

4.3.2 1-vs-a SVM故障诊断模型分析

4.3.3 DAG-SVM故障诊断模型分析

4.4 类间分类精度优化DAG-SVM结构

4.4.1 算法步骤及优化流程设计

4.4.2 实例分析

4.5 本章小结

5 基于粗糙集和优化DAG-SVM的船舶主机故障诊断

5.1 粗糙集属性约简

5.1.1 粗糙集属性约简步骤

5.1.2 原始决策表的构造

5.1.3 差别矩阵属性约简

5.2 船舶主机故障诊断分析

5.2.1 基于DAG-SVM故障诊断分析

5.2.2 DAG-SVM拓扑结构优化

5.2.3 故障诊断实验分析

5.3 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

作者简历及攻读硕士学位期间的科研成果

（6）ANFIS数据挖掘模型研究及其应用（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景

1.2 研究现状

1.3 研究意义

1.4 本文结构

1.5 本章小结

第2章粗糙集理论

2.1 粗糙集的基本概念

2.1.1 集合中的近似关系

2.1.2 约简与核的概念

2.2 信息系统与知识的含义

2.2.1 信息系统与决策表

2.2.2 属性约简算法

2.3 知识不确定性的分析

2.4 本章小结

第3章 ANFIS模糊神经网络

3.1 人工神经网络的基本原理

3.1.1 人工神经网络的学习原理

3.1.2 人工神经网络的特性

3.1.3 人工神经网络的激活函数

3.1.4 人工神经网络的学习方法

3.2 模糊控制系统的组成

3.2.1 模糊化处理

3.2.2 模糊规则库

3.2.3 模糊推理

3.2.4 清晰化处理

3.3 ANFIS模糊控制系统

3.4 本章小结

第4章气象学基础知识

4.1 天气系统简介

4.1.1 气团

4.1.2 锋

4.2 天气预报简介

4.2.1 气象数据的收集

4.2.2 天气预报常用方法

4.3 本章小结

第5章基于ANFIS的气象预测模型的设计与实现

5.1 模型的设计

5.1.1 样本的选择

5.1.2 样本数据的构成

5.2 数据的预处理

5.3 实验结果与评估

5.4 本章小结

第6章总结与展望

6.1 总结

6.2 展望

参考文献

致谢

个人简历

（7）基于粗糙集理论和最小二乘支持向量机的区域物流需求预测研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景和意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究现状

1.2.1 物流需求预测指标的国内外研究现状

1.2.1.1 物流需求预测指标的国外研究现状

1.2.1.2 物流需求预测指标的国内研究现状

1.2.2 物流需求预测方法国内外研究现状

1.2.2.1 物流需求预测方法国外研究现状

1.2.2.2 物流需求预测方法国内研究现状

1.2.3 目前研究中存在的问题

1.3 研究的内容、方法和创新点

1.3.1 研究内容

1.3.2 研究方法

1.3.3 研究创新点

1.4 研究技术路线

第2章区域物流需求以及预测相关理论

2.1 区域物流需求相关概述

2.1.1 区域物流需求的内涵

2.1.2 区域物流需求的特点

2.1.3 区域物流需求分析的目的以及必要性

2.2 区域物流需求分析的内容

2.3 区域物流需求的量化指标研究现状

2.3.1 我国物流产业的统计现状

2.3.2 区域物流需求的量化指标研究现状

2.4 常用的物流需求预测的方法

2.4.1 区域物流需求预测的内涵

2.4.2 区域物流需求预测的步骤

2.4.3 区域物流需求的定性预测方法

2.4.4 区域物流需求的定量预测方法

2.5 本章小结

第3章区域物流需求的影响因素分析

引言

3.1 四川省社会经济与物流发展状况分析

3.1.1 四川省经济发展总体情况

3.1.2 四川省三大产业发展情况

3.1.3 四川省物流业发展状况分析

3.1.3.1 货运及其构成方面概况

3.1.3.2 社会物流需求规模持续扩大

3.2 浙江省社会经济与物流业发展状况分析

3.2.1 浙江省经济发展总体情况

3.2.2 浙江省三大产业发展情况

3.2.3 浙江省物流业发展情况

3.2.3.1 社会物流需求规模不断提高

3.2.3.2 区域货运以及基础设施情况

3.3 区域物流需求的影响指标的选取原则

3.4 区域物流需求的影响因素分析

3.4.1 影响区域物流需求的经济因素

3.4.2 影响区域物流需求的非经济因素

3.4.3 区域物流需求影响因素指标的初步构建

3.5 区域物流需求预测指标与其影响因素的相关性分析

3.5.1 四川省货运量与影响因素之间的Person相关性分析

3.5.2 浙江省货运量与其影响之间的Person相关性分析

3.5.3 相关性结果分析

3.6 本章小结

第4章基于粗糙集和支持向量机的区域物流需求预测模型的构建

引言

4.1 粗糙集理论简介

4.1.1 粗糙集的基本概念

4.1.2 属性约简与核

4.1.3 属性的离散化

4.2 ROSETTA软件介绍

4.2.1 ROSETTA简介

4.2.2 ROSETTA功能简介

4.3 支持向量机SVM模型原理

4.3.1 SVM简介

4.3.2 SVM的非线性回归原理

4.3.3 最小二乘支持向量机LSSVM原理

4.4 RS-LSSVM模型在区域物流需求预测中的适用性和优势

4.4.1 RS-LSSVM预测模型的适用性

4.4.2 RS-LSSVM模型预测区域物流需求的优势

4.5 RS-LSSVM区域物流需求预测模型的构建步骤

4.6 本章小结

第5章区域物流需求预测模型实证分析研究

5.1 区域物流需求影响因素的属性约简实证分析

5.1.1 四川省区域物流需求影响因素的属性约简

5.1.2 浙江省区域物流需求影响因素的属性约简

5.2 基于RS-LSSVM的区域物流需求预测的实证分析

5.2.1 四川省区域物流需求的RS-LSSVM预测模型的构建

5.2.2 浙江省区域物流需求的RS-LSSVM预测模型的构建

5.2.3 结论

5.3 基于RS-BP神经网络模型预测

5.3.1 四川省区域物流需求的BP神经网络预测模型

5.3.1.1 BP神经网络简介

5.3.1.2 RS-BP神经网络的建立与评价

5.3.2 浙江省区域物流需求的BP神经网络预测模型

5.3.2.1 BP神经网络的建立

5.3.2.2 浙江省RS-BP预测模型评价

5.4 基于PSO算法优化的RS-LSSVM模型

5.4.1 标准粒子群算法PSO以及改进算法

5.4.2 四川省基于AIWPSO算法优化的LSSVM预测模型的实证分析

5.4.3 浙江省基于AIWPSO算法优化的LSSVM预测模型实证分析

5.4.4 结论

5.5 未来3年区域物流需求预测

5.5.1 四川省未来3年货运量的预测

5.5.2 浙江省未来3年货运量的预测

5.5.3 区域货运量预测结果分析以及区域发展建议

5.6 本章小结

第6章总结与展望

6.1 本文结论

6.2 未来研究展望

参考文献

指导老师对学位论文的学术评语

学位论文答辩委员会决议书

附录

致谢

（8）中医辅助诊疗关键技术研究（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文主要内容

1.4 论文组织结构

第2章相关技术

2.1 粗糙集理论

2.1.1 粗糙集概述

2.1.2 基本概念

2.1.3 属性约简

2.2 决策树简介

2.2.1 决策树的主要过程

2.2.2 决策树的剪枝方法

2.3 本体知识库

2.3.1 知识库概述

2.3.2 本体定义

2.3.3 本体的构成要素及分类

2.4 数据挖掘

2.4.1 数据挖掘技术

2.4.2 数据挖掘过程

2.4.3 推荐系统及算法

2.5 本章小结

第3章基于粗糙集的集成树医学辅助诊断方法

3.1 引言

3.2 医疗数据属性约简方法

3.2.1 基于粗糙集信息熵的医疗数据属性约简算法

3.2.2 基于遗传算法的医疗数据属性约简算法

3.2.3 基于Johnson算法的医疗数据属性约简算法

3.3 基于集成树的医学辅助诊断方法

3.3.1 基于C4.5决策树的医学辅助诊断模型

3.3.2 决策树的集成学习算法

3.3.3 基于Bagging的 C4.5 集成树诊断模型

3.4 基于粗糙集的集成树医学辅助诊断方法

3.5 实验分析

3.5.1 仿真数据

3.5.2 基于UCI标准数据集的试验分析

3.5.3 本文方法与其他方法的试验比较

3.6 本章小结

第4章基于本体知识库的用药和处方推荐方法

4.1 引言

4.2 中医本体知识库的构建

4.2.1 中医本体库构建流程

4.2.2 主要参考标准

4.2.3 中医本体库构建方法

4.3 基于中医本体的用药和处方推荐方法

4.3.1 基于中医本体的用药推荐方法

4.3.2 基于协同过滤算法的处方推荐方法

4.4 实验分析

4.4.1 中药推荐方法实验分析

4.4.2 处方推荐方法实验分析

4.5 本章小结

第5章中医辅助诊疗平台构建

5.1 系统概述

5.1.1 系统介绍

5.1.2 系统功能模块

5.1.3 系统操作流程

5.2 中医辅助诊疗系统

5.2.1 辅助开方

5.2.2 辅助诊断

5.2.3 辅助诊断-全局搜索

5.3 本章小结

第6章结论

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间的研究成果

（9）粗糙集理论在属性约简及模糊聚类中的应用研究（论文提纲范文）

摘要

Abstract

变量注释表

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 论文的研究内容及结构

2 相关概念和理论

2.1 粗糙集理论

2.2 知识的分类

2.3 约简与核

2.4 本章小结

3 种新的基于粗糙集理论的属性约简算法

3.1 引言

3.2 基于邻域粗糙集属性重要度的属性约简算法

3.3 基于属性最大重要性和最小相关性的属性约简算法

3.4 实验研究

3.5 本章小结

4 一种新的基于粗糙集理论的模糊聚类算法

4.1 引言

4.2 模糊聚类算法

4.3 基于粗糙集的抑制模糊聚类算法

4.4 实验研究

4.5 本章小结

5 总结与展望

5.1 工作总结

5.2 研究展望

参考文献

作者简历

致谢

学位论文数据集

（10）粗糙集在数据挖掘不确定性问题中的研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 选题背景与意义

1.2 国内外研究现状

1.3 论文结构安排

1.4 论文特色

第二章粗糙集理论与数据挖掘

2.1 粗糙集理论

2.2 数据挖掘

2.3 基于粗糙集的数据挖掘

2.4 本章小结

第三章粗糙集在数据挖掘中的具体应用

3.1 基于粗糙集理论不完备信息系统的数据挖掘

3.2 粗糙集方法与其他数据挖掘方法的结合

3.3 粗糙集应用于不完备信息系统的方法

3.4 本章小结

第四章基于粗糙集理论的数据挖掘技术应用于学生成绩分析

4.1 实施方案

4.2 方案实施实例

4.3 本章小结

第五章结论与展望

5.1 主要结论

5.2 研究展望

参考文献

攻读硕士学位期间取得的学术成果

致谢

四、基于粗糙集理论的数据挖掘方法的研究（论文参考文献）

[1]高速铁路调度集中系统硬件可靠性分析方法研究[D]. 韩浪. 中国铁道科学研究院, 2021(01)
[2]基于邻域粗糙度量的离群点检测方法研究[D]. 张玉婷. 四川师范大学, 2021(12)
[3]多元线性回归和粗糙集聚类在疫情数据分析中的应用[D]. 刘斓乾. 吉林大学, 2020(03)
[4]贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用[D]. 张静驿. 山西医科大学, 2020(11)
[5]基于粗糙集和优化DAG-SVM的船舶主机故障诊断研究[D]. 刘国强. 大连海事大学, 2020(01)
[6]ANFIS数据挖掘模型研究及其应用[D]. 刘嵩楠. 中国地质大学(北京), 2020(08)
[7]基于粗糙集理论和最小二乘支持向量机的区域物流需求预测研究[D]. 张森. 深圳大学, 2020(10)
[8]中医辅助诊疗关键技术研究[D]. 陈军亚. 河南科技大学, 2020(06)
[9]粗糙集理论在属性约简及模糊聚类中的应用研究[D]. 王晨曦. 山东科技大学, 2019(05)
[10]粗糙集在数据挖掘不确定性问题中的研究[D]. 魏悦亮. 中国石油大学, 2010(02)

标签：数据挖掘论文; 粗糙集论文; 聚类论文; 大数据论文; 贝叶斯网络论文;

基于粗糙集理论的数据挖掘方法研究

一、基于粗糙集理论的数据挖掘方法的研究（论文文献综述）

二、基于粗糙集理论的数据挖掘方法的研究（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、基于粗糙集理论的数据挖掘方法的研究（论文提纲范文）

（1）高速铁路调度集中系统硬件可靠性分析方法研究（论文提纲范文）

（2）基于邻域粗糙度量的离群点检测方法研究（论文提纲范文）

（3）多元线性回归和粗糙集聚类在疫情数据分析中的应用（论文提纲范文）

（4）贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用（论文提纲范文）

（5）基于粗糙集和优化DAG-SVM的船舶主机故障诊断研究（论文提纲范文）

（6）ANFIS数据挖掘模型研究及其应用（论文提纲范文）

（7）基于粗糙集理论和最小二乘支持向量机的区域物流需求预测研究（论文提纲范文）

（8）中医辅助诊疗关键技术研究（论文提纲范文）

（9）粗糙集理论在属性约简及模糊聚类中的应用研究（论文提纲范文）

（10）粗糙集在数据挖掘不确定性问题中的研究（论文提纲范文）

四、基于粗糙集理论的数据挖掘方法的研究（论文参考文献）

猜你喜欢