一、图像检索中基于标记与未标记样本的主动学习算法(论文文献综述)
傅炜杰[1](2021)在《高效机器学习算法的若干问题研究》文中提出机器学习算法赋予了计算机通过挖掘历史数据来总结决策经验的能力。由于其避免了专家系统所需的大量人工规则的整理,机器学习算法已经被广泛应用在诸如文本挖掘、视觉分类、推荐系统等场景中。然而,大部分机器学习算法常常为提升准确率而忽视了实践中效率的牵制问题,其导致的巨大时间复杂度对当下互联网规模的数据极不友好。与此同时,机器学习算法伴随的各种超参数导致大量人力与计算资源耗费在调参过程中,为机器学习算法的训练带来了额外的负担。为此,高效的机器学习(efficient machine learning)获得了越来越多的关注,其旨在快速或方便地从大规模数据中归纳到任务所需的决策经验。本文基于低秩分解、近似估计、分布引导等技术,从分类模型(classification models)的构建、训练样本(training data)的选择性标记及黑盒决策(decisions of blackbox classifiers)的解释三个角度,进行了高效机器学习算法的研究。特别地,本文研究了图模型在半监督学习中的高效分类算法,及其在主动学习中的高效样本选择策略。同时,本文探索了面向深度模型的高效解释算法。本文的具体创新点如下:1.针对图模型的权重计算,提出了快速局部权重评估算法。通过引入绝对值约束以替代不等式约束,将重构误差最小化的优化问题中低效的迭代解转化为高效的解析解。同时,给出了该算法在半监督锚图分类器中的应用,实现了后者权重估计5~10倍的速度提升。2.针对大规模数据的邻接关系建模,提出了层次化锚图模型。通过将锚点层推广到层次化的金字塔结构,构建低秩的数据点标签矩阵,进一步解耦了图模型在效率和性能上的博弈问题;构建了基于样本原空间和谱空间中的高效分类算法,在单机上实现了8百万数据点在2分钟的快速半监督分类。3.针对大数据集合的样本的选择性标记问题,提出了近似的期望误差下降策略。该策略通过快速局部影响力度量和局部误差下降与影响力比率估计,实现了可靠的误差下降估计,并实现了主动学习20~100倍的加速。4.针对深度网络高性能但低可理解性的问题,提出了基于分布引导的卷积神经网络解释方法。该方法通过在UNet网络后端引入分布控制器避免了解释器目标函数的超参设定,实现了解释器的高效优化和决策的快速解释。5.从计算负责度、计算效率以及计算能力角度,分析了高效机器学习的相关工作,并提供了一个面向实践中的高效机器学习算法的选择建议。
李彤[2](2020)在《高分遥感图像场景理解及识别方法研究》文中提出高分辨率遥感图像作为对地观测的主要手段之一,以其对地物几何、纹理、结构等信息的精细描述能力,在土地利用管理与监测、智慧城市的建设等应用中发挥着重要作用。“高分辨率对地观测系统重大专项”的启动更是将针对高分辨率遥感图像的处理技术及应用研究推向了一个高潮。空间分辨率提高、地物描述更加复杂,令仅基于像素层面和面向对象的分析已无法满足各类应用需求,因此,挖掘地物的语义信息、构造地物之间语义关系的表达与推理模型以实现图像场景层面的理解、识别遥感图像中具有典型特征的局部场景等更高层更抽象的解译成为研究热点。论文面向高分辨率遥感图像,以基于场景层面的语义理解和识别为主旨,针对高分遥感图像处理中面临的主要问题进行深入的研究和探讨。论文工作对高分遥感图像的语义信息挖掘及土地资源利用的自动智能解译应用等,具有重要的理论意义和研究价值。论文具体研究内容包括以下四部分。首先,针对大幅面高分遥感图像地物组成和结构复杂、数据量大,难以直接进行分类识别的问题,研究了大幅面遥感图像感兴趣区域提取方法,在感兴趣区域的基础上进行后续的研究,以提高处理效率。由于视觉显着性模型仅关注地物的光谱信息而忽略空间信息,论文利用地物空间分布,通过构造边缘-角点联合密度分布指数,实现了基于几何分布的感兴趣区域提取。在此基础上提出了基于形心密度分布指数的感兴趣区域分级提取方法,首先利用改进的视觉显着性模型初步提取感兴趣区域,而后构造形心密度分布指数,实现感兴趣区域的精细提取。实验结果表明,提出的方法可根据需求在大幅面遥感图像中提取不同类型的感兴趣区域,并有效降低虚警。其次,针对传统的低层视觉特征无法有效表达遥感图像场景的语义信息的问题,研究了面向语义鸿沟的视觉词包模型及其构造过程中的可变因素,从子图像块的划分、特征描述子的选择、视觉单词个数的设置、分类器核的选择等方面入手,对比分析了各项因素对场景语义表达与识别结果的影响,选择有效的语义信息表达方式实现场景理解。在此基础上,将空间信息引入视觉词包模型,结合最优尺度分割,提出了基于中层特征的高分遥感图像语义分类与场景识别方法。实验结果证明,改进的视觉词包模型可以有效提高场景识别的准确率,同时将中层特征所包含的语义信息引入地物分类应用也可很好地提高分类精度。然后,针对在遥感场景识别中不同数据集间无法共享标记样本的问题,分别研究基于遥感场景和自然场景特征迁移的遥感场景识别方法。一方面,充分利用不同遥感图像场景数据集,提出对抗变分自动编码机模型,通过源域与目标域遥感场景图像的对抗训练,实现不同遥感图像场景数据集间的迁移学习;另一方面,利用计算机视觉领域中包含大量标记样本的自然场景数据集,研究基于典型相关分析的多视角场景图像迁移识别方法,消除视角差异,实现自然场景与遥感场景之间的信息迁移。实验表明,基于遥感与自然场景特征迁移的高分遥感图像场景识别方法可改善目标域训练样本不足引起的欠学习及过拟合现象,提升遥感场景识别的准确率。最后,针对遥感图像场景识别中标记样本不足的问题,研究基于半监督学习和主动学习的高分遥感图像小样本场景识别方法。通过研究所有未标记样本的特征分布,结合少量有标记样本,提出了结合密度峰值与图的样本选择方法,为部分未标记的样本赋予伪标签,同时利用不确定性准则的主动学习思想,查询密度峰值聚类中位于聚类边界附近的样本,实现训练样本的扩充,从而实现遥感图像小样本场景识别。实验表明,提出的半监督与主动学习相结合的方法可有效提升小样本下遥感场景识别的准确率,在初始训练样本较少的情况下表现尤为明显。
邢玉莹[3](2020)在《多视图多标记学习方法研究与应用》文中提出多视图多标记学习作为机器学习中最具潜力的技术之一,近年来备受关注且已被广泛应用至异质多媒体数据分析和生物信息学等诸多领域中。该技术旨在从不同的角度出发,对有多个特征表示的事物进行描述。在多视图多标记学习中,一个对象拥有多个属性视图且被多个概念标签所标注。传统的多视图多标记学习方法旨在通过对同一对象的多个属性视图进行整合以获取其所对应的标记,且这些多视图数据融合方式大多都是监督式的,在模型训练过程中需要大量的有标记样本作为输入。然而,在真实世界中,对多视图多标记对象进行标注代价十分昂贵,需要耗费大量的人力和财力,且同一对象的多个视图之间信息的交流与传递对于该对象的学习表现力也会产生很大影响。进一步地,为了更好地解决多视图样本学习过程中每个对象在不同视图上多个子样本之间存在的语义鸿沟,衍生出了另外一种更为复杂的多视图多示例多标记学习框架。该框架的学习目的是通过整合一个样本(包)在多个视图中所含子样本(示例)的特征来获取该样本所对应的多个概念标签。传统的多视图多示例多标记学习算法大多都是监督式的,且忽略了包、示例以及标记这3种类型对象之间所存在的多种关联关系对样本学习表现力的影响。此外,这些算法也无法适用于部分包在多个视图上的匹配信息未知,以及标记不完整的弱监督场景。针对这些不足之处,本文围绕多视图多标记学习框架,并结合协同训练算法、矩阵分解、半监督学习和主动学习等技术对多视图复杂对象进行建模,完成的主要工作如下:1.提出了一种新的多标记协同训练算法(Multi-label Co-Training,MLCT),通过引入大量的未标记样本,来更好地探索多视图多标记这一复杂对象多个视图之间信息的交流与传递对样本学习表现力的影响。MLCT首先利用成对标记之间的共现信息来解决协同训练与多标记学习结合过程中常见的类别不平衡问题。然后设计了一种新的信息交换策略,通过找出对每个视图而言具有较高预测置信度的样本及标记,并将该信息传递给其它分类器以提升样本的预测表现力。在多个公开的多视图多标记基准数据集上的研究验证了该模型的有效性。2.设计了一种新的基于协同矩阵分解的多视图多示例多标记学习算法(Multi-view Multi-instance Multi-label Learning Based on Collaborative Matrix Factorization,M3Lcmf)来探索包、示例和标记这3种对象之间存在的复杂的关联关系以及这些对象在不同视图上内部结构的差异性对样本学习效果的影响。该方法首先对由包、示例和标记节点所构成的多视图异构网络中多种不同类型的关联关系数据进行编码;然后再协同这些关联关系矩阵进行协同分解来获取关于包、示例与标记的低秩表示;并通过对这些关联关系矩阵进行选择性整合来探索样本与标记之间存在的潜在关联。在多个多示例多标记基准数据集上的实验结果证明了该方法可以在包级别和示例级别上取得较好的预测表现力。3.提出了一种更灵活更开放的弱监督多视图多示例多标记学习算法框架(Wealy-supervised Multi-view Multi-instance Multi-label Learning,WSM3L)来解决包在多个视图上匹配信息部分未知以及标记缺失的问题。该模型首先利用多视图字典学习为多视图多示例多标记对象学习一个多视图共享字典以及与每个视图相对应的编码矩阵;其次WSM3L结合样本在包级别上的标记相似度与特征编码相似度来对不同视图中匹配关系未知的包进行匹配;最后利用多个视图中包的近邻信息以及示例级别上的标记预测信息来补全包的缺失标记。在多个基准数据集和真实数据集上的包级别预测结果和示例级别预测结果显示了该模型的有效性和灵活性。4.通过结合主动学习和多视图多示例多标记学习,提出了一种新的算法框架(Multi-view Multi-instance Multi-label Active Learning,M3AL)来降低未标记多视图多示例多标记复杂对象的标注成本。M3AL先利用多视图自表达学习来捕获所有样本在多个视图上的共性与差异性,并结合未标记样本在多个视图中示例的分布情况来设计不确定度量策略以筛选出最不确定的样本-标记对。通过对这些筛选出来的样本-标记对进行查询从而在提升分类器学习性能的同时来降低多视图多示例多标记复杂对象的标注代价。在多个公开数据集上的结果表明,使用该方法可以有效地降低多视图多示例多标记复杂对象的标注成本,提高分类精度。
张芬[4](2019)在《视觉属性学习及其在图像检索中的应用研究》文中研究指明随着现代通信和多媒体技术的迅猛发展,网络上数字图像的数量出现了急剧增长,如何从海量的数字图像中快速而有效地找到人们所需要的图像,是一个非常有理论价值和实际意义的研究课题。为缩小图像底层特征与高层语义之间的语义鸿沟,如何将图像底层特征与图像的语义视觉关键词相结合进行图像自动标注,以及如何利用学习的图像标签进行高效的图像检索,成为新的研究热点。本文研究属性的学习以及基于属性的图像检索方法,围绕着三个问题开展了相关的研究工作,创新成果如下:(1)针对相对属性学习中局部特征表示的准确性问题,本文提出一种基于属性相关局部区域的深度相对属性学习方法。由于很多属性是面向局部的,属性相关的局部特征表示较全局特征表示更能表征属性变化,本文通过改进属性空间范围发现方法,以提高局部定位的准确性。此外,深度学习的特征较手工设计的特征更具识别力,本文通过串接从深度网络提取的中间层局部特征和高层全局特征来获得更准确的特征表示。在公开的图像数据集上进行了实验,实验结果验证了上述方法的有效性,并提高了相对属性学习性能。(2)针对基于二进制属性的图像检索结果中所含查询属性强度的无序性问题,本文提出一种基于分组属性强度的图像检索方法。原来的基于二进制属性的图像检索方法最先检索到的图像,其属性强度往往参差不齐,导致检索结果无法满足用户需求。通过结合二进制属性和相对属性来学习分组属性强度,在粗粒度的检索过程中融入细粒度的元素,使得先检索到的图像具有更强的属性强度。在公开的图像数据集上进行了实验,所得检索结果更符合用户预期目标,较原有的基于二进制属性的图像检索方法具有更好的检索性能。(3)针对扩展属性学习中语义关系度量的精确性问题,本文提出一种基于网络搜索量的扩展属性图像检索方法。该方法通过结合两种外部语言库共同构建候选扩展属性集,并且根据网络数据可以直接反应用户对属性词的使用量和熟悉度,利用从网络上获得的数据信息来度量用户偏好,以剔除候选集中不常用的项,得到最终的扩展属性集。用户通过该方法进行图像检索时,查询属性的范围不仅包括预标签属性,还包括扩展属性。此外,本文还提出一种一致性度量方法来粗略地验证所学习的扩展属性的可靠性。实验结果表明,所提方法在一定程度上提高了用户查询输入的自由度和图像检索性能。
王增茂[5](2019)在《面向小样本问题的主动学习理论及应用研究》文中研究表明近年来,机器学习在大数据应用中取得了很大的成功,应用场景和范围日益丰富,涵盖了计算机视觉,自然语言处理,智能医疗等众多领域。大数据为机器学习的发展带来机遇的同时也带来了挑战,突出的表现为数据标记困难。数据类型多样、数据产生环境复杂、数据更新速度快等因素,导致在实际应用中往往只有少量的标记数据可以利用,大大降低了模型泛化能力。如何利用有限的人工标记提高数据的分类精度,即小样本问题,是当前机器学习领域的前沿问题之一。主动学习技术是机器学习领域解决小样本问题的基础方法之一,其利用人机交互的方式,从大规模数据中选取最具有信息量的样本进行人工的标记,逐步的建立高质量小样本训练数据集,来提升分类模型在小样本下的泛化能力。本文面向小样本下的数据分类和预测任务,系统地研究了利用主动学习解决分类任务中数据匮乏的方法。不确定性和代表性是主动学习查找最具信息量样本的两大核心准则。不确定性主要是为了查找数据中类别间界面附近的数据点,代表性主要是为了挖掘数据集中的分布结构、减少冗余和加速学习。本文为了提升主动学习的性能,设计了一系列不确定性信息和代表性信息统一结合的样本学习模型,主要创新点包括:1)针对单标签数据分类问题,本文提出了将双样本理论和不确定性结合的启发式主动学习框架,框架中基本上涵盖了进行理想样本查询的所有条件,克服现有主动学习方法框架通过约束假设表达数据结构造成算法适应性差的难题。依据此框架进行主动学习算法设计,可以选择出即具有不确定性又具有代表性的样本。2)针对多标签数据分类问题,本文提出了基于最大相关熵准则的鲁棒多标签主动学习模型,解决异常低相关标签影响主动学习中不确定性和代表性准则准确表达的难题.提出的模型主要是利用最大相关熵准则的有界性,抑制低相关标签在两种准则衡量中影响,发挥强相关标签在衡量中的主导作用。3)针对半监督和主动联合学习中存在的半监督信息欠缺问题,本文提出了一种融合代表性和判别性的半监督主动学习方法,主要是利用主动学习循环中更新前后的标记集,建立多个分类模型和聚类模型,依据分类模型对未标记样本分配可靠性伪标签获得判别性样本,依据聚类中的近邻原则进行未标记样本的伪标签标记获得代表性样本,而不能进行伪标签分配的样本则作为主动学习样本查询的候选集。通过这种融合方式,可以极大地丰富标记集中判别性和代表性信息,快速提升主动学习的性能。4)针对领域适配和主动学习联合学习中不确定性与代表性准则框架不统一的难题,本文提出了一种领域适配协同的多域主动学习方法,将目标域数据和源域数据嵌入到一个不确定性和代表性联合的主动学习框架中进行目标域样本的查询,同时在主动学习中不断调整源域数据分布,使其更加适合目标域分类任务,大大提高跨领域分类问题精度。
张敏[6](2019)在《基于半监督学习的WMS元数据文本多标签分类方法》文中研究表明随着地理信息网络共享和志愿者地理信息技术(VGI)的发展,主题内容多样的开放式网络地图服务(Web Map Service,WMS)资源大量涌现,为地学研究与应用提供了丰富的数据资源。但现有元数据标准缺乏显式、细粒度和面向领域的内容描述机制,导致领域专家和服务用户无法快速定位目标专题内的资源数据。目标领域的服务检索需求对服务数据的主题多标签分类提出了迫切的要求。但WMS元数据文本内容纷繁复杂、长短各异、语言不一,地学术语和通识词汇混杂,且缺乏标注应用领域的元数据集,导致WMS元数据文本的精准多标签分类面临着巨大的挑战。本文提出了一种基于半监督学习的WMS元数据文本多标签分类方法,在仅依赖少量标记样本数据的前提下,实现了WMS元数据双层多标签主题匹配。该方法包含特征选择、多标签分类和二次主题提取三部分:1)特征选择:选取社会受益领域(Societal Benefit Areas,SBAs)作为粗粒度领域主题,引入语料库抽取与SBAs语义密切相关的典型词,基于Word2vec算法计算典型词与文本特征的空间距离,实现最优领域特征子集的选择。2)多标签分类:提出多标签分类基模型ML-CSW,该模型以语料库计算得到的文本特征与主题的语义相似度作为文本特征权重,训练主题预测模型。在此基础上,提出基于半监督学习的多标签分类算法SML-SWKNN,将ML-CSW与经典的多标签分类算法ML-KNN(Multi-label K Nearest Neighbor)结合进行协同训练,实现WMS元数据的多标签分类。3)二次主题提取:基于粗粒度领域主题分类结果,利用LDA算法进行二次主题提取,构建双层领域主题目录,获得WMS元数据与双层领域主题的匹配映射关系。为了验证本文多标签分类方法的可行性,本文分别以WMS和图层元数据作为研究对象,开展了特征选择准确性、协同训练基模型准确性和SML-SWKNN算法的分类准确性、语义合理性、适用场景等验证实验。实验结果表明本文提出的特征选择算法能够有效提升分类性能,协同训练基模型单独在数据视图中分类性能也较好。SML-SWKNN算法相比经典的多标签分类算法有较大的提升,且算法在富含主题信息的长英文文本中性能最优。多标签分类和双层主题匹配具备语义合理性,能够推广应用于地理信息门户或目录服务中辅助WMS资源的检索发现。
陈霞[7](2019)在《基于样本和标记建模的弱监督分类方法研究》文中进行了进一步梳理监督式分类技术基于强监督假设,通过学习大量的、具有单一且明确的真值标记的样本来训练分类模型。尽管现有的监督式分类技术已经取得了巨大的成功,但由于数据标注过程需要耗费大量的人力和物力,且受外部环境、问题特性以及标注者自身的原因等多方面因素的制约,很多数据获取到的往往是少量的、不准确的标记。此外,真实世界中的对象普遍具有多义性,即每个样本可以同时拥有多个标记。在多义性场景下,指数规模的输出空间使得学习系统需要更加充裕的监督信息。传统的监督式分类框架在不足够的监督(即不足够的有标记样本)、不准确的监督(即不准确的标记信息)及多义的监督(即每个样本可以同时拥有多个标记)的弱监督场景下难以取得较好的效果。因此,研究弱监督场景下的分类算法具有极大的现实意义。本文围绕上述三种弱监督场景,通过分析现有的弱监督方法的不足,分别基于半监学习技术、多标记主动学习技术与偏多标记学习技术展开研究,完成的主要工作如下:1、基于半监督学习技术解决不足够的监督的问题:由于真实世界中的样本并不总是均匀分布的,两个靠近决策边界的、拥有不同标记的样本可能会相距很近,因此很容易被错误分类。针对这一问题,我们提出一种基于聚类调整相似度的半监督分类方法SSC-CAS。该方法首先利用聚类算法探索所有未标记样本与有标记样本的结构信息,然后根据样本所属的聚类簇之间的相似度调整样本之间的相似度,使得处于决策边界处且处于不同聚类结构的样本间的相似度减小。最后,SSC-CAS在这个新构造的图上执行基于图的半监督分类。实验结果证明了这种构图方式的有效性,且SSC-CAS获得了较相关对比方法更好的分类表现。此外,大部分现有的半监督分类方法都同等对待每个样本。事实上,越靠近决策边界的样本应该获得更多的关注。基于上述情况,我们提出一种新的基于样本加权的半监督分类方法WS3C。该方法首先基于多次聚类结果衡量样本的难聚类程度与样本间的相似度。越靠近决策边界的样本越难聚类,应拥有更大的权重。然后,WS3C利用样本的难聚类程度对样本进行加权并结合样本间的相似度构建了一个流形正则化框架来预测未标记样本的标记。实验分析证明了这种样本加权方式的有效性,且WS3C具有较相关对比方法更好的分类表现。2、基于多标记主动学习解决多义的监督下不足够的监督的问题:在多义的监督场景下,样本的标注过程更加困难且代价昂贵。一个样本是否与一个标记相关取决于该样本是否包含与该标记相关的特征信息。然而,当前的主动学习方法查询一个样本标记对的相关性时,要求标注者详细审查完整个样本。事实上,对于一个相关的样本标记对,标注者可以更容易地仅通过审查待标注样本的关键的子样本来审查所查询的样本标记对的相关性,减少标注代价。基于上述情况,本文提出了基于子样本标记对查询的多标记主动学习方法CMAL。该方法首先利用不确定性、标记相关性以及标记空间稀疏性选择出最有价值的样本标记对,然后基于所选择的样本标记对迭代地选择出最可能相关的子样本标记对给专家标注。实验结果表明,在同样的成本条件下,CMAL能够获得较相关对比方法更好的分类表现。3、基于偏多标记学习解决多义的监督下不准确的监督的问题:在多义的监督的场景下,样本的标注过程更加困难,因此更容易出现噪声标记。显然,噪声标记的存在会影响分类器的分类表现。然而,当前的多标记学习方法假设已获取的标记是无噪的,研究多义的监督下不准确的监督的工作还很少。基于上述情况,本文提出一种基于矩阵分解的多标记噪声标记识别方法MF-INL。该方法首先利用矩阵分解技术分解原始的包含噪声标记的样本标记关联矩阵为两个低维的矩阵,同时保持样本在低维空间的结构信息与标记在低维空间的相关性。然后,MF-INL利用分解的两个矩阵重构样本标记关联矩阵。在该重构的关联矩阵中,关联值更低的样本标记关联更可能是噪声关联,即该标记更可能为该样本的噪声标记。实验结果证明了MF-INL识别噪声标记的有效性。为进一步提高噪声标记识别的表现与同时实现噪声标记场景下的分类器训练,本文提出一种特征诱导的偏多标记学习方法fPML。该方法通过将样本特征与标记映射到同一个低维的语义空间学习原始样本标记关联矩阵的低秩逼近,估计样本标记关联置信度,进一步识别噪声标记。特别地,fPML在识别噪声标记的同时,利用估计的样本标记关联置信度训练一个投影矩阵,将样本特征映射到标记空间,实现对未标记样本的标记预测。实验结果表明fPML较对比方法能够更有效地识别噪声标记,且在未标记样本标记预测上也获得了较对比方法更好的表现。
孙金[8](2019)在《基于主动学习的人脸标注研究》文中研究说明由于移动电子设备的普及,人们可以随时随地接收和发送一些多媒体信息,越来越多的人通过社交网络例如Facebook、Instagram分享他们的照片、视频,从而导致了大量图片数据的产生。如何管理这些大量的图片成为一个亟待解决的问题。在这些大量的图片中大部分和人脸相关,因此人脸标注对于图片的管理、分类来说是一个非常重要的工具。传统的人脸标注方式有手工标注和自动化标注。手工标注是一个准确率较高的标注方式,但同时也是一个耗时、费力的方式。而自动化人脸标注依赖大量的标记数据训练模型。由于手工标注成本较大以及自动标注方式对标记数据的依赖,本文以人脸标注研究为基础,基于主动学习的半自动人脸标注方式为研究对象,利用结合了人脸的先验约束和上下文信息的分类模型,提出了高效的人脸标注方法。传统的分类模型基于样本之间的相似度进行分类,但由于人脸受到光线、角度、遮挡等诸多因素的影响,往往性能较差。本文利用人脸样本之间的约束(例如在同一张图片上出现的两张人脸肯定来自不同的人),提出了一个半自动人脸标注模型。该模型以马尔可夫随机场为基础,加入样本之间的匹配和非匹配约束,采用置信度传播算法更新样本状态,预测样本的标签。实验结果表明,在传统分类算法模型基础上加入人脸之间的约束可以提高分类的正确率。近年来,卷积神经网络得到了深入研究,并且取得了很多优秀的成果。不同于传统的分类模型,卷积神经网络直接将图片样本作为网络的输入,不需要对图片的抽象特征进行预提取,而人脸的特征提取一直是具有挑战性的任务。本文在卷积神经网络基础上,提出了一种基于平滑假设的半自动人脸标注模型。该模型利用了人脸样本之间的约束、上下文信息,并在网络更新的过程中加入基于平滑假设的平滑约束。实验结果表明加入了平滑度、约束和上下文信息的半自动人脸标注模型可以获得更好的性能。
李翼宏[9](2018)在《基于主动学习的恶意代码检测技术研究》文中研究说明当前新型恶意代码数量和种类日益增多,对网络空间安全提出了新的挑战。基于特征码等传统的恶意代码检测技术,其检测形式单一,难以检测新型恶意代码。基于常规机器学习的检测技术需要训练大量的已标记样本,然而新型恶意代码的已标记样本较少,难以取得好的检测结果。因此,本文研究一种基于主动学习的恶意代码检测技术,提高对新型恶意代码的检测效果。论文首先对传统的恶意代码分析和检测技术的研究现状及优缺点进行研究,给出本文的研究方向和基本思路,提出三个技术创新点。一是针对样本特征提取过程中存在的系统性、完整性不强的问题,结合动静分析搭建特征提取框架,并提出一种基于simhash的动静融合特征提取算法,得到一种动静融合的新特征。二是针对提取的特征维数过高的问题,提出一种基于聚类的样本特征降维算法,对特征向量进一步优化,降低维数带来的影响。三是针对传统机器学习算法效率较低的问题,提出一种基于MDMRE(Maximum Distance and Minimum Risk Estimate,MDMRE)主动学习的恶意代码检测算法,其中包含基于最大距离的样本选择算法和最小估计风险的样本标记算法,通过对未标记样本进行选择和标记,并加入训练集实现增量训练,提高了在少量已标记样本下新型恶意代码的检测效果。
齐亚莉[10](2017)在《基于内容的图像检索与图像语义分析》文中研究表明基于内容的图像检索技术具有广阔的应用前景,低层视觉特征与高层语义特征之间的“语义鸿沟”是制约该技术应用的主要问题。本文围绕基于内容的图像检索技术中的“语义鸿沟”问题,对相关反馈技术和图像语义分析技术进行了研究,完成的主要工作包括:针对相关反馈的小样本、正负样本集的不对称、以及图像检索中的标识样本与未标识样本之间的不平衡问题,提出了基于主动学习支持向量机的相关反馈图像检索方法。在选择参与主动学习的样本时,提出了基于低层视觉特征相似度和支持向量机最优分割面的确定策略,选择离分割面最近的负样本参与主动学习,该策略遵循主动学习的本质,避免了不确定性样本选择策略的随机性;在主动学习过程中,设计自适应正则化规则,选择最合适的正则化参数,提升了系统的泛化性。实验表明,该方法有效地提升了图像检索效率,检索系统具有更高的准确性和更好的泛化性。针对全局特征表达图像语义准确性低的问题,研究了图像局部区域分割技术,提出了基于对象语义的图像分类方法。设计了一种基于高斯混合模型和条件随机场的对象区域分割方法,获得图像中的对象区域;利用多层感知器进行有监督学习,生成对象语义模板,解决对象语义相似度的问题;利用训练好的对象语义模板,对图像进行分类。实验表明,提出的分类方法对于二语义图像具有很高的分类准确率。传统的图割方法在对多标签语义图像进行分割时,计算复杂度非常高。针对这个问题,提出了基于图割的多标签图像语义自动分割方法。利用主颜色区域作为标签种子,不需要先验知识,也不需要选择种子像素或区域,降低了因选用像素或超像素而引起的计算复杂度;利用α-扩展移动算法进行优化,提升分割速度。实验表明,该自动分割算法具有较快的分割速度和较好的分割准确率,且比人工配置的多标签分割有更好的性能。针对视觉词袋在图像语义分类中准确性低、消耗时间长的问题,提出了基于语义词袋的检索方法。在语义区域分割的基础上,利用支持向量机进行语义标注和分类;用区域语义词汇代替传统的视觉词汇,精炼图像语义表达的准确性,减少语义词汇量。实验表明,该方法提高了图像语义表达的准确性,具有更好的检索性能。
二、图像检索中基于标记与未标记样本的主动学习算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、图像检索中基于标记与未标记样本的主动学习算法(论文提纲范文)
(1)高效机器学习算法的若干问题研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 机器学习与模式识别 |
1.1.1 基于半监督学习的分类模型 |
1.1.2 面向样本选择的主动学习 |
1.1.3 分类器的决策解释 |
1.2 研究内容和主要贡献 |
1.3 文章结构 |
第二章 背景知识 |
2.1 符号规范 |
2.2 半监督的图分类器 |
2.2.1 图模型的构建 |
2.2.2 图分类器的优化 |
2.3 主动学习中的样本价值度量 |
2.3.1 基于不确定性的抽样 |
2.3.2 基于期望模型变化的度量 |
2.3.3 基于期望误差的方法 |
2.4 分类器决策的可视化解释 |
2.4.1 基于梯度的决策解释 |
2.4.2 基于扰动的决策解释 |
2.5 其他背景知识 |
2.5.1 矩阵计算的复杂度 |
2.5.2 矩阵逆定理(伍德伯里矩阵恒等式) |
2.5.3 概率密度的转移公式 |
2.5.4 偏态系数 |
2.6 本章小节 |
第三章 面向简单图分类器的高效算法研究 |
3.1 研究背景 |
3.2 基于锚图的半监督分类器 |
3.3 基于锚图分类的高效算法 |
3.3.1 快速的非负权重评估 |
3.3.2 稀疏拉普拉斯构建 |
3.3.3 模型优化 |
3.3.4 复杂度分析 |
3.4 实验与分析 |
3.4.1 实验设定 |
3.4.2 消融实验 |
3.4.3 与相关算法的比较 |
3.4.4 参数敏感性分析 |
3.5 本章小节 |
第四章 针对层次化图分类器构建和优化的高效算法研究 |
4.1 基于层次化锚图的朴素分类器 |
4.1.1 层次化锚图分类器 |
4.1.2 复杂度和有效性分析 |
4.1.3 实验分析 |
4.2 结合标签预测器的加速分类器 |
4.2.1 层次化锚图的标签预测器 |
4.2.2 复杂度分析 |
4.2.3 实验分析 |
4.3 本章小节 |
第五章 面向高价值样本选择与标记的高效算法研究 |
5.1 研究背景 |
5.2 基于近似误差下降的高效主动学习 |
5.2.1 近似误差下降准则 |
5.2.2 高效主动学习算法 |
5.2.3 复杂度分析 |
5.2.4 讨论 |
5.3 实验与分析 |
5.3.1 与相关算法的比较 |
5.3.2 消融实验 |
5.4 本章小节 |
第六章 高效的卷积神经网络解释技术研究 |
6.1 研究背景 |
6.2 实时决策解释生成器 |
6.2.1 实时解释器 |
6.2.2 控制器设计准则 |
6.2.3 控制器设计 |
6.2.4 评估器优化 |
6.2.5 解释器的高效性分析 |
6.2.6 分布控制器对其他输入分布的作用 |
6.3 实验与分析 |
6.3.1 实验设定 |
6.3.2 物体识别 |
6.3.3 场景识别 |
6.3.4 讨论 |
6.4 本章小节 |
第七章 实践中的高效学习算法选择 |
7.1 基于模型简化的高效机器学习 |
7.1.1 基于核模型的方法 |
7.1.2 基于图模型的方法 |
7.1.3 基于深度模型的方法 |
7.1.4 基于树模型的方法 |
7.1.5 小结 |
7.2 基于优化近似的高效机器学习 |
7.2.1 基于小批量的梯度下降算法 |
7.2.2 基于坐标的梯度下降算法 |
7.2.3 基于马尔科夫链蒙特卡洛的数值积分 |
7.2.4 小结 |
7.3 基于并行计算的高效机器学习 |
7.3.1 基于多核的单机系统 |
7.3.2 基于多机的分布式系统 |
7.3.3 小结 |
7.4 交叉协作 |
7.5 展望 |
7.5.1 可能的扩展方向 |
7.5.2 开放性讨论 |
7.6 本章小结 |
第八章 工作总结与未来展望 |
8.1 工作总结 |
8.2 未来工作展望 |
参考文献 |
攻读博士学位期间的学术活动及成果情况 |
(2)高分遥感图像场景理解及识别方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 国内外研究现状及分析 |
1.2.1 感兴趣区域提取研究现状 |
1.2.2 高分遥感图像场景识别研究现状 |
1.2.3 小样本遥感图像解译研究现状 |
1.2.4 研究现状简析 |
1.3 本文的主要研究内容及结构安排 |
第2章 基于几何密度分布的大幅面遥感图像感兴趣区域分级提取方法 |
2.1 引言 |
2.2 高分遥感图像特性分析 |
2.3 基于视觉显着性的感兴趣区域提取 |
2.3.1 人眼视觉特性分析 |
2.3.2 典型视觉注意机制模型分析 |
2.3.3 多尺度全局对比直方图方法 |
2.3.4 基于视觉注意机制的显着区域提取分析 |
2.4 基于几何密度的感兴趣区域分级提取 |
2.4.1 基于边缘-角点联合密度分布的感兴趣区域提取 |
2.4.2 基于形心密度分布的感兴趣区域分级提取 |
2.5 实验结果及分析 |
2.5.1 实验数据 |
2.5.2 评价指标 |
2.5.3 大幅面遥感图像的感兴趣区域提取实验结果与分析 |
2.6 本章小结 |
第3章 基于中层特征的高分遥感图像语义理解及场景识别方法 |
3.1 引言 |
3.2 面向语义鸿沟的视觉词包模型 |
3.2.1 语义鸿沟问题分析 |
3.2.2 视觉词包模型 |
3.3 基于中层特征的高分遥感图像语义分类及场景识别 |
3.3.1 遥感图像分割及最优分割尺度选择 |
3.3.2 基于改进词包模型的高分遥感图像语义分类及场景识别 |
3.4 实验结果及分析 |
3.4.1 实验数据 |
3.4.2 视觉词包模型各步骤讨论 |
3.4.3 视觉词包模型参数对比 |
3.4.4 高分遥感图像语义分类及场景识别结果 |
3.5 本章小结 |
第4章 基于特征迁移的高分遥感图像场景识别方法 |
4.1 引言 |
4.2 基于对抗学习的高分遥感图像场景识别 |
4.2.1 变分自动编码机 |
4.2.2 对抗变分自动编码机 |
4.3 基于视角迁移的高分遥感图像场景识别 |
4.4 实验结果及分析 |
4.4.1 实验数据 |
4.4.2 遥感场景数据集间迁移学习场景识别结果 |
4.4.3 自然场景与遥感场景数据集间迁移学习场景识别结果 |
4.5 本章小结 |
第5章 基于半监督与主动学习的高分图像小样本场景识别方法 |
5.1 引言 |
5.2 基于图的半监督学习 |
5.3 结合密度峰值与图的遥感图像小样本场景识别 |
5.3.1 密度峰值聚类 |
5.3.2 结合密度峰值与图的样本选择 |
5.4 实验结果及分析 |
5.4.1 RSSCN-7 数据集场景识别结果 |
5.4.2 RSC-11 数据集场景识别结果 |
5.4.3 UC Merced-21 数据集场景识别结果 |
5.4.4 小样本场景识别结果分析 |
5.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(3)多视图多标记学习方法研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要内容 |
1.4 本文组织结构 |
2 相关研究方法 |
2.1 相关知识 |
2.2 评价方法 |
2.3 本章小结 |
3 多标记协同训练算法(MLCT) |
3.1 MLCT算法原理 |
3.2 实验结果与分析 |
3.3 本章小结 |
4 基于协同矩阵分解的多视图多示例多标记学习算法(M3Lcmf) |
4.1 M3Lcmf算法原理 |
4.2 实验结果与分析 |
4.3 本章小结 |
5 弱监督多视图多示例多标记学习算法(WSM3L) |
5.1 WSM3L算法原理 |
5.2 实验结果与分析 |
5.3 本章小结 |
6 多视图多示例多标记主动学习算法(M3AL) |
6.1 M3AL算法原理 |
6.2 实验结果与分析 |
6.3 本章小结 |
7 总结与展望 |
7.1 论文总结 |
7.2 论文展望 |
参考文献 |
致谢 |
发表论文及参加课题一览 |
(4)视觉属性学习及其在图像检索中的应用研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号表 |
英文缩略词对照表 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外相关工作研究进展 |
1.2.1 属性学习 |
1.2.2 基于二进制属性的图像检索 |
1.2.3 基于相对属性的图像检索 |
1.3 基于属性的图像检索方法存在的关键问题 |
1.4 属性学习和基于属性的图像检索相关数据集 |
1.5 本文的主要研究工作 |
1.6 本文的章节安排 |
2 基于属性相关局部区域的深度相对属性学习 |
2.1 引言 |
2.2 二进制属性学习和相对属性学习的差异 |
2.3 局部定位 |
2.3.1 属性分类 |
2.3.2 图像排序 |
2.3.3 局部发现 |
2.4 深度特征提取和排序 |
2.5 实验与结果分析 |
2.5.1 数据集 |
2.5.2 实验设置 |
2.5.3 相对属性学习精度比较 |
2.5.4 相对属性排序结果示例 |
2.5.5 消融实验 |
2.5.6 交互式图像检索结果比较 |
2.6 本章小结 |
3 基于分组属性强度的图像检索 |
3.1 引言 |
3.2 分组属性强度 |
3.2.1 二进制属性学习 |
3.2.2 相对属性学习 |
3.2.3 分组属性强度学习 |
3.2.4 检索模型的描述 |
3.3 实验与结果分析 |
3.3.1 数据集 |
3.3.2 实验设置 |
3.3.3 图像检索性能比较 |
3.3.4 在LFW-10测试集上的检索结果示例 |
3.4 本章小结 |
4 基于网络搜索量的扩展属性图像检索 |
4.1 引言 |
4.2 基于扩展属性的检索模型 |
4.2.1 检索过程 |
4.2.2 训练过程 |
4.3 基于网络搜索量的扩展属性学习 |
4.3.1 基于WordNet的语义关系度量 |
4.3.2 基于Wiktionary的语义关系度量 |
4.3.3 基于网络数据的相对平均检索量计算 |
4.3.4 扩展属性学习的算法流程 |
4.3.5 扩展属性的可靠性验证 |
4.4 实验与结果分析 |
4.4.1 数据集 |
4.4.2 实验设置 |
4.4.3 扩展属性学习结果 |
4.4.4 相对平均检索量结果 |
4.4.5 扩展属性验证结果 |
4.4.6 检索性能比较 |
4.4.7 a-Yahoo数据集上的检索结果示例 |
4.5 本章小结 |
5 结论与展望 |
5.1 结论 |
5.2 创新点 |
5.3 展望 |
参考文献 |
攻读博士学位期间科研项目及科研成果 |
致谢 |
作者简介 |
(5)面向小样本问题的主动学习理论及应用研究(论文提纲范文)
论文创新点 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 主动学习准则 |
1.2.1.1 不确定性准则 |
1.2.1.2 代表性准则 |
1.2.1.3 不确定性准则和代表性准则结合 |
1.2.2 半监督协同主动学习 |
1.2.3 领域适配协同主动学习 |
1.3 尚待解决的问题 |
1.4 本文的研究方法与研究内容 |
1.5 全文的组织结构 |
2 小样本学习基础理论 |
2.1 主动学习 |
2.1.1 不确定性采样 |
2.1.2 专家委员会 |
2.1.3 期望模型变化 |
2.1.4 期望误差减小 |
2.2 半监督学习 |
2.2.1 自训练 |
2.2.2 协同训练 |
2.2.3 直推式SVM |
2.2.4 生成模型算法 |
2.2.5 基于图的半监督学习 |
2.2.6 流形正则化 |
2.3 迁移学习 |
2.3.1 基于实例的迁移学习方法 |
2.3.2 基于特征空间的迁移学习方法 |
2.3.3 基于模型的迁移学习方法 |
2.4 学习模式对比分析 |
2.5 本章小结 |
3 结合不确定性和代表性的启发式主动学习框架 |
3.1 引言 |
3.2 双样本测试问题 |
3.3 结合不确定性和代表性的启发式主动学习框架 |
3.3.1 不确定性和代表性联合框架 |
3.3.2 不确定性和代表性联合算法 |
3.4 实验及分析 |
3.4.1 实验数据及实验设置 |
3.4.2 实验结果及分析 |
3.4.3 参数敏感性分析 |
3.5 本章小结 |
4 鲁棒的多标签主动学习方法 |
4.1 引言 |
4.2 最大相关熵准则理论 |
4.3 鲁棒的多标签主动学习方法 |
4.3.1 多标签不确定性衡量 |
4.3.2 多标签中代表性衡量 |
4.3.3 多标签主动学习方法 |
4.3.4 模型优化求解 |
4.4 实验及分析 |
4.4.1 实验数据及实验设置 |
4.4.2 实验结果及分析 |
4.4.3 参数分析 |
4.4.4 复杂度分析 |
4.4.5 损失函数分析 |
4.5 本章小结 |
5 融合判别性和代表性的半监督主动学习方法 |
5.1 引言 |
5.2 基于K-均值的半监督聚类树算法 |
5.3 融合判别性和代表性的半监督主动学习方法 |
5.3.1 主动学习策略 |
5.3.2 半监督主动学习中判别性信息提取 |
5.3.3 半监督主动学习中代表性信息提取 |
5.3.4 融合判别性和代表性的半监督主动学习方法 |
5.4 实验及分析 |
5.4.1 实验数据及设置 |
5.4.2 实验结果及分析 |
5.4.3 模型简化分析 |
5.4.4 参数分析 |
5.5 本章小结 |
6 领域适配协同的多域主动学习方法 |
6.1 引言 |
6.2 理论基础 |
6.2.1 实例权重法实例权重法 |
6.2.2 最大均值差异理论 |
6.3 领域适配协同的多域主动学习方法 |
6.3.1 领域适配协同的主动学习框架 |
6.3.2 多域主动学习方法 |
6.3.3 优化求解 |
6.4 实验及分析 |
6.4.1 实验数据及设置 |
6.4.2 实验结果及分析 |
6.4.2.1 数据集20Newsgroups |
6.4.2.2 字符数据集 |
6.5 本章小结 |
7 总结与展望 |
7.1 全文总结 |
7.2 未来展望 |
参考文献 |
攻博期间发表的科研成果目录 |
参与的科研项目 |
攻读期间所获奖励 |
致谢 |
(6)基于半监督学习的WMS元数据文本多标签分类方法(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 地理信息资源发现与主题分类研究现状 |
1.2.2 特征选择研究现状 |
1.2.3 半监督学习研究现状 |
1.2.4 多标签分类研究现状 |
1.3 研究目标与内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 创新点 |
1.3.4 技术路线 |
1.4 论文的组织结构 |
2 基于语料库与WORD2VEC的领域特征子集选择 |
2.1 地学本体库与英语词汇网 |
2.1.1 地球与环境术语语义网络 |
2.1.2 WordNet |
2.2 文本表示 |
2.2.1 文本表示的基本概念 |
2.2.2 Word2vec |
2.3 领域特征子集选择 |
2.3.1 典型词词表生成 |
2.3.2 特征过滤 |
2.4 本章小结 |
3 基于半监督学习的多标签文本分类 |
3.1 协同训练基本原理 |
3.2 ML-KNN算法基本原理 |
3.3 ML-CSW算法设计 |
3.3.1 特征词与主题的距离计算 |
3.3.2 ML-CSW多标签分类流程 |
3.4 SML-SWKNN算法设计 |
3.5 本章小结 |
4 基于LDA的细粒度领域主题提取 |
4.1 隐狄利克雷分布基本概念 |
4.2 LDA计算过程 |
4.2.1 Gibbs采样 |
4.2.2 LDA建模过程 |
4.3 细粒度领域主题提取 |
4.4 本章小结 |
5 WMS元数据文本分类实验 |
5.1 实验数据与实验环境 |
5.1.1 实验数据 |
5.1.2 实验环境 |
5.1.3 评价指标 |
5.2 SML-SWKNN算法与基模型准确性验证 |
5.3 特征选择方法准确性验证 |
5.4 分类算法适用性验证 |
5.5 典型文本验证 |
5.6 本章小结 |
6 原型系统设计与实现 |
6.1 WMS元数据扩展 |
6.2 原型系统架构 |
6.3 原型系统展示 |
6.4 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
攻读硕士学位期间学术成果 |
致谢 |
(7)基于样本和标记建模的弱监督分类方法研究(论文提纲范文)
摘要 |
ABSTRACT |
1.绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 半监督分类 |
1.2.2 主动学习 |
1.2.3 偏标记学习与多标记学习 |
1.3 本文的研究目标、内容及创新点 |
1.4 本文的组织结构 |
2 相关研究概念 |
2.1 图构造策略 |
2.1.1 全连通图 |
2.1.2 近邻图 |
2.1.3 局部嵌入构图 |
2.1.4 稀疏表示构图 |
2.1.5 多图融合构图 |
2.2 标记关联性 |
2.3 主动学习 |
2.4 评价指标 |
3 半监督分类研究 |
3.1 问题定义及符号说明 |
3.2 基于聚类调整相似度的半监督分类(SSC-CAS) |
3.2.1 SSC-CAS方法介绍 |
3.2.2 在Toy数据集上可视化地验证SSC-CAS |
3.2.3 实验及分析 |
3.2.4 方法小结 |
3.3 基于样本加权的半监督分类(WS3C) |
3.3.1 WS3C方法介绍 |
3.3.2 在Toy数据集上可视化地验证WS3C |
3.3.3 实验及分析 |
3.3.4 方法小结 |
4 多标记主动学习研究 |
4.1 问题定义及符号说明 |
4.2 基于子样本标记对查询的多标记主动学习(CMAL) |
4.2.1 CMAL方法介绍 |
4.2.2 实验及分析 |
4.2.3 方法小结 |
5 偏多标记学习研究 |
5.1 问题定义及符号说明 |
5.2 基于矩阵分解的多标记噪声标记识别(MF-INL) |
5.2.1 MF-INL方法介绍 |
5.2.2 目标方程的优化求解 |
5.2.3 实验及分析 |
5.2.4 方法小结 |
5.3 特征诱导的偏多标记学习(f PML) |
5.3.1 fPML方法介绍 |
5.3.2 目标方程的优化求解 |
5.3.3 实验及分析 |
5.3.4 方法小结 |
6 总结与展望 |
6.1 论文总结 |
6.2 论文展望 |
参考文献 |
致谢 |
发表论文及参加课题一览 |
(8)基于主动学习的人脸标注研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 研究内容、研究方法和研究技术路线 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 研究技术路线 |
1.3.4 研究可行性分析 |
1.4 本文组织结构 |
第二章 相关工作 |
2.1 人脸标注相关研究 |
2.1.1 基于个人相册集的人脸标注 |
2.1.2 基于网络的人脸标注 |
2.1.3 基于监督学习的人脸标注 |
2.1.4 基于无监督学习的人脸标注 |
2.1.5 基于视频的人脸标注 |
2.2 基于主动学习的半自动人脸标注研究 |
2.3 本章小结 |
第三章 基于主动学习的人脸标注流程 |
3.1 数据预处理 |
3.1.1 人脸目标检测 |
3.1.2 人脸矫正和图像预处理 |
3.1.3 人脸特征提取 |
3.2 基于主动学习的人脸标注 |
3.2.1 人脸标注框架 |
3.2.2 主动学习算法的选择 |
3.3 本章小结 |
第四章 基于马尔可夫随机场的半自动人脸标注方法 |
4.1 问题提出 |
4.2 相关定义 |
4.2.1 马尔可夫随机场 |
4.2.2 人脸约束 |
4.3 马尔可夫随机场模型 |
4.3.1 约束的生成 |
4.3.2 判别模型 |
4.3.3 主动学习选择样本 |
4.4 实验及结果分析 |
4.4.1 实验数据集介绍 |
4.4.2 数据集预处理 |
4.4.3 实验结果分析 |
4.5 本章小结 |
第五章 基于平滑假设的半自动人脸标注方法 |
5.1 问题提出 |
5.2 相关定义 |
5.3 平滑约束 |
5.3.1 上下文信息 |
5.3.2 平滑度计算 |
5.4 交互式人脸标注框架 |
5.4.1 框架 |
5.4.2 人工标注 |
5.5 实验及结果分析 |
5.5.1 实验数据集介绍 |
5.5.2 数据集预处理 |
5.5.3 实验结果分析 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 展望 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(9)基于主动学习的恶意代码检测技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状及存在问题 |
1.2.1 恶意代码分析技术 |
1.2.2 恶意代码检测技术 |
1.3 论文的组织结构 |
1.4 论文的主要工作 |
第二章 主动学习的相关技术基础 |
2.1 主动学习概述 |
2.2 主动学习的分类 |
2.2.1 基于池的主动学习算法 |
2.2.2 基于流的主动学习算法 |
2.3 主动学习的应用 |
2.3.1 在文档分类方面的应用 |
2.3.2 在图像分类方面的应用 |
2.3.3 在入侵检测方面的应用 |
2.4 本章小结 |
第三章 基于动静融合相关分析的特征提取算法 |
3.1 恶意代码的混淆技术 |
3.1.1 加壳技术 |
3.1.2 变形技术 |
3.2 算法的基本思想 |
3.2.1 静态特征提取 |
3.2.2 动态特征提取 |
3.2.3 动静融合特征提取 |
3.3 算法的设计与分析 |
3.3.1 算法的设计 |
3.3.2 算法的分析 |
3.4 模拟实验及结果分析 |
3.4.1 实验目的与设计 |
3.4.2 实验步骤 |
3.4.3 实验结果与分析 |
3.5 本章小结 |
第四章 基于聚类的样本特征降维算法 |
4.1 降维算法分析 |
4.2 算法的基本思想 |
4.2.1 特征矩阵的形成 |
4.2.2 初始聚类阈值的设定 |
4.2.3 特征降维 |
4.3 算法设计与分析 |
4.3.1 算法的设计 |
4.3.2 算法的分析 |
4.4 模拟实验及结果分析 |
4.4.1 实验目的与设计 |
4.4.2 实验步骤 |
4.4.3 实验结果与分析 |
4.5 本章小结 |
第五章 基于MDMRE主动学习的恶意代码检测算法 |
5.1 算法的基本思想 |
5.1.1 基于随机森林的分类器训练算法 |
5.1.2 基于最大距离的样本选择算法 |
5.1.3 基于最小估计风险的样本标记算法 |
5.2 算法的设计与分析 |
5.2.1 算法的设计 |
5.2.2 算法的分析 |
5.3 模拟实验及结果分析 |
5.3.1 实验目的与设计 |
5.3.2 实验步骤 |
5.3.3 实验结果与分析 |
5.4 本章小结 |
结束语 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(10)基于内容的图像检索与图像语义分析(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 系统结构 |
1.2.2 国内外研究成果 |
1.2.3 存在的问题 |
1.3 本文的研究内容 |
第2章 基于主动学习支持向量机的相关反馈图像检索方法 |
2.1 相关反馈技术 |
2.1.1 相关反馈方法分类 |
2.1.2 相关反馈中存在的问题 |
2.2 主动学习 |
2.2.1 主动学习模型 |
2.2.2 主动学习模型的分类 |
2.3 基于支持向量机的主动学习方法 |
2.3.1 支持向量机 |
2.3.2 基于支持向量机的相关反馈图像检索算法 |
2.3.3 基于支持向量机的主动学习模型 |
2.4 正则化 |
2.5 新的主动学习支持向量机的相关反馈检索方法 |
2.5.1 未标注样本的选择策略 |
2.5.2 基于自适应规则的模型选择 |
2.5.3 新的相关反馈方法 |
2.5.4 复杂度分析 |
2.6 实验结果与分析 |
2.6.1 数据库 |
2.6.2 图像特征 |
2.6.3 性能评价和结果分析 |
2.7 本章小结 |
第3章 基于对象语义的图像分类方法 |
3.1 图像分割方法 |
3.1.1 基于边缘的图像分割方法 |
3.1.2 基于阈值的图像分割方法 |
3.1.3 基于区域的图像分割方法 |
3.1.4 基于特定理论的图像分割算法 |
3.4 对象区域分割 |
3.4.1 高斯混合模型 |
3.4.2 条件随机场 |
3.4.3 基于高斯混合模型与条件随机场的对象区域分割算法 |
3.5 基于对象语义的图像分类 |
3.5.1 多层感知器 |
3.5.2 多层感知器的训练 |
3.5.3 基于对象语义模板的图像分类 |
3.6 实验结果与分析 |
3.6.1 对象区域分割结果 |
3.6.2 对象语义模板训练结果 |
3.6.3 对象语义分类结果 |
3.7 本章小结 |
第4章 基于图割的多标签语义自动分割方法 |
4.1 图像语义分割 |
4.1.1 图像语义分割分类 |
4.1.2 典型的图像语义分割算法 |
4.2 基于图割的图像语义分割 |
4.2.1 图像与图 |
4.2.2 图割(Graph cut) |
4.2.3 最大流/最小割算法 |
4.2.4 最小割求解与能量函数 |
4.3 多标识区域语义分割算法 |
4.3.1 主颜色数特征 |
4.3.2 能量函数优化 |
4.3.3 自动分割算法 |
4.4 实验结果与分析 |
4.5 本章小结 |
第5章 基于语义词袋的图像检索方法 |
5.1 图像语义分析 |
5.1.1 特征语义化 |
5.1.2 图像语义分析算法 |
5.2 图像语义自动标注 |
5.2.1 基于机器学习的图像语义标注方法 |
5.2.2 基于分类的图像标注方法 |
5.2.3 基于统计模型的图像语义标注方法 |
5.3 基于语义词袋的图像语义分析、标注和检索方法 |
5.3.1 视觉词袋 |
5.3.2 语义分析和标注 |
5.3.3 基于语义的检索方法 |
5.4 实验结果与分析 |
5.4.1 准确性分析 |
5.4.2 时间复杂度分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
发表的论文与参加科研情况说明 |
致谢 |
四、图像检索中基于标记与未标记样本的主动学习算法(论文参考文献)
- [1]高效机器学习算法的若干问题研究[D]. 傅炜杰. 合肥工业大学, 2021(02)
- [2]高分遥感图像场景理解及识别方法研究[D]. 李彤. 哈尔滨工业大学, 2020(02)
- [3]多视图多标记学习方法研究与应用[D]. 邢玉莹. 西南大学, 2020(01)
- [4]视觉属性学习及其在图像检索中的应用研究[D]. 张芬. 大连理工大学, 2019(08)
- [5]面向小样本问题的主动学习理论及应用研究[D]. 王增茂. 武汉大学, 2019
- [6]基于半监督学习的WMS元数据文本多标签分类方法[D]. 张敏. 武汉大学, 2019(09)
- [7]基于样本和标记建模的弱监督分类方法研究[D]. 陈霞. 西南大学, 2019(01)
- [8]基于主动学习的人脸标注研究[D]. 孙金. 南京航空航天大学, 2019(02)
- [9]基于主动学习的恶意代码检测技术研究[D]. 李翼宏. 国防科技大学, 2018(01)
- [10]基于内容的图像检索与图像语义分析[D]. 齐亚莉. 天津大学, 2017(01)