一、WEB使用记录挖掘研究(论文文献综述)
孟强[1](2017)在《面向电子商务用户行为的Web数据挖掘模型与应用研究》文中指出互联网和信息技术的发展,促使不断产生新的商业模式,而电子商务这一全新的商业模式凭借互联网和信息技术飞速发展,传统企业纷纷转型走向电子商务发展道路。然而,随着电子商务的快速发展,电子商务网站平台所呈现给用户的商品信息量急剧增长,给用户带来了很多不便的同时,也严重阻碍了电子商务更好的发展。在大数据电子商务时代,企业如何将数据挖掘的思想和方法应用到电子商务中,利用Web数据挖掘技术的强大数据分析处理能力,从海量的Web数据中挖掘出潜在的、有价值的客户行为信息,并用来辅助企业进行正确的、高效的商务分析与决策,这已成为目前研究的热点问题。针对目前对构建与应用电子商务Web数据挖掘模型研究的不足,本文首先介绍了电子商务概述、用户行为的定义和分析内容,Web数据挖掘的定义、分类、流程及常用技术,个性化推荐系统的简介、作用及推荐方法;其次,介绍了 Web数据挖掘在电子商务中的应用背景、应用价值、Web数据分析的类型、数据来源及特点;再次,基于电子商务用户行为Web数据,按照CRISP-DM数据挖掘方法论,运用IBM SPSS Modeler数据挖掘软件,采用多种数据挖掘技术,分析并构建出了用户购买行为预测模型,商品推荐模型,用户细分模型和商品特征分析模型;最后,基于商品推荐模型,设计出了商品个性化推荐系统的总体框架、离线模块、在线模块和MQ数据库,并以MQ音像商城为例,进行设计和开发,最终实现了用户可自行选择设置推荐方法的MQ音像商品的个性化推荐。本文基于电子商务用户行为的Web数据,重点对Web挖掘模型的构建及其在电子商务个性化推荐系统中的应用进行了相关研究和探讨,这对电子商务企业应用Web挖掘模型具有一定的现实意义。
谭博闻[2](2016)在《Web日志关联规则挖掘方法研究与应用》文中进行了进一步梳理随着计算机和互联网的快速发展,Web已经成为全球信息共享和传播的重要平台,它给人们的学习、生活和工作等方方面面带来了巨大的便利。然而Web信息的爆炸式增长所带来的“信息过载”导致了人们很难从庞大的信息中获取自己想要的知识;如何合理的建设网站;如何向用户提供精准的个性化服务并增加用户的粘性成为网站设计者考虑的主要因素。Web日志挖掘是解决这一问题的有效方法,通过对日志文件进行分析,从中找出Web用户的潜在访问行为模式,进而作为改进Web服务设计的依据,提高Web的服务质量和服务效率。本文首先对Web日志挖掘及其数据预处理过程进行简要介绍,数据预处理是Web日志挖掘的基础,数据预处理的质量将直接影响数据挖掘的结果,其中确定用户身份是一个非常重要也是非常困难的环节,本文针对用户识别在现有研究基础之上将Cookie、URL以及用户在访问页面的停留时间作为相应的启发式规则添加到用户的识别过程中,由此产生了一种新的用户识别方法。实验结果表明改进后的方法能够提高用户识别的效率和精度。根据现有的技术发展路线,Web日志挖掘主要可以分为两类。一类是把Web日志数据经过预处理之后转化成符合规范的格式导入数据库中,再运用数据挖掘算法对数据库中的数据进行挖掘和分析;而另一类就是将Web日志数据经过清洗之后便直接进行挖掘和分析。本文采用了第一种方式,用传统的关联规则挖掘方法来对预处理后的Web日志数据进行处理,希望发现用户的频繁访问模式,从而对Web站点的结构进行调整或者是为用户提供个性化服务。本文在AprioriTid算法的基础上进行了改进,形成了新的关联规则挖掘算法。实验数据表明改进后的算法在时间效率和空间效率上有着不错的表现。最后将改进后的算法应用到预处理后的Web日志数据上,并对挖掘出来的结果进行了简要的分析。
孙慧[3](2016)在《Web日志攻击序列模式挖掘的研究》文中进行了进一步梳理Web应用已经渗透到了人们的日常生活中,用户与Web应用程序的交互一般是通过Web服务器来实现的。Web日志作为Web服务器最重要的一个部分,记录了 Web服务器的运行状况以及客户端对服务器的请求信息。Web日志中包含大量普通用户的浏览信息,同时恶意用户的请求信息也被记录在日志中。分析Web日志信息,在经营层面上,有利于了解网站的运行情况,在安全层面上,通过对恶意用户的操作记录进行分析,有利于探索攻击行为,增强网站的防护。然而通常对Web日志的分析更倾向于挖掘普通用户的需求,提高用户体验,改善站点结构。另一方面,在安全层面上很少会使用挖掘技术对日志中的攻击行为进行研究。本文探索一种对日志中的攻击数据进行挖掘的方法,期望通过对日志中攻击数据的挖掘,发现攻击者对网站的攻击路径,更加轻易的发现网站中存在的漏洞。本文提出了 一种从Web日志中挖掘攻击频繁序列模式的方法,使用改进的PrefixSpan算法,对日志中的攻击记录进行挖掘,并将攻击序列以可视化图形的方法展示给用户。通过对挖掘结果的分析,能够帮助管理人员加强网站的防护,发现网站的潜在漏洞,保护网站免受进一步的攻击。本方法的主要步骤包括:在数据预处理阶段,收集日志数据、日志结构信息、网页信息、攻击特征码信息;通过对日志进行数据预处理得到攻击序列数据库,预处理部分包括日志数据清洗、统一资源定位符号(Uniform Resource Locator,URL)清理、用户识别、区分人为攻击和漏洞扫描器攻击和会话识别五个步骤;使用改进的序列模式方法PrefixSpan分别对人为攻击序列数据库和漏洞扫描器攻击序列数据库进行模式挖掘;对挖掘生成的频繁序列进行模式分析并将序列转换为图形语言。本文根据以上步骤在已有的序列模式挖掘算法PrefixSpan上进行改进,并且使用Java语言实现了该方法,通过对实际运行网站中收集的日志数据进行测试实验,完成了对网站攻击者序列模式的挖掘,并生成可视化图形。
石敏[4](2014)在《基于聚类划分的关联规则在Web日志挖掘中的应用研究》文中研究说明随着电子商务、Web服务以及基于Web的信息系统的快速发展和壮大,基于Web的组织在日常运作中已经收集了大量的Web日志信息。分析并发现这些潜在的规律及知识,对于用户访问、广告投放和个性化服务等应用有着重大的意义。本文将将针对Web日志中半结构化数据集,以发现Web用户访问记录中潜在的规律和知识为目标。以Web日志关联规则挖掘模式为方法,提出了一种改进的基于聚类划分的Web日志关联规则挖掘方法。Web日志挖掘是指自动发现和分析模式、这些模式来自于收集的点击流和相关数据或用户与一个或多个网站互动的结果。其目标是捕捉、建模并分析用户与网站交互的行为模式和模型。所发现的模式经常被表示成有着共同需求或兴趣的一群用户频繁访问的页面、对象或者资源的集合。而对整合好的记录数据进行分析的类型和层次依赖于分析员的最终目标和预期的结果。在本文里,也描述了Web使用记录挖掘领域里最常用的模式发现类型以及分析技术在应用中的实践。本文工作如下:(1)介绍了Web使用日志挖掘的发展背景与国内外发展现状,总结了当前Web使用日志挖掘技术的一些算法,并在已有的算法基础上提出了改进的方向;(2)本文再针对原始Web日志数据的半结构化和冗余特性,提出了日志预处理的一些步骤与方法,针对预处理之后的数据进行了一定的建模,使得后面的挖掘步骤能够有条不紊的进行,也保证了后续挖掘的数据质量;(3)针对Web日志挖掘中的一些关键算法进行了详细的陈述与分析,对算法中存在的劣势也提出了一些改进方向;(4)针对Web日志中的原始关联规则Apriori算法提出了基于聚类划分的Apriori算法,克服了原始算法挖掘规则覆盖率不够高的问题,并且就原始算法和改进的算法做了一个仿真实验,并针对实验后的结果进行了对比分析,验证了改进后的算法在挖掘性能上的提升,最后给出了推荐系统的原型设计。
由海涌,姜达[5](2013)在《浅谈Web数据挖掘技术的应用》文中研究表明随着Internet使用的广泛性和Web技术的发展,数据挖掘这一技术研究也逐渐的走进了基于Web研究的阶段。数据挖掘技术已经在不同的领域广泛的应用,本文主要分析探讨了关于Web数据的特点有哪些,以及Web数据挖掘的分类,当然最重要的一点就是Web数据挖掘技术的应用,主要表现在对网络服务性能上的提高,以及给电子商务企业等带来的影响和其他领域的应用。
赵静[6](2013)在《高校图书馆搜索引擎中Web使用记录挖掘研究》文中认为针对高校的信息资源检索的命中率低问题提出了运用Web使用记录挖掘的高校图书馆搜索引擎。通过采用Web使用记录挖掘技术和Clementine对高校图书馆网站的Web访问日志记录进行挖掘。在Web使用记录挖掘流程中,提出一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新算法,获得有效提高识别用户的实验结果。最后用路径分析来挖掘模式,优化网站结构,从而提高高校图书馆搜索引擎的命中率。
史玉龙[7](2013)在《Web访问对象轨迹聚类方法研究》文中研究表明自互联网诞生20多年以来,基于Web的信息系统、电子商务、Web服务等领域得到迅速发展和壮大,同时数据收集和数据存储技术的快速进步使得互联网上囤积了海量的点击流数据和用户数据,从这数以万亿计的数据中提取有价值模式已成为巨大挑战。阶段的研究分成三大主要方向:基于Web结构挖掘技术、基于Web内容挖掘技术和基于Web使用挖掘技术,其中基于Web使用挖掘技术就是本文重点研究的内容。本文主要以Web用户访问数据预处理过程、访问轨迹聚类使用技术以及在Web用户访问个性化推荐等方向为主线着手开展研究,主要研究成果从以下几个方面阐述。首先在深入研究了使用Web使用挖掘领域的相关理论和技术之后,给出了挖掘实施过程整体框架,包括Web用户访问数据预处理工作、Web访问轨迹聚类、应用个性化推荐等核心模块。在预处理阶段详细阐述了预处理的数据格式化、访问数据元识别、数据完整性、访问事务识别等个子过程的方法步骤,并附以文字图示详细阐述。用已经公开的远程服务器日志作为数据集,实验验证了提出的方案的正确性并得到聚类粒度小的用户访问记录,这对后期的工作打下坚实的基础。其次针对Web使用数据量庞大、聚类过程的效率不高并占用大量系统资源、聚类结果准确性的评估等问题,提出了用户兴趣特征的形式化表示方法和用户之间的相似度计算方法。另外,在KPC聚类算法的基础上引入投票选举策略思想,加速改进算法的收敛速度,提升聚类结果的精准度,并且验证实验显示出期望的结果并且具有很高的现实指导意义。最后一部分是依据前两方面的成果,针对互联网造成的信息泛滥、信息迷航问题,提出一个基于改进聚类算法的用户访问个性化推荐模型,给出了其中详细的形式化定义并列出判定当前用户隶属聚类中心的算法步骤。针对上述给出的方法进行了仿真实验验证模型可行性。
倪静[8](2012)在《Web数据挖掘研究初探》文中认为随着大型数据库的不断涌现,不缺数据缺知识的矛盾日益突出。大量web信息中获取有用的信息是web数据挖掘的关键问题。该文重点探讨了Web挖掘的基本原理和关键技术,针对Web挖掘的分类进行了描述,论述了Web挖掘的挖掘流程、应用领域及研究发展方向。
李亮[9](2012)在《基于WEB挖掘的网站结构优化技术研究》文中认为Web技术不断创新,特别是物联网技术跨越式的发展,使企业能够利用传感器、射频等智能装置对物理世界进行感知识别,依托通信网络实现了人与物、物与物的信息交互以及生产生活信息的无缝连接,有效地集成了Infranet、Intranet、 Internet。这使得Web上信息量无比丰富,给人们生活提供了极大方便,但同时在客观上也增加了用户从海量数据中获取所需信息的难度,用户在面对众多的超链接选择时经常会产生一些无益于到达其目标页面的无谓点击行为。这一方面增加了Web服务器负担和网络的数据流量,造成网络阻塞,导致网络访问速度的下降,从而进一步影响信息搜寻行为的效率;另一方面阻碍了企业开展有针对性的电子商务活动。目前针对这类问题的主要解决方法是WEB挖掘,其中一种有效的方法是网站结构优化技术,它通过使用数据挖掘技术找到现有网站结构存在的不足之处并进行改善。目前存在的多种网站结构优化技术中,基于Web使用挖掘技术的网站结构优化是一个重要的研究方向,Web使用挖掘技术可以充分利用访问日志等信息发现用户的访问模式,并通过分析和研究Web日志记录中的规律来指导电子商务网站结构优化工作的进行。本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程,主要工作成果为:(1)研究了通过Web日志挖掘优化网站结构的过程,提出了一种通过挖掘用户期望页面来优化网站结构的算法,该算法主要以更早和更少的回退两个不同的角度去优化发现期望页面的过程,分析表明,该算法可以更有效的发现用户期望页面,从而实现网站物理结构的调整和再组织。(2)提出了一个针对分布式动态网站的Web日志挖掘数据预处理方法。在数据清理之前加入了数据合并过程,提出了日志合并算法,在该算法中充分考虑了服务器的时钟同步和时区差异对日志合并的影响,在数据清和用户识别部分添加了页面过滤部分。改进了框架式结构页面过滤算法,为了消除框架页面对Web日志挖掘算法的影响。(3)针对学校网站,利用上面的算法,设计和实现站点结构优化工具。通过该工具,可以收集用户访问日志和站点结构数据,并使用日志清理工具上述数据进行清理和转换。站点结构优化组件使用这些数据挖掘用户的期望位置,并根据这些结果调整网站的链接拓扑,以给用户提供便捷易用的链接,优化网站结构。
蔡示帮[10](2012)在《基于Web使用挖掘的个性化推荐服务研究与实现》文中研究说明随着Internet的快速发展和广泛应用,WWW(World Wide Web万维网)已经积累了数据巨大、领域广泛、内容丰富的信息,并成为人们获得信息与服务的重要途径。然而Web信息具有形式多种多样、更新速度较快、冗余垃圾信息较多的特点,也使得Web用户难以快速获得所需的知识信息。如何快速有效满足用户的信息需求,提供高效的信息服务,越来越受到大家的高度关注,并引起人们的足够重视。传统的信息服务方式主要依赖于搜索引擎对Web信息进行检索,将过滤后的信息提供给用户,但这种方法没有考虑到Web用户的多样性,各个用户的背景、习惯、访问目的是不一样的,提供大众化的通用信息服务难以满足不同用户的需求,需要面向用户提供有针对性的个性化信息服务。针对这一问题,本文对基于Web使用挖掘的个性化技术进行了有益的探索和研究。首先,该文介绍了Web使用挖掘理论和应用范围,重点研究和分析了Web使用挖掘的处理流程,概述了个性化服务理论和要求,并对Web使用挖掘在个性化推荐服务中的处理过程进行了深入分析。其次,该文分别以关联规则和聚类两种方式对个性化推荐算法进行了深入研究,在关联规则方式中,分析了Apriori算法的不足之处,提出了剪枝优化和事务压缩改进策略,给出了改进算法应用于挖掘用户频繁访问路径;在聚类方式中,设计了用户页面兴趣度的表示与计算方法、用户使用事务集的形成方法,提出了一种改进的层次聚类算法,并应用于基于用户使用事务集的聚类分析中,给出了结合用户使用文档集的个性化推荐服务策略。然后,该文阐述了基于Web使用挖掘的个性化推荐服务系统的设计思想,分析设计了系统主要组成模块,并对各模块进行了详细介绍,包括用户识别、行为数据收集、用户偏好分析和个性化信息推荐。最后,通过结合中小企业信息化资源平台后台管理系统进行再次开发,在SSH(Struts,Spring,Hibernate)框架上实现了个性化推荐服务系统,并以平台用户的使用记录数据对系统进行了实验分析,推荐服务结果与用户的实际访问情况基本相符,验证了推荐算法的有效性和个性化推荐服务系统的实用性。
二、WEB使用记录挖掘研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、WEB使用记录挖掘研究(论文提纲范文)
(1)面向电子商务用户行为的Web数据挖掘模型与应用研究(论文提纲范文)
中文摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究目的及意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.2.3 国内外研究述评 |
1.3 研究方法及技术路线 |
1.3.1 本文研究方法 |
1.3.2 本文技术路线 |
1.4 研究内容及创新点 |
1.4.1 主要研究内容 |
1.4.2 本文的创新点 |
第2章 相关理论概述 |
2.1 电子商务用户行为 |
2.1.1 电子商务概述 |
2.1.2 电子商务用户行为的定义 |
2.1.3 电子商务用户行为分析的内容 |
2.2 Web数据挖掘技术 |
2.2.1 Web数据挖掘的定义 |
2.2.2 Web数据挖掘的分类 |
2.2.3 Web数据挖掘的流程 |
2.2.4 Web数据挖掘的常用技术 |
2.3 个性化推荐系统 |
2.3.1 个性化推荐系统的简介 |
2.3.2 个性化推荐系统的作用 |
2.3.3 个性化推荐系统的推荐方法 |
2.4 本章小结 |
第3章 Web数据挖掘在电子商务中的应用 |
3.1 电商中应用背景及Web数据分析的类型 |
3.1.1 商业应用背景 |
3.1.2 Web数据分析的类型 |
3.2 电商中Web挖掘的数据来源及特点 |
3.2.1 Web挖掘的数据来源 |
3.2.2 Web挖掘的数据特点 |
3.3 电商中Web挖掘的应用价值 |
3.3.1 挖掘潜在客户 |
3.3.2 提供个性化服务 |
3.3.3 改进站点设计 |
3.3.4 聚类客户 |
3.3.5 搜索引擎的应用 |
3.3.6 广告效益评估 |
3.3.7 网络安全 |
3.4 本章小结 |
第4章 基于电子商务用户行为的Web挖掘模型构建 |
4.1 数据理解与准备 |
4.1.1 数据理解 |
4.1.2 数据准备 |
4.2 Web挖掘模型的构建与分析 |
4.2.1 使用分类分析构建用户购买行为预测模型 |
4.2.2 使用聚类分析构建商品推荐模型 |
4.2.3 使用决策树C5.0算法构建用户细分模型 |
4.2.4 使用关联分析Apriori算法构建商品特征分析模型 |
4.3 本章小结 |
第5章 商品推荐模型在MQ音像商城中的应用与实现 |
5.1 商品个性化推荐系统的设计 |
5.1.1 系统总体框架设计 |
5.1.2 离线模块系统设计 |
5.1.3 在线模块系统设计 |
5.1.4 数据表结构设计 |
5.2 商品个性化推荐系统的实现 |
5.2.1 开发平台和工具 |
5.2.2 主要运行界面 |
5.3 本章小结 |
第6章 全文总结与研究展望 |
6.1 工作总结与不足 |
6.2 未来展望 |
参考文献 |
致谢 |
攻读学位期间发表的论文 |
(2)Web日志关联规则挖掘方法研究与应用(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文的主要工作 |
1.4 论文的组织结构 |
第2章 Web数据挖掘 |
2.1 Web数据挖掘概述 |
2.2 Web数据挖掘的原理 |
2.3 Web数据挖掘的分类 |
2.4 Web日志挖掘 |
2.4.1 Web日志数据源 |
2.4.2 Web日志挖掘过程 |
2.4.3 Web日志挖掘的应用 |
2.5 Web日志预处理技术 |
2.5.1 数据清理 |
2.5.2 用户识别 |
2.5.3 会话识别 |
2.5.4 事务识别 |
2.6 本章小结 |
第3章 Web日志预处理中改进的用户识别方法 |
3.1 相关概念 |
3.2 用户识别常用算法 |
3.3 优化的用户识别算法 |
3.4 实验验证 |
3.5 本章小结 |
第4章 Web日志挖掘算法研究 |
4.1 关联规则挖掘 |
4.1.1 关联规则挖掘思想 |
4.1.2 关联规则的基本概念 |
4.2 AprioriTid算法介绍 |
4.3 一种基于AprioriTid的改进算法 |
4.3.1 算法改进理论及证明 |
4.3.2 算法分析 |
4.3.3 实验验证 |
4.4 实际挖掘结果分析 |
4.5 本章小结 |
第5章 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(3)Web日志攻击序列模式挖掘的研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究动机 |
1.3 国内外研究现状综述 |
1.3.1 Web挖掘综述 |
1.3.2 国外研究综述 |
1.3.3 国内研究综述 |
1.4 主要工作 |
1.4.1 问题的提出 |
1.4.2 研究目标 |
1.4.3 本文完成的工作 |
1.5 本文的组织结构 |
第2章 背景及相关技术研究 |
2.1 网络安全现状 |
2.2 Web应用漏洞 |
2.2.1 结构化查询语言注入漏洞 |
2.2.2 跨站脚本漏洞 |
2.2.3 文件包含漏洞 |
2.2.4 远程命令执行漏洞 |
2.2.5 目录遍历漏洞 |
2.3 网络漏洞防护措施 |
2.4 本章小结 |
第3章 Web日志攻击序列模式挖掘的设计 |
3.1 引言 |
3.2 数据收集 |
3.2.1 特征库中攻击特征码的收集 |
3.2.2 日志和网站结构信息收集 |
3.3 数据预处理模块 |
3.3.1 日志解析 |
3.3.2 日志清洗 |
3.3.3 URL清理 |
3.3.4 用户识别 |
3.3.5 攻击者分类 |
3.3.6 会话识别 |
3.4 序列模式挖掘模块 |
3.5 模式分析模块 |
3.5.1 序列最大化 |
3.5.2 图形化 |
3.6 本章小结 |
第4章 Web日志攻击序列模式挖掘的系统实现 |
4.1 引言 |
4.2 数据预处理模块的详细设计与实现 |
4.2.1 数据预处理模块设计 |
4.2.2 算法实现 |
4.3 序列模式挖掘模块的详细设计与实现 |
4.3.1 模式挖掘模块设计 |
4.3.2 算法实现 |
4.4 模式分析模块的详细设计与实现 |
4.4.1 模式分析模块设计 |
4.4.2 算法实现 |
4.5 本章小结 |
第5章 系统实验 |
5.1 引言 |
5.2 实验环境 |
5.3 实验 |
5.3.1 漏洞特征库收集实验 |
5.3.2 数据清洗功能实验 |
5.3.3 模式生成实验 |
5.4 本章小结 |
结论 |
参考文献 |
附录A 攻读硕士期间发表学术论文和申请专利目录 |
附录B 攻读硕士期间所参加的科研项目目录 |
致谢 |
(4)基于聚类划分的关联规则在Web日志挖掘中的应用研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第1章 绪论 |
1.1 课题背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要内容和结构 |
第2章 Web 挖掘与 Web 日志挖掘 |
2.1 数据挖掘与 Web 挖掘 |
2.2 Web 挖掘的概述 |
2.3 Web 日志挖掘的关键元素 |
2.3.1 Web 日志的来源 |
2.3.2 Web 日志的类型 |
2.3.3 Web 日志挖掘的关键过程 |
2.3.4 Web 日志挖掘的关键应用 |
2.4 本章小结 |
第3章 数据预处理与数据建模 |
3.1 数据的获取及预处理概述 |
3.2 Web 日志的不确定性 |
3.3 Web 日志的预处理 |
3.3.1 数据清洗 |
3.3.2 用户识别 |
3.3.3 会话识别 |
3.3.4 路径补充 |
3.3.5 事务识别 |
3.4 Web 日志数据建模基础 |
3.5 Web 日志数据建模的关键元素 |
3.5.1 Web 页面权重 |
3.5.2 Web 隐式语义 |
3.6 日志数据仓库的多维建模 |
3.7 本章小结 |
第4章 Web 日志挖掘算法的研究及改进 |
4.1 Web 日志挖掘算法概述 |
4.2 关联规则和 Apriori 算法的改进 |
4.2.1 关联规则的基本概念 |
4.2.2 Apriori 算法的思想及伪码实现 |
4.2.3 Apriori 算法的分析及改进 |
4.3 聚类分析和 K-means 算法的改进 |
4.3.1 聚类分析的基本概念 |
4.3.2 聚类分析方法的主要分类 |
4.3.3 K-means 算法的思想及伪码实现 |
4.3.4 K-means 算法的分析及改进 |
4.4 K-means 和 Apriori 算法在日志挖掘中的性能评价 |
4.5 基于 K-means 聚类的 Apriori 算法 |
4.6 本章小结 |
第5章 改进算法的仿真实验及结果分析 |
5.1 实验目的 |
5.2 实验环境 |
5.2.1 实验平台 |
5.2.2 实验数据集来源及特征 |
5.3 实验过程及结果分析 |
5.3.1 数据准备阶段 |
5.3.2 算法挖掘阶段 |
5.3.3 实验结果分析 |
5.4 本章小结 |
第6章 基于 Web 日志挖掘的原型系统设计 |
6.1 系统总体设计 |
6.1.1 可视化插件服务 |
6.1.2 离线分析服务 |
6.1.3 在线推荐服务 |
6.2 功能模块详细设计及过程分析 |
6.2.1 日志数据采集模块 |
6.2.2 日志预处理模块 |
6.2.3 日志挖掘模块 |
6.2.4 在线推荐服务模块 |
6.3 系统应用场景 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
致谢 |
参考文献 |
(5)浅谈Web数据挖掘技术的应用(论文提纲范文)
1 Web数据的特点 |
1.1 异构数据库环境 |
1.2 散布式数据源 |
1.3 半结构化 |
1.4 动态性强 |
1.5 多样复杂性 |
2 Web数据挖掘的分类 |
2.1 内容挖掘 |
2.2 结构挖掘 |
2.3 使用记录挖掘 |
3 Web挖掘相关技术的应用 |
3.1 提高网络服务性能 |
3.2 在电子商务中的应用 |
3.3 科研领域 |
4 结束语 |
(6)高校图书馆搜索引擎中Web使用记录挖掘研究(论文提纲范文)
0 引言 |
1 高校图书馆搜索引擎中Web使用记录挖掘流程分析 |
1.1 数据收集 |
1.2 数据准备 |
1.3 建立用户兴趣模型 |
1.4 模式挖掘 |
2 搜索引擎Web使用记录挖掘应用 |
2.1 数据收集 |
2.2 日志预处理 |
2.2.1 数据清理 |
2.2.2 事务识别 |
2.3 路径分析挖掘模式 |
3 结语 |
(7)Web访问对象轨迹聚类方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 论文研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 论文的组织结构 |
第2章 Web 轨迹聚类方法研究 |
2.1 Web 使用挖掘 |
2.1.1 概述 |
2.1.2 相关研究技术方法 |
2.2 Web 访问轨迹聚类技术方法 |
2.2.1 聚类概述 |
2.2.2 轨迹聚类相关研究方法 |
2.3 基于轨迹聚类个性化推荐 |
2.4 本章小结 |
第3章 Web 访问数据预处理研究 |
3.1 预处理对象及相关技术研究 |
3.1.1 预处理对象 |
3.1.2 预处理相关技术 |
3.2 预处理过程具体实现 |
3.2.1 数据格式化 |
3.2.2 访问数据元识别 |
3.2.3 处理数据完整化 |
3.2.4 访问事务识别 |
3.3 验证实验 |
3.3.1 实验环境 |
3.3.2 数据预处理过程 |
3.4 本章小结 |
第4章 基于投票策略的访问轨迹聚类 |
4.1 Web 访问轨迹聚类过程 |
4.2 基于浏览兴趣的用户相似度计算 |
4.2.1 用户兴趣特征表示 |
4.2.2 用户相似度计算方法 |
4.3 基于投票策略的 KPC 聚类算法 |
4.3.1 KPC 算法描述 |
4.3.2 投票选举策略 |
4.3.3 聚类中心 |
4.4 实验与评价 |
4.4.1 用户相似度实验 |
4.4.2 基于投票策略的 KPC 聚类对比实验 |
4.5 本章小结 |
第5章 用户访问个性化推荐模型 |
5.1 用户访问个性化推荐模型 |
5.2 基于投票策略轨迹聚类的推荐引擎 |
5.3 推荐模型仿真实验 |
5.4 本章小结 |
结论 |
参考文献 |
致谢 |
(8)Web数据挖掘研究初探(论文提纲范文)
1 Web数据挖掘的研究背景和国内外现状 |
2 Web数据挖掘概述 |
3 Web数据挖掘的分类 |
4 数据挖掘的主要技术 |
5 结束语 |
(9)基于WEB挖掘的网站结构优化技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 WEB 数据挖掘 |
1.1.2 网站结构优化 |
1.2 国内外研究现状及意义 |
1.2.1 国内外研究现状 |
1.2.2 研究意义 |
1.3 论文结构 |
第二章 WEB 数据挖掘综述 |
2.1 数据挖掘 |
2.1.1 数据挖掘的定义 |
2.1.2 数据挖掘的方法和工具 |
2.1.3 数据挖掘的流程 |
2.2 WEB 数据挖掘 |
2.2.1 WEB 数据挖掘的定义 |
2.2.2 WEB 数据挖掘的对象 |
2.2.3 WEB 数据挖掘的分类 |
2.2.4 WEB 数据挖掘的流程与方法 |
2.3 WEB 日志挖掘 |
2.3.1 WEB 日志挖掘的术语和概念 |
2.3.2 WEB 日志挖掘过程 |
2.3.3 WEB 日志挖掘的数据源 |
2.3.4 WEB 日志挖掘的应用 |
第三章 网站结构优化研究 |
3.1 网站结构优化概述 |
3.1.1 WEB 站点结构及其表示 |
3.1.2 网站结构优化概念 |
3.1.3 网站结构优化研究的主要问题 |
3.1.4 网站结构优化的目标 |
3.2 网站结构优化方法综述 |
3.2.1 基于用户行为方法 |
3.2.2 基于站点模型方法 |
第四章 基于访问模式挖掘的网站结构优化 |
4.1 访问模式挖掘问题定义 |
4.2 访问模式挖掘的特点 |
4.3 数据收集 |
4.4 分布式动态站点的日志挖掘数据预处理 |
4.4.1 数据合并 |
4.4.2 数据清理 |
4.4.3 用户识别 |
4.4.4 会话识别 |
4.4.5 改进的会话识别 |
4.4.6 路径补充 |
4.5 序列模式挖掘算法 |
4.5.1 序列模式挖掘步骤 |
4.5.2 序列模式挖掘的几种算法比较 |
4.6 基于用户访问序列挖掘的站点路径优化 |
4.6.1 访问者的搜索模式 |
4.6.2 目标位置和期望位置的发现 |
4.6.3 改进的目标位置和期望位置的发现 |
4.6.4 站点结构的调整 |
第五章 网站结构优化系统的设计与实现 |
5.1 概述 |
5.2 系统的设计 |
5.2.1 站点结构优化工具结构 |
5.2.2 系统架构 |
5.3 系统的实现 |
5.3.1 数据预处理模块 |
5.3.2 站点结构优化模块 |
5.4 系统关键技术分析 |
5.4.1 数据预处理技术 |
5.4.2 站点结构优化关键技术 |
5.5 小结 |
第六章 总结与展望 |
6.1 本文小结 |
6.2 进一步的工作 |
参考文献 |
致谢 |
攻读硕士期间科研成果 |
(10)基于Web使用挖掘的个性化推荐服务研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 论文完成的主要研究工作 |
1.4 本文组织结构 |
2 Web 使用挖掘概述 |
2.1 数据挖掘 |
2.1.1 数据挖掘定义 |
2.1.2 数据挖掘的主要过程 |
2.2 Web 挖掘 |
2.2.1 Web 挖掘概述 |
2.2.2 Web 挖掘分类 |
2.3 Web 使用挖掘 |
2.3.1 Web 使用挖掘概述 |
2.3.2 Web 使用挖掘的过程 |
2.3.3 Web 使用挖掘的应用 |
2.4 个性化服务 |
2.5 基于 Web 使用挖掘的个性化信息推荐 |
2.6 本章小结 |
3 基于 Web 使用挖掘的个性化推荐算法研究 |
3.1 基于关联规则的个性化推荐算法研究 |
3.1.1 关联规则 |
3.1.2 改进 Apriori 算法挖掘用户频繁访问路径 |
3.1.3 用户频繁访问路径与个性化推荐服务应用 |
3.2 基于聚类的个性化推荐算法研究 |
3.2.1 聚类分析 |
3.2.2 基于层次聚类算法对用户使用事务聚类 |
3.2.3 用户事务聚类及在个性化服务中的应用 |
3.3 本章小结 |
4 基于 Web 使用挖掘的个性化推荐系统分析与设计 |
4.1 系统的设计思想 |
4.2 个性化推荐服务系统的框架 |
4.2.1 用户识别 |
4.2.2 行为数据收集 |
4.2.3 用户偏好分析 |
4.2.4 个性化信息推荐 |
4.3 本章小结 |
5 基于 Web 使用挖掘的个性化推荐服务系统的实现 |
5.1 系统介绍 |
5.2 关键技术与处理策略 |
5.2.1 用户识别处理 |
5.2.2 页面浏览时间计算 |
5.2.3 推荐页面集生成策略 |
5.3 推荐系统的实验 |
5.4 本章小结 |
6 结论 |
致谢 |
参考文献 |
个人简历、在学期间发表的学术论文及取得的研究成果 |
四、WEB使用记录挖掘研究(论文参考文献)
- [1]面向电子商务用户行为的Web数据挖掘模型与应用研究[D]. 孟强. 黑龙江大学, 2017(07)
- [2]Web日志关联规则挖掘方法研究与应用[D]. 谭博闻. 重庆邮电大学, 2016(03)
- [3]Web日志攻击序列模式挖掘的研究[D]. 孙慧. 湖南大学, 2016(03)
- [4]基于聚类划分的关联规则在Web日志挖掘中的应用研究[D]. 石敏. 武汉理工大学, 2014(04)
- [5]浅谈Web数据挖掘技术的应用[J]. 由海涌,姜达. 电子技术与软件工程, 2013(06)
- [6]高校图书馆搜索引擎中Web使用记录挖掘研究[J]. 赵静. 现代电子技术, 2013(02)
- [7]Web访问对象轨迹聚类方法研究[D]. 史玉龙. 哈尔滨工程大学, 2013(04)
- [8]Web数据挖掘研究初探[J]. 倪静. 电脑知识与技术, 2012(32)
- [9]基于WEB挖掘的网站结构优化技术研究[D]. 李亮. 西北师范大学, 2012(04)
- [10]基于Web使用挖掘的个性化推荐服务研究与实现[D]. 蔡示帮. 重庆理工大学, 2012(06)