【毕业设计】面向金融领域的实体关系抽取系统设计与实现
文件列表(压缩包大小 117.29M)
免费
概述
面向金融领域的实体关系抽取系统设计与实现
关系抽取是信息抽取中的关键技术之一。面向金融领域的实体关系抽取是在实体识别的基础上,进一步提炼出实体间的关系,建立实体间的联系,服务于金融行业。
本系统主要针对机构与机构、人与机构之间进行实体关系抽取。关系抽取问题可以转化为分类问题,关系抽取就是在已经定义好的关系列别上,确定当前实体对之间关系的所属类别。
本系统利用有监督的机器学习方法,在人工标注的语料库上使用多种分类算法进行训练。在训练过程中,使用交叉验证的手段来确定各个分类算法的最佳参数,并根据交叉验证的结果选择最佳的分类算法,训练出最佳模型并保存。最后利用已经训练好的模型进行实体关系抽取。
本系统将关系抽取应用到金融领域,通过对系统的设计与研发,得到以下研究成果和结论。
介绍了项目的研发背景,阐明了关系抽取在金融领域的作用,分析了关系抽取的国内外研究现状。关系抽取是金融领域知识图谱构建的基本手段之一。
定义了金融领域机构与机构间,人与机构间的关系类别。使用有监督的机器学习的方法进行面向金融领域的实体关系抽取,并分析了其实质是进行文本分类。
采用多种分类算法来进行关系抽取,使用交叉验证的手段来调整模型参数,并通过综合比较各分类算法的性能来选出最佳的分类算法和分类模型。
详细叙述了从模型训练到关系抽取的整个流程,证明了SVM在文本分类中的良好性能。
摘 要 Abstract 目 录 第1章 绪论 1.1 课题背景及意义 1.2 国内外研究现状 1.3 本文主要工作内容 第2章 需求分析 2.1 金融领域实体关系定义 2.2 系统需求 2.2.1 系统功能性需求 2.2.2 系统非功能性需求 2.3 本章小结 第3章 系统设计 3.1 系统总体设计方案 3.1.1 软件体系结构 3.1.2 系统功能结构图 3.1.3 系统实现流程 3.2 系统存储数据结构设计 3.3 本章小结 第4章 系统实现 4.1 模型训练 4.1.1 网络爬虫数据采集 4.1.2 人工标注语料库 4.1.3 结巴分词 4.1.4 模型参数调优 4.2 关系抽取 4.3 本章小结 第5章 系统测试与性能分析 5.1 关系类别测试 5.2 系统性能分析 5.3 本章小结 结 论 参考文献 原创性声明 致谢
如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈
评论(0)