毕业设计 · 圈子

5551 位酷友已加入

本圈子收集理工类毕业设计与毕业论文，本科、硕士、博士各阶段的都可以，上传时请尽量注明毕设的概述信息~加入圈子可以上传、下载资料，也可以使用提问来寻求资料或分享你认为有价值的站外链接~

提问或寻求资源

PDF分享

资料包分享

站外资源

关注推荐最新

热门标签

计算机毕业设计·圈子首发

错位时空更新了

资源

[Java、Python 课程设计]基于人脸识别的员工考勤系统

[Java、Python 课程设计]基于人脸识别的员工考勤系统目录一、需求分析 1．产品描述 2．产品需求分析 3．产品预期目标二、总体设计 1. 基本思路 2. 遇到的问题与解决方案 3. 完整设计过程. 4. 流程图三、程序详细设计 1. 编写及测试环境 2. 程序依赖库 3. 调用函数清单 4. 函数调用关系四、程序运行结果测试与分析 1. 第一版程序（无 GUI 界面）展示 2. 第二版程序展示五、结论与心得六、程序源码及参考文献 1. 程序源码 2. 参考文献及资料一、需求分析 1．产品描述员工刷脸考勤系统。需要使用 Python 作为程序开发语言，能够通过摄像头添加员工信息并通过摄像头识别员工。另外拓展要求是能够导出每日考勤表。 2．产品需求分析程序要求使用 Python 作为编程语言，作为目前行业最流行的编程语言，使用 Python能够大大提高代码的可读性，提高编写效率，对于这种比较小的程序来说能够缩短开发周期。另外通过使用摄像头添加和识别员工，这就要求不能使用静态图片来添加信息而应该是实时监测，实时执行的系统。最后，扩展要求需要导出每日考勤表。这就需要程序具有读写表格的功能以及类似数据库的存储能力。 3．产品预期目标第一代版本应该具备调用摄像头实时监测人脸的能力，并且在用户的确认下能够自动为员工注册或签到，在后台数据库更新员工的签到状态，并能够手动或自动的导出考勤表。第二代版本可以添加GUI界面使程序更易用，美观，降低学习成本和使用的复杂性。二、总体设计基本思路根据给出的要求，各个击破。首先要求使用摄像头收集信息，那么我们就使用OpenCV模块，利用该模块优秀的兼容性，我们能够通过函数调用任何笔记本的基础摄像设备从而提供视频流的输入。之后，我们考虑在人脸识别方面使用dlib库作为我们的基础识别工具，用于在摄像头开启的状态下对每一帧实时的检测人脸，得益于它的轻量化与易用性，这一项功能对系统的计算能力要求不高，可以应用于普通的嵌入式设备中。关于接下来的员工注册环节，考虑到需要使用数据库或类似数据库的工具来保存员工信息，所以我们打算使用云端服务进行人脸的比对和数据库的建立。毕竟，如果数据库保存在本地有被篡改的风险，并且容量也是不容忽视的一点，经过多次比对，我们使用百度 AI 开放平台作为我们实现人脸比对+数据库功能的平台。云端加持，我们能够节省很多存储空间和运算能力，更加适合轻量化的设备。遇到的问题与解决方案 a) 最初遇到的问题就是学习百度AI开放平台。我们最初担心学习成本比较高。但是在耐心阅读了相关开发文档后，我们发现百度人脸识别的接口简单易用，非常方便。另外，这个发开文档对于我们之后遇到的一系列疑问起到了很好的指导作用。 b) 第一个问题就是我们在测试百度 AI 平台人脸识别功能的时候，一直无法识别人脸图像。平台要求传入的图像必须是以 BASE64字符串或 URL 字符串或FACE_TOKEN 字符串的方式上传。我们选择了最普通的 BASE64 方式上传，但是传回的信息是：‘error_code:222203 image check fail’，在网上查找解决方案才了解到，我们使用的本地编码器得到的字符串不是 utf-8格式，云端无法扫描，于是我们添加了格式转换。问题解决。 c) 通过调用 dlib 库能够很好的实时监测人脸，起初我们打算在用户确认签到时将整个图像帧保存并上传，但是我们调用的云端功能只能识别一个人脸并与数据库比对，另外有一个多重比对的功能似乎并不能满足我们的需求，于是我们期望能够将确认的图像帧中所有的人头区域截取出来然后再依次上传。经过查阅，我们最后依据识别人脸提供的边框参数对图像进行裁剪然后记录下人脸数之后依次上传。并依次接收检测的参数。 d) 在后期想要加入 GUI 界面的时候我们使用的是 wxPython库，在网络上查看相关的设计代码的时候发现有的使用了类结构，有的直接上函数然后在主函数里画程序框，我们一开始不想封装成类，因为参数的修改工程浩大，但是在试验了后者（不使用类）的方法之后，我们发现不使用类无法满足设计要求，最后只能作罢。 e) GUI 界面制作好之后，我们开启摄像头的界面与主程序界面不是同一个，是另外弹出的。在指导老师的要求下，我们需要把图像嵌入在程序框中。这怎么嵌啊？搜索可行的方案之后才了解到，可以利用 OpenCV 在接受图片之后直接在程序框内画图像。多了这么一个过程，帧率比之前有所下降。 f) 在最后的程序优化中，有一处异常。在开启摄像头之前点击关闭摄像头会提示变量未定义，即抛出异常 AttributeError。这是因为类中的 camera 参数还没有被创建。那么我在这里就加了一个异常处理来规避这个问题。 g) 我们通过使用 os 库来获取文件的绝对路径，但是得到的字符串路径实际上是该文件所在文件夹的路径，要想对这个文件进行操作，仍需要手动在该路径后面添加文件名。 h) 如果人脸在程序中只有一半，但是用户仍然点击了注册，那么程序会报错。因为裁剪程序获取了推测的人脸边框数据，但是在裁剪的时候超出了边界，抛出异常 IndexError。为了处理这个异常，在检测到程序抛出 IndexError 异常后提示用户不要半张脸注册签到。完整设计过程首先拿到题之后我们根据前问所述的基本思路开始寻找能够使用的模块并依次对每一个模块进行测试，确保模块能够单独运行。首先考虑摄像头的问题，配置好 OpenCV 之后，测试了调用摄像头的代码，能够完美运行。之后，开始测试百度 AI 开放平台提供的人脸识别接口。根据开发文档的指导，配置好了 baiduAPI 基础库，研究具体接口的用法。我们先在云端创建了一个人脸用户组，并且上传了一张我本人的照片作为测试。然后通过程序向云端发送另一张我的照片，在经历了上述的错误以及排错过程后，终于传回了SUCCESS 的信息。有趣的是，云端传回的处理结果是一个非常长的字典和列表多层嵌套的结构，我又专门复习了一遍字典的相关概念以及从这种结构中提取到想要的信息。最终我们提取的信息就是，识别状态，识别的人脸对应的名称。值得注意的是，员工在云端的人脸库注册的 ID 必须和本人姓名一致，否则在写入表格环节无法认证并修改签到状态。不过这是后话了。接下来开始测试 dlib 库的人脸识别和人脸截取模块。网络上有一个可以参考的实时检测程序，他的代码很有借鉴意义，我简化了他的程序，仅仅是实时在画面中用方框标出人脸即可，这样既可以让用户很直观的看到程序识别出了人脸，而且简化了计算过程加快了。切割的代码是利用了dlib识别的时候返回的人脸的基本参数，然后利用 OpenCV 进行裁剪。测试的时候是输出到指定的目录。经测试，在单独运行之后能够在指定目录找到单独的人脸图像。我们在这个时候打算先不做数据库及图表写入的模块，因为上述这些已经测试的模块，把它们整合起来的代码量已经不短了。于是，我们开始整合模块，写函数。整个过程并不难，就是一些逻辑关系的判断和特定时候的调用。尤其需要注意的是部分语句的顺序，比如摄像头的开启和释放。在完成之后就开始调试表格写入的功能了。在查阅了网上相关的 Python 操作Excel 表格的库，最终使用了 xlrd，xlwt，配合来读写 Excel 表格。首先在初始化程序的时候就联络云端数据库获取人脸库的 ID 列表然后创建表格并写入 ID。之后在每次注册成功之后，也就是云端传回 SUCCESS 的消息之后就在表格对应的 ID 后写入 Registered 以及从系统获取的当前时间。这样，整个程序的所有模块就都已经整合了。开始添加一些优化的代码，添加了网络检查工具，因为整个程序必须需要网络环境，否则会报错。然后为了兼容所有设备，写了一个创建目录的函数，用于缓存图片文件和存储历史考勤日志，这个目录创建函数被作为初始化函数在程序打开时即运行并创建缓存目录。另外，我们还完善了员工的注册功能，如果有图像传到云端并识别失败，那么会展示为识别出人的头像，然后询问用户是否注册，如果用户注册，那么在用户输入这个人的姓名之后，自动上传图像为其注册。如果用户不注册，那么就将该图片上传至 guest 人脸图像组，ID 命名为检测时间。这些全部做完之后，因为没有做 GUI 界面，所以还不太放心，于是开始在网上寻找 Python 相关的 GUI 模块。最终选定用 wxPython 模块制作图形界面。我们在网上找到了两种方法，一个是需要编写类的，这个类也是必须按照这个模块的格式来写，另一个就是不用编写类，直接在主函数里面画框。因为时间不多，我们选择了不使用类，因为如果用类的话，类内部的参数需要修改的地方太多了，直接编写更快一些，但是限制也颇多。向图形界面中融合了已经编写的内容之后，程序大体就完成了。然后迎接老师的检查。最终老师给出的改进意见是把指令从图像上拿出来。原本在没有图形界面之前，我们的指令是嵌在摄像头的画面上的，为了融合图形界面，我们也就没有更改。另外一点，我们的图形界面点 open camera 的时候，摄像头程序框是单独再弹出来一个的，老师要求我们把这个摄像头框嵌入在程序里，不要再多弹出一个。根据老师的要求，我们具体做了如下的更改： a) 移除图像上的所有命令，把这些命令都转化为程序框中的按键。这可就有点麻烦了，因为我们没有用类，写按钮很麻烦。所以我们干脆一不做二不休，就使用了类。重新修改了所有参数，新写了一个类，在类中添加按钮方便多了。于是乎，我们把摄像头的开启，关闭，签到，注册以及使用说明都添加到了程序中。 b) 把视频流嵌入到程序中这个要求，经过网上的搜索，我们了解到，这个过程实际上是用 OpenCV 把获取的图像在程序框中一帧一帧的画一遍。经过一番研究之后终于在我们的程序上实现了这个功能。 c) 修补了程序中的一些逻辑漏洞。比如在没开摄像头的时候点关闭摄像头会提示，开启摄像头之后再点开启会提示。这里面的原理最开始是用简单的判断isOpend这样的函数返回值来确定是否开启或者关闭，但是后面就有一种情况发生，就是在没有打开摄像头的时候，这个类内部的camera变量还没定义，会有异常报出，提示变量未定义。于是我就在isOpend这个函数外面加上了异常处理，如果有未定义异常同样提示未开启，就完美解决了。以上，便是我们程序设计的完整过程。流程图三、程序详细设计编写及测试环境操作系统：macOS Mojave 10.14.6 IDE：PyCharm Professional 2019.01 Python 3.7 程序依赖库除了注释标注的部分外，其余 import 的依赖库均是其本名，可以直接从 PyCharm 的集合库中搜索安装。调用函数清单（类）外部调用函数：类内部调用函数：函数调用关系文字描述：以最后一个版本的代码为例。整个程序的基础就是 wx 模块框架。首先初始化运行类mainApp 然后调用该类的唯一函数 OnInit(self)运行 wx frame 基类（class face_emotion）执行__init__画出一个程序框和基础的按键布局。执行initialize(client)创建表格，执行 clear_images(path_save,path_cache)清除缓存路径下的文件方便进一步操作。然后等待用户操作。”Open Camera”执行learning_face(self, event)，该函数创建多线程任务并开始执行_learning_face(self,event)开始主程序阶段。执行 makedir()创建基础路径，紧接着执行核心函数live_came_detect(separate_path, cache_path, self.userlist, self)开启摄像头并等待进一步操作。用户按下 confirm 键，开始执行 confirm_face(self, event)为其进行签到或注册，首先是face_separate(cc_path, sep_path, detector)函数，分割人脸图像，然后执行 face_recognize(client, read_path)进行识别签到，如果数据库中没有此人，则提示是否注册，如果是，调用 show_img(path)显示陌生人的头像，请求用户输入人命。然后开始运行 face_register(client,read_path,group_id,usr_name)进行注册。点击close camera 按钮执行close_face(self, event)关闭摄像头。点击 View Log 执行view_log(self, event)打开当前状态的考勤表。点击 about us 执行 about_us(self,event)弹出简介消息框。四、程序运行结果测试与分析第一版程序（无 GUI 界面）展示程序开启，左侧为控制台输出信息根据提示，点击 C 键确认签到，注意左侧的输出信息（我是 bruce）提示签到成功换了一个没有录入的信息的同学，检测到没有匹配的图像（留意输出信息）给出照片图像并询问姓名注册成功程序结束后，自动弹出该日考勤表第二版程序展示五、结论与心得首先拿到这道题之后，基本的思路就已经想到了。因为面部识别比对在我的印象里可能需要一定的计算量，所以我一开始就打算用云端的服务实现这个功能。不过后来在学习了 dlib 的相关用法之后发现，计算量似乎也并没有那么大，其他的一些思路都是在一边编写程序的时候，一边继续扩展想法的。距离上一个学期学 Python 已经过了三个多月，一些东西或许会忘记，但是当我真正开始写代码的时候，开始在网上查阅开发文档的时候，当时学的记的内容就都想起来了。经过本次课程设计，我对 Python 的编程技能又重新巩固加强了。在这个过程中，我逐渐认识到，软件编写的过程中，强调的是逻辑的连贯性和程序的模块化。逻辑的连贯性指的就是在编写的过程中，要对整个程序的整体架构有所了解，这样对于我们这次这样走一步想一步的方法非常有好处，因为当我们走完一步之后，下一个方向自然就会在脑中呈现，一些复杂的逻辑实现起来，也并不绕。而对于程序的模块化的理解，则是在比较中产生的。另外一个朋友也做课设，但是很多都是直接借鉴了网上的整套体系或者方法，首先第一点就是很难吃透或是跟上它的逻辑，另外一点就是调试的时候，不能分开分段调试，造成工作量巨大。如果我们能够逻辑清晰的把每个模块都分开进行测试的话，会节省很多调试的思考量和时间。关于在调试的是过程中发现的一些问题，一部分我在之前的部分也有所提及。比如超过列表界限的这个异常，最开始并不知道什么原因。因为当时我们只是偶然的发现会报出 IndexError 的异常，经过定位之后，确认报错的代码是在截取人脸部分的，再进一步理解这个异常的触发因素，最终确定是在截取的时候超过了图片的下表界限。那么能导致这个因素的，也就只有半张脸在图像内会导致了。这是一个很典型的调试纠错过程，本次课程设计我们也有多次这样的排错经历，更加丰富了我们的调试经验。不难发现，我在本次课程设计中承担的是主要的程序编写工作：）收获当然是要比做实验要更多，让我更加熟悉在这个领域一些基础的编程思想和方法，比如关于考勤系统的编程逻辑，关于人脸识别的基础的原理算法和应用方法。通过网上查阅别人的经验或是第三方组织的开发文档对于解决问题十分有效，因为首先别人的经验都是前人踩过的坑，有助于少走弯路。第三方的开发文档在使用他们写的工具的时候能够帮助你快速定位出错部位的具体功能和调用关系，这样不仅能够解决问题，还能同时掌握这一块工具的具体使用，对于后面的程序或是日后再使用大有益。因为时间关系，我们在最后做 GUI 界面的时候，一些美化的元素可能并不是太好，没有来得及改进。另外，在完成了老师提出的要求后，其实还有一些瑕疵，比如我们的确是把视频流嵌入到了程序框中，但是程序框的大小和视频流的分辨率不匹配，所以每次开启摄像头的时候，程序框的大小都会变化，从原始大小扩大到摄像头视频的分辨率大小。这一点值得进一步研究改进。还有关于考勤表的机制，我们就是直接利用了读写Excel 表格的想法，我们可以把表格也嵌入到程序框中，随时调用查看，随时关闭，压缩内存成本，这也是一点还未完成的地方。我想在这个方面使用 Java 或许会更轻松一些。当然还有其他很多功能的扩展功能。六、程序源码及参考文献程序源码该程序现已开源，可自行阅览：https://github.com/BrucePoki/Attendance-system 参考文献及资料 [1]. Davis E. King. Dlib-ml: A Machine Learning Toolkit[J]. Journal of Machine Learning Research 10, pp. 1755-1758, 2009 [2]. Noel Rappin, Robin Dunn. wxPython in action[M]. British: Manning Publications, 2006:1-552. [3]. coneypo.Python3 利用 Dlib 实现摄像头实时人脸检测和平铺显示，2019-1-24. [4]. conetypo.Python3 利用 Dlib 实现人脸检测和剪切,2018-1-24. [5]. monster_ygs.Python 创建目录文件夹,2017-3-18. [6]. 仿佛泣雪如画.如何在 Python 中创建 Excel 表格,2018-7-31. [7]. yanyingli.python 中的 wx 模块,2019-2-1. [8]. Baidu.百度人脸识别 Python SDK 文档,2019. [9]. zhuzaiming2004.将 opencv 的视屏流嵌入 wxpython 的框架中,2018-11-12. [10].inspurer.WorkAttendanceSystem，System,2018-9. 转载自https://github.com/BrucePoki/Attendance-system

计算机毕业设计·圈子首发

空心人更新了

资源

【毕业设计】基于监督学习的web入侵检测系统

算法描述使用算法：SVM支持向量机在样本数量过万的时候发现knn很吃力但是在训练样本较少条件下KNN可以将精度提升到百分之百。数据描述使用了一千多条SQL注入样本转载自：https://github.com/3riccc/graduation_design/blob/master/README.md

推荐系统论文归类总结本文主要记录较新的推荐系统论文，并对类似的论文进行总结和整合。目录推荐系统论文归类总结综述协同过滤理论矩阵分解因子分解机基于内容的推荐基于DNN的推荐基于标签的推荐基于自编码器 Item2Vec 上下文感知模型基于视觉的推荐基于RNN的推荐基于图的推荐基于树的推荐公司的推荐系统的发展历程数据集参考资料版权声明综述《Deep Learning based Recommender System: A Survey and New Perspectives》《Use of Deep Learning in Modern Recommendation System: A Summary of Recent Works》这几个综述比较全面，介绍了目前的深度学习在推荐系统中的应用。协同过滤理论 1.《Application of Dimensionality Reduction in Recommender System - A Case Study》推荐系统的维度下降技术。这是发表于2000年的“古老”论文，该文是最早探讨如何解决协同过滤数据量很大时的问题。这个论文提出了使用传统的SVD降维的技术。这个文章提出推荐系统可以分为两部分：预测、推荐。预测可以使用加权和，推荐使用TopN。可能因为这个文章特别早吧，他认为推荐系统面临的主要问题是三个：稀疏，规模，“同义词”。当数据集稀疏的时候，皮尔逊近邻算法可能根本无法使用。规模很好理解。这个同义词的意思是两个相似的物品名字不同，推荐系统不能发现他们之间的隐相关性。同义词问题没看到这个文章怎么解决的，事实上我也没看到其他论文上如何解决这个问题，甚至已经不认为这是推荐系统要解决的问题了。该文认为SVD的任务有两个： 1.捕捉用户和商品的隐层关系，允许我们计算用户对商品打分的预测值。 2.对原始的用户和商品关系进行降维，并且在低维空间计算邻居。该传统的SVD是一种矩阵分解方法，这种方法的缺点是需要先把评分矩阵缺值补足，是一种线性代数里的求解析解的方法。这种方法可以研究的一个点就是如何进行缺失值填补，不同的填充方法，对结果产生不同的影响。另外就是SVD降维是代表维度k值的选取，这个需要使用实验获得。另外，真正的预测是放在线下运行的，可以在用户的访问时迅速做出推荐。总体而言，这个文章介绍了SVD如何在推荐系统中使用，并通过实验说明了如何做预测和推荐。因为该矩阵分解方法和后来的矩阵分解差异已经很大，所以不放入后面的矩阵分解篇幅中。 2.《Amazon.com Recommendations Item-to-Item Collaborative Filtering》亚马逊发表的基于物品的协同过滤在 User-based 方法中，随着用户数量的不断增多，在大数量级的用户范围内进行“最近邻搜索”会成为整个算法的瓶颈。Item-based 方法通过计算项之间的相似性来代替用户之间的相似性。对于项来讲，它们之间的相似性要稳定很多，因此可以离线完成工作量最大的相似性计算步骤，从而大大降低了在线计算量，提高推荐效率。在 Item-based 方法中，要对 A 和 B 进行项相似性计算，通常分为两步：1）找出同时对 A 和 B 打过分的组合；2）对这些组合进行相似度计算，常用的算法包括：皮尔森相关系数、余弦相似性、调整余弦相似性和条件概率等。伪代码如下： 3.《Item-Based Collaborative Filtering Recommendation Algorithms》影响最广的，被引用的次数也最多的一篇推荐系统论文。文章很长，非常详细地探讨了基于Item-based 方法的协同过滤，作为开山之作，大体内容都是很基础的知识。文章把Item-based算法分为两步：（1）相似度计算，得到各item之间的相似度基于余弦（Cosine-based）的相似度计算基于关联（Correlation-based）的相似度计算调整的余弦（Adjusted Cosine）相似度计算（2）预测值计算，对用户未打分的物品进行预测加权求和。用户u已打分的物品的分数进行加权求和，权值为各个物品与物品i的相似度，然后对所有物品相似度的和求平均，计算得到用户u对物品i打分。回归。如果两个用户都喜欢一样的物品，因为打分习惯不同，他们的欧式距离可能比较远，但他们应该有较高的相似度。在通过用线性回归的方式重新估算一个新的R(u,N)。文章很经典，没有太难理解的部分，可以看别人的笔记：https://blog.csdn.net/huagong_adu/article/details/7362908 矩阵分解 1.《Matrix Factorization Techniques for Recommender Systems》矩阵分解，推荐系统领域里非常经典、频繁被引用的论文。这个论文是推荐系统领域第一篇比较正式、全面介绍融合了机器学习技术的矩阵分解算法（区别于传统的SVD矩阵分解）。矩阵分解是构建隐语义模型的主要方法，即通过把整理、提取好的“用户—物品”评分矩阵进行分解，来得到一个用户隐向量矩阵和一个物品隐向量矩阵。在得到用户隐向量和物品隐向量（如都是2维向量）之后，我们可以将每个用户、物品对应的二维隐向量看作是一个坐标，将其画在坐标轴上。虽然我们得到的是不可解释的隐向量，但是可以为其赋予一定的意义来帮助我们理解这个分解结果。比如我们把用户、物品的2维的隐向量赋予严肃文学（Serious）vs.消遣文学（Escapist）、针对男性（Geared towards males）vs.针对女性（Geared towards females），那么可以形成论文中那样的可视化图片：这种矩阵分解方法区别于传统的SVD，这种方法不仅不需要进行缺失值填补，而且相比于线性代数里的奇异值分解，该方法从问题的描述上就是一个最优化问题。给出目标损失函数，然后优化它。所以已经和SVD没什么关系了。矩阵分解算法具有的融合多种信息的特点也让算法设计者可以从隐式反馈、社交网络、评论文本、时间因素等多方面来弥补显示反馈信息不足造成的缺陷，可以根据需要很容易的把公式进行改变。比如考虑到时间变化的用户、项目的偏差，可以对预测评分函数改写成： 2.《Feature-Based Matrix Factorization》从公式推导到优化方法，到参数更新策略讲得非常详细的一篇工程实践论文。非常好的一篇文章，把矩阵分解讲的特别详细，强烈推荐一看。提出了基于特征的矩阵分解模型。其实这个模型并不是一个新的大的改变，只不过是对于已有的很多矩阵分解的变体进行了一个统一的形式定义。该文章把矩阵分解分为了用户特征、物品特征、全局特征，对这三个特征都有相应的系数矩阵。这个模型很容易地可以加上Pairwise方法，时间系数，邻域信息，层次信息等。本文也给出了优化矩阵分解模型选用的方法，参数更新公式，计算加速的方法等非常详细的说明。总体的框架如下图。这个矩阵分解的速度可以很快，有点类似FM，不过比FM多了全局偏置。值得一看，一定会对矩阵分解有更深的认识。这个文章是偏向于工程实践的，所以循序渐进地引出来每个式子。和普通的论文的佶屈聱牙相比，绝对能看懂。唯一可惜的是没有看到公开的代码，如果发现了再补到这里。 3.《Probabilistic Matrix Factorization》PMF是对于基本的FunkSVD的概率解释版本，殊途同归本文要提出一个解决非常系数和不平衡的数据集的模型，解决了很多在NetFlix数据集上运用矩阵分解失败的两个原因： 1.没法适用于大规模数据集 2.对于冷门的用户很难做推荐它假设评分矩阵中的元素Rij是由用户潜在偏好向量Ui和物品潜在属性向量Vj的内积决定的，并且服从以下的正态分布：同时，假设用户偏好向量与物品偏好向量服从于均值为0以下的正态分布：对正太分布取log，之后会发现后面的正则化项和超参与数据集分布有关，是不变的。所以可以得到了要优化的目标方程：所以，绕了一圈之后会发现，如果假如评分、用户、物品的向量是正太分布的话，那么就能通过数学方法推导出和SVD基本一致的目标方程，所以标题才直接取名概率矩阵分解机。这个思路很清奇，文章的后面又基于这个基本的目标方程进行了两种改进。 4.《Regression-based Latent Factor Models》基于回归的隐因子模型这个论文其实就是对《Probabilistic Matrix Factorization》进行了改进。本文也是基于高斯先验，但是把正太分布的均值从0-均值改成了基于特征的回归方法来计算，使得模型假设更有说服力。优点是三个： 1.一个模型同时解决了冷热启动问题； 2.减少了使用共现物品或用户的相关性； 3.给预测提供了附加信息，提高了准确度。 5.《Collaborative Filtering with Temporal Dynamics》加入了时间变量的协同过滤这个论文的想法是显然易见的：用户给物品的打分是随着时间变化而变化的。因此，该文在以前模型的基础上加入了时间因素。文中对两种推荐方法：基于邻域的模型、隐因子模型都做了相应的改进。主要的公式是：实际应用的模型是基于SVD++改进的。本文基于这样的思想：用户和物品的偏置都会随着时间变化，用户的隐因子也会改变，但是物品的隐因子认为是不变的。另外在思考这个问题的时候也要考虑到把时间分箱时要兼顾到粗细粒度，本文还综合考虑了用户喜好随着时间的渐变和突变。因为这个文章比较全面系统，我觉得可以多看几遍。 6.《Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model》近邻方法+因子分解这个文章自称是第一篇把近邻方法和因子分解方法融合到一起的论文。难点其实在于把近邻方法转换为因子分解方法相似的通过迭代更新参数进行求解的方式，而传统的近邻方法是基于原始数据集统计求解的、不需要迭代。文章对最近邻模型只做出了多个改进：模型参数通过训练得到，加入了隐式数据，用户偏置项使用学习得到，对邻域个数进行了归一化。对因子分解方法主要采用了SVD++方法。最后的融合模型如下图，使用梯度下降更新参数。这个模型相当于三层模型的累加：基准模型+因子分解模型+最近邻模型。这篇解读相当不错：https://blog.csdn.net/fangqingan_java/article/details/50762296 7.《Leveraging Long and Short-term Information in Content-aware Movie Recommendation》几个模型的融合这个文章简直好大全。MF，LSTM，CNN，GAN全都用上了。本质是学习得到用户和电影的隐层向量表示。学习的方式是最小化能观测到的电影评分预测值和真实评分值的方根误差。即MF的公式是：另外，矩阵分解不能学到关于时间变化的用户口味的变化，所以本文用到了LSTM。文章整体的架构如下。因子分解机 1.《Factorization Machines》大名鼎鼎的FM FM模型是一个可以用于大规模稀疏数据场景下的因式分解模型，这个模型的求解是线性时间复杂度的，他可以使用原始数据直接求解而不需要像SVM一样依赖支持向量。另外FM是个通用的模型，可以在任何实数数据上使用，可以做分类和回归甚至能做排序等任务。 FM的思想是在线性回归的基础上，增加了两个特征的线性组合，求解线性组合的方式是使用了矩阵分解的方式。因为如果数据本身就很稀疏，于是两个变量的共现数据极少，但是矩阵分解使得不同的特征对不再是完全独立的，而它们的关联性可以用隐式因子表示，这将使得有更多的数据可以用于模型参数的学习。目标函数如下：上面的二次项矩阵可以通过数学进行优化，使得时间复杂度降为O(kN)。 2.《Field-aware Factorization Machines for CTR Prediction》大名鼎鼎的FFM FFM是对FM的改进，添加了Field的概念，也就是说每个特征归于哪一类。假设Field有f个。那么每个特征都要有f个隐向量。当两个特征做交叉的时候，使用每个特征与另外一个Field对应的向量求点积。这样的话，就能保证相同Field对同一个特征的作用是相同的，而不同Field的特征对同一个特征的作用是不同的。另外，FFM不能向FM那样使用数学优化了，所以时间复杂度是O(kN^2). 3.《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》FM的深度学习版本这个模型基于wide & deep做了改进，首先模型包括FM和DNN部分，是个并联结构，FM和DNN共享相同的输入（embedding）。每个Field独立地embedding到相同的维度，大大减少了网络参数。Field到embedding层的映射向量恰好是FM层学习到的向量。 deep FM的优点： 1）不需要任何预训练 2）学习到了低维和高维特征交叉 3）一个特征embedding的共享策略来避免特征工程基于内容的推荐《Content-Based Recommendation Systems》基于内容做推荐的综述文献。这个文章是篇综述，没有很深的理论。文章分析了数据分为了结构化的数据和非结构化的数据，然后介绍了常见的机器学习算法，如决策树，线性模型，kNN方法，朴素贝叶斯等等方法。很适合作为推荐系统及其相关机器学习方法的入门教材。基于DNN的推荐《Deep Neural Networks for YouTube Recommendations》谷歌神作，字字珠玑 Youtube推荐系统的比较老的解决方案，使用候选集生成网络和排序网络两部分。特征是用户embedding和视频embedding，加入了视频的曝光时间等特征作为训练。本来听起来是简单的解决方案，其实里面把推荐系统工程化的问题都一一介绍了，让我们更清楚地知道，线下模型训练的过程和线上服务过程分别怎么做的，多分类问题怎么加速等。值得仔细思考里面的每一步做法的用意。推荐系统架构：候选集生成网络：王喆对这篇文章进行了更详细的解读，并探讨了工程化的问题：https://zhuanlan.zhihu.com/p/52169807 基于标签的推荐《Tag-Aware Recommender Systems: A State-of-the-art Survey》综述。原本以为基于标签的推荐很简单，其实我错了，这个综述我就没看太懂。不过基于标签的推荐在实践里还是挺重要的，比如用户给主播打的标签可以用作推荐。文章指出标签的作用： 1.反映用户的喜好 2.表达了物品的语义信息，来帮助评估潜在的用户质量 3.标签之间的重复出现的情况表现了用户的社区和物品的聚类情况。因此，标签可以帮助解决冷启动问题。 1.基于网络的模型 2.基于张量的模型 3.基于主题的模型（LDA）基于自编码器《AutoRec: Autoencoders Meet Collaborative Filtering》《Training Deep AutoEncoders for Collaborative Filtering》NVIDIA的文章，偏向于工程实现《Deep Collaborative Autoencoder for Recommender Systems:A Unified Framework for Explicit and Implicit Feedback》《Collaborative Denoising Auto-Encoders for Top-N Recommender Systems》对推荐系统的归纳很好，公式很详细。这几篇文章的思想基本一样，本质都是协同过滤。优化的目标在自编码器的基础上稍作修改，优化目标里只去优化有观测值的数据。 Item2Vec 《Item2Vec: Neural Item Embedding for Collaborative Filtering》微软的开创性的论文，提出了Item2Vec，使用的是负采样的skip-gram 《Item2Vec-based Approach to a Recommender System》给出了开源实现，使用的是负采样的skip-gram 《From Word Embeddings to Item Recommendation》使用的社交网站历史check-in地点数据预测下次check-in的地点，分别用了skip-gram和CBOW 固定窗口的skip-gram的目标是最大化每个词预测上下文的总概率：使用shuffle操作来让context包含每个句子中所有其他元素，这样就可以使用定长的窗口了。上下文感知模型《A Context-Aware User-Item Representation Learning for Item Recommendation》这个文章提出，以前的模型学到的用户和物品的隐层向量都是一个静态的，没有考虑到用户对物品的偏好。本文提出了上下文感知模型，使用用户的评论和物品总评论，通过用户-物品对进行CNN训练，加入了注意力层，摘要层，学习到的是用户和物品的联合表达。更倾向于自然语言处理的论文，和传统的推荐模型差距比较大。基于视觉的推荐 1.《Telepath: Understanding Users from a Human Vision Perspective in Large-Scale Recommender System》京东最近公开的推荐系统，通过研究商品的封面对人的影响进行推荐这个文章参考大脑结构，我们把这个排序引擎分为三个组件：一个是视觉感知模块（Vision Extraction），它模拟人脑的视神经系统，提取商品的关键视觉信号并产生激活；另一个是兴趣理解模块（Interest Understanding），它模拟大脑皮层，根据视觉感知模块的激活神经元来理解用户的潜意识（决定用户的潜在兴趣）和表意识（决定用户的当前兴趣）；此外，排序引擎还需要一个打分模块（Scoring），它模拟决策系统，计算商品和用户兴趣（包括潜在兴趣和当前兴趣）的匹配程度。兴趣理解模块收集到用户浏览序列的激活信号后，分别通过DNN和RNN，生成两路向量。RNN常用于序列分析，我们用来模拟用户的直接兴趣，DNN一般用以计算更广泛的关系，用来模拟用户的间接兴趣。最终，直接兴趣向量和间接兴趣向量和候选商品激活拼接在一起，送往打分模块。打分模块是个普通的DNN网络，我们用打分模块来拟合用户的点击/购买等行为。最终这些行为的影响通过loss回馈到整个Telepath模型中。在图右侧，还引入了类似Wide & Deep网络的结构，以增强整个模型的表达能力。 2.《Visually Explainable Recommendation》可视化地可解释推荐模型这个文章放在基于视觉的推荐的原因是，比较新奇的地方在于提取了商品封面的特征，并融合到了推荐和推荐解释之中。本文的基础模型使用商品的封面通过预训练好的VGG网络转化为图像向量。对特征进行加权求和之后的结果与商品的向量merge，再与用户的向量内积求总的向量结果，把该结果进行和用户是否购买的真实数据求交叉熵，优化该Loss.文章指出该模型最后训练的结果可以用推荐，也可以用注意力权重来做推荐解释。本文还提出了进一步的模型Re-VECF。该模型使用商品的用户评论结合图像、用户和商品作单词预测训练GRU。加入用户评论的好处是可以提高推荐的表现、文本评论可能隐含着用户对商品封面重要的偏好。该模型能更好的做出推荐结果和推荐解释。基于RNN的推荐《Session-based Recommendations with Recurrent Neural Networks》 2016年的文章，GRU4Rec，使用每个会话中用户的行为记录进行训练。《Recurrent Neural Networks with Top-k Gains for Session-based Recommendations》2018年的新文章，对上文进行了优化；原理相同的。基于RNN的推荐也是源于一个朴素的假设：对于用户的行为序列，相邻的元素有着相近的含义。这种假设适合基于会话的推荐系统，如一次电子商务的会话，视频的浏览记录等。相对于电影推荐，基于会话的推荐系统跟看中短期内用户的行为。论文想法在于把一个 session 点击一系列 item 的行为看做一个序列，用来训练一个 RNN 模型。在预测阶段，把 session 已知的点击序列作为输入，用 softmax 预测该session下一个最有可能点击的item。这个文章里用的是GRU，目标是优化pair-wise rank loss。有一个不错的论文解读文章：http://www.cnblogs.com/daniel-D/p/5602254.html 基于图的推荐《Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time》社交网站的图推荐，2017年本文介绍了 Pinterest 的 Pixie 系统，主要针对他们开发的随机游走和剪枝算法，此外系统本身基于 Stanford Network Analysis Platform 实现。基于树的推荐《Learning Tree-based Deep Model for Recommender Systems》淘宝的推荐系统，2018年最新发布基于树的推荐是一种比较新奇的一种推荐算法，其设计的目的主要是解决淘宝的巨大的数据问题，给出了一种能线上服务的实时推荐系统的模型。此外，本文证明了此模型在MovieLens-20M和淘宝自己的用户数据上的准确、召回、新奇性都比传统方法好。采用的数据是隐式反馈，本模型提供几百个候选集，然后实时预测系统会进行排序策略。树的作用不仅仅是作为索引使用，更重要的是把海量的数据进行了层次化组织。训练过程是如果用户对某个物品感兴趣，那么最大化从该物品节点到根节点的每个节点的联合概率。该路径上的每个节点都和用户有相关性，树的结构从底向上表现出了用户物品的相似性和依赖性。如下图所示，左侧的三层全连接学习到用户的向量表示，右侧的树结构学到了节点的表示，最后通过二分类来训练出用户是否对该节点感兴趣。训练的损失函数是最小化一个用户对每个采样了的节点的交叉熵。（树结构类似于Hierarchical softmax，也同样使用了负采样等。）公司的推荐系统的发展历程《Related Pins at Pinterest: The Evolution of a Real-World Recommender System》Pinterest的推荐系统发展历程这个推荐系统主要用到的是随机游走的图算法，Pin2Vec，Learning to Rank等方法。只介绍了思想，没有公式和算法。可以直接看解读：http://blog.csdn.net/smartcat2010/article/details/75194918 2013年的时候，推荐系统主要基于Pin-Board的关联图，两个Pin的相关性与他们在同一个Board中出现的概率成正比。在有了最基本的推荐系统后，对Related Pin的排序进行了初步的手调，手调信号包括但不局限于相同Board中出现的概率，两个Pin之间的主题相似度，描述相似度，以及click over expected clicks得分。渐渐地，发现单一的推荐算法很难满足产品想要优化的不同目标，所以引入了针对不同产品需求生成的候选集(Local Cands)，将排序分为两部分，机器粗排和手调。最后，引入了更多的候选集，并且提高了排序部分的性能，用机器学习实现了实时的个性化推荐排序。数据集《Indian Regional Movie Dataset for Recommender Systems》提供了印度本土的电影观看数据集参考资料『我爱机器学习』FM、FFM与DeepFM Factorization Machines 学习笔记转载自https://github.com/fuxuemingzhu/Summary-of-Recommender-System-Papers

前往

页

前一页 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 后一页

理工酷

首页

圈子

资源下载

毕业设计 · 圈子

计算机毕业设计·圈子首发

[Java、Python 课程设计]基于人脸识别的员工考勤系统

计算机毕业设计·圈子首发

【毕业设计】基于监督学习的web入侵检测系统

土木毕业设计·圈子首发

BIM建筑模型图

计算机毕业设计·圈子首发

【毕业设计】基于深度学习的甲状腺超声图像良恶性诊断算法研究

土木毕业设计·圈子首发

酒店社区建筑模型图

计算机毕业设计·圈子首发

【毕业设计】基于Docker的分布式应用控制系统

计算机毕业设计·圈子首发

【毕业设计】在iOS上使用OpenCV实现图片中的文字框选

计算机毕业设计·圈子首发

基于协同过滤的推荐系统算法研究

计算机毕业设计·圈子首发

【毕业设计】面向高考招生咨询的问答系统设计与实现

计算机毕业设计·圈子首发

【毕业设计】基于Android的人脸门禁系统

计算机毕业设计·圈子首发

【毕业设计】基于SpringBoot及thymeleaf搭建的疫情信息管理系统

计算机毕业设计·圈子首发

推荐系统论文归类总结

理工酷

首页

圈子

资源下载

站外资源

问答

网址导航

毕业设计 · 圈子

计算机毕业设计·圈子 首发

[Java、Python 课程设计]基于人脸识别的员工考勤系统

计算机毕业设计·圈子 首发

【毕业设计】基于监督学习的web入侵检测系统

土木毕业设计·圈子 首发

BIM建筑模型图

计算机毕业设计·圈子 首发

【毕业设计】基于深度学习的甲状腺超声图像良恶性诊断算法研究

土木毕业设计·圈子 首发

酒店社区建筑模型图

计算机毕业设计·圈子 首发

【毕业设计】基于Docker的分布式应用控制系统

计算机毕业设计·圈子 首发

【毕业设计】在iOS上使用OpenCV实现图片中的文字框选

计算机毕业设计·圈子 首发

基于协同过滤的推荐系统算法研究

计算机毕业设计·圈子 首发

【毕业设计】面向高考招生咨询的问答系统设计与实现

计算机毕业设计·圈子 首发

【毕业设计】基于Android的人脸门禁系统

计算机毕业设计·圈子 首发

【毕业设计】基于SpringBoot及thymeleaf搭建的疫情信息管理系统

计算机毕业设计·圈子 首发

推荐系统论文归类总结

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

土木毕业设计·圈子首发

计算机毕业设计·圈子首发

土木毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发

计算机毕业设计·圈子首发