计算机

计算机 · 圈子

8557 位酷友已加入

计算机圈子中包含常用的技术文档、源代码、模型、数据集、学习教程、技术报告等干货资料,加入圈子可以上传、下载资料,也可以使用提问来寻求资料或分享你认为有价值的站外链接~

关注推荐最新

热门标签

资源

【Demo】活体人脸识别

活体人脸识别 之前公司项目需要,研究了一下人脸识别和活体识别,并运用免费的讯飞人脸识别,在其基础上做了二次开发,添加了活体识别。项目需要就开发了张嘴和摇头两个活体动作的识别。 这里简单介绍一下当时的开发思路和一些个人拙见,欢迎大神指点。 首先说一下讯飞第三方的人脸识别的几个缺点:1.识别不稳定,各点坐标跳动偏差比较大,不容易捕捉;2.CPU使用率比较高,连续识别一会儿手机会明显发烫,手机配置低的,就会反应很慢,本人使用的iPhone 6s,配置还可以,还算比较流畅,但也会发烫。3.屏幕小的手机识别率相对会低一点,当然这也和手机的配置脱不了干系。 下面开始我们的活体识别开发之路: 确定位置 讯飞的人脸识别坐标跳动比较大,如果全屏识别发现很容易出现错误的识别,导致识别错误的被通过,所以为了降低这个可能性,特意加了脸部位置的限制,把识别位置和范围大大缩小,大大提高了识别精度和成功率。 原版的Demo里给出了人脸框的坐标,也显示出了人脸的框,代码如下: 在这段代码的启发下,我对此作了改装,把动态的人脸框,改成了静态的框,这个静态框,就是指示和限定人脸位置的框,根据屏幕大小画出的,代码如下: 这里的框是限定脸部位置的,所以脸部位置超出设置的范围的时候,就需要停止人脸识别,停止动作识别,并给出用户提示,提示用户调整位置,或者明确告诉用户,脸部距离屏幕太近了,或者太远了。判定脸部位置的代码如下: 这个方法基于Demo中第三方封装库中给的代理方法-(NSString*)praseDetect:(NSDictionary* )positionDic OrignImage:(IFlyFaceImage*)faceImg; 判断脸部并返回人脸的脸框的坐标,所以利用给的脸部框坐标做判断,超出设置的范围时停止识别。 其中,脸部框两边的坐标左边大于一定值且右边小于一定值的时候,判定为脸部位置“太远了”;同理,脸部框两边的坐标左边小于设定边框点且右边大于设定边框右边点的时候,判定为脸部位置“太近了”;如果位置正确,则脸部位置到达正确位置,这个时候显示脸部各点,并开始活体动作识别:张嘴和摇头。我这里先做张嘴,再做摇头。 张嘴识别 张嘴识别,这里的嘴部定点有五个:上、下、左、右、中。这里我取的是上下左右四个点,并判断上下点的距离变化和左右点的距离变化,一开始只判断了上下点距离变化超过设定值得时候就判断为张嘴,后来测试过程中,上下晃动屏幕,会判断失败,直接通过。所以为了解决这个bug,并判断更严谨,加上了左右点的判断,即上下点变化大于设定值并且左右点变化小于设定值的时候判定为张嘴动作识别通过。代码如下: 张嘴动作识别通过后,开始判断摇头动作。 摇头识别 摇头识别,这里的摇头动作相比于张嘴动作,摇头动作我没有限制位置,张嘴识别必须在设置的框内完成动作,摇头动作不需要,因为摇头动作幅度大,需要的位置大,如果再限定位置的话,识别要求比较高,不容易识别通过,用户体验差。 摇头识别的思路比较简单,没有做细致的计算分析,仅仅是判断了鼻尖的点的坐标改变大于设定值,即判定为摇头动作通过。代码如下: 其实这样判断摇头是有bug的,左右晃动手机超过一定的距离,也会判定摇头通过,当时时间紧张,没做过多处理,所以就暂时这样判定了。 其他细节 判断比较数据,我用了计数法,取得是不同时间点的帧图片上的点的位置并记录下来,然后和初始值做比较,所以如果判断不符合要求,需要清除数据,并重新开始记录并判定。 另外Demo里给出了两种记录动作的方式,一种是有声音的拍照,一种是无声音的截图,可以为人脸的对比做铺垫。 尾声 Demo的gitHub地址为:https://github.com/fuzheng0301/FaceRecognition ,讲解博客在:https://www.jianshu.com/p/1b7ae429f14c ,如果感觉还可以,感谢点击star,大家的支持是我不断努力源源不断的动力。 来源https://github.com/fuzheng0301/FaceRecognition

计算机

计算机·圈子   首发

阿托 更新了
资源

【Demo】Attention Gate网络(图像分类和分割)

Attention Gate网络(图像分类和分割) U-Net和VGG-16模型中使用Attention Gate的Pytorch实现。 该框架可用于医学图像分类和分割任务。 Attention Gate网络结构的示意图 附加Attention Gate的示意图 参考 1."Attention-Gated Networks for Improving Ultrasound Scan Plane Detection", MIDL'18, Amsterdam 会议论文 会议海报 2."Attention U-Net: Learning Where to Look for the Pancreas", MIDL'18, Amsterdam 会议论文 会议海报 安装 来源https://github.com/ozan-oktay/Attention-Gated-Networks

资源

新浪微博数据爬取+js前端可视化

微博数据可视化开发文档 开发 cnpm install npm start 功能模块 宏观维度 博主男女分布图 分析维度:全部博主的男女对比 分析方式:散点图 分析内容: 男女的占比; 男女的平均微博数对比; 男女的平均粉丝数对比 博主地理位置分布热力图 分析维度:全部博主地域分布 分析方式:地图 分析内容: 微博使用人数在全国的分布情况,普遍在东部颜色较深; 各省微博使用的人数 博主个人维度 粉丝数、关注数和微博数 分析维度:微博数、关注数、粉丝数 分析方式:雷达图 分析内容:比较 全部博主的平均数 与 特定博主的情况 朋友关系拓扑图 分析维度:好友圈、好友拓扑 分析方式:关系图 分析内容: 博主的直接、间接好友的朋友有哪些人 博主的好友中男女分布 微博数日历图 分析维度:微博打卡情况 分析方式:日历图 分析内容: 挖掘特定博主在一年内的微博发布情况 日历图单元格内的点越大,表示当天微博数量越多 点击后还能看到当天所有微博出现的高频、关键词 微博热度折线图 分析维度:微博热度趋势 分析方式:折线图 分析内容: 博主微博的点赞、评论、转发数量的变化趋势; 每条微博的内容 微博词云图 分析维度:微博常用词 分析方式:词云图 分析内容: 博主的常用词分布,大小表示频度 博主的关注领域 微博发布时间分布图 分析维度:微博发布时间 分析方式:饼图、散点图 分析内容: 博主在周几的发布频率 博主在几点的发布频率 博主在周几的几点发布频率 代码结构 前端代码结构 服务端代码结构 服务端API文档 获取博主列表 路由:GET /api/bloggers 请求参数: page:第几页 limit:每页几个 name:博主姓名模糊搜索 返回数据: 获取博主数量 路由:GET /api/bloggers/count 请求参数: name:博主姓名模糊搜索 返回数据: 获取单个博主基本信息 路由:GET /api/bloggers/:id 请求参数: id:博主id 返回数据: 获取博主朋友列表 路由:GET /api/bloggers/:id/friends 请求参数: id:博主id 返回数据: 获取博主微博列表 路由:GET /api/bloggers/:id/weiboContent 请求参数: id:博主id 返回数据: 获取平均粉丝数、关注数和微博数统计 路由:GET /api/statistic/average 返回数据: 获取性别分布统计 路由:GET /api/statistic/sex 返回数据: 获取地理分布统计 路由:GET /api/statistic/location 返回数据: 数据库说明 数据库采用MongoDB 数据库中各表的含义及结构 数据库中共有4个Collection:blogger_info、weibo_content、blogger_friend、user_id,以下进行详细说明 blogger_info 含义:存储博主的个人信息 字段说明 id:博主的微博ID name:微博昵称 sex:性别 birthplace:生源地 weibo_num:微博数 following:关注好友数 followers:粉丝数 blogger_friend 含义:存储博主的好友列表 字段说明 id:博主的微博ID friends:好友列表 id:好友的微博ID user_id 含义:存储全部博主的微博ID 字段说明 id:博主的微博ID 特殊说明:该collection是一边爬取博主的好友,一边存储其好友ID 如何恢复数据库 在命令行界面分别输入以下命令: weibo-mongodb-data 存储了数据库中所有collection的数据,数据库包含 10500 位微博用户的基本信息、好友信息、微博信息,大约600M 数据,需要的话,联系作者 liangjiakun@zju.edu.cn 数据爬取过程 爬取说明 博主的好友列表:即博主的关注列表 对于关注列表、粉丝列表,新浪微博最多只能查看最新关注的200个用户,跟爬虫技术无关 为了便于数据分析,在爬取过程中进行了如下剪枝(在config.py中可以自定义): 每位博主最多只爬取20位好友 每位博主最多只爬取1年以内的微博信息,同时限制不超过300条 好友列表中只有好友的id字段信息,如果需要获取好友的基本信息和微博信息等,可以用id到基本信息表和微博信息表中查找 转载自:https://github.com/JKLiang9714/weibo-data-visualization

计算机

计算机·圈子   首发

阿托 更新了
资源

【Demo】基于Python、Keras和CASIA-HWDB1.1实现卷积神经网络

CASIA-HWDB1.1-cnn 该存储库是包含深度学习库Keras和CASIA-HWDB1.1数据集的子集进行的实验。 此处提供的代码实现了卷积神经网络,其测试集准确性有时大于95%。 该网络配置是Zhang Yuhao在《 Deep Convolutional Network for Handwritten Chinese Character Recognition》中描述的配置的简化版本; 由于我们只想使用卷积网络和深度学习库,因此没有进行任何改进模型的尝试。 环境依赖 假设你已经安装了Keras及其后端,并对其进行了配置。 使用以下命令安装其他必需的依赖项: 该代码最后在Keras 2.1.5上进行了测试,使用TensorFlow 1.8.0作为后端,以及h5py 2.7.1,numpy 1.14.2,Pillow 5.1.0,scikit-image 0.14.0和scipy 1.0.0。 测试在单个GeForce GTX 970下运行。 用法 在发布的部分中,我们上传了CASIA-HWDB1.1数据集的(压缩)子集,经过训练的模型和一些分类,所有这些均按照以下步骤生成。 如果你使用我们的子集,请从步骤3开始。 0.从官方地址下载CASIA-HWDB1.1数据集(HWDB1.1trn_gnt.zip(1873 MB)和HWDB1.1tst_gnt.zip(471 MB))并将其解压缩(需要以ALZ格式解压缩档案): 1.将数据集转换为HDF5二进制数据格式: 2.从HDF5数据集中提取200个字符类别的子集: 3.在子集中训练网络: 4.(可选)生成一些分类的报告: 来源https://github.com/integeruser/CASIA-HWDB1.1-cnn

资源

交通标志的识别分类(基于GTSBR数据)

项目介绍 完成交通标志的识别分类(基于GTSBR数据),测试数据集上达到98.84%的准确率 检测部分的特征提取层包含YoloV2,yoloV2Tiny,yoloV3,MobileNet,SqueezeNet,ShuffleNet和由项目作者设计的结构:S-MobileNet 训练 : python main.py train 测试 : python main.py test 结果展示 权重模型参见:https://github.com/jacobssy/Traffic_Sign_detection/issues/4 转载自:https://github.com/jacobssy/Traffic_Sign_detection

计算机

计算机·圈子   首发

侧卫 更新了
资源

2020年中国专有云行业发展洞察-艾瑞咨询

内容 专有云是吸收公有云与私有云双重优势的最佳中间方案:专有云在稳定性、易用性、拓展性等方面具备公有云级别的成熟度,又兼顾了私有云的安全可控,能够更好地满足政企特定性能、应用及安全合规等诉求。 市场积极回应,专有云行业发展迅猛:得益于政策推动及自身需求的萌发,传统行业客户上云步伐不断加快,其对信息安全可控和企业业务稳定的要求不断催生对于专有云服务的需求。我国专有云市场于2019年接近100亿元规模,并以接近60%的年复合增长率持续扩张。 依然处于蓝海市场,但竞争日益激烈:随着公有云厂商陆续推出专有云部署模式或解决方案,国内专有云市场聚集了有雄厚资金实力的公有云厂商、传统IT厂商、系统集成商、电信运营商及垂直型厂商,市场竞争更加激烈。 多云融合、产业互联网、物联网将是行业下一阶段发展的关键词:专有云成为企业多云融合策略的一部分,赋能传统产业加速数字化转型,并将在物联网高速发展的加持下迎来新的增量空间。 目录 专有云行业概述 中国专有云市场发展现状 行业未来发展趋势 报告来源:艾瑞咨询 发布时间:2020

计算机

计算机·圈子   首发

侧卫 更新了
资源

2020年中国智能语音行业研究报告-艾瑞咨询

内容 人类对机器语音识别的探索始于20世纪50年代,迄今已逾70年。2016年,在深度神经网络的帮助下,机器语音识别准确率第一次达到人类水平,意味着智能语音技术落地期到来。不过人们面对“AI”时希望得到自然、类人的交互体验,这是一个宏伟的开放性课题,背后涉及的各学科技术仍有不足,还面临长期的求索方能突破。 消费级智能硬件是最早显示出市场潜力的赛道,市场各方都在瞄准消费级智能交互终端。而智能终端的背后还有广阔的生态,包括语音开放平台、语音操作系统、内容等等,近年行业正在经历从单一商业模式向多元化商业模式的变迁,技术输出的“厚度”增加,“边界”扩大,也带来了技术落地曲线的加速度增加。 智能语音企业级和公共级市场主要有平台化技术输出和解决方案两类商业模式,解决方案业务占比较高。与国外市场以医疗为重头有所差异,我国市场以智能客服、公检法及教育业务份额更高。智能语音为各行业解决了刚需性问题,将促进各行业业务效率的提升。 目前全国约有超过250家企业参与智能语音语义市场。互联网巨头、技术提供方、设备商和行业集成商应分别重视连续性投入支持问题、基础开发模块标准化程度提升与商务团队配置问题、设备后服务增长问题和软件研发能力建设问题,迎接人机交互升级带来的行业价值链扩张。 目录 智能语音相关技术概述 子研究(1/3)消费级市场 子研究(2/3)企业级与公共级市场 子研究(3/3)市场参与者 最后 报告来源:艾瑞 发布时间:2020年

计算机

计算机·圈子   首发

侧卫 更新了
资源

2020年中国AI基础数据服务行业研究报告-艾瑞咨询

内容 目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度。 对比中国与世界的发展情形来看,人工智能行业发展前景良好,而作为强关联性的AI基础数据服务行业受其发展红利的影响,未来市场仍有不小的上升空间。 2019年中国AI基础数据服务行业市场规模可达30.9亿元,预计2025年市场规模将突破100亿元,年化增长率为21.8%。 中小型数据供应商的整体体量仍然可观,但随着业务门槛提升、客户需求多样化,越来越多的“中小型数据供应商” 在苦恼生存问题,该群体在未来1-2年内将迎来一阵“倒闭潮”。 “品牌数据服务商” 在这1-2年内应该“居安思危”,注重品牌认可度塑造、提高规模化生产能力、大力发展如预标注、项目进度可视化等精细化运营方式、增加如语音合成(TTS)数据处理等差异化服务,最终追求的是单位价格的利润最大化。 目录 中国及全球人工智能发展概览 人工智能基础数据服务市场现状 人工智能基础数据服务行业壁垒 行业发展机遇与挑战 报告来源:艾瑞咨询 发布时间:2020

计算机

计算机·圈子   首发

阿托 发布了
资源

【项目】人脸编辑生成对抗网络

概述 使用深度神经网络编辑人脸图像。用户可以使用直观的输入(例如草图和着色)来编辑面部图像,网络SC-FEGAN可以从中生成高质量的合成图像。本项目使用了带有门控卷积层的SN-patchGAN鉴别器和类似Unet的生成器。 依赖的第三方库 tensorflow numpy Python3 PyQt5 opencv-python pyyaml 设置 首先,从Google驱动器下载模型。(https://drive.google.com/drive/folders/1VPsYuIK_DY3Gw07LEjUhg2LwbEDlFpq1) 运行这些命令以启动程序。 通过编辑demo.yaml文件选择要使用的GPU数量(不支持多GPU)。 如何使用 使用简单的GUI编辑人脸图像。网络仅填充图像的已擦除区域。 按钮说明 Open Image:打开要编辑的图像。 Mask:在左查看器的脸部所需区域上绘制遮罩。 Sketches:在左侧查看器上绘制所需的线。 Color:绘制彩色线条。如果您第一次单击此按钮,则必须从调色板中选择一种颜色。 Palette: 换颜色。选择颜色后,单击Color按钮以应用更改。 Save Img:保存结果。将其另存为“ name.jpg ”。 Arrange:安排编辑工作。 Undo:撤消以前的编辑工作。 Complete:生成图像并将其显示在正确的查看器上。 建议使用以下工作流程: 参照原始图像合理地画出草图。 在草图区域上绘制蒙版。 点击“安排”按钮。 在蒙面区域上绘制颜色。 点击“完成”。 示例结果 脸部编辑 编辑耳环 面部修复 面部修复(仅草图和颜色) 引用 转载自:https://github.com/run-youngjoo/SC-FEGAN

  • 1
  • 100
  • 101
  • 102
  • 168
前往