【Demo】基于Pytorch的中文语义相似度匹配模型 - 资源下载

1 有用

4 下载

【Demo】基于Pytorch的中文语义相似度匹配模型

文件列表（压缩包大小 126.26K)

免费

概述

基于Pytorch的中文语义相似度匹配模型

运行环境：

python3.7 pytorch1.2 transformers2.5.1

数据集：

采用LCQMC数据（将一个句对进行分类，判断两个句子的语义是否相同（二分类任务）），因数据存在侵权嫌疑，故不提供下载，需要者可向官方提出数据申请http://icrc.hitsz.edu.cn/info/1037/1146.htm ，并将数据解压到data文件夹即可。

模型评测指标为：ACC，AUC以及预测总共耗时。

Embeding：

本项目输入都统一采用分字策略，故通过维基百科中文语料，训练了字向量作为Embeding嵌入。训练语料、向量模型以及词表，可通过百度网盘下载。链接：https://pan.baidu.com/s/1qByw67GdFSj0Vt03GSF0qg 提取码：s830

模型文件：

本项目训练的模型文件（不一定最优，可通过超参继续调优），也可通过网盘下载。链接：https://pan.baidu.com/s/1qByw67GdFSj0Vt03GSF0qg 提取码：s830

测试集结果对比：

部分模型，借鉴了 https://github.com/alibaba-edu/simple-effective-text-matching-pytorch https://github.com/pengshuang/Text-Similarity 等项目。

来源https://github.com/zhaogaofeng611/TextMatch

理工酷提示：

如果遇到文件不能下载或其他产品问题，请添加管理员微信：ligongku001，并备注：产品反馈

0/250

免费登录即可免费下载

·圈子

位酷友已加入

阿托

积分 • 17099

圈子：计算机

标签：

计算机机器学习人工智能

文件编号：1066

上传时间：2021-02-25

文件大小：126.26K

加入组织

微信扫码，每周推送最新资料

理工酷

首页

圈子

资源下载

运行环境：

数据集：

Embeding：

模型文件：

测试集结果对比：

推荐资源

推荐问题

加入组织

理工酷

首页

圈子

资源下载

站外资源

问答

网址导航

运行环境：

数据集：

Embeding：

模型文件：

测试集结果对比：

推荐资源

推荐问题

加入组织