0 有用
10 下载

【Demo】基于深度学习的中文语音识别系统ASRT

文件列表(压缩包大小 6.50M)

免费

概述

ASRT:一个基于深度学习的中文语音识别系统

Introduction 简介


本项目使用Keras、TensorFlow基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现。

Model 模型


Speech Model 语音模型

CNN + LSTM/GRU + CTC

其中,输入的音频的最大时间长度为16秒,输出为对应的汉语拼音序列

  • 关于下载已经训练好的模型的问题

可以在Github本仓库下releases里面的查看发布的各个版本软件的压缩包里获得包含已经训练好模型参数的完整源程序。

发布的成品软件可以在此下载:ASRT下载页面

Language Model 语言模型

基于概率图的最大熵隐马尔可夫模型

输入为汉语拼音序列,输出为对应的汉字文本

About Accuracy 关于准确率


当前,最好的模型在测试集上基本能达到80%的汉语拼音正确率

不过由于目前国际和国内的部分团队能做到98%,所以正确率仍有待于进一步提高

Python Import


Python的依赖库

  • python_speech_features
  • TensorFlow (1.13+)
  • Keras (2.3+)
  • Numpy
  • wave
  • matplotlib
  • math
  • Scipy
  • h5py
  • http
  • urllib

程序运行依赖环境详细说明

Data Sets 数据集


几个最新免费开源的中文语音数据集

特别鸣谢!感谢前辈们的公开语音数据集 如果提供的数据集链接无法打开和下载,请点击该链接 OpenSLR

License 开源许可协议

GPL v3.0 © nl8590687 作者:AI柠檬

来源https://github.com/nl8590687/ASRT_SpeechRecognition

理工酷提示:

如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈

评论(0)

0/250