语音识别性别数据集
文件列表(压缩包大小 405.43K)
免费
概述
创建该数据库以根据语音和语音的声学特性将语音识别为男性还是女性。该数据集包括从男性和女性说话者那里收集的3168个录制的语音样本。
使用seewave和tuneR软件包在R中通过声学分析对语音样本进行预处理,分析的频率范围为0hz-280hz(人声范围)。
数据集 测量每个语音的以下声学属性,并将其包含在CSV中:
meanfreq:平均频率(以kHz为单位) sd:频率标准偏差 中位数:中位数频率(以kHz为单位) Q25:第一个分位数(以kHz为单位) Q75:第三分位数(以kHz为单位) IQR:分位数范围(以kHz为单位) 偏斜:偏斜(请参阅特殊说明中的注释) kurt:峰度(请参阅规范说明中的注释) sp.ent:频谱熵 sfm:光谱平坦度 模式:模式频率 质心:频率质心(请参阅specprop) peakf:峰值频率(具有最高能量的频率) meanfun:跨声信号测得的基频平均值 minfun:跨声学信号测得的最小基频 maxfun:跨声学信号测得的最大基频 meandom:整个声信号测得的主频的平均值 mindom:整个声信号测得的主频的最小值 maxdom:整个声信号测得的主频最大值 dfrange:跨声信号测得的主频范围 modindx:调制指数。计算为相邻基频测量之间的累计绝对差除以频率范围 标签:男性或女性
准确性 基线(总是预测男性) 50%/ 50%
逻辑回归 97%/ 98%
CART 96%/ 97%
随机森林 100%/ 98%
支持向量机 100%/ 99%
XGBoost 100%/ 99%
如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈
评论(0)