语音识别性别数据集 - 资源下载

1 有用

6 下载

语音识别性别数据集

文件列表（压缩包大小 405.43K)

免费

概述

创建该数据库以根据语音和语音的声学特性将语音识别为男性还是女性。该数据集包括从男性和女性说话者那里收集的3168个录制的语音样本。

使用seewave和tuneR软件包在R中通过声学分析对语音样本进行预处理，分析的频率范围为0hz-280hz（人声范围）。

数据集 测量每个语音的以下声学属性，并将其包含在CSV中：

meanfreq：平均频率（以kHz为单位） sd：频率标准偏差中位数：中位数频率（以kHz为单位） Q25：第一个分位数（以kHz为单位） Q75：第三分位数（以kHz为单位） IQR：分位数范围（以kHz为单位）偏斜：偏斜（请参阅特殊说明中的注释） kurt：峰度（请参阅规范说明中的注释） sp.ent：频谱熵 sfm：光谱平坦度模式：模式频率质心：频率质心（请参阅specprop） peakf：峰值频率（具有最高能量的频率） meanfun：跨声信号测得的基频平均值 minfun：跨声学信号测得的最小基频 maxfun：跨声学信号测得的最大基频 meandom：整个声信号测得的主频的平均值 mindom：整个声信号测得的主频的最小值 maxdom：整个声信号测得的主频最大值 dfrange：跨声信号测得的主频范围 modindx：调制指数。计算为相邻基频测量之间的累计绝对差除以频率范围标签：男性或女性

准确性 基线（总是预测男性） 50％/ 50％

逻辑回归 97％/ 98％

CART 96％/ 97％

随机森林 100％/ 98％

支持向量机 100％/ 99％

XGBoost 100％/ 99％