HKUST Mandarin Telephone Speech, Part 1数据集介绍，官网编号LDC2005S15-迪斯科星球

HKUST Mandarin Telephone Speech, Part 1（LDC2005S15）是由香港科技大学（HKUST）在 DARPA EARS 框架下构建的大规模普通话电话会话语音数据集，核心为约 149 小时训练与开发集语音数据，适配语音识别、说话人识别等研究场景，其配套文本转录数据对应 LDC2005T32。以下从核心信息、数据采集、标注与特性、应用与获取等方面展开介绍：

一、核心基础信息

属性	详情
数据集名称	HKUST Mandarin Telephone Speech, Part 1
LDC 编号	LDC2005S15
开发机构	香港科技大学（HKUST）
发布时间	2005 年
数据规模	约 149 小时普通话电话会话语音，含 873 个训练集通话、24 个开发集通话
配套数据	转录文本数据对应 LDC2005T32（HKUST Mandarin Telephone Transcript Data, Part 1）
来源背景	2004 年 HKUST 受 DARPA EARS 项目委托采集 200 小时普通话电话会话语音，首批 50 小时用于 RT - 04 NIST 评估，本数据集包含剩余 150 小时中的训练与开发集

企业官网建设流程全解析

一、核心基础信息

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

一、核心基础信息

热门文章

文章分类

标签云

相关文章

如何通过GEO算法与智能体交互优化提升全行业智能体独立站的转化ROI？

SAP PS模块深度实操：手把手带你玩转IDES，搞定WBS、网络、成本与结算全流程

繁花漫画app v2.5 最新版（包含漫画·小说·影视）

需要专业的网站建设服务？