从零到一搞定WRF-Chem排放源:手把手教你配置namelist.input中的生物、人为与火灾排放
2026/6/6 5:52:12
HKUST Mandarin Telephone Speech, Part 1(LDC2005S15)是由香港科技大学(HKUST)在 DARPA EARS 框架下构建的大规模普通话电话会话语音数据集,核心为约 149 小时训练与开发集语音数据,适配语音识别、说话人识别等研究场景,其配套文本转录数据对应 LDC2005T32。以下从核心信息、数据采集、标注与特性、应用与获取等方面展开介绍:
| 属性 | 详情 |
|---|---|
| 数据集名称 | HKUST Mandarin Telephone Speech, Part 1 |
| LDC 编号 | LDC2005S15 |
| 开发机构 | 香港科技大学(HKUST) |
| 发布时间 | 2005 年 |
| 数据规模 | 约 149 小时普通话电话会话语音,含 873 个训练集通话、24 个开发集通话 |
| 配套数据 | 转录文本数据对应 LDC2005T32(HKUST Mandarin Telephone Transcript Data, Part 1) |
| 来源背景 | 2004 年 HKUST 受 DARPA EARS 项目委托采集 200 小时普通话电话会话语音,首批 50 小时用于 RT - 04 NIST 评估,本数据集包含剩余 150 小时中的训练与开发集 |