从零到一搞定WRF-Chem排放源:手把手教你配置namelist.input中的生物、人为与火灾排放
2026/6/6 5:52:12
Mandarin Affective Speech(LDC2007S09,又称 MASC)是 LDC 于 2007 年发布的普通话情感语音数据集,由浙江大学团队采集,含 40 名发音人、约 5.2 小时标注语音与文本,核心用于情感语音识别、韵律特征研究与说话人识别,填补了普通话情感口语标注语料的早期空白。以下从核心信息、采集处理、格式标注、应用价值等方面详细介绍:
| 项目 | 详情 |
|---|---|
| 发布机构 | 美国语言数据联盟(LDC) |
| 数据规模 | 40 名发音人(男女各 20),5100 个短语、20400 个语音片段、136 个段落,约 5.2 小时语音;对应完整转录与情感标注 |
| 情感类型 | 4 种核心情感(愤怒、高兴、悲伤、恐惧)+ 中性,每种情感含强弱 2 种强度梯度,覆盖基础情感表达场景 |
| 语料来源 | 2005 年 8-9 月采集,语句含 12 条语义中性句、2 条情感句(每类情感),覆盖不同句法类型,适配语言学与技术研究 |
| 发布时间 | 2007 年 8 月 13 日 |