Malto Speech and Transcripts数据集介绍,官网编号LDC2012S04

📅 发布时间:2026/7/5 1:00:27 👁️ 浏览次数:
Malto Speech and Transcripts数据集介绍,官网编号LDC2012S04
Malto Speech and TranscriptsLDC2012S04是 LDC 于 2012 年发布的印度东北部德拉威语Malto低资源口语语料库聚焦濒危 / 小众语言记录、方言变异与语音建模是研究 Malto 语言现状与语音特征的核心资源。一、基本信息项目 详情官方编号 LDC2012S04全称 Malto Speech and TranscriptsLDC发布方 Linguistic Data ConsortiumLDC发布时间 2012 年语言 Malto马尔托语德拉威语系LDC采集时间 2005–2009 年LDC总时长 约 8 小时LDC存储介质 1 张 DVD‑ROM官网 https://catalog.ldc.upenn.edu/LDC2012S04语言背景 印度东北部比哈尔、贾坎德邦、西孟加拉邦及孟加拉国的 Pahariyas 族群使用属濒危小众语言2001 年印度普查约 22.5 万使用者LDCNLP语料共享、LDC语料https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg