基于语谱图的江西境内赣方言自动分区研究

颜为之,王明文,徐凡,但扬杰,罗健

PDF(7855 KB)
PDF(7855 KB)
中文信息学报 ›› 2021, Vol. 35 ›› Issue (4) : 1-7,15.
语言分析与计算

基于语谱图的江西境内赣方言自动分区研究

  • 颜为之,王明文,徐凡,但扬杰,罗健
作者信息 +

Automatic Partition of Gan Dialect in Jiangxi Province Based on Spectrogram

  • YAN Weizhi, WANG Mingwen, XU Fan, DAN Yangjie, LUO Jian
Author information +
History +

摘要

汉语方言分区研究是语言学的重要组成部分。鉴于传统基于词汇和语法的人工方言分区方法具有一定的主观性,该文研究了如何有效利用语音本身特征进行方言的自动分区。论文首先构建了江西省11个省辖市、91个下辖县级行政区的时长约1 500分钟的1 223条语音语料库,然后在传统的MFCC语音特征提取基础上,提出了基于CNN的自编码降维语谱图的深度学习特征提取模型,对降维后的语音特征分别采用k均值算法聚类、高斯混合聚类和层次聚类对方言自动分区。实验结果表明,新型语谱图特征的聚类性能度量内部指标DBI指数以及DI指数显著优于传统MFCC特征,维度为16时语谱图和MFCC下的拼接特征聚类效果与传统人工方言分区较为接近。

Abstract

Chinese dialect partition is a vital issue in linguistics. In contrast to the traditional manual dialect partition according to the vocabulary and the grammar, this paper studies how to effectively use the features of speech itself to automatically partition the dialect. This paper first constructs 1,223 speech corpora of 1,500 minutes from the 11 municipalities and 91 county-level administrative regions in Jiangxi Province. Then a deep learning feature extraction model based on CNN self-encoding dimension reduction spectrogram has been put forward. The k-means clustering, Gaussian mixture clustering and hierarchical clustering are examined, respectively. The results revealed that, according to the cluster performance metrics DBI and DI index, the proposed language spectrogram features significantly outperform traditional MFCC features. Under the 16-dimension, the clustering effect of the concatenation of the spectrogram feature and the MFCC feature is found to be close to that of the traditional artificial dialect partition.

关键词

语谱图 / 聚类 / 赣方言 / 方言分区

Key words

spectrogram / clustering / Gan dialect / dialect partition

引用本文

导出引用
颜为之,王明文,徐凡,但扬杰,罗健. 基于语谱图的江西境内赣方言自动分区研究. 中文信息学报. 2021, 35(4): 1-7,15
YAN Weizhi, WANG Mingwen, XU Fan, DAN Yangjie, LUO Jian. Automatic Partition of Gan Dialect in Jiangxi Province Based on Spectrogram. Journal of Chinese Information Processing. 2021, 35(4): 1-7,15

参考文献

[1] 李国强, 傅伯言. 赣文化通志[M].南昌:江西教育出版社,2004.
[2] 王临惠. 汉语方言分区的语音标准刍议[J]. 南开语言学刊,2005(01): 18-22, 226.
[3] 刘镇发.百年来汉语方言分区平议[J].学术研究,2004(04):125-130.
[4] 李小凡. 汉语方言分区方法再认识[J]. 方言, 2005(04):356-363.
[5] 侯兴泉. 汉语方言区片划分语音标准的层级和主次[J]. 暨南学报(哲学社会科学版),2013, 35(09): 147-154, 164.
[6] 李蓝. 方言分区的历史与方法平议[J]. 语言战略研究, 2018, 3(02):38-49.
[7] 颜森. 江西方言的分区(稿)[J]. 方言, 1986(01):19-38.
[8] 李如龙.客赣方言调查报告[M].厦门:厦门大学出版社, 1992.
[9] 刘纶鑫. 客赣方言比较研究[M].北京: 中国社会科学出版社,1999.
[10] 孙宜志,陈昌仪,徐阳春.江西境内赣方言区述评及再分区[J]. 南昌大学学报(人文社会科学版), 2001(02): 110-117.
[11] 谢留文.赣语的分区(稿)[J]. 方言,2006(03): 264-271.
[12] 陆致极.汉语方言间亲疏关系的计量描写[J]. 中国社会科学,1987(01):155-166.
[13] 郑锦全.汉语方言沟通度的计算[J].中国语文, 1994(01): 35-43.
[14] 沈榕秋.谈汉语方言的定量研究[J].语文研究, 1994(02) :45-52.
[15] 陈海伦. 论方言相关度、相似度、沟通度指标问题[J]. 中国语文, 1996(05): 361-368.
[16] 陈海伦.方言间韵母系统相似度测度研究[J].中国语文, 2000(02):139-145, 190.
[17] 陈鹏飞.计量方法在汉语方言关系研究中的运用[J]. 天津师范大学学报(社会科学版), 2006(02): 66-69, 80.
[18] 项梦冰.从语言特征分布图到方言分区图——以沂南方言为例[J]. 现代语言学, 2018, 6(1): 61-76.
[19] 王荣波,贾桂云. 类聚分析在方言分区上的应用——以江淮官话洪巢片为例[J]. 国际汉语学报, 2017, 08(01): 47-56.
[20] 鲁晓倩. 基于VP树和GMM的说话人识别研究[D]. 合肥:中国科学技术大学硕士学位论文, 2014.
[21] Skowronski M D, Harris J G. Increased MFCC filter bandwidth for noise-robust phoneme recognition[C]//Proceedings of IEEE International Conference on Acoustics. IEEE, 2002.
[22] 胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用, 2012, 32(09): 2542-2544.
[23] 潘凌云, 孙达传, 吴美朝. 语音识别中基于语谱图的语音音素分割方法[J]. 杭州大学学报(自然科学版),1995(01): 42-46.
[24] Badshah A M, Ahmad J, Rahim N, et al. Speech emotion recognition from spectrograms with deep convolutional neural Network[C]//Proceedings of the International Conference on Platform Technology & Service. 2017.
[25] 马义德, 袁敏, 齐春亮,等. 基于PCNN的语谱图特征提取在说话人识别中的应用[J]. 计算机工程与应用, 2005(20): 81-84.
[26] 中国社会科学院语言研究所. 863语音识别语音语料库 RASC863—四大方言普通话语音库[A].中国中文信息学会,2003:4.
[27] 殷志刚.语音语料库的建设和作用[N].中国社会科学院院报,2007-7-23(03).
[28] 陈小莹,陈晨,华侃,等. 语音语料库的设计研究[J]. 科技信息, 2008(36): 5-6.
[29] 杨鸿武,梁青青,郭威彤,等.一个面向言语工程的兰州方言语料库[J].西北师范大学学报(自然科学版), 2009, 45(06): 54-59.
[30] 邹法欣.语音语料库的设计与实现[D].桂林: 广西师范大学硕士学位论文, 2012.
[31] 高原,顾明亮,孙平,等.多用途汉语方言语音数据库的设计[J]. 计算机工程与应用, 2012, 48(05):118-120.
[32] 陈昌仪. 赣方言概要[M]. 南昌:江西教育出版社,1991.
[33] Fan Xu, Jian Luo, Mingwen Wang, et al. Speech-driven end-to-end language discrimination towards Chinese dialects[J]. ACM Transactions on Asian and Low-Resource Language Information Processing, 2020, 19(5): 1-24.
[34] Fan Xu, Mingwen Wang, Maoxi Li. Building parallel monolingual Gan Chinese dialects corpus[C]//Proceedings of the 11th Conference of the Language Resources and Evaluation Conference (LREC), 2018: 244-249.

基金

国家自然科学基金(61876072,61772246);江西省社科规划项目(18YY04);江西省自然科学基金(20192ACBL21030)
PDF(7855 KB)

1468

Accesses

0

Citation

Detail

段落导航
相关文章

/