%0 Journal Article %A 郑亚斌 %A 刘知远 %A 孙茂松 %T 中文歌词的统计特征及其检索应用 %D 2007 %R %J 中文信息学报 %P 61-67 %V 21 %N 5 %X 我们在歌词上做了一些传统的自然语言处理相关的实验。歌词是歌曲语义上的重要表达,因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实验表明,其分布基本符合齐夫定律。利用向量空间模型的表示,我们可以找到比较相似的歌词集合。另外,我们探讨了如何利用歌词中的时间标注信息进行进一步的分析: 例如发现歌曲中重复片段,节奏划分,检索等。初步的实验表明,我们的方法具有一定的效果。 %U http://jcip.cipsc.org.cn/CN/abstract/article_788.shtml