基于Level Set方法的西夏字轮廓提取

柳长青

PDF(552 KB)
PDF(552 KB)
中文信息学报 ›› 2009, Vol. 23 ›› Issue (4) : 71-77.
综述

基于Level Set方法的西夏字轮廓提取

  • 柳长青
作者信息 +

Contour Extraction of Xixia Characters Based on Level Set

  • LIU Changqing
Author information +
History +

摘要

随着国内外对西夏研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献进行数字化、文本化则有着极其重要的意义。首先利用平滑和细化算法对西夏影印文献进行了预处理,然后利用Level set方法对影印文献中的西夏字进行了轮廓提取。Level Set演化函数在空间方向上采用了四阶紧致差分逼近式离散,计算过程中加入了窄带算法及全局优化方法。实验表明,算法在不增加计算时间的基础上可以得到较精确的西夏字轮廓。

Abstract

Recently, researches on Xixia characters develop so much and a large number of Xixia documents have been published with their original forms at home and abroad. How to carry out the fast digitalization of those documents is of great importance. Based on the level set technique, we first process those documents by the smooth algorithm, and then the contours of Xixia characters are extracted by Level set. Level Set evolutionary function is descritized by the fourth-order symmetrical compact finite different scheme in spatial direction. Narrow-band algorithm and global optimization methods are adopted in computation. The experiment proves to be effective and can be applied to extracting relatively accurate contours of Xixia characters.
Key words artificial intelligence; pattern recognition; Xixia characters information processing; level set method; Xixia characters; contour extraction; compact difference

关键词

人工智能 / 模式识别 / 西夏文信息处理 / Level Set方法 / 西夏字 / 轮廓提取 / 紧致差分

Key words

artificial intelligence / pattern recognition / Xixia characters information processing / level set method / Xixia characters / contour extraction / compact difference

引用本文

导出引用
柳长青. 基于Level Set方法的西夏字轮廓提取. 中文信息学报. 2009, 23(4): 71-77
LIU Changqing. Contour Extraction of Xixia Characters Based on Level Set. Journal of Chinese Information Processing. 2009, 23(4): 71-77

参考文献

[1] 李宇明.搭建中华字符集大平台[J].中文信息学报, 2003, 17(2):1-6.
[2] 史金波,可恰诺夫.俄藏黑水城文献[M].上海:上海古籍文献出版社, 1997.
[3] 史金波,陈育宁.中国藏西夏文献[M].甘肃:敦煌文艺出版社, 2005.
[4] 刘耀,段慧明,王惠临,等.中医药古文献语料库设计与开发研究[J].中文信息学报, 2008, 22(4):24-30.
[5] 王静帆,邬晓钧,夏云庆,等.中文信息检索系统的模糊匹配算法研究和实现[J].中文信息学报,2007,21 (6):59-64.
[6] 包和平,王学艳.国外对中国少数民族文献的收藏与研究概述[J].情报杂志, 2002, (6):72-76.
[7] 西部时报.国际敦煌项目(IDP)[J/OL].http://www.westtimes.com/news/2005_5/200552015533251665.shtml,2005_05_20/2008_2_20.
[8] 马希荣, 柳长青. 夏汉字处理及电子字典[M/CD]. 北京:清华大学出版社, 1999.
[9] 柳长青.变长记录词库结构在“夏汉电子字典”中的应用[J].固原师专学报, 2001, 22(6):29-32.
[10] 柳长青, 马希荣. 西夏字与汉字共存方案的实现[J].宁夏大学学报(自然科学版), 2001, 22 (1):45-47.
[11] 景永时, 贾常业.基于方正典码之上的西夏文录入系统使用手册[M]. 香港:香港社会科学出版社, 2005.
[12] 马希荣,王行愚.西夏文特征提取的研究[J].计算机工程与应用,2002,13(4):38-41.
[13] Paragios N, Deriche R. Geodesic active contours and level sets for the detection and tracking of moving objects [J]. IEEE Transactions on Image Processing, 2000, 22(3):266-280.
[14] 蔡力, 周军, 封建湖,等. 基于变分等值线方法的图像分割技术[J].计算数学, 2006, 28(1):43-52.
[15] 刘儒勋,王志峰.数值模拟方法和运动界面追踪[M].安徽:中国科学技术大学出版社,2001.61-78.
[16] 黄福珍,苏剑波.基于Level Set方法的人脸轮廓提取与跟踪[J].计算机学报,2003,26(4):491-496.
[17] Chan T F, Vese L A. Active contours without edges[J].IEEE Transactions on Image Processing, 2001, 10(2):266-277.
[18] 李俊,杨新,施鹏飞. 基于Mumford-Shah模型的快速水平集图像分割方法[J].计算机学报, 2002, 25(11): 1175-1183.
[19] 傅德薰,马延文.计算流体力学[M].北京:高等教育出版社,2002.87-90.
[20] 蒋欣.水平集方法及其在图像分割上的应用[J].上海生物医学工程,2004, 25(3):29-32.
[21] 李培峰,朱巧明,钱培德. 一个基于ISO/IEC10646的汉字输入模型[J].中文信息学报,2006, 20 (5):91-96.
[22] 江荻, 严海林, 孙伯君,等. 《元朝秘史》电子文本检索系统的研制[J].中文信息学报, 2006, 20 (3):36-42.

基金

国家自然科学基金资助项目(60803104,06AMZ001);宁夏自然科学基金资助项目(NZ0836);宁夏高等学校科研资助项目(2007年);宁夏大学科学研究基金资助项目(ZR0628)
PDF(552 KB)

829

Accesses

0

Citation

Detail

段落导航
相关文章

/