《智能词典毕业设计开题报告.doc》由会员分享,可在线阅读,更多相关《智能词典毕业设计开题报告.doc(6页珍藏版)》请在三一办公上搜索。
1、 毕业设计(论文)开题报告(全日制本科生)课题名称智能词典课题类别设计 论文 专业、班级 软件工程2006级4班学生 学号 20061610412指导教师 二九 年 十二月 一、 本课题设计(研究)的目的:在当今的翻译工作中,翻译人员往往根据自己的经验或者各自通过字典或上网搜索关键字等方式完成翻译工作,但这样做经常会由于不同翻译人员的翻译风格的不同,造成翻译内容的不一致,可能会出现同一关键字使用不同的翻译内容的现象,因而造成翻译进度的缓慢,翻译质量的下降等问题。因此,需要统一翻译风格和翻译内容的智能词典软件。本课题就是实现一个能够在局域网内使用的智能词典。在局域网内部架设词典服务器,服务器拥有
2、原始的关键字词典。客户端能够通过局域网连接服务器,并能实现查询、添加、删除、修改服务器上词典的功能。具体任务包括:1、开发服务器端程序,在服务器上建立词典数据库,并预留接口。2、开发客户端系统,通过TCP/IP实现与服务端的连接,实现在局域网内对词典进行查询、添加、删除、修改等操作。3、将系统嵌入网页文本抽取系统WEB-TIES。二、 设计(研究)现状和发展趋势:在国际交流和科研教育等领域,人们需要对异国语言文字进行翻译,过去这是语言大师施展才华的舞台。而现在,一方面互联网日益发展,网络信息激增,国际社会交流愈加频繁;另一方面硬件技术飞速发展、软件技术不断完善,因此机器翻译已成为克服交流时所产
3、生的语言障碍的重要手段之一,而智能词典正是机器翻译中十分重要的一种使用形式。机器翻译和智能词典的定义:计算机翻译通常叫机器翻译(machine translation),即全自动高质量机器翻译(fully automatic high quality machine translation),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译。智能词典,就是人们利用计算机上的智能词典软件,实现一种自然语言文本到另一种自然语言文本的翻译。而这种翻译方式主要是以单词为单位的,即只对单个的单词通过智能词典做出语意上的解释,而不对句子或文章做出逻辑上的
4、翻译。机器翻译的发展史告诉我们,伴随着信息技术的发展以及全球网络的一体化趋势,机器翻译技术也得以不断提高,翻译软件的辅助翻译作用愈发明显。而对于从事机器翻译研究的专家、学者或软件开发人员来说,机器翻译的发展过程,其实就是一步一步跨越机器翻译技术障碍的过程。作为不同语言之间的翻译交流,机器翻译既是一门科学,也是一门艺术。随着计算机应用技术的不断发展,为了解决计算机语言交流的复杂、繁琐、枯燥等问题,机器翻译的研究工作开始了新的里程。应该说,机器翻译经过几十年的发展,还是取得了很大的进展,特别是作为人们的辅助翻译工具,机器翻译已经得到大多数人的认可,近年来国内外翻译软件的蓬勃发展,就证明了这一点。目
5、前,国内的机器翻译软件就有很多种,根据这些软件的翻译特点,大致可以分为三大类:词典翻译类、汉化翻译类和专业翻译类。 而词典翻译类作为机器翻译中的一种重要类别,在经历了不断的发展后,呈现出以下几大特点:一、多向翻译多向翻译的实现,使得词典软件的应用范围不再局限于汉英词典的简单水平上,而成为每个电脑用户必备的真正意义上的词典。现在一些智能词典不仅实现了英英、英汉、汉英、汉汉四向翻译,还实现了许多不同语言之间的多项查询,这极大地方便了不同用户对于不同领域的需求。二、即时语音以往的智能词典软件大多数只提供单词查询、添加、删除等简单操作,后来随着技术的发展以及用户的需求,现在大多数智能词典都提供了单词的
6、发音,采用了比较成熟的语音技术(诸如TTS全程语音技术),在朗读整句或整篇文档时,可以自由调节语音、语速、频率、指定发音引擎,朗读效果得到大幅度提高,成为了练听力的好助手。 三、 设计(研究)的重点与难点,拟采用的途径(研究手段):本课题将在Windows平台下使用Visual C+ 6.0或 Visual studio2008进行开发,开发语言拟使用C和C+。具体要求为:将词典架设在服务器端,服务器拥有原始的关键字词典,客户端安装在每个翻译人员的个人终端,翻译人员可以通过客户端在局域网内访问服务端的词典进行翻译工作,管理员能够对登录服务器的翻译人员进行简单的管理,并能对服务器词典上的关键字进
7、行添加、删除和修改等操作。此外,本课题是基于网页文本抽取系统WEB-TIES开发,需要将词典功能嵌入抽取系统中。该课题还将尝试对文本的简单智能取词功能,单词的多项翻译功能以及简单的即时语音功能。本课题的研究重点为如下几个方面:1、开发服务器端程序,在服务器上建立词典数据库,并预留接口。2、开发客户端系统,通过TCP/IP实现与服务端的连接,实现在局域网内对词典进行查询、添加、删除、修改等操作。3、将系统嵌入网页文本抽取系统WEB-TIES。本课题的难点如下:1、 将系统嵌入网页文本抽取系统WEB-TIES。2、 维护服务器端的原始关键字词典,对原始关键字词典文本进行加密处理等操作。3、 实现对
8、文本的简单智能取词功能。4、 实现简单的即时语音功能。由于本课题需要掌握的知识点较多,需要具备扎实的C/C+编程基础,熟悉数据库基本操作,具备扎实的数据结构和算法基础,熟悉TCP/IP技术及其编程实现,具备VC和MFC的编程能力。以上虽列出了本课题涉及到的难点,然而在具体实现时本课题设计中的难点将分布在开发过程中的各个阶段。四、 设计(研究)进度计划:03月03日起到 06月10日止,共计14周。具体安排如下:1、开题阶段(搜集资料、方案确定)2月16日3月2日2、初期阶段(设计、实验、研究、初稿)3月3日5月25日3、修改定稿阶段5月25日6月1日4、答辩及成绩评定6月4日6月9日五、 参考
9、文献:1 王敬普,林亚平,周顺先.基于包装器模型的文本信息抽取.计算机应用,2006(3).2 樊玉俊,胡熠,陆汝占.基于机器可读词典的词汇知识抽取.计算机应用与软件.2008,25(06):8-10.3 Freitag and McCallum. Information Extraction with HMM Structures Learned by Stochastic Optimization, In: Proc of the Seventeenth National Conference on Artificial Intelligence and Twelfth Conferenc
10、e on Innovative Applications of Artificial Intelligence. 2000,584-589.4 刘华.网页信息抽取及建库系统C#实现.2006,32(16):49-51.5 Microsoft.NET Remoting 权威指南.机械工业出版社.2003年5月.6 用TCP/IP进行网际互连.电子工业出版社.2008年10月.7 计算机网络自顶向下方法与Internet特色.机械工业出版社.2007年7月.8 Data Abstraction and Problem Solving With C+ - Walls and Mirrors.清华大学出版社.2005年11月.9 深入浅出MFC 第2版.华中科技大学出版社.2008年11月.指 导 教 师 意 见签名: 月 日 教研室(学术小组)意见教研室主任(学术小组组长)(签章): 月 日院(系)意见院长(教学主任)(签章): 月 日