语言超人之梦.ppt

上传人:sccc 文档编号:5671867 上传时间:2023-08-08 格式:PPT 页数:52 大小:120.04KB
返回 下载 相关 举报
语言超人之梦.ppt_第1页
第1页 / 共52页
语言超人之梦.ppt_第2页
第2页 / 共52页
语言超人之梦.ppt_第3页
第3页 / 共52页
语言超人之梦.ppt_第4页
第4页 / 共52页
语言超人之梦.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《语言超人之梦.ppt》由会员分享,可在线阅读,更多相关《语言超人之梦.ppt(52页珍藏版)》请在三一办公上搜索。

1、语言超人之梦,黄曾阳(中科院声学所 HNC实验室)2006年8月23日,目录,1 网络世界需要语言超人2从语言超人反思图灵检验3语言超人基因之梦4 一个语言超人基因的介绍5一个句群的考察6一丝曙光的体验,1 网络世界需要语言超人,后工业时代正在出现与传统世界并存的 另一种世界,那就是网络世界。这已经是一个活生生的存在,是人类社会前所未有的一个特殊存在。这个特殊存在会引发新的哲学课题么?会。但问题究竟是什么 还没有凝聚出来。,网络世界与传统世界的比较,传统世界 网络世界 亚当和夏娃出生接近“万岁”尚未出生政治、经济、文化的分野十分清晰 一片模糊导演与演员有明确分工 没有这种分工有序 无序后工业时

2、代 史前时代(政治舞台的导演是政治家和军事家,经济舞台的导演是企业家,文化舞台的导演主要是哲学家),网络世界怎样才能从无序状态进入有序状态 即脱离史前时代呢?,关键在网络人的诞生。这里的网络人不是指当前意义下的网民,而是指那些能够理解自然语言、只在网上生存、无肉体而能思维的网络人。网络人的诞生将彻底改变网络世界的面貌,使网络世界脱离“史前”时代。没有网络人的诞生,网络世界就不可能脱离“史前”时代,脱离“史前”时代的网络世界才会大放异彩,使传统世界发生无愧于后工业时代的巨大变化,如同工业时代之如农业时代。,网络人的基本特征,记忆力超人“一目千行,过目不忘”(张松和黄蓉的妈妈算什么?)故名之语言超

3、人,中国人的智力描述,记忆力“一目十行,过目不忘”敏捷力“七步成诗”、“眉头一蹙,计上心来”领悟力“举一反三”、“明察秋毫”、“愤启悱发”,判断力“神机妙算”“料事如神”“锦囊妙计”行动力“势如破竹”、“以柔克刚”、“四两拨千斤”(想象力、创造力),中国人对五力表现情有独钟,章太炎先生曾依据“五力”标准而评定其门生中的五王 天王 黄侃(季刚)(1886-1935)东王 汪东(旭初)(1890-1963)西王 朱希祖(逖先)(1879-1944)南王 钱玄同(翼王)(1887-1939)北王 吴承士(检斋)(1884-1939),网络人的记忆力确实可畏,其敏捷力也许可惊,但其领悟力、判断力、行动

4、力、想象力、创造力肯定可控因此不必担心:这种“一目千行,过目不忘”语言超人会起来造反。,在西方 确实有人担心网络世界的这种潜在性灾难,万一这些网络人偷食了那伊甸园里善恶树上的果子怎么办呢?那网络世界岂不是要重演圣经里的灾难故事了么?因此 他们试图抵制甚至扼杀网络亚当和夏娃的诞生。担心者们既不了解智能科学和技术的本性,也不了解 即使真的出现了网络人,届时向网络社会注入文明基因并不难办到。因此 担心者的担心是多余的,我们可以放心地去从事语言超人的探索。,2从语言超人反思图灵检验,计算机的原创者原创过人工智能的伟大构思,提出过人工智能的智能标准,那就是著名的图灵检验。图灵检验:检验者向一间黑屋子的两

5、个对象 分别以书面语方式进行盘问,检验者知道 其中一个对象不是人而是机器人,检验目的在于确定谁是谁。如果检验者在经过充分盘问后仍不能确定谁是谁,则该机器人就是具有人工智能的机器人。,图灵先生是伟大的天才,但图灵检验的设计却过于天才了!表面上 问题出在图灵先生对盘问内容的限定不当。(该限定的重点放在掩饰人的弱点,而不考虑掩饰机器人的弱点,这实际上就是对机器人提出了过高的智能要求。)实质上 问题出在图灵先生对人工智能的科学探索方向还来不及深思熟虑,就英年早逝(1912-1954)了。,但是 图灵先生的崇拜者实在是太多了,自然语言理解的探索就存在着图灵检验的鲜明烙印,著名的CYC计划就是明证。自然语

6、言理解的悲观论实质上大都采用了图灵检验标准,尽管某些悲观论者或许不知道图灵其人。,智能是概念空间的全方位表现,上一讲里谈到概念空间的五大坂块,图灵检验基本上是对五大坂块综合智能的全面模拟,这肯定不是本世纪的课题,更遑论上个世纪了。,但是 这并不是说 我们应该抛弃图灵检验,相反 应该深入领会图灵检验的启示意义。黑屋子和两个盘问对象只是形式,重要的是盘问本身。盘问是一门学问,这才是图灵检验的本质。也许只有现代心理学家做到了对图灵检验的心领神会和科学运用,而计算机学界、特别计算语言学界反而忽视了。你去盘问“太平洋和青蛙谁大”有什么意义?去盘问“咬死了猎人的狗”是什么歧义结构又有多少意义?,盘问的第一

7、号学问是 盘问使用的语言单位,第二号是 盘问使用的文本形式,第三号是 盘问的内容。什么语言单位是合适的、科学的盘问单位?字或词语?短语或小句?句子或段落?篇章?什么语言文本是合适的、科学的盘问文本?童话和诗歌?红楼梦或三国演义?鲁迅的杂文或朱自清的散文?什么内容是盘问的“大场”与“急所”(将简称“大急”)?,盘问的合适语言单位是句群,盘问的合适语言文本是媒体信息,盘问内容的“大急”是领域、情景和背景。为什么?,因为:,第一 句群与语境单元对应(明晰性)。第二 媒体信息是最广大受众能够理解的信息(可行性),(其信息表述方式已经考虑了受众的理解力,消解了需要专家知识才能理解的专业表达方式,比较适合

8、语言超人的知识状态。)第三 语境单元存在世界知识的先验知识框架(科学性),这一知识框架可以事先存入语言超人之脑。第四 经过语境单元萃取以后 语境单元框架里已经填入了领域、情景和背景的具体知识。(可操作性)第五 理解力的集中体现(“大急”性),一个具体句群里面包含的领域、情景和背景知识经常是不完备的,但语境单元框架可以给出这种不完备性的提示,对这一提示的运用能力是语言超人理解力的根本标志,这一提示运用力可以量化么?语言超人可以通过盘问过程进行学习而得到提高么?这一点 这关键性的一点 这需要中华文明的特殊智慧才能看明白的一点(冯友兰先生的观点)已经出现了曙光么?,3语言超人的基因之梦,语言超人必须

9、看作是一种特殊的生命形态,生命需要基因。语境单元就是语言超人的基因。语境单元萃取SGU就是培育这个基因。语言超人之梦的征程要从语言超人的基因之梦起步。,我们都十分熟悉生命的多样性,没有生命的多样性就没有生命,生命的多样性来源于基因的多样性,语言超人当然也具有基因多样性。这里说的语言超人基因当然只涉及理解基因,而且是指理解基因的团块,也可称语言超人的胚胎,简称语言超人基因。那么 语言超人基因的“多”对应着语境概念树的226么?不是!因为 语境单元不是对应于概念树,而是对应于语境概念树的延伸概念,每一个这样的延伸概念就对应着语言超人的一个基因。,研究语境概念树的延伸概念就是研究语言超人的基因,这确

10、实是一个探索之梦!我们已经确定地知道语言超人基因的数量必然小于226*i+226*i*j+226*i*j*k个这个数字与动物或人类基因数字十分巧合,这是否具有什么哲学意义?我不知道 但请记住10,848=226*4*4*3这个数字。,4一个语言超人基因的介绍,这个基因的名字叫做民务a123e2m3她属于领域概念树“政治治理与管理a12”里的一个三级延伸概念。她的领域句类代码是ReT01Y802*322J=Re+T0A+T01Y802+T0C+Y802B1(她就是语言超人的一个基因,语义块里的符号(要素)大体对应于DNA),民务,4-1 民务符号a123e2m3所蕴涵的世界知识4-2 民务领域句

11、类代码所蕴涵的世界知识4-3 民务的概念关联性表示式4-4 民务符号的“坐标”,4-1 民务符号a123e2m3所蕴涵的世界知识,a 专业活动(第二类劳动)a1 政治活动 a12 国家的治理与管理(治国)a123 治国面临的基本关系 a123e2m 治国中的官民关系 a123e2m3 民务,国家的治理与管理a12简称治国。农业时代出现过“政治就是夺取和巩固政权”的政治公式。现代政治公式是“政治主要是国家的治理与管理”,因为 a12体现政治活动a1的作用效应侧面,政权活动a11只是a1的过程转移侧面。政治活动中心应为a12而不是a11。,其对应的概念关联式如下:a11:=(1,2)ga1(政权活

12、动对应于政治活动过程转移侧面)a12:=(0,3)ga1(治国对应于政治活动的作用效应侧面)a12:=j72e51ga1(治国是政治活动的主体),4-2 民务领域句类代码蕴涵的世界知识,SCD=Re+T0A+T01Y802+T0C+Y802B1民方T0A(例如登记者)向官方Y802B1(例如登记受理者)办理T01Y802(例如登记)一件需要得到官方认同的活动T0C(例如登记内容)这一活动必须有所参照Re,两个对象 官与民 官是老大Y802B1、民是老二T0A(蕴涵在符号a123e2m里)一项内容 老二是该内容的直接参与者,老大并不直 接参与,但老二必须将该内容T0C通知老大(蕴涵在符号T0C和

13、T01Y802*322J里)句式 汉语句式(格式代码)必须采用规范格式,而不能采用基本格式。(铁律),4-3 民务的概念关联性表示式,a123e2m3:=(jruj719),l0144e61,4012e21)(民务具有不对称性,主宰者是官方)a123e2m3=a12im(民务与治国基本方式的推动与抑制强交式关联),4-4 民务符号的“坐标”,治国a12的概念延伸结构表示式a12:(t=a,3,7,k=3;9t=a,ae2m,3(e2m,eam,n),7(m,e2m),1e2m,2*t=a,3k=4;3e2m(e1n,3),3e21i,3ea1d01,3ea2c01,3ne2n,347,713,

14、727,1e2me2n;3ne2n3)a12t 治国的基本课题a123 治国面临的基本关系a12i 治国基本方式a12k 治国谋略,a12t=a 治国的两项基本课题a129 国家治理 a129t=a 国家治理的两项永恒课题 a1299 开拓性治理 a129a 整顿性治理a12a 国家管理 a12ae2m 国家管理的两个基本侧面 a12ae21 横向管理 a12ae22 纵向管理,a123 治国面临的基本关系a123:(e2m,eam,n;)a123e2m 官民关系a123eam 层级关系a123n 军政关系,a123e2m 官民关系 a123e2me1n 税 a123e2me1ni 税制 a1

15、23e2m3 民务 a123e21i 国家救助 a123e21e7n 民意回应 a123eam 层级关系 a123ea1d01 最高层级 a123ea2c01 最低层级,a123n 军政关系 a1234k=2 军政关系对立统一状态的时代性 a123ne2n 军政关系的积极与消极状态 a123n7 军政关系的特殊状态 a123n7k=x 特殊军政关系的基本类型 a123n71 绝对优势执政党与军队的关系,a12i 治国基本方式 a12i:(m,e2m)a12im 推动与抑制 a12ie2m 权力的集与分 a12im 推动与抑制 a12i1 奖励 a12i1i 授予 a12i2 惩罚 a12i23

16、 禁止 a12i0 规范 a12ie2m 集权与分权 a12ie2me4m 集权与分权的度,a12k 治国谋略a12k=3 治国谋略的三项特定内容a121 意识形态治理a122 政治应变a123 政治待遇,a121 意识形态治理 a121*t=a 理念宣传与舆论监督 a121*te2n 宣传与监督的多样性和单一性a122 政治应变 a122e2m 政治应变的对内和对外两侧面 a122*t=a 政治应变的两项特定内容 a122*9 情报活动(a122*9)反情报活动 a122*a 警卫活动,a123 政治待遇 a123k=x 政治待遇的基本类型 a1231 对特殊人物的政治待遇 a1232 对前

17、政权代表的政治待遇 a1233 对少数民族的政治待遇 a1234 对宗教力量的政治待遇 a1235 对特定社会力量的政治待遇,“民务”这个词语是本全书为延伸概念a123e2m3的表述而引入的,包括民政a123e213和民事a123e223两个概念。应该指出 民政与民事并不对称,官方具有对民方进行管理的权力,而民方不具有对官方进行管理的权力。官民关系的这一基本特征与制度无关,符号本身a123e2m3并未给出对这一不对称性的描述,而体现在下面的概念关联式里:,a123e213:=(a12a,l10,rc30ara123e223;l01,a119)(民政定义为政府对民间事务的管理)a123e2m3:

18、=(jruj719),l0144e61,4012e21)(民务具有不对称性,主宰者是官方)a123e2m3=a12im(民务与治国基本方式的奖励、惩罚与规范强交式关联)a123e2m3=a527(民务与法治的民众侧面强交式关联),5一个句群实例的考察,社会力量|设立|,-应当在科学技术行政部门|办理登记手续。具体办法|由国务院科学技术行政部门|规定。,|在奖励活动中|不得收取|任何费用。SG-C=!111T0aY8022*21J#T0C=XY10*22J+&%!112D01X4*22J+f44T19Ya0*21J&Cn#TA=,The establishment of society-orie

19、nted science and technology prizes by social non-governmental sectors|shall be through registration procedures|with administrative departments of science and technology.+&%The specific measures|are to be formulated|by the administrative department of science and technology of the State Council.+Non-

20、governmental sectors|establishing|society-oriented science and technology prizes|upon registration|shall not charge|any fees|in prizeing activities.SG-E=T0aY8022*21J+&%!027D01X4*22J+f44T19Yb0*21JCn#TA=!0pXY10*22JWy,汉语 英语!111T0aY8022*21J=!0#T0C=XY10*22J MLC+&%!112D01X4*22J=+&%!027D01X4*22J+f44T19Yb0*

21、21J&Cn=+f44T19Yb0*21JCn#TA=#TA=XY10*22Jwy,本句群的突出难点逗号之难(逗号多功能难点,10号难点)“在”字之难(主辅变换难点,9号难点)“奖”与“收取”的不相容之难(复杂省略难点,15号难点),本句群由5个语段构成,第一语段是小句么?社会力量|设立|,第二语段里的省略容易判定和恢复么?其中的“在科学技术行政部门”是辅块么?(-应当在科学技术行政部门|办理登记手续。)第三语段里的省略容易判定和恢复么?(具体办法|由国务院科学技术行政部门|规定。)第四语段是小句么?(,)第五语段里的省略容易判定和恢复么?(|在奖励活动中|不得收取|任何费用。),6 一丝曙光

22、的体验,1 第二语段的“科学技术行政部门”与“办理登记手续”同时出现,这足以引发民务语境单元的联想,基于该语境单元的先验知识官方还需要进一步确认,民方要找出“证据”。2 前者得到第三语段的“国务院科学技术行政部门”的进一步确认3 后者得到第一语段里的“社会力量”的印证。4 于是 语境单元得以认定。,SCD=Re+T0A+T01Y802+T0C+Y802B15 运用语境单元的先验知识语言超人可以认定 第一语段是对T0A和T0C的映射,第二语段里的“科学技术行政部门”是对Y802B1的映射,“办理登记手续”是对T01Y802的映射,第四和第五语段组合起来是对Re的映射。6 在上述认定的基础上,语言

23、超人有希望给出上面的HNC标注,这意味着句类分析的20项难点可以通过句群分析SGU得到比较彻底的解决。,SCD=Re+T0A+T01Y802+T0C+Y802B17 语言超人还可以认定 第一语段是著名的花园幽径句(属于HNC的原型句蜕),第二语段的不定特指“具体办法”是指T0C-T01Y802的“具体办法”,第二语段的“在科学技术行政部门”不是辅块,而是主块Y802B1。8 语言超人有希望懂得“向”是“在”的合适替代符号。(-应当在科学技术行政部门|办理登记手续。)9 语言超人还有希望懂得 第四和第五语段的英语翻译并不妥当,汉语的模糊表达方式是否优于英语非模糊表达方式?(未指定费用收取者,指定

24、Non-governmental sectors为收取者)10 上列5-9项应成为盘问的要点,并通过这种盘问方式创立一个适合于语言超人培育的图灵检验。,以上所说 是一丝曙光还是一段神话?如果你的神话感大于曙光感,那是我的表达失误,很对不起。但不论是哪种感觉 都是最美的存在,因为她们都属于探索之梦。让最美的存在永远与我们同在。谢谢!,附:句类分析的20项难点(上),01 特征语义块EK多句类代码的选定02 全局语句(简记为EgJ)与局部/蜕化语句(简称句蜕,简记为ElJ)的判定(多动词难点)03 含LS语句与复句的判定04 广义对象语义块多元逻辑组合的分析05 Ek/EK复合构成与分离的分析06 以指代和句间接应词语为代表的浅层隐知识揭示07 无EK语句的句类辨认08 广义对象语义块GBK分离现象的分析09 逗号功能的判定,附:句类分析的20项难点(下),10语义块主辅变换的分析11句类转换的分析12特殊块扩的辨认13复杂因果句的识别14体词多义的选定15 以复杂省略和想象描述为代表的深层隐知识揭示16 语句违例格式的判定(汉语多见,下同)17 动词体词化的识别18 动态组合词的识别与语义认定19 分词消歧20 伪词鉴伪(汉语特有),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号