自然语言理解-语义知识的形式化表示.ppt

上传人:小飞机 文档编号:5309748 上传时间:2023-06-24 格式:PPT 页数:92 大小:335.50KB
返回 下载 相关 举报
自然语言理解-语义知识的形式化表示.ppt_第1页
第1页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第2页
第2页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第3页
第3页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第4页
第4页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《自然语言理解-语义知识的形式化表示.ppt》由会员分享,可在线阅读,更多相关《自然语言理解-语义知识的形式化表示.ppt(92页珍藏版)》请在三一办公上搜索。

1、语义知识的形式化表示,什么是意义?,关于意义的许多说法,指称论意念论行为论情境论实证论真值论用法论境况论,从计算机的角度看意义,计算机只能在符号世界里转圈圈;意义就是符号变换的游戏;纯粹从符号世界的角度看,“A的意义是B”意味着什么?所谓知道一个符号串的意义,包含两层意思:1 你可以把一个符号串A变换为符号串B;2 原则上,关于这个符号串A的变换游戏没有止尽;,意义:符号之间的变换关系,a.在一种语言内进行的符号变换“张三打了李四”“李四被张三打了”b.在不同语言之间进行的符号变换“张三用手打了李四”“Zhang San hit Li Si with his hand”c.在不同性质的符号系统

2、之间进行的符号变换“这是残疾人通道”,意义:符号之间无止尽的变换关系,“我买了辆车”意思1:我付钱从某处购买了一辆车意思2:我拥有了一辆车意思3:我可以使用这辆车意思4:我的钱都花完了,如何确定符号之间的变换关系,问题1:如何让计算机知道“A的意思是B”?问题2:如何让计算机把符号A变换为符号B?问题1 问题2,困难:形式与意义的非一一对应性,一个形式多个意义自然语言理解必须面对的问题一个意义多个形式“意义”怎么能论“个”呢?自然语言生成必须面对的问题把上述问题换种表述法:符号A对应着多个可能的变换结果B1,B2,B3,,在特定场合下,到底选哪一个?,一个形式多个意义(多义词),这个编辑很不错

3、他每年要编辑一百万字的书兼名、动两个词性的多义词这小伙子是干警察的好材料把这个小伙子的材料送人事部这是一种新型材料只有名词一个词性的多义情形这是我刚买的字典我刚查的字典,难道还有错虚词的多义情形,一个形式多个意义(多义词?多义句式?),许多读者给编辑部打来了电话X1+有+Y1:空间关系这本书有许多读者X2+有+Y2:领有关系编辑部有许多读者张老大有很多手下许多人给编辑部打来了电话读者1:0价*这本书有许多人读者2:1价编辑部有许多人手下:0/1价?张老大有很多人,一个形式多个意义(指代消解),张三i把他j出卖了张三i把他i,j的朋友出卖了老张i有个漂亮的女儿j,i,j 很骄傲老张i买了辆新车j

4、,j 很贵老张i中了头奖j,i 很高兴,一个形式多个意义(泛指与特指),人是会死的苏格拉底是人苏格拉底是会死的鲁迅的作品不可能在一天之内全部读完祝福是鲁迅的作品祝福不可能在一天之内全部读完,一个形式多个意义(量化词组),驴子句(donkey sentence)If John owns a donkey,he beats it.Every farmer who owns a donkey beats it.John owns a donkey.,一个形式多个意义(结构、关系),发现了敌人的哨兵牛奶饼干反对的是他他正在上课开刀的是张大夫在火车上写标语小明的信,一个形式多个意义(隐喻),董永这回算是

5、背上口大黒锅了这家伙真是个狐狸白天不懂夜的黒送温暖办教育董永终于抹平了七仙女心头的创伤教堂的钟又敲响了卧室的钟慢了整整一个小时,一个意义多个形式(同义词),不没(有)我不去西藏我没去西藏我不知道结果*我没知道结果*我不病我没病这锅肉还不烂这锅肉还没烂,一个意义多个形式(同义结构),A 马文才害死了梁山伯B1 梁山伯被马文才害死了B2 马文才把梁山伯害死了1)A B2*B1,又抢走了祝英台。2)*A*B2 B1 之后,一家人整日以泪洗面。,语义知识的性质和作用,语义知识跟句法知识的性质差别主要在于知识颗粒度的粗细不同语义知识就是细化了的句法知识;句法知识就是非常概括的语义知识;宏观而言,语义知识

6、跟句法知识的作用是相同的都是为了正确地进行符号串的变换操作,依赖语义知识进行结构分析,例1发现宝藏的人v+n1+的+n2例2知道敌军的意图v+n1+的+n2,依赖语义知识进行词义消歧,多义 词义项 释义 英语译词例1 想主意 想1 思索,思考 think例2 想女儿 想2想念,怀念 miss,依赖语义知识进行推理,例1 乡长买了一瓶茅台 乡长拥有了一瓶茅台例2 乡长给了村长一瓶茅台 村长得到了一瓶茅台 乡长失去了一瓶茅台例3 乡长正在打鼾 乡长正在睡觉例4 Every farmer who owns a donkey beats it.John is a farmer.Pandora is a

7、 donkey.Does John beat Pandora?-Yes.-I dont know,语义理解语义知识,理解符号串A的意思将A变换为符号串B对A进行句法结构分析在机器看来,只不过是在做符号串变换的操作对A进行词义排歧分析对A进行推理要进行上述符号变换操作,除了需要句法知识外,还需要语义知识,语义知识的类型及其形式化表示,关于词义聚类关系的知识(纵向)关于词义组合关系的知识(横向)属性名:属性值 型语义知识(静态)词典条件-动作 型语义知识(动态)规则句法知识与语义知识的一体化(同样的形式化表示),关于词义聚类关系的知识,同义(近义)关系反义关系同位关系上、下位关系,语义特征表示,语

8、义场描述,语义场是对语义特征的系统化表述顺序,循环,层级,语义场为结构化的语义特征值提供了描述手段一月,二月,十二月星期一,星期二,星期日钱,两,斤,公斤,吨学士,硕士,博士国,省,市,县,镇,乡,村,语义场描述,颜色语义场,XY 的意思是:如果一种语言包含Y,则一定也包含XBerlin,B.&Kay,P.1969,Basic Color Terms,Berkeley and Los Angeles:University of California Press.,亲属关系语义场,亲属词本质上表示的是人与人之间的关系;复杂的关系可以还原为基本的关系和属性;最基本的关系是:亲子关系(Parent)

9、、夫妻关系(Consort)、长幼关系(Order);最基本的属性是性别属性(Sex),值为男性(Male),女性(Female);任意一个亲属词都可以表达为参考人X的函数;e.g.亲属名关系表达式属性描述妻子C(X,Y)Sex(X)=M;Sex(Y)=F哥哥O(Y,X)&P(Z,X)&P(Z,Y)Sex(Y)=M,语义分类树,语义知识应用示例(一),1)判断句子是否合法句法分析例(1)手枪比步枪更难使用例(2)*手枪比武器更难使用2)细化组合模式(从词类到语义类)句法分析修理汽车的工人-v+n+的+n寻找烈士的遗物-v+n+的+n 修理汽车 的工人-v+交通工具+的+人寻找烈士的遗物-v+人

10、+的+具体物,语义类与语义特征,类与特征所描述的信息是等价的;有n个取二值的特征,就可以分出2n个类,反之亦然。“烈士”、“家属”烈士家属*家属烈士烈士语义类:人家属语义类:人,关系:Yes“关心烈士的家属”v+n+的+nv+人+的+人v+人+的+人关系:Yes从词类到语义类到语义特征,是不断对结构模式进行细化的一个过程,关于词义组合关系的知识,理想目标:描述任意词语之间的组配关系动词名词之间的组配关系论元个数配价数论元类型论旨角色对论旨角色的选择限制论旨角色与句法结构位置之间的对应关系广义配价模式,论元个数配价数,反映动词所能投射的基本句法结构的性质V 零元(价)动词_ V 一元(价)动词_

11、 V _ 二元(价)动词_ V _ _ 三元(价)动词X元(价)动词,X 价动词,_ 为(向,对)_ V董永总为别人着想大家向董永看齐董永对七仙女发火_ V VP那个犯人企图逃跑董永觉得不舒服_ V NP VP董永告诉七仙女晚上六点开会,论元类型论旨角色,反映动词所能结合的名词语义角色,汉语动词的论旨角色层级系统,论旨角色的定义,原型施事(proto-typical agent)典型性渐减的三个小类,论旨角色的定义,施事、感事、主事句法上的分布,施事的句法定义,1)作基础句的主语。例如“弟弟哭了”“小张吃了一碗汤面”;2)作“把”字句的主语。例如“哥哥把校长给得罪了”;3)作“被、由”等介词的

12、宾语。例如“后勤工作由老刘负责”;4)作“V一V、V了V”等重叠形式的主语。例如“你试(一)试”;5)作“不VP”和“没有VP”等否定形式的主语。例如:“小沈不去”;6)不在宾语位置上出现,除非句首是处所性成分。例如:“*笑了小明”;,选择限制(语义组配),如何描述选择限制,句法属性层次商量:当事:,复数:Yes,;争吵、对话、语义属性层次吃:施事:语义类:人|动物,受事:语义类:食物词例层次嗑:施事:语义类:人,受事:词语:*瓜子正面描述与反面描述变卖:施事:语义类:人|集体,受事:语义类:-人,论旨角色与句法结构的对应关系,动词各论旨角色可以出现的句法位置S3:A+用+I+_+P 例如:妈

13、妈用小刀切西瓜S4:I+A+_+P 例如:这把刀我切肉S5:Ma+A+_+P 例如:那些白菜我都包饺子了S6:A+用+Ma+_+R 例如:姐姐用细毛线织了一件上衣S7:A+把+Ma+_+R 例如:妈妈把板栗全包了粽子S8:A+_+I 例如:我切这把大刀S9:A+_+Ma 例如:我包韭菜馅儿,你包肉馅儿S10:A+_+M 例如:我包小包,你包大包A-施事;I-工具;P-受事;Ma-材料;M-方式;R-结果;,论旨角色与句法结构的对应关系(续),R1vp-vp np:$.内部结构=述宾,IF%vp.受事=%np TRUE,IF%vp.结果=%np TRUE,R2np-vp u np:,IF%vp.

14、内部结构=述宾 THEN%vp.施事=%np ENDIF,发现宝藏的人 发现宝藏 的人 知道敌军的意图知道敌军的意图 发现敌人的哨兵发现敌人的哨兵 发现敌人 的哨兵,广义配价模式,纵向拓展从词到短语在两个方向上对标准配价模式进行扩展横向拓展从“动名”关系拓展到“动形”关系,“形名”关系,“名名”关系,“副形”关系,,短语结构的组配性质,买买衣服买贵了这件衣服你买贵了*你买贵了这件衣服晾晾衣服晾阳台上晾干晾干衣服*晾干阳台上,“动形”语义组配描述,买便宜的布*买便宜染红,洗干净了洗胖了洗聪明了*洗僻静了*洗适宜了*洗远了?洗浓了动词形容词动词形容词名词,其他词类之间的组配约束,名名组配(n+n)

15、整体部分关系“没有盖儿的杯子”“没有杯子盖儿”集合成员关系“北大的学生”*“学生的北大”实体材料关系“塑料凉鞋”*“凉鞋塑料”个体亲属关系“老张的女儿”*“老张的”副词/形容词动词(短语)*正在知道*马上买贵了*认真地懂得了,格语法,Case GrammarCharles J.Fillmore,1966Towards a modern Theory of caseThe case for case 格辨Some Problems for Case Grammar,格的含义,传统语言学中的格是表层格词尾变化词干音变格语法中的格是“深层格”体词与谓词的及物性关系句法语义关系,例子,The door

16、 opened.The key opened the door.The boy opened the door.The door was opened by the boy.The boy opened the door with a key.The boy:施事格The door:客体格The key:工具格,格语法,基本规则词汇部分转换部分,基本规则,S-M+PP-V+C1+C2+CnC-K+NP,基本规则,S-M+P一个句子S可以改写成情态和命题两大部分情态部分包括否定、时、式、体、以及其他被理解为全局情态成分的状语命题牵涉到动词和名词短语、动词和内嵌小句之间的关系,基本规则,P-V+C

17、1+C2+Cn任何命题P都可改写成一个动词V和若干个格C。动词是广义上的动词,包括:动词、形容词、甚至包括名词、副词和连词,基本规则,C-K+NPK为格标,是各格范畴在底层结构中的标志。,格表,施事格Agentive工具格Instrumental承受格Dative使成格Factitive方位格Locative客体格Objective收益格Benefactive源点格Source终点格Goal伴随格Comitative,词汇部分,在词库中标明词汇的底层格的特征Street+LocativeIdea-Locative标出动词的框架特征Cry+Arun+ACry 和 run 可以带有一个表示施事的N

18、P区分必选格和可选格,转换部分,和转换语法类似移动删除插入复写,格语法与汉语,有局限性汉语不是动词中心流水句、无动局、连动、紧缩等结构,无法用一个动词统率一个句子的模式来描述。,义素分析法,丹麦语言学家叶姆斯列夫 L.Hjelmslev美国语言学家卡茨J.Katz和福多尔J.A.Fodor提出解释语义学,义素分析法,义素是意义的基本要素义素是词的理性意义的区别特征词的理性意义是一系列语义特征的总和,例1,男人:+人、+成年、+男性女人:+人、+成年、-男性男孩:+人、-成年、+男性女孩:+人、-成年、-男性,例2,陆军:军队在陆地作战f通常由组成步兵炮兵装甲兵工程兵各专业部队海军:军队在海上作

19、战f通常由组成水面舰艇潜艇海军航空兵海军陆战队各专业部队同一类型的义素写在同一花括弧f:适用范围“各”是一个标志,它表示被标志的义素可以分解为若干同类的义素。,义素分析法,了解词与词搭配是在语义上受到什么样的限制用于判断同义词、近义词之间的差别,蒙太古语法,Montague Grammar语义研究的形式化问题蒙太古认为自然语言研究必须是数学的一个分支组成部分句法翻译语义,MG理论模式,词库,有意义的词语,义类,内涵逻辑表达式,语义规则,特定模型中的外延或内涵所指,对应函数f,翻译规则,基本词语,语类,句法规则,树形图,MG句法部分,语类 categorye和t以及它们之间关系的一组集合e:表示

20、个体词语(individual expression)或实体词语(entity expression)不同于名词或者名词短语e.g.chair不属于e语类,只有具体的某把椅子的词语才属于e语类t:表示具有真值的语言单位,真值词语(truth value expression)或陈述语句(declarative sentence),语类,如果A和B位语类标记,则A/B、A/B均为语类标记所有语类都是从e和t中推出A/B表示一个可以与B语类词语结合而产生A语类标记的语类A/B和A/B表示属于不同句法范畴而具有相同语义范畴的语类,语类一览表,句法规则,句子依照费雷格原理,通过短语有小到大的结合而逐渐

21、产生短语之间的结合通过句法规则来实现典型的句法规则Sn如果PA,PB,那么 Fm(,)PC,且Fm(,)=,基本规则,S1对于任何A语类来说,BA(即A类基本词语)PA(即A类短语)S3如果PCN,Pt,那么F3,n(,)PCN,且F3,n(,)=s.t.,其中来自,并根据中第一个BCN的阳、阴、中性,用he、she、it或him、her、it来提换中的每一个hen或himn。S2如果PCN,那么F0(),F1(),F2()PT,且F0()=every,F1()=the,F2()=不是a 就是an,具体情况依中第一词和或搭配形式而定。,合取和析取规则,S11和S13处理有and或or连接的合取

22、或析取短语S11如果,Pt,那么F8(,),F9(,)Pt,且F8(,)=and,F9(,)=or,量化规则,S14至S16为量化规则S14 PT,PT,那么F10(,)PT,且:如果不是hek形式短语(即不是传统意义上的人称代词),那么F10(,)就等于将中第一个hen或himn用代替,其后出现的hen或himn则根据中第一个BCN或BT的性用he,she,it或him,her,it替换如果=hek,则F10(,)等于将中所有的hen或himn用hek或himk来替换,时态及记号规则,S17为时态及记号规则,MG翻译部分,MG为表示句法和语义的同态性,通常将句子翻译成内涵逻辑表达式每一条句法

23、规则都有相对应的一条翻译规则,MG翻译部分,表示的内涵,表示的外延Pa=P(a)叫做括号等式=谓词变项P表示个体集合的属性人名和代词在MG中的依法分别为:PP,PPhen,变换,变换指的是把主目代入含有算子指定的那个变项的表达式中,并消掉及变项。xx(a)=a,函数应用规则,S4至S10将A/B语类的短语与B语类的短语结合而产生A语类的短语S4如果Pt/IV,PIV,那么F4(,)Pt,且F4(,)=,其中是将中的第一个动词替换成第三人称单数形式的结果。,MG语义部分,MG内涵逻辑有句法和语义两部分组成句法部分主要确定内涵逻辑表达式义类问题语义部分主要有语义规则组成,这些规则根据模型来确定内涵

24、逻辑表达式中的所指问题。,MG内涵逻辑句法部分,内涵逻辑的句法主要确定内涵逻辑表达式的逻辑义类(logical type)问题基本义类有两个:e和te表示个体t表示真值义类和语类是不同的概念,义类的递归性的定义,t 是一个义类;e是一个义类;如果a和b是义类,那么是一个义类;如果a是义类,则是一个义类其中表示一个由a向b映射的函数,表示a的内涵。,义类与语类的对应关系,义类与语类一一对应,有一个函数关系,用f表示f(t)=tf(e)=e对于任何A、B语类来说,f(A/B)=f(A/B)=,f(A),MG内涵逻辑句法,基本成分常项变项内涵逻辑句法部分的作用主要是确定内涵逻辑表达式的义类,其规则表

25、述如下:义类中的每一个变项都属于ME(即义类的有意义词语);义类中的每一个常项都属于ME;如果ME,u为b义类变项,则uME;如果ME,ME,则()MEb;等等,MG内涵逻辑语义部分,内涵逻辑模型语义规则,主要确定内涵逻辑表达式的所指问题,内涵逻辑模型,具体表述如下Da=ADt=0,1D=D=其中Da表示a的所指(denotation)。E的所指为模型中的个体集合,t的所指为一个真值集合,的所指是一个由a所指向b所指映射的函数。是a的内涵,内涵逻辑的语义规则,如果是一个非逻辑常项,则如果是一个变项,内涵逻辑的语义规则,如果ME,是一个b义类变项,则 是一个函数h,其定义域为Db。对于Db中任何一个x来说,其中g表示对变项y的一次赋值。,内涵逻辑的语义规则,如果ME,MEb,则,小结:句法与语义的分界与重叠,小结:语言知识的筛子模型,小结:意义的组合原则(principle of compositionality),语言中有多少成分的意义可以被“组合”出来,有多少不能被“组合”呢?组合函数,Meaning(s)=F(Meaning(s1),Meaning(s2),),s=s1s2,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号