Praat客服语音标注.docx

上传人:牧羊曲112 文档编号:4888136 上传时间:2023-05-21 格式:DOCX 页数:15 大小:504.08KB
返回 下载 相关 举报
Praat客服语音标注.docx_第1页
第1页 / 共15页
Praat客服语音标注.docx_第2页
第2页 / 共15页
Praat客服语音标注.docx_第3页
第3页 / 共15页
Praat客服语音标注.docx_第4页
第4页 / 共15页
Praat客服语音标注.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《Praat客服语音标注.docx》由会员分享,可在线阅读,更多相关《Praat客服语音标注.docx(15页珍藏版)》请在三一办公上搜索。

1、Praat客服语音标注语音转写操作手册(三层)1 点击praatopenread from file找到 你打开的文件一打开一选中同一个文件名的两个文件一View & Edit;2 Ctrl+2可以同时两层打点,Alt+Backspace可以删除时间点;做完以后Ctrl+S保存到根文件下面;请参看培训视频二、开始标注语音文件时间边界定位:按Tab键可以播放语音,再次按Tab键/Esc键可以停止 播放语音按Ctrl+i |可以放大波形;Ctrl+o |可以缩小波形。建议放 大12标注听音,在整段电话语音的基础上,根据语义和停顿时间等因素,在音频信号中每一句话的句首和句尾分别添加 时间边界。添加时

2、间边界的方法为:将鼠标移动到语音波形的相应位置,这时会出现一条虚线以及圆,分别点击SPEAKER层和CONTENT层对应的圆即可。或者直接Ctrl+2可以自动同时在SPEAKER层和CONTENT层打上时间点。在整个语音文件中,SPEAKER层和CONTENT层的时间边界的数目是完全一致的,每一对时间边界也是完全相等的。请注意,SPEAKER层和CONTENT层的时间边界必须保持一致。也就是说不管点击哪一层的时间边界,另外一层一定是空心蓝色,而不是实心蓝色文件标注: GLOBAL层主要标注语音文件的一些全局信息,包括说 话人性别信息和语种信息(方言区)。标注格式如下: speaker:空格1空

3、格性别,空格2空格性别;空 格language:空格1空格方言区,空格2空格方言区例如:speaker: 1 male, 2 female; language: 1 普通话,2 普通话speaker: 1 male, 2 male; language: 1 普通话,2 普 通话speaker: 1 female, 2 female; language: 1 普通话, 2普通话speaker: 1 female, 2 male; language: 1 普通话, 2 普通话 SPEAKER层需要标注的是说话人信息,“说话人”取值为以下两种:1、2,分别表示说话人1、说话人2。(说话人1、2仅标注

4、在文字段上,符号段不标注)如果是客服类对话,则SPEAKER层的“说话人”取值为1的语音,必须是话务员;用户的语音取值为2客服定义为奇数,用户为偶数;(客服一定是和用户有直接对话,否则不算客服)如果第三个人是用户的情 况:speaker: 1 female, 2 female, 4 female; language: 1 普通话,2普通话,4普通话CONTENT层需要标注的是该句对应的文字,如果是汉 语交谈,则只能用简体汉字。对于语音中的数字部分需 根据发音情况转换为对应的汉字,例如“ 27”一“二十 七”;“我的电话是p381832”f“我的电话是二三八幺 八三二(与发音相同)”。 CONT

5、ENT层正常语音的标注如果此语段为某一个人的汉语对话语音,请在SPEAKER 和 CONTENT 标注时间边界,SPEAKER层标注1或者2, CONTENT层输入相应的文本。如果此语段为两个人交叉语音,关于重n交叉)的语音,即对于某个人的一句话未完,另一个人的 一句话已经开始的情况:请在SPEAKER层和CONTENT层标注时间边界,SPEAKER层不标注内容,CONTENT层标注“ 对于叠加,必须是真实的。不能将大段的听不清语 音和叠加混在一起。叠加段内的非叠加部分,前后 最多不得超过1个字。至于由于添加叠加的时间边 界导致的半个语音(即切掉头或者尾)可用*或 UNK来表示。*和UNK取决

6、于是单段的听不 清,还是在语音中听不清。在整个语音中,需根据说话人的变换来增加时间边 界。如果同一说话人说话时间较长,则应根据其语义来 增加时间边界,每个时间段的长度最多不能超过 8s,但断句也不要太散太短。每个自然语言段平均 在5-6秒左右即可。每个时间边界的最佳位置在音频能量的最低点(即 波谱图上黑色部分最淡的地方),如果仅有几个字 包含不进来,那么建议舍弃这几个字英文:(英文小写)【单词】对于语音中简单的英文单词,在能听懂的 情况下,直接标出即可。特殊符号用发音标注,不 写特殊符号。例如:“网址是三w点sina点com”;“二三八幺八三二艾特 qq点com”;(不要写)“请以井号键结束”

7、;(不要写#)【字母】每个字母中间用空格隔开。例如:good表 示单词读音,good则表示字母读音。例如:我的 编号是f m s幺三二如果发音是表示应答的“嗯”,统一都用“嗯”, 不要用恩”或者“厄”。其他的这种口头发音, 也需要用带口字旁的汉字标注。比如哦,啊,唉等. CONTENT层短暂噪音的标注短暂噪音是指非常短暂的突发的声音,所有此类标注都 是中括号与语音内容的组合,不要标注时间边界。1听不清的一个字/英文单词直接在句子中标注UNK例如:二三八幺八8职二2两个或者两个以上听不懂的字,标注*听不清的长句方曰大段的英文句子拿着话筒和其他人说话3短暂的笑声:直接在句子中标注LAUGH。4短暂

8、的由说话人发出的干扰浊音:直接在句子中标注 SONANT咳嗽声打喷嚏清嗓子5 系统提示音,即系统播出的语音提示:PROMPT系统 自动播放的语音内容,而非说话人的语音内容(第二层不用标说话 人)例如:PROMPT欢迎致电我公司现在由一号客服代表为 您服务 CONTENT层持续噪音的标注持续噪音是指比较长的一段声音,所有此类标注都是单 独的噪音类型,需要标注中括号和时间边界,SPEAKER 层不标注内容1明显的静音段(大于500ms):SIL(如果空白段没有任何声音,可以空着,后期技术处理)2各种垃圾声音:ENS1)连续的拍桌子2)连续的敲击声3)持续的各种环境噪音(大于500ms)3连续的笑声

9、:LAUGH4持续的音乐声:MUSIC唱歌声(有歌词和旋律)哼唱(没有歌词,但有旋律) 口哨声可能是别人唱歌、演奏,也可能是背景的电视、收音机发出的音乐和歌声 口哨声包括持续时间较长的彩铃声5录音及电信系统引起的噪声:SYSTEM包括电话按键音由赤、电话忙音beap、录音系统的 其他噪音等,都是通信系统主动发出的声音,而不 是摘机、挂机或干扰带来的咔啦或毗毗杂音。一般会用的噪音符号:+,*,ENS,UNK,SONANT,LAUGH,PROMPT,SYSTEM修改标注去除端点:点中端点,alt_backspace移动端点:直接用鼠标拖动修改文字:点中语音段,在编辑框中修改保存 Ctrl+S保存到

10、你文件的根目录下面;三 工具自查checktool1 先进入程序安装文件夹,安装perl和python程序。注意perl 安装使用默认路径C:Perlbinperl , python 安装使用默认路径C:Python27python2 点击1_Textgrid_modify tmp已完成语音放tmp里面一退出来一步点击run3 把 1_Textgrid_modify 中 tmp 的语音全部复制到一2_checktool 的 tmp 中一run看出错的地方,如:intervals 50,说明第50段语音有错,将对 应文件的textcheck打开,查找到intervals 50,查看是什么错误, 最后在里面做修改,保存即可(改一个错误保存一次),再重复上 面的操作改下一个错误,直到最后没有报错为止。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号