《互联网数据挖掘-part3-proj.ppt》由会员分享,可在线阅读,更多相关《互联网数据挖掘-part3-proj.ppt(15页珍藏版)》请在三一办公上搜索。
1、Research Projects and User Studies,朱廷劭(Zhu,Tingshao)Ph.D,主要场景,抑郁,焦虑亚健康,信息爆炸,网络文献多,网络舆论,舆情分析,联通,电信,教育网,网关设备,Projects,GLOSS系统及推荐联系人:黄健()网络行为与心理/人格联系人:杨刚()网络舆情分析(用户视角,网络日志分析)联系人:房志奇()网络文本的情感分类(读者)联系人:王焱(),招募参与各个部分的同学!,GLOSS系统结构图,GLOSS系统,基础搜索/solr,CiteSeerX,Medline,研究生论文,搜索优化,推荐,行为意图分析,数据挖掘,个人中心,社交网络,数据
2、网络下载,研究生院毕业论文获取,http:/gloss/,GLOSS功能模块,搜索排序优化搜索行为分析半监督学习用于搜索再排序Meta-search:google scholar和MS学术搜索结合相关论文推荐(内容,搜索意图,日志)学伴推荐根据学伴网络推荐论文,时间安排表,1,2,3,4,5,6,7,8,9,10,用户实验,结果讨论,功能模块的设计、实现和测试,GLOSS1.0,GLOSS部署,功能模块提交,GLOSS系统框架优化,记录点击率,GLOSS实现,模块功能接口,数据收集整理,三月,四月,GLOSS项目组招募,GLOSS开源,参与GLOSS项目组的好处:作为考核的重要部分系统在研究生
3、院实际部署,其他同学将受益你的工作以开源系统发布,简历增彩后续课程GLOSS数据你有权使用(研究),其他呢?,没有了,真的没有了!,作者 Vs.读者情感,网络文本的读者情感分类,通过对新闻内容的分类,预测读者的情感,而不是作者的情感。,项目和实验安排,用户实验设计和实施,数据收集以及预处理情感分类器的训练和优化基于半监督学习的情感分类,1,2,3,4,5,6,7,8,9,10,分析及结果讨论,情感分类器训练优化,实验数据/准备,三月,四月,数据收集,网络行为与心理健康状况/人格,通过行为可以了解一个人的心理健康状况和人格,是否可以通过网络行为来了解网民的心理健康状况和人格?,通过用户实验,记录
4、网络使用历史记录以及心理测评结果,训练网络行为和心理模型。网络使用历史记录,数据匿名化处理,只对内容进行总结和分类,不通过网络历史回溯到个人。(知情同意书,为期一个月),项目和实验安排,用户实验设计和实施,数据收集以及预处理网络行为特征提取,行为及心理模型训练,1,2,3,4,5,6,7,8,9,10,分析及结果讨论,用户网络历史数据收集整理,Pilot Study,实验准备,三月,四月,心理测评(全),心理测评(简版),心理测评(全),心理测评(简版),行为心理模型训练与优化,Pilot Study数据发布,网络舆情分析,根据网络的使用历史记录,从用户的视角分析舆情。,项目和实验安排,用户实验设计和实施,数据收集以及预处理舆情分析系统的训练与优化,1,2,3,4,5,6,7,8,9,10,分析及结果讨论,用户网络历史数据收集整理,Pilot Study,实验准备,三月,四月,心理测评(全),心理测评(简版),舆情分析系统的训练与优化,Pilot Study数据发布,Thank you!,