报告题目:基于主题模型的文本情感和话题建模的研究
报告人:徐康
时间:2018年10月17日上午10:30
地点:best365体育官网登录入口326会议室
主办单位:best365体育官网登录入口
报告摘要:
目前互联网社交媒体中文本(例如,新闻、微博和短评论)不断增加,这些内容中包含了大量感兴趣的话题,例如民众对社会中发生各种事件的正面和负面的意见。情感分析工作的目的正是研究民众对于不同的产品、时间、组织等对象的情感和意见。其中,情感主题模型可以同时挖掘文本中包含的话题及其对应的情感极性。但是,现有的情感/主题模型挖掘长文本中(情感相关的)话题质量不佳,并且不能很好地处理像微博文本这样的短文本。本报告主要介绍在(情感)主题模型中引入各种不同的外界知识,并且设计了三个(情感)主题模型融合不同的知识,包括融合维基百科知识的主题模型、融合Word Embedding知识的情感主题模型、融合社交媒体结构知识的情感主题模型。最后实验结果表明融合各种外界知识的主题模型可以改进主题挖掘的性能。
个人简介:
徐康,男,江苏省南京市人。2007年至2011年本科就读于南京信息工程大学,2011年至2013年硕士就读于上海东华大学。2013年9月起就读于东南大学计算机科学与工程学院软件工程专业,导师为漆桂林教授。博士期间的主要的研究内容包括情感分析、文本分析、主题模型、知识图谱以及事件抽取等。基于上述这些研究的内容,已经发表了6篇论文,其中4篇一作(CCF B类会议 ECAI、CCF C类的杂志 IDA、国内知识图谱会议CCKS和国内的语言学会议CCL)和两篇非一作的会议(CCF A类的AAAI和CCF B类的ISWC)。另有两篇SCI杂志和两篇会议文章在审。同时,也参加一些学术会议和期刊的审稿服务工作,包括CCF A类会议AAAI、IJCAI和B类会议ISWC的子审稿人,以及SCI期刊Knowledge-Based System和Decision SupportSystems的审稿人。博士期间(2014年)因参与“大规模医疗本体的构建和推理技术及其应用研究”项目在百度实习交流三个月。同时也因欧盟项目SemData的资助,在西班牙的马德里理工大学和德国的卡尔斯鲁厄理工学院交流学习5个月。同时,博士期间也参与实验室的项目,包括与华为合作的互联网分析项目,主要负责其中的事件抽取模块。