语义分类方法在淘宝评论文本中应用研究

作者:高彦 刊名: 上传者:徐卫东

【摘要】电子商务近些年的迅猛发展,人们选择线上购物平台的越来越多,淘宝网作为最大的C2C电子商务平台拥有庞大的客户群,人们通过淘宝网可以在短时间内获得千里之外的商品而无需实地购买。这在一定程度上,影响了人们的购买行为,人们可以通过网络进行交流,缩短了人与人之间的距离,这使得人们在进行购买行为前习惯搜索该商品或者服务的相关评价信息,消费者在线评论文本的价值则被挖掘出来。此外商家也可以从评论中获取商品信息加以改进提升,那么用户评价的进一步提取有效信息就成了首要问题。在现阶段的研究中,不同学者对于情感分类进行了多方面多角度的研究,情感词汇以及否定词特征、特征级别的领域特征集合的情感挖掘等一系列观点和方法相继提出。但是针对于评论文本碎片化、短语句的特性,往往传统的文本分类技术不太适用于此。而对于评论文本的研究中包括关键词分类、情感倾向分类等等,提出了一系列的应用研究,提取文本当中的关键词或者表达情感的情感词汇,通过分析词语的褒贬程度从而确定文本的情感倾向。针对这些问题,本文提出了基于语义的评论文本分类方法。挖掘评论文本中的情感倾向词汇,通过情感词汇的语义关系进行概念间分类。利用语义分类方法,基于《知网》和《同义词林》的词汇间关系构建初始语料库,在语料库中,确定种子词汇的情感倾向性,再通过其他词汇与种子词汇间概念关系从而确定其他词汇的情感倾向,从而达到评论文本语义分类的目的。语义褒贬倾向的研究为文本分类、文本过滤等自然语言处理的研究提供了新的思路和手段,将语义分类应用到淘宝评论文本中去同样也会是一种趋势。通过语义分类的标准将评论文本进行重新分类。改变原有的手动选择“好评”、“中评”、“差评”改为自动识别“褒”“中”“贬”“未评价”的分类标准。本文提出淘宝评论文本语义分类的方法,将评论文本进行分词处理,标注词性,提取观点词;通过语义进行分类后的文本会发现更加直观、清晰,从而验证语义分类的可行性。

全文阅读

密 级: 学校代码:10075 分类号: 学 号:20131669 专业硕士学位论文 语义分类方法在淘宝评论文本中 应用研究 学位申请人:高 彦 指导教师:宇文姝丽 副教授 孙广芝 副研究馆员 申请学位级别:专业硕士 学科专业:图书情报 授予学位单位:河北大学 答辩日期:二○一五年五月 Classified Index: CODE: 10075 U.D.C: NO: 20131669 A Dissertation for the Degree of Professional Master Application research on Semantic classification in taobao comment text Candidate: Gao Yan Supervisor: A.P.Yuwen Shuli A.P. Sun Guangzhi Specialty: Professional Master’s Degree Academic Degree Applied for: Master of Library and Information Science University: Hebei University Date of Oral Examination: May, 2015 河北大学 学位论文独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人己经发表或撰写的研究成果,也不包含为获得河北大学或其他教 育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了致谢。 作者签名:b 日期:扣u-年b月10日 学位论文使用授权声明 本人完全了解河北大学有关保留、使用学位论文的规定,s卩:学校有权保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存 论文。 本学位论文属于 1、保密•, 在 年 月 日解密后适用本授权声明。 2、 不保密szf。 (请在以上相应方格内打“V” ) 保护知识产权声明 本人为申请河北大学学位所提交_目为办破巧成和4 d � _ f 的学位论文,是我个人在导师f丈媒砀指导并与导师合作下取得的研究成果,研 究工作及取得的研究成果是在河北大学所提供的研究经费及导师的研究经费资 助下完成的。本人完全了解并严格遵守中华人民共和国为保护知识产权所制定的 各项法律、行政法规以及河北大学的相关规定。 本人声明如下:本论文的成果归河北大学所有,未经征得指导教师和河北大 学的书面同意和授权,本人保证不以任何形式公幵和传播科研成果和科研工作内 容。如果违反本声明,本人愿意承担相应法律责任。 声明人: 高為 曰期:年6月⑴日 作者签名: 导师签名: 日期: X 年6月丨0曰 日期: fbv [^“年彡月曰 摘 要 I 摘 要 电子商务近些年的迅猛发展,人们选择线上购物平台的越来越多,淘宝网作为最大的 C2C 电子商务平台拥有庞大的客户群,人们通过淘宝网可以在短时间内获得千里之外的商品而无需实地购买。这在一定程度上,影响了人们的购买行为,人们可以通过网络进行交流,缩短了人与人之间的距离,这使得人们在进行购买行为前习惯搜索该商品或者服务的相关评价信息,消费者在线评论文本的价值则被挖掘出来。此外商家也可以从评论中获取商品信息加以改进提升,那么用户评价的进一步提取有效信息就成了首

参考文献

引证文献

问答

我要提问