研究生院

您的位置: 首页  新闻动态

2017年华东师范大学研究生学术论坛(沙龙)系列报道(9)

发布日期: 2017-12-28   浏览次数 351

许鑫教授:“文本挖掘技术及其应用探讨”研讨会

——华东师范大学研究生学术论坛(工商管理分论坛)第三期顺利开展

1115日下午,华东师范大学研究生学术论坛(工商管理分论坛)第三讲——“文本挖掘技术及其应用探讨”研讨会在闵行校区法商南楼135会议室顺利举行,经济与管理学部工商管理学院副院长许鑫老师主讲该讲座,经管学部实验中心工程师姚占雷老师负责相关演示教学,出席论坛研讨会的有工商管理学院企业管理系连燕玲老师、吕君老师、旅游管理系罗佳琪老师以及工商管理学院2017级全体硕博研究生,也有众多本科生自发参加了该研讨会。

讲座分为两个板块,首先是许老师的文本挖掘技术理论与应用分享板块。不同于一些讲座追捧热门技术,此次交流的主基调定在技术运用过程中的反思。在该板块,许老师以常见的瓶颈引入,以问题为导向,阐释了文本挖掘技术的概念演化,并指出基本流程中的重点难点。在主要技术的脉络梳理过程中,除了技术自身的特点外,许老师还强调了领域差异性与文本差异性的关系,尤其要贴合研究问题,选择不同文本源,改进运用方法。进一步,许老师通过举例研究成果中的成功案例,为文本技术的具体应用场景,提供了思路范例。最后,许老师提出“6大矛盾”,辩证地总结了文本挖掘技术的价值观,启发在座者进行后续思考。

紧接着的是姚老师的文本挖掘开源软件的实践操作板块。姚老师先后演示了实验室开源工具的中文分词、中英文词频统计、共现分析、可视化展示、信息采集等功能。在操作实践中,人工干预的重要性也被强调,姚老师指出,领域词表的构建以及数据清洗的过程,都需要投入大量精力,人力对文本处理结果优劣起到不容小觑的作用。演讲结束之后,学生继续就疑难问题与姚老师互动交流。

此外,为了加深文本挖掘技术的理解,许老师赠送与会人员《基于文本特征计算的信息分析方法》(许鑫 著)一书,作为讲座内容的延展阅读。

现场照片

许鑫教授对文本挖掘技术的思辨,不仅延伸了文本相关领域的思维深度,更为大数据驱动背景下工商管理交叉学科的研究,提供了新的视野。