为加强学术交流合作,提升我院教师在新文科背景下的语言研究与教学能力,6月29日下午,我院音系学与句法学团队在6346教室进行了“知行”系列学术沙龙活动。本次活动由贺俊杰教授主讲,周石平博士主持,我院音系学与句法学教师团队参加讲座。
贺俊杰,陕西师范大学教授,博士生导师,曾在国内外多所知名大学任教或访问研究,研究兴趣涉及理论语言学、应用语言学、音系学、语言测试学及自然语言处理等。本次活动,贺教授围绕知识挖掘技术与语言研究主题展开。
首先,贺教授以有关文本特征及其作者归属判断的问题引发了全场思考,在众多文本中,依据哪些特征对其作者归属进行判断这一问题引出了本次交流活动的主题——利用知识挖掘进行语言研究。贺教授说,在大数据时代,作为语言研究者,理应懂得利用知识挖掘技术服务于自己的语言学研究。对于讲座开始提出的问题,他和团队利用知识挖掘技术,以理性的方法为解答问题提供了视角。
接下来,贺教授带领大家明晰了“知识”、“数据挖掘”等主题词的定义,随后介绍了运用探索性因子分析方法对57名作家的151部完整文学作品中的二字词进行提取、分类、统计,获得了文本的45个维度的理性特征,将它们降维呈现在波状图、比例图、雷达图等二维和三维图表中,让人更直观地感受到了不同时期、不同作家、不同题材的不同文字特征,为解答讲座开始提出的问题提供了可能性,让在场的老师受益良多。
最后,贺教授总结道,人类对于文学作品的特征感知往往是感性的,人们通过长期大量的阅读感知出某个作者的文字偏好,引发文学思想领域的探讨。本研究希望通过数据挖掘的方法为文学研究提供一种理性的独特视角,也创造更多可供探讨的深刻话题,希望这个研究案例推动大家对数据挖掘的进一步认识,也为我院教师的语言教学和研究提供参考。
图文:林艳、苗楚月 审核:鲁燕 发布:李丹