长江网12月12日讯(长江日报记者杨佳峰 通讯员党波涛)“尬聊”是个什么意思?“怼”又是怎么回事?哪些词是网络流行语?哪些词又是网络热词?华中师大研制的一个新平台在不久的将来既可以让普通大众学习了解网络语言,还可进行网络流行语、网络热词等的研究发布。12月12日,国家语委语言资源网上线。该网站由华中师范大学国家语言资源监测与研究网络媒体中心研制,将汇聚优质语言资源,最终建设成为我国语言资源领域重要的信息门户。
据悉,国家语言资源监测与研究网络媒体中心自2005年落户华中师大以来,一直致力建设汉语网络媒体监测语料库。目前,该语料库包括网络新闻、博客、微博、论坛四类语料,各类语料文本已近1.48亿篇次,总字符数达1500亿,其中汉字总数为1300亿。这些语料每年以数百万篇次的速度增加,为网络媒体语言现象的研究和监测提供了必要的数据基础。目前,国家语委语言资源网已汇集了国家语委19家科研机构的48种语言资源,以及来自其他高校、研究所、社会机构的开放的各类语言资源。今后,随着国家语委语言资源网的分期建设、不断补充完善,一大批这样的语料库将共享共建,为学术研究提供海量资源。
该中心主任、华中师大计算机学院院长何婷婷介绍,目前网站建设主要是原资源,与语言研究、教学和语言政策等学术关联较多,网站后期将在大众的语言学习方面进行建设。如网络流行语的发布,就是要基于真实的语料库,依据数量和频次等通过数据分析进行排序,这样很容易就找到热词。