首页 >> 语言学 >> 语言学常用资源
北京大学中国语言学研究中心CCL现代汉语语料库
2015年09月22日 11:36 来源:中国社会科学网 作者:语言学频道综合 字号

内容摘要:CCL语料库由北京大学中国语言学研究中心(Center for Chinese Linguistics PKU)开发。

关键词:CCL语料库;北大语料库;现代汉语语料库;在线;免费

作者简介:

  语料库快速入口:

    CCL现代汉语语料库 

  语料库介绍:  

  CCL语料库由北京大学中国语言学研究中心(Center for Chinese Linguistics PKU)开发,期间得到了北京大学计算语言学研究所、中科院计算技术研究所等单位同仁的大力支持和帮助。CCL语料库建设工作先后得到多项课题的资助,包括:(1) 教育部教育振兴专项资助项目”: 现代汉语句子结构规则研究及其辅助软件环境的开发(200110);(2) 北大中文系211工程子项目中国语言文学教学和基础理论及应用研究;(3) 教育部人文社会科学重点研究基地重大项目: 基于大规模汉英对齐语料的语言研究与教学平台。 

  CCL语料库及其检索系统为纯学术非盈利性质,语料库中的中文文本未经分词处理,检索系统以汉字为基本单位。主要功能特色在于:支持复杂检索表达式(比如不相邻关键词查询,指定距离查询,等等);支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句);支持在“结果集”中继续检索;用户可定制查询结果的显示方式(如左右长度,排序等);用户可以从网页上下载查询结果(text文件)。 

  CCL汉语语料库总字符数为783,463,175,其中现代汉语语料库总字符数为581,794,456。 

  其他信息:

    语料库文件目录

    CCL现代汉语语料字符统计信息 

分享到: 0 转载请注明来源:中国社会科学网 (责编:王婷婷)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们