智源研究院发布开源中文互联网语料库CCI 4.0

据智源研究院消息,5月6日,智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0。本次发布包括了中、英语两种语言,并将在随后的发布中,开源更多语言的版本。CCI 4.0数据集由智源研究院牵头,联合包括阿里云、上海人工智能实验室、华为、出门问问、金山办公、昆仑万维、面壁智能、奇虎科技、美团、稀宇科技、月之暗面、紫东太初、中科闻歌、科大讯飞等多个机构共同贡献。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!