多语种自然语言处理

为了在海量文本数据中提取有效信息,更好地开展文本信息处理,开发了可识别汉、英、维、哈、俄等200多种语言的语种识别系统;整理建设了多语言资源库,开发了词语形态切分、形态还原、词性标注及词对齐等系列工具软件,为开展维吾尔语自然语言处理奠定了坚实基础和技术支撑;针对敏感关键词的监管和舆情监测,开发了维吾尔语、哈萨克语关键词生成软件、维吾尔语文本自动摘要系统、维吾尔语新闻话题检测系统;面向形态丰富语言的实时检索,构建了维吾尔语词级和词根级关键词检索系统、哈萨克语词级和词根级关键词检索系统。

研究方向及内容

RESEARCH DIRECTION AND CONTENT
研究方向 多语种自然语言处理
研究内容 机器翻译,文本语种识别,维吾尔语语义理解与分析,维吾尔文文章自动摘要,信息抽取,命名实体识别等。
主持项目 包括国家重点研发计划、中国科学院战略性先导科技专项、中国科学院国防科技创新重点部署项目、自治区十三五重大专项、国家自然科学基金、自治区自然科学基金、自治区重点实验室开放课题、中科院西部之光项目等。

成果展示

ACHIEVEMENT EXHIBITION
0
标准
0
专利
0
软著
0
论文

产品及案例

PRODUCTS AND CASES