当前位置:文档之家› 自然语言理解-实验报告

自然语言理解-实验报告

分词系统工程报告
课程:自然语言理解
姓名:王佳淼
学号:
班级:信息安全11-1
日期:2013-11-2
实验一宋词字统计
一.研究背景
本实验所涉及的研究背景是利用计算机来“鉴赏”宋词。

主要针对宋词这种特殊的汉语诗歌体裁,开展了有关自动生成算法及其实现方法的探索性研究。

通过对大量语料的学习,来自动生成宋词。

由于宋词自身的特性,能够在经过大量预料学习后,利用在宋词当中出现频率较高的词语或者单字排列组合来生成宋词。

二.实验所采用的开发平台及语言工具
实验在WIN7的环境下利用VC++编程。

三.系统设计
(1)算法基本思想
从文本中字符,判断是否为中文字符(全角字符),若为全角字符则根据需要继续读取,即读取两个或三个字。

利用map容器来存储统计结果。

(2)流程图。

相关主题