1.为扩展分词【cí】词典【diǎn】,提高分词的【de】准确率,本【běn】文【wén】提出了一种基于信息熵的中文高频词抽取算【suàn】法,其结果可以用来识别未【wèi】登录词【cí】并【bìng】扩充现有词【cí】典。