永发信息网

如何實現漢語拼寫檢查?

答案:1  悬赏:80  手机版
解决时间 2021-01-03 05:13
  • 提问者网友:战皆罪
  • 2021-01-02 14:30
如何實現漢語拼寫檢查?
最佳答案
  • 五星知识达人网友:空山清雨
  • 2021-01-02 14:40

中文文本常用的自动校对的校对策略:①机器自动查错和人工确认纠错相结合;②词法、语法、语义多层次查错、纠错策略;③规则方法和语料库统计方法相结合;④ 面向查错的“粗分析”方法它们的校对技术深度·般有以下三个层次 l:① 简单上下文匹配:在查出的错误字词前后一定范围内匹配,用词库和后补信息或文本特征来判别;② 词切分 下文匹配:对文本中的句子自动切分,用词库和后补字信息来纠正错误字:⑧ 自然语言理解E下文匹配:用词、语法、语义等知识,逐句对文本进行分析、理解,由此选择正确的代替字例如,方正金山校对软件主要是在现代汉语语法规则制导下,利用模糊分词及多遍扫描技术,将 个句子分为若干词或词组,对照系统提供的通用词库、专业词库及用户自定义词库进行校对。清华大学利用汉字二元同现概率的大规模汉语语料文本的统计分析,互信息、同现信息等结果进行分词、词性标注、词性排歧,用语料库知识指导文本校对;基于语料库统计的MARKOV语言模型,利用上下文相关信息指导文本校对。杭州大学基于N联字的汉字识别后处理研究,以及北京师范大学基于句法结构和特征信息的词法、甸法语义校对系统的实现 等都取得了很大的进展,对文本自动校对极具指导意义和创造性启示 『“I[15】 [当前,有不少优秀的校对软件如“黑马文字校对”、“方正金山中文校对”、“三欧”、“文捷”、“人工智能校对通”以及台湾的“啄木鸟”等系统已走向市场,实现了商品化,可实现对语句不通、丢字多字、打字错误、错别字、重句、英文单词拼写错误、不规范标点、年月日错误、数字及章节错误的自动校对 校对速度可达50万字/4,时。但以上系统基本上是基于“词组”校对的辅助校对系统,存在以下不足之处 :1.虽然系统能够查出许多字、词错误来,但表现出同样错误症状的一些字、词错误却不能被发现。如:“报纸杂志以挥舆论监督功能”一句不能发现错误。2.校对能力基于词法层次上,对涉及句法、语义的许多错误无法发现。如:“他们不能新闻记者有关材料”一句不能发现错误。3.误判率较高。如:“有记者共约300人”误判“共约”为“公约”。4.对许多错字串未给出建议信息,即使给出也离正确的字、词相差甚远。5.没有提出校对软件查错的召回率(recaL L ratio)、查准率(accurate ratio)和误判率(err()r
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯