服务介绍

错别字校对服务的建设背景

发布时间:2014-11-01


随着政府网站信息量的不断膨胀,以及信息发布人民共和国及时性的不断提高,因各种各样原因而导致的网页错别字问题已日益严重。监测校对出来的错别字五花八门,存在政治性错误、敏感词错误、语法错误、用词错误、使用重复词错误等,通过分析整理归纳,形成错误的原因主要有以下四个方面:

1.某些词组用法容易混淆,包括同音、同形字,如“其他”和“其它”、“转帐”和“转账”、“下功夫”和“下工夫”、“必须”和“必需”、“的”和“地”、“制定”和“制订”等。部分词汇具有一定的争议,如“其他”和“其它”,在很多场合可以通用,但是“其他”是《现代汉语词典》等权威工具书推荐的,因此本校对报告以《现代汉语词典》推荐为准。

2.有些错误由于粗心大意导致,如:“中华人民共和国”变成 “中华人民共各国”、“浙江省”变成了“浙江市”、“人民政府”变成了“人民府”等。

3.可能由于扫描文字识别软件(ORC)导致的错误,如:“朱镕基”变成了“朱钅容基”、“人”变成了“入”、“拔”变成了“拨”等。

4.政治用语错误,如“中港合资企业”中“中港”不能并列、“新疆维吾尔自治区”变成了“新疆省”、“广西壮族自治区”变成了“广西省”等。

这些错误的发生,可能是由于粗心大意或不了解专有知识等各种原因导致,只有借助于校对软件才能够避免类似情况的发生,同时让编辑人员引起对类似问题的注意,最终提高网站信息的准确性。因此非常有必要构建一套网站校对系统,该系统要求能够对网站进行一次性深度校对,同时能够实现对网站进行每日增量信息的校对服务。