ZKX's LAB

畅飞扬大数据检测研究中心发布档案数字化质量行业市场报告

2020-11-01新闻17

随着信息在全球的快速发展,世界对信息的快速增长,信息产品和信息服务对于各个国家、企业、家庭、个人都不可缺少。信息技术已成为支撑当今经济活动和社会生活的基石。在当前市场环境下,信息产业成为世界各国,特别是发达国家竞相投资,发展性的产生部门。信息技术的广泛应用使信息的重要生产要素和战略资源的作用得以发挥,信息技术也代表着当今先进生产力的发展方向,使人们能更高效地进行资源优化配置,从而推动传统服务和生产不断升级,提高社会运行效率。

畅飞扬大数据检测研究中心专注于电子档案、档案数据和图文图像的识别与检测的研究及服务。

日前畅飞扬大数据检测研究中心发布2020年档案数字化后的质量检测行业报告,数据显示,其2020年服务检测的8000万张/幅影像中,图像明暗度合格率仅为78%,图像曝光合格率也仅为81%。分析显示其主要原因是供应商在数字化作业过程中,缺乏及时检查和质量把控,追求效率,也缺少相应的质量管控工具,人为的检查难以做到肉眼长时间保证良好的状态。在扫描仪长时间的运转作业过程中,产生振动致使数值发生偏差等因素。

质量检测结果较为严重的是数据重复复制率竟高达14%。在利益和效率的驱使下,个别缺乏责任感的外包服务商或岗位工作人员将数据复制充数,这种以追求数量而不顾及质量的做法,在目前普遍采用人工抽检模式下,给业主方及外包服务商在数据质量方面埋下了诸多隐患:对于业主方而言,日后在数据管理及利用方面,造成局部数据缺失错乱,以致后续还需投入经费重新补做,给职能管理部门的政绩形象造成负面影响;对于外包服务商而言,因数字化加工过程质量管控不够及时严谨,导致最后业主方验收质量不达标,工人工资发了质量问题依然存在最后兜底的还是企业,大大增加了企业人工成本和延长项目工期。

影像倾斜合格率和影像裁剪合格率为90%及92%。中标服务企业在数字化过程中,作业的设备在所难免的发生颠簸,质量检查岗位人员也无法张张页页检查到位,裁剪岗位人员对裁剪值和分辨数值难以统一把握,完全凭个人主观判断,致使后期验收过程中不达标和返工,来回地办理领取搬运原始数据核对、修正等工作,也相应增加了相关方的管理投入和成本支出。

报告显示在影像倒置率的检测中合格率达到99.9%。在2020年检测服务中,从8000万张/幅的影像中检测出来的倒置影像有八万张/幅以上。分析认为,发生这种错误的主要原因是中标服务企业在整理数字化过程之中,未对档案进行逐一排查,按规范和流程操作,一味追求快速成件的做法所致。

综合质量检测反映出数据统计准确率仅为95%。在海量数据中,对各种类型档案和幅/张以及条目要做到百分百的清算不是一件容易的事。一方面也体现出一些档案服务企业在为业主方服务的过程中存在将数量调高调整的存在,抱有业主方是在验收时以抽检方式,不可能全部抽检到的侥幸心理。也使得业主方遭受经济损失和后续数据利用及管理上都存在一定混乱错误。

检测分析结果显示,档案数据逻辑规则准确率为93%,涉密文件、敏感信息等内容的筛查筛出1%的文件涉及秘密和敏感信息内容。结果显示逻辑规则发生错误主要是“张冠李戴”,漏录和错录及少录等原因。面对庞大的电子数据档案有清末民初以及新中国成立以来的档案文件。档案局/馆以及政府各部门管理档案的专职人员少,专业的编研人手不足,且工作量大,难以从海量的原始文档中逐一审阅排查哪一些是涉密文件,在原来保管条件有限下,普通文件与涉密文件混搭存放管理等多种因素造成的原因。检测报告显示八千万张/幅的检测数量中涉及秘密及敏感信息的就高达80000张/幅以上。有些秘密文件甚至是绝密档案尚未解密,若是泄密将是严重后果!

近年来随着数字化城市的推进,从事档案数字化企业犹如雨后春笋爆发式增长,但行业亦是参差不齐。一些企业在缺少技术与专业服务能力的情况下,一味追求效率和效益,导致档案数字化成果问题百出;一些业主方和档案服务企业缺乏有效的管控和专业的管理队伍,在后期日常管理和利用上也是发现数据缺失,混乱等诸多问题。基于上述情况,畅飞扬大数据检测研究中心和《畅影云检》档案数据智检存储机器人在其检测服务中得出上述结论。

——深圳市畅飞扬大数据检测研究中心首席数据研究员 杨杨

#行业互联网

随机阅读

qrcode
访问手机版