近日,为了促进档案服务业企业快速发展,“中国档案服务业产学研用协同发展暨《中国档案服务业企业蓝皮书》编撰研讨会”在广西南宁召开。北京汉王影研科技有限公司(以下简称“汉王影研”)受邀参加此次会议。
本次研讨会的主题为“中国档案服务业的现状、发展与用户评价”,同时在中国档案学会的关心、支持下,发起成立了“档案服务业产学研用协同发展联盟”。该联盟旨在促进中国档案服务业学术繁荣和人才培养,促进中国档案服务业行业规范发展,促进中国档案服务业产品水平提升,促进学界、业界之间交流高效畅通。
北京汉王影研科技有限公司档案业务事业部总经理千亮,就我司最新的档案研究成果,在大会上作出了《AI技术在档案服务业中的应用与实践》报告。
千亮总经理从企业介绍、技术介绍与生态合作三个方面出发,在报告中详尽阐述了AI技术为档案服务行业带来的巨大变革,其中涵盖了诸如手写识别、OCR智能识别技术、自然语言处理、人脸生物识别技术、笔触控及轨迹、微小颗粒检测等众多智能人机交互领域的研究开发。
他还强调了现阶段AI技术的卓越表现:如极具高度精确的图文识别能力、文档智能编目功能、高识别率的图像处理技术以及将RPA(机器人流程自动化)技术和AI领域完美交融的强大能力。具体来说,文本识别引擎具备极高的适应干扰性,即使面对表格、排版纷繁复杂、页面污损、手写打印、扭曲字样和笔记涂改等状况,该引擎也能通过海量“脏图”样本加以深度学习,从而确保输出结果能够不受影响,准确无误的还原原稿内容。
智能图文识别技术
随着信息社会的发展,纸质文档的形态越来越复杂化、多样化,如背景底色、污渍等噪声污染,卡证票据表格等不同类型文档。同时在业务过程中,存在有一定比例的手写体文档,字迹潦草、书写风格不一。
以上这些因素给文字识别带来了新的技术挑战,低抗噪、小样本、单一字体的传统OCR已无法满足文档“多样性”的识别及利用需求。
汉王图文识别能力正是基于以上需求痛点专门打造,引擎具备以下三大特点:
一是安全无忧:完全在内网或政务专网内部署,数据不外漏,保证信息安全;
二是快速灵动:采用新一代云计算架构,支持高并发,成熟稳定,易于整合,面对海量数据也能快速灵动;
三是精准可靠:基于AI机器学习、深度学习技术,包含文字识别、图像识别、图像处理、材料识别、文本解析抽取等功能,识别处理解析准确率高、速度快。
电子影像智能分类技术
文档编目工作是数字化工作的基础工序,文档编目的准确性、详细程度是后续查阅、利用的基础,在过去信息技术未能满足自动编目需求的时候,档案工作者通常进行人工手动编目,耗时耗力,且工作枯燥容易出错,随着技术的发展,计算机开始辅助人工进行自动编目,但会存在图文识别不准确、编目准确率较低的情况,无法最大程度辅助编目工作,仍需大量手动干预。
汉王影研文档智能编目能力,融合先进的OCR图文识别、语义分析、文件切分、机器学习等技术,结合多年积累的行业大数据,可实现电子卷宗、电子档案等电子文件材料的文件切分、智能命名、自动编目、自动归目,可自动、快速、详细、准确标注材料名称及一键归目,方便快速定位检索,可视化利用电子材料内容,减轻业务人员编目工作压力,为各行业业务材料数字化工作开展提供技术支撑,为深度应用工作奠定坚实基础。
基于汉王自研新一代图文识别能力,印刷体识别准确率在99%以上,手写体识别准确率在95%以上;对于图片进行版面分析,可有效提取文档标题,准确率达95%以上;基于多年积累的大数据及汉王新一代自然语言处理引擎技术,关键要素综合抽取准确率在90%以上。
电子影像检测与处理技术
数字化的电子档案及电子文件面临以下问题:数字化后的图片质量差、涉密涉敏感信息筛查难度大、电子件不符合规范标准要求、图像类型多,图像噪声复杂等。
汉王影研图像处理检测能力正是针对以上问题专门打造,引擎基于AI机器学习、图像处理、图文识别技术,可对电子图像材料进行质量检测、特征检测、文字检测、图像质量处理,实现对电子图像文件质量自动核查,合规性自动判断,机器自动处理,检测结果可直接出具检测报告或回传业务系统,并对图像缺陷与噪声进行智能处理,从数据源头进行质量标准化把控。
同时,汉王影研图像处理检测能力具备可靠精确、高效保障、持续优化、集成方便四大优势。
RPA软件机器人技术
RPA+AI先进技术为智慧城市打造的数字劳动力,可很好地解决大中小城市劳动力短缺、和人口老龄化问题,实现人机协同和谐共处。
汉王影研将RPA软件机器人技术融入到各个行业中,协助人工完成各种规则明确、重复度高的业务操作,节省人力成本,提高管理效率,如自动核对账目、案件网上立案、逐条信息录入等。同时把各行各业的工作人员,从繁重的重复劳作中解放出来,让人类劳动力有机会最大限度地,发挥人类的创造力、灵活性和协作能力,将他们独特的人类价值凸显出来。
北京汉王影研科技有限公司成立于2005年,是汉王科技(股票代码002362)旗下高新技术企业,专注于文档数据化服务20余年,是业内优秀的业务数据内容管理信息化与流程服务提供商。通过本次大会,汉王影研将继续秉承“合作共赢、共同成长、共同收获”的合作理念,为合作伙伴提供经验、技术及工具的输出赋能,构建“开放、协作、共赢”的文档信息化平台,不断更新优化智慧档案产品的迭代升级,助力档案产业高质量发展。