数据加工行业现况介绍:
● 国家单位、科研单位、教育机构、调研公司、金融机构、保险公司、企事业单位、图书馆、单位及个人等都面临大量的档案、图书、文档等纸质资料的数字化保存及加工需要,由此,数据加工行业应运而生,已发展成为一个成熟的服务性行业。
● 数据加工基本操作环节分为档案整理、档案扫描、图像质检、图像存储、目录建库、数据挂接、数据验收及数据备份。在其中,需要加入全过程管理,加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
数据加工日常业务需求:
● 档案整理:
※ 目录数据准备:按照要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。
※ 拆除装订:不去除装订物,影响扫描效果的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
※ 区分扫描件和非扫描件:按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。
※ 页面修整:破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
※ 档案整理登记:制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。
※ 恢复装订:扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。
● 纸质档案扫描录入:
※ 使用标准的扫描设备
√ 高速扫描,将各种纸质档案等转换成电子档案
√ 固定间隔时间自动扫描
√ 可承受批量性连续扫描为同一文件
√ 支持重张检测,不能漏扫
√ 可承受大量数据处理
√ 可承受长时间工作模式
√ 操作便捷,稳定耐用
※ 确定扫描方式
√ 根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
※ 确定扫描色彩模式
√ 扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。
※ 确定扫描分辨率
√ 扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥100dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。需要进行OCR汉字识别的档案,扫描分辨率建议选择≥200dpi。
※ 扫描登记
√ 认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
● 电子档案采集、处理、识别预处理:
√ 影像清晰,便于识别
√ 识别条码对文件进行自动分类
√ OCR数字提取,确保影像清晰
√ 图像偏斜度、清晰度、失真度智能纠正
√ 自动识别文字方向并纠正影像自动
√ 自动侦测纸张并进行扫描
√ 滤色、去装订孔等多种影像处理
√ 具有JEPG2000等多种压缩及文件保存格式
√ 纸质档案和电子录像档案关联,比对审阅
√ 不同资料按需分类,归整管理
● 图像存储
※ 确定存储格式
√ 采用黑白二值模式扫描的图像文件,一般采用 TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。
※ 命名图像文件
√ 纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
● 目录建库
※ 选择数据格式选择
√ 目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。
※ 档案著录
√ 按照要求进行著录,建立档案目录数据库。
※ 目录数据质量检查
√ 采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
● 数据挂接
※ 汇总挂接
√ 档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。
※ 数据关联
√ 以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
※ 交接登记
√ 认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
● 数据验收
※ 数据抽检
√ 以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。一个全宗的档案,数据验收时抽检的比率不得低于5%
※ 验收指标
√ 目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。合格率=抽检合格的文件数/抽检文件总数×100%
※ 验收审核
√ 验收“通过”的结论,必须经分管领导审核、签字后方有效。
※ 验收登记
√ 认真填写纸质档案数字化验收登记表单。
● 数据备份
※ 备份范围
√ 经验收合格的完整数据应及时进行备份。
※ 备份方式
√ 为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。
※ 数据检验
√ 备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。
※ 备份标签
√ 数据备份后应在相应的备份介质上做好标签,以便查找和管理。
※ 备份登记
√ 填写纸质档案数字化备份管理登记表单。
● 档案管理:
√ 档案在线审核
√ 分权限进行档案管理
√ 多平台档案查阅
√ 档案安全管理
√ 档案备份
数据加工电子化管理解决方案:
数据加工电子化管理系统的功能特色:
● 数字文档扫描影像处理系统 集Twain扫描、影像处理、档案管理等强大功能于一体,是提供给需要大批量扫描纸质文档的企业、政府、事业单位以及做数字化加工扫描服务的公司一个易用、安全、高效的扫描软件。通过该系统,可以方便的对扫描后的图片进行处理,如文档替换或插入、剪切旋转、去噪去空白页、合并拆分、倾斜校正、黑边补白等等,处理完成后可以方便的以多种格式存储。
● 数字文档扫描影像处理系统 是注重细节和客户体验的文档应用软件,我司研发团队着手于客户角度,过程中逐步导入实际需求,不断更新功能力求精益求精。自此完全满足大批量纸质文档的成批处理,并支持高速扫描仪,使您不必再为无法管理堆积如山的纸介质文件而犯愁。
※ 操作界面简洁直观,全中文界面,人性化的操作设置;
※ 统一的扫描接口,中文参数设置,支持绝大部分扫描仪;
当您要扫描一份多页文档的时候,是否总为漏扫、错扫而烦恼呢,本系统可让您在扫描之后检查并插入或替换文档,且不影响文件的正常排序,最后才进行存档保存输出,免去了错一张就要重扫的烦恼,大量节约您宝贵的时间。
※ 几十种影像优化处理功能,OCR识别,PDF转换等
√ 图像剪切:直接剪切图像中有用的部分,去除多余信息,同时减小文件大小
√ 图像旋转:默认设置可将图像旋转90度、180度、270度,也可以将图像任意角度旋转或镜像翻转
√ 去除黑点:可框选清除文档内不需要的内容
√ 自动去除空白页:扫描一批文件时可自动将空白页去除
√ 自动文字方向识别:根据文字方向自动将整个影像旋转成正确的方向
√ 装订孔、黑边补白:自动补白黑边及装订孔,使文档整洁美观
√ 倾斜校正:影像有轻微歪斜,可手动进行任意角度的调节,以得到正的影像
※ 几十种影像优化处理功能,OCR识别,PDF转换等
√ 图像剪切:直接剪切图像中有用的部分,去除多余信息,同时减小文件大小
√ 图像旋转:默认设置可将图像旋转90度、180度、270度,也可以将图像任意角度旋转或镜像翻转
√ 去除黑点:可框选清除文档内不需要的内容
√ 自动去除空白页:扫描一批文件时可自动将空白页去除
√ 自动文字方向识别:根据文字方向自动将整个影像旋转成正确的方向
√ 装订孔、黑边补白:自动补白黑边及装订孔,使文档整洁美观
√ 倾斜校正:影像有轻微歪斜,可手动进行任意角度的调节,以得到正的影像
适用机型: