长沙分类信息网-长沙新闻网

供应图书数字化加工

2021-1-20 12:36:51发布5次查看

图书文献数字化
电子图书就是利用现代信息技术将传统纸质图书数字化,通过网络进行传送,使用计算机进行阅读,是图书的创新性革命。在世界的任何一个地方,当你打开计算机,通过一根电话线就能够连接一个图书馆的时候;当大量图书不仅能阅读,还能够进行快速全文检索的时候,图书呈现给人们的不再仅仅是知识,更多的是资源和力量。
图书文献数字化的制作流程1.图像扫描
扫描人员负责对项目图书进行分类,根据不同书籍资料及客户需要采取高速和平板两种扫描方式进行,扫描过程中严格控制扫描质量,保证后期制作流程的顺利进行。扫描完成数据以编号或书名进行命名和排序,质检人员对扫描图像进行检验,确保无缺页、漏页、缺内容、扭曲等现象发生,对不合格图像进行返工重新扫描。
2.图像处理
修图人员对扫描合格电子图像进行调色、校正、去污、裁切、统一尺寸等;同时对发现的各项图像问题进行返修或返扫或做好备注记录。(如:图像不清晰,原稿残、缺、不完整、无法调清晰等问题做好备注记录,以便于更换稿件。)
3.ocr识别及校对
用专业的ocr录入工厂对电子图像进行版面分析、自动识别、纵向校对、横向校对等流程,(采用纵、横双向校对方式以控制文字差错率),如果客户对差错率要求特别高,我们将在识别校对的基础上再进行一、二、三次人工校对和黑马校对。以保障数据的质量达到客户要求的水平。
4.索引制作:
按照索引项目利用所提供的软件进行标注或人工标引,并检查索引的文字正确性与索引的字段标识。
5.成品验收:
对结果数据的电子图像、文本及索引进行全面的质检,合格后向客户提交成品数据,并做好备份。
6.后续服务:
数据提交后专人接待客户对提交数据成品的见意及意见,根据客户要求进行及时修改,确保客户满意。
图书数字化的成品分类
根据客户的不同利用需求,我们将成品数据归为以下四类:
1.电子图像数据
这类图书数字化,仅仅是将各种纸质资料进行扫描和图像优化处理,以便存储和浏览。其存储格式有pdf\tiff\jpg等。此类主要应用于古籍等识别校对较困难和彩--像书籍文字内容较少等书籍。这类数据一般不进行文字的识别校对。 特点:价格便宜,项目时间短。 缺点:电子图像文件大,浏览速度慢。
2.文本数据
这类图书数字化,是将电子图像中的文字或手稿文件进行ocr识别校对和人工录入,形成全文本化的电子文件,便于重新印刷出版等一系列编改。其存储格式有txt\word\rtf\pdf等。 特点:占用空间小,可对任意内容进行编改,浏览速度快。 缺点:单纯的文字内容,无格式、无固定版面,制作费用高。
3.双层pdf
这类图书数字化,是将电子图像进行ocr识别校对后,生成双层pdf,上层为图像数据,文本文字附在图像下方。图像层方便浏览,文字层可复制、检索。 特点:价格相对比较便宜,可浏览可复制。 缺点:无排版格式,文本层为纯文字。浏览速度慢,不可进行编改。
4.版面还原
这类图书数字化,是将电子图像进行ocr识别校对编改后,生成原稿样式文档,其格式有rtf\pdf等。保留原来版面,可进行复制、编改和检索。 特点:可检索,占地少,方便编改。 缺点:价格高,工期时间长。

北京捷诚聚创数据有限责任公司

13001095661
北京市昌平区回龙观西大街9号院东亚上北11号楼0110室
该用户其它信息

推荐信息

长沙分类信息网-长沙新闻网
关于本站