|
维普资讯数字化加工中心主要从事文档资料数字化加工、图像压缩及处理、信息检索等服务。 目前维普资讯数字化加工中心的数字化加工车间日数据加工能力为20万页,年加工文档资料可达5000万页。是国内最大的文献资料数字化加工基地。
维普资讯数字化加工中心具有国际先进水平的"大规模的文档资料数字化加工与网上发布系统"。该系统已通过由重庆市科学技术委员会组织的专家委员会鉴定,并已全部正式投入使用和开展服务。该系统的文档资料数字化规模已达到国内领先水平,可灵活组合的加工方式与实用化的图像压缩技术已进入该领域的国际先进行列。该项目2002年6月获国家科技部、财政部中小企业科技创新基金支持,2003年九月被信息产业部列为2003年度国家信息产业科研(民品)计划项目。该系统的研制与开发,解决了文档资料数字化和网络化的问题,为文档资料的数字化保存和信息发布提供了完整的解决方案。该系统可广泛应用于图书馆、档案馆、医院、银行、税务、证券和保险公司等需要对大量的文献资料和票据进行保存、资源共享与信息发布的单位。
业务范围:
1、 文献资料数字化加工;
2、 基于人工智能的信息处理技术开发;
3、 海量数据内容管理与发布系统建设;
4、 图像、文本压缩技术与压缩信息检索技术开发。
大规模的文献资料数字化加工与网上发布系统:(点击栏目查看详细内容)
项目特点
1、高速的双层加密PDF生成系统、图像压缩比高。
双层PDF可以100%保留原始版面效果,并且支持选择/复制/检索等功能。通过批量扫描、快速录入后,经过去污、纠偏和OCR识别,直接生成可以检索的双层PDF文件,这个PDF文件是双层的,上层是原始图像,下层是识别结果。
采用国际认准的标准压缩技术:JBIG2高倍压缩技术;比TIFF和基于TIFF的PDF压缩比高3~10倍,且能支持基于图像全文的搜索。
2、实现了文献资料加工的工程化、规模化:
日(8小时)加工能力可达到15万页*A4(21台扫描仪、50人*计算机)。
3、实现了数字化、无纸化加工生产和管理。
对数字化生产线的规模可进行配置:数字化生产线的生产平台,根据实际的需要,加入不同的功能构件,就能够构造出不同的数字化加工生产线。
4、数字文献网络化
数字化后的文献信息通过信息发布系统的整序处理之后,可通过Intranet/Internet迅速地在数字文献网站上发布,达到信息资源共享的目的。
5、可建立专业的数字文献网站
该数字文献网站包括文献信息内容管理,面向用户的文献检索,文献的在线浏览以及用户信息管理等功能,可为读者用户提供方便快捷的文献检索和全文信息服务。 |
项目评价
已通过技术鉴定的“大规模的文献资料数字化加工与网上发布系统”已全部在公司正式投入使用和服务,以中国工程院倪光南院士(原联想集团总工)为主任、重庆大学校长吴中福教授为副主任的专家鉴定委员会认为,该系统已达到国内领先、国际先进水平,并具有以下技术创新点:
1、 用软生产线的加工方式保证了文献资料加工的工程化与规模化;“座席不对应”的设计思想保证了生产线上各个工序的动态配置,平衡了各条生产线的工作量,避免瓶颈的出现。
2、 用“电子工单”完成各工序间的任务传递,取消了纸介质信息在生产线上的流动,实现了生产管理的自动化与无纸化。
3、 批量、快速的前端扫描完美的PDF重现:识别结果PDF是采用图文双层PDF,完美的实现了原文重现。支持PDF文件加密功能,可以控制用户编辑/打印/修改该PDF文件,在标准化管理中非常有必要。支持数十种图像格式到双层PDF文件的直接转换,包括TIFF,
JPG, BMP, DCX, PCX, EMF, GIF, PCD, PIC, PICT, PNG, PNM, PSD,
TGA, WMF等图像格式,自动生成文本层,合并到双层PDF中,不需要人工干涉。
4、 JBIG2格式高倍压缩技术能将生成的扫描图像转换成和光符阅读机(OCR)转换的文本文件一样大小。一张被扫描的图像可以压缩到比TIFF
G4小10倍。采用JBIG2解码的PDF文件的解决图像方案,能将原始的TIFF和PDF文件直接压缩成超强压缩的用JBIG2解码的PDF文件。这些压缩的PDF文件不仅是正常PDF图像文件的一部分,而且也能生成你的当前数据库系统的全文搜索和索引。
5、 该系统实现了对各种扫描仪的集成操作、数字图像的编辑处理、提供对文献资料的多种检索入口、面向生产线的管理工具、通用图书发布网站框架生成工具以及专用图像浏览器。
专家鉴定委员会一致认为:该系统的研制与开发解决了文献资料数字化和网络化的问题,为文献资料的数字化保存和信息发布提供了完整的解决方案,生产方式与规模在国内外都是一个突破。该系统在现有生产环境与条件下的文献资料数字化规模已达到国内领先水平,软生产线的加工方式与实用化的图像压缩技术已进入该领域的国际先进行列。该系统在实现数字化的加工方法、流水线的生产方式等方面提供了一整套可以借鉴的成功经验,它的开发成功以及推广应用,对我国数字图书馆、电子档案馆以及电子政府的建设具有巨大的推动意义。 |
主要成功项目
现在该系统不仅用于图书期刊的数字化工程,也已广泛用于档案的全文数字化及网络化工程。
1、 国家科技部:建国后至今的档案资料数字化和网络化工程,300万页;
2、 国家林业局:建国后至今的档案资料数字化和网络化工程,500万页;
3、 重庆市科委:1966年至今的档案资料数字化和网络化工程,200万页;
4、 科技部西南信息中心:1989-2000年7000余种中文期刊数字化工程,共2000万页,25册。
5、 重庆市房地产交易所数字化档案管理系统;
6、 重庆市企工委档案资料光盘管理及调阅系统;
7、 重庆市渝中区档案馆:知青档案数字化管理系统;
8、 成都市电信局勘测规划设计院:工程图纸数字化及光盘调阅系统。
9、 中国石油西南油气田分公司重庆气矿:各种技术档案及工程图纸数字化及网络化工程;
10、 云南省昭通市科技局档案数字化工程;
11、 西安铁路铁路分局宝鸡电务段档案数字化管理系统;
12、 四川石油管理局科技成果档案光盘管理及调阅系统。 |
样本文件下载
|