云因公司与平章公司强强整合 全面推进出版行业信息化建设
 
 
 
 
  专家观点   
 
数字出版 您的位置:网站首页-专家观点 -数字出版
 行业信息化
 出版集团信息化
 出版社信息化
 文化公司信息化
 数字出版
 其它
 
出版资源的数字化
发布时间:2012-11-05 【选择字体:
未经过规范化处理的出版资源,即使是以“数字化”形式存在,也只不过是以数字形式存储的出版资源而已,这类资源很难在数字出版领域中成为可利用的资源并发 挥其应有的价值。而目前许多传统出版单位,正热衷于将其所掌握的出版资源大规模地进行数字化工作,而这种不按数字出版规范处理程序进行的数据加工方式,只 能称其为出版资源的数字化过程,而其产生的后果只能产生大量的数据垃圾,为数字化资源建设造成极大的浪费。
  那么,什么样的资源才能真正成为数字化的出版资源呢?对照上面提出的问题,我想数字化出版资源起码要具备以下几个基本要求:
一、 资源的可用性
  可用性是指两个方面,一是资源的版权有效性,即资源经过数字化加工处理后,出版单位对其是否具有版权意义上的使用权。二是资源自身的价值,是否具有一次加工,多次复用价值。
  1.版权的有效性 在传统出版时代,出版单位获得的大多是专用出版权, 有的甚至只是非专用出版权,而并没有获得改编权以及其他载体形式的出版权,特别是对于数字出版最为重要的网络传播权。而这些法律上的授权问题如果不能得到 真正解决,即使出版单位花费大量人力、物力和精力将其作品数字化,却可能面临数字环境下运营的合法问题而无法使用。为此,对具有一定价值且需要进行数字化 的资源或已形成数字化的资源需要二次加工的资源,首先要进行版权授权的认证工作,未获得有效许可的资源是不能进行二次开发的。
  2.可复用性 并非所有的出版资源都具有可复用性,或者是利用复用性不强。在传统出版资源中,复用性较强的资源有工具书、教材等长销类产品,其次是以提供数据分析和信息 服务类的数据库产品,最后是经典读物以及浏览性读物。对于不同的资源,其数据处理水平及加工要求也各有不同。
  工具书、教材 这是数字化出版资源的核心,对这类资源要在完成同类资源 的大规模集成后,要进行数据的深度标引,并完成查重排歧,才具有可使用的价值。这也是加工难度最大一项工作,其中涉及如何利用计算机技术进行数据挖掘、信 息整理和知识管理、知识服务等数字出版核心技术。
  数据分析和信息服务类的数据库产品 向面某一领域或特定读者群的非工具 书或教材类的出版资源,其单一资源的可复用性较弱,但大规模集成后,可形成一定强度的资源库,通过积累和沉淀,可形成新形态的信息产品,如清华同方的资源 库,这类资源是通过大规模集成之后形成新的衍生性信息消费产品,可满足新的消费需求,并促进原来产品的发行与销售。其可行性关键在于集成度和信息提取度。 并非一两家传统出版单位可实现的,一般来说,要形成行业集成才有可能形成有效的规模产品,支撑产业的数字阅读需求。如在集团层面上集成,则专题性的集成度 不足,难以形成有效消费群。
  在技术层面上,由于对内容信息需求的多样性和复杂性,其底层数据结构及信息提取等问题,需要大量数据库和网络信息处理的专业人才,因此,要在基于新的信息消费产业链的基础上,进行跨媒体、跨部门、跨行业、跨领域的优质资源整合,才可取得成效。
  经典性读物及大众阅读性读物 这类出版物由于其浏览性、实效性强、典藏性和资源性相对较弱,因此,大多以在线发布,顺序浏览为主,能满足公众利用网络或手机阅读终端,实现情节性浅阅读的基本需求。
二、 资源的可流通性
  出版资源的流通性也要多不同的角度来看,一是数据自身的可流通性、二是载体的兼容性、三是内容的需求性。
  1.数据的可流通性 要达到在不同载体上一次加工多次利用的目的,首先要解决字符的规范性问题。而国内目前各出版单位所拥有的“数字化资源”,大多是基于GB18030的字符 集,这个字符集所收汉字263个,难发满足出版用字的需求。因此资源中存在大量非标造字,不具有可流通性。要想提高资源的流通性,必须将资源构架的的基础 上,也就是超大字符集的基础上,并实现现有资源用字符的五同问题,即:文同字(同字异形的认同))、字同形(同形异构的认同)、形同码(同形异码的认 同),码同位(同字异码的码位归并),符同码(各类符号系统在符号集中的同一性)。只有在超大字符集的基础上,解决了五同问题,数据才真正具有可流通性。
  2.载体的可兼容性 要想出版资源在不同载体形式上发布,重点需要解决 不同媒体形态资源的存储格式和精度问题。媒体格式一定要采用国际通用标准,如采用非国际标准的企业格式,将造成载体间兼容性的瓶颈,使得资源无法有效传播 和利用。精度问题也是数字化资源中存在的一个严重问题,特别是图片资源,往往由于前期采集精度不足,导致可用性大大降低,以至不可用。因此,对具有利用价 值的图片资源,特别是珍贵资源,要按全张印刷的精度采集,并分层存储。
  3. 内容的需求性 数字出版物的传播方式是被动传播,即资源存储在运营环境中是静态的,如无用户需求导致的阅读点击行为的产生,则根本不可能实现传播。因此, 阅读需求越少的内容信息,越不具有可流通性,要提高资源的流通性,就要认真解决在网络环境下读者需求的动态采集和用户需求的定性量化分析,只有解决了需求 描述和描述机制,才能真正做到按需定制,按需生产、按需加工、按需提供,才能真正提高资源的流通性和可用性。
  三、可获取性
  由于数字环境下的资源是以静态的形式存在,如何有效地将资源组织起来以 便于读者的查询和检索,如何类聚地提供信息和内容、如何基于用户的认智规律,拓展性地组织和关联信息,并有效地利用多种媒体形态,综合艺术地动态推送展示 内容,是提高静态内容的动态流动性所必须解决的问题。
  四、可维护性
  数字出版资源的特点之一是可不断地对资源进行动态地更新维护,以满足和 响应不同用户群体的阅读需求。因此,能否建立起一支强大的,具有强大的信息利用和处理能力的编辑队伍,不断对资源进行更新和维护,才是使资源具有生命力和 可持续展发生命力最为核心的问题,一个资源如不能及时更新和补充,则需求就会枯竭,用户就会消失,资源本身的价值就会下降甚至消亡。
关于云章 | 常见问题 | 资料下载 | 联系我们
版权所有©北京云章科技有限公司

备案号: 京ICP备15007995号
京公网安备11010802017679
  地址:北京市海淀区苏州街18号院长远天地大厦A1座601、B2座1110
电话:010-82609567   82609568  
邮箱: mail@pzcp.com