数字图书馆中多媒体信息的组织与利用 _时代人物智库_http://www.ems86.com/index.php
 
时代智库
 
数字图书馆中多媒体信息的组织与利用
投稿信箱:87610500@163.com   编辑部:电话:010-86109586广告部:电话:010-86109586发行部:电话:010-86109586

数字图书馆中多媒体信息的组织与利用 
李洁红
(广东食品药品职业学院图书馆,广东 广州510520) 
  摘 要:随着科学技术的高度发展,在软件开发和项目实施过程中,有大量的文本、声音、图像、动画、视频等多媒体数据需要管理,因此很多时候迫切需要一套多媒体信息组织系统来管理和利用这些多媒体信息。
  关键词:数字图书馆;多媒体信息;信息组织
  中图分类号:G251.5 文献标识码:A 文章编号:1008 - 7508(2010)08 -0084-02
  一、媒体信息概述
  1、多媒体概念及其特征。
  (1)多媒体的概念。多媒体技术(Multi-mediaTechnology)是计算机领域的一支新兴的技术,一般认为:多媒体技术是能够同时综合处理多种信息,且使信息之间建立逻辑联系,集成为一个交互性系统的技术。是指能够同时采集、处理、编辑、存储和输出两个以上不同类型信息媒体的技术,将文、声、图、像和计算机集成在一起的技术。所谓“多种信息”是指信息媒体多样化。这些信息媒体包括文字、声音、图形、图像、动画、活动影像等。将计算机处理信息空间范围扩展,不再局限于数值、文本和图形、图像,使得计算机更加人类化,使人类能得心应手地处理各种信息。
  (2)多媒体的特征。多媒体技术具有交互性和集成性:
  ①交互性:“交互性”向用户提供更加有效控制和使用信息的手段,同时也为多媒体技术的应用开辟了更加广阔的领域。交互性可以增加用户对信息的理解,延长信息保留的时间。
  ②集成性:主要指多媒体的集成以及这些媒体设备的集成。这是多媒体技术的先决条件,其具有的特征就是集文、图、声、像多种媒体为一体。多媒体技术的“实时性”,是由于多种媒体集成时,其中的声音及活动的视频图像是和时间密切相关的,甚至是强时的。因此多媒体技术必然要支持实时处理,这是同步传达声音和图像所必需的。
  2、多媒体数据库。
  多媒体数据库(Multi-mediaDatabase)是数据库技术和多媒体技术相结合的产物。在许多数据库应用如办公自动化、信息系统、教育、CAD、CAM和医疗等应用中都涉及到大量的文本、图形、图像、声音等多媒体数据,这些数据与数字、字符等格式化数据不同,它们是一些结构复杂的对象。因此,传统数据库技术如数据存储、管理、检索、更新等都不能适应对这些数据的应用和管理需求,需要有专门的多媒体数据库管理系统的支持。
  二、数字图书馆中多媒体的信息及其组织特点
  1、数字图书馆中多媒体信息的特点。
  研究数字图书馆中多媒体信息的特点是为了从分析多媒体信息的特性入手,进一步探求多媒体信息管理的理想策略。下面所述的多媒体信息的特点是通过与常规数据的比较体现出来的。与传统的文本信息相比较,多媒体信息具有以下显著特点:
  (1)数据量巨大。
  多媒体信息将其数字化之后,其数据量是极其庞大的。如美国国会图书馆将其1/3的馆藏,约500万册的善本、珍本资料数字化后大约104TB;又如一段“新闻联播”中播音员播报的录像,将其原封不动地保存下来放到数字图书馆中,占据了几百个G的空间,即使将其有效压缩,还是要占据几个G的字节。如此庞大的数据量,使得如何将这些多媒体信息存储于数字图书馆中成为一个问题,即使存储下来,如何快速地找到用户所需的多媒体信息又成为另一个问题。
  (2)更直观和更易于被理解。
  事物的属性是多种多样的,不同的人从不同的角度来看待同一件事物所得出来的结论是不同的。事实上,我们为了能从多个方面对事物进行检索,不得不对其进行详尽的描述,但是,事物的属性是无法穷举的,因此其检索入口总是有限的。相反,假如我们把一幅图画、一段视频或音频直接呈现于用户面前,用户可以根据自己的需要充分地利用它们,这不仅简单直观,而且更易于被用户理解。
  (3)数据模型复杂。
  常规数据的数据结构简单明了,而多媒体信息则对应一个复杂对象,既包含多媒体信息本身(如一张图片、一段视频),还应包含多媒体信息的说明信息(即多媒体的元信息);同时多媒体对象之间通常存在复杂的层次结构关系。文本信息的检索途径多种多样,如题名、作者、关键词等,现在还提供全文检索,使得对于文本信息的查询十分方便。而多媒体信息不同于文本信息,文本信息的字符单元有固定的形态,并且字符单元的数量是有限的,多媒体信息则是由不同的点阵、不同的频率按不同的排列组合而成,如图像中某对象的形状和颜色、视频中的运动、音频中的音调等使得它难以通过内容来检索。不过,目前对于多媒体信息在内容检索方面有所突破。
  2、数字图书馆多媒体信息的组织。
  数字图书馆中多媒体信息的组织,主要包括数字馆藏的分析和选择、不同媒体信息的数字化、压缩格式的选择以及存储方式的确定。
  (1)数字馆藏的分析与选择。
  在进行多媒体信息的组织前,数字图书馆首先要根据其建设的目标和用户的需求,确定多媒体收藏的范围以及对收藏品原物的初步整理和保管计划,然后,选择收藏格式,同时解决好版权、知识产权等方面的问题。
  (2)多媒体信息的数字化。
  数字图书馆中的信息有两种来源:一种是目前以数字化形式存在的信息。如目前发表在网上的信息,或者是现在出版的光盘、VCD影碟,或者是近些年在利用电子出版技术出版纸质图书过程中生成的电子文本,这些信息经一定的格式转换就可直接纳入数字图书馆的信息资源库。另一种来源是目前以非数字化形式存在的信息。如铅排的图书,或者古代的图书,或者是储存在磁带、录像带中的音频、视频信息,这些信息在纳入数字图书馆之前必须先对其进行数字化。
  (3)多媒体信息的压缩和存储。
  数字图书馆所涉及数据量是其他任何系统都没有遇到过的,因而需要大规模数据库存储和处理这些数据。目前的数据库能否应付如此海量数据的存储与管理?即使现在的数据库在管理上能满足要求,能否承受得了其系统成本?在数字图书馆的数据中,文本数据的存储量不是很大,真正大的是多媒体信息。因此,如何理想完善地存储海量多媒体信息是数字图书馆系统设计的核心任务之一。
  采用最具有发展活力和应用前景的数据库技术关于数字图书馆多媒体信息的存储,目前出现了多种不同的数据库方案。一种是对关系数据库进行扩展,用二进制对象支持多媒体对象;一种是使用面向对象的数据库;还有一种是利用数据库技术与其他学科的内容相结合而产生的新一代数据库技术,诸如多媒体数据库技术、并行数据库技术、分布式数据库技术等;再有一种就是采用面向应用领域的数据库新技术,如数据仓库技术。
  3、多媒体信息数据库存储方案的选择。
  综合考虑上述数字图书馆多媒体信息的特性及几种数据库存储方案,笔者挑选了三种最常见的存储技术:
  一是数据仓库技术,数字图书馆不仅要提供一次信息,还必须提供经过深层次开发的二次、三次信息;其功能不仅应包括信息导航和信息提供,还应包括信息分析和决策。数据仓库能把数据转换为信息,从中挖掘出知识,最终创造出效益;
  二是分布式数据库技术,分布式数据库以其在分布性和开发性方面的优势获得了越来越多的青睐。其应用领域已不再局限于OLTP,从分布式计算机、因特网应用、数据仓库到高效的数据复制都可看到分布式数据库系统的影子。以数据仓库为例,它建立在原有多个数据库系统的基础上,需要能从异构数据库中提取数据并且能逐步扩展处理能力和系统规模,而分布式数据库系统能提供集成异构数据库的功能;
  三是面向对象的数据库技术,近年来,随着面向对象理论和技术的发展,许多多媒体应用系统中的多媒体数据管理建立在面向对象的数据模型(以下简称OO模型)上,但目前,面向对象数据库技术仍处于不断发展和创新的阶段,有关OO数据模型和面向对象数据库系统的研究在数据库领域是沿着3条路线展开的:一条是以关系数据库和SQL语言为基础的扩展关系模型;另一条是以面向对象的程序设计语言为基础,研究持久的程序设计语言,支持OO模型;还有一条是建立新的面向对象数据库系统,支持OO数据模型。
  随着人们对面向对象数据库在理论上和实践上研究和开发的不断深入,面向对象数据库将能很好地存储不同类型的信息,能使信息资源的组织真正实现面向主题,它是数据库技术发展的方向。而面向对象数据库与CORBA体制的集成将成为数字图书馆多媒体信息实现永久存储必然的发展方向。
  三、数字图书馆中多媒体信息的应用与发展
  对于数字图书馆环境下的海量数字资源,只靠关键词已经难以足够形象和准确地描述多媒体信息所呈现的视觉或听觉感知,致使适用于文本信息的关键词检索方式显得相形见绌,而基于内容的多媒体信息检索技术在数字图书馆建设中逐渐显示出无比的优越性。基于内容的多媒体信息检索技术是数字图书馆的关键技术之一,是海量多媒体信息得以高效、充分地获取和利用的技术支持。它的发展和在数字图书馆建设中的推广应用,将从根本上提升数字图书馆的信息服务能力和对用户的信息贡献力度。基于内容的多媒体检索技术的发展趋势主要集中在以下两个方面:
  (1)高层语义检索。
  所谓高层语义,其特征主要涉及图像的场景语义、行为语义和情感语义。一般而言,高层图像语义往往建立在较低层次的特征获得的基础上,并且层次越高,语义越复杂,涉及的领域知识越多。为了克服基于简单视觉特征的图像检索方法不足,人们提出了基于语义的多媒体检索方法。与基于低层物理特征查询不同,语义特征包含了自然语言处理和传统图像检索技术,这种检索方法的目标是最大限度地减小简单视觉特征与丰富的语义之间的语义鸿沟。缩小语义鸿沟的办法有两种:由高层语义特征导出低层特征和由低层特征向语义特征的转换。就图像语义而言,它具有模糊性、复杂性、抽象性,一般包括3个语义层次:特征语义、目标和空间关系语义、高层语义。在实际开发中,只要在原有检索系统中加入高层语义到低层特征的转化,就可以在不改变现有的图像特征库和匹配方式的情况下,实现基于高层语义的图像检索。图像语义的提取过程是由低层特征向高层语义转化的过程,在获取语义和有效表达语义的基础上,可以建立语义索引,提取图像语义。
  (2)综合检索。
  多媒体信息具有各种时间和空间关系,很难统一为一种特征,有着不同的表示方法,例如,同样是颜色特征,可以有直方图特征、颜色距、颜色集、主颜色等多种特征表示法,它们从不同的角度表示媒体的特征。而如何有机地组织多种特征,并根据用户的查询要求组合各种特征来进行检索,将是一个值得研究的问题。比如检索一个视频信息,可以根据动作特征加上音频特征一起来检索,这样的话,检索效果可能会更好。综合还意味着采纳其他学科领域的成果,如传统的基于文本的信息检索技术、人工智能技术等,基于内容的检索系统要充分利用现有的文本检索功能,并集成到基于内容的检索系统中,向用户提供完备的检索能力。仅基于特征的视频检索系统很难成功,基于文本信息和特征相结合的视频检索是未来的发展趋势。


参考文献:
[1]韩圣龙.多媒体数字资源的开发和利用[J].数字图书馆论坛,2006,(10).
[2]杨向明.21世纪图书馆发展方向[J].图书馆,2006,(01):45-48.
[3]李慧.数据库技术与数字图书馆中的信息组织[J].现代图书情报技术,2001,(05).
[4]朱跃龙,黄玮,何勉.基于CORBA的永久对象存储[J].计算机工程,2001,(09).
[5]吴楠,宋方敏.一种基于图像高层语义信息的图像检索方法[J].中国图像图形学报,2006,(12).


收稿日期:2010-02-21
作者简介:李洁红(1967-),女,广西贵港人,广东食品药品职业学院图书馆馆員。研究方向:情报与档案管理。

 

2012-11-12 16:57:21 - http://www.ems86.com/
针对常用几种检测扶梯超速、逆转保护功能方法缺点和误判现象的剖析 11/5
抚顺地区蝶类资源名录初报 10/26
职务侵占罪中主体认定的思考 10/31
地铁车辆运营中MCM电压传感器的作用及典型故障分析 10/27
对村委会主任收受贿赂问题应如何定性 10/31
 

组织机构

收录证书

关于我们 在线投稿 汇款方式 全站搜索 友情链接

        说明:部分文章源于网络转载,原作者无法查证,如有侵犯版权或不同意网络资源共享,请联系指出,我们会立即进行改正或删除有关内容。
        咨询电话:029-86191817  投稿信箱:87610500@163.com