既然是数据管理,首先就要明确管理多少数据。数据量的多少直接影响媒资系统统计出客户需要保存的节目时间、节目增量和工作目标,进而得出各站点的数量,最终确定媒体文件和元数据的存储空间。个人认为应当从以下几方面来考虑:
1. 系统中高低码率文件编码方式和码率的选择。对台内现有数字化系统的资料进行保存时,一般可选用制作网、新闻网或播出网中的原始文件格式。现在的媒资管理系统基本上可对多种码率、多种编码格式的节目资料文件统一管理,这样既避免了转码带来的时间、空间上的浪费,又防止出现因转码可能带来的视音频质量损失。
表1 媒资系统高低码率格式的选择
如上表所示,海量存储一定是多格式的,从长远来看,不管是高清还是标清压缩算法都会改变,面向应用也会有不同的考虑,而且允许针对不同的节目形态在节目类型方面做一些优化,例如改变文件的封装方式以有效提高效率等,这些优化都是有针对性的,需要根据实际情况制定相应的策略。
2. 上载工作站和编目工作站数量的确定。上载工作站的数量主要是根据用户每天需要上载的传统磁带节目量的大小来确定的。由于上载的过程是1:1的信号上载,通常需要了解用户现有的磁带类型,各类节目的库存量,计划完成节目数字化采集上载的工作时间(如一年内完成多少小时等),由此计算出每天需要上载的节目量,从而得到系统需要配置多少台上载工作站。个人认为还需要注意的是,要考虑到上载工作站的可用时间以及上载人员的工作习惯,相应增加站点的数量,常见的配置方案是6小时/每天的上载量对应1台工作站。
此外,如果仅仅考虑完成传统磁带上载保存的话,简单计算可按每台上载工作站对应需要配置2台编目工作站来配置;如果考虑保存其他系统的数字化成品和素材,每天每增加3小时的编目工作就应相应增加1台编目工作站即可。
3. 明确数据总量,科学规划存储系统配置。在确定了媒资系统的上载站点和上载时间后,基本上就可以明确在一个较长的时间内数据量的大小,这也对存储系统的选型、配置提出了要求。媒资的存储系统通常包括在线盘阵和近线数据流磁带库,同时我们也要把媒资系统数据库的元数据作为数据管理的重要对象之一来对其进行存储规划:
·在线盘阵主要存储媒体文件、关键帧等数据,同时还可以作为提供上载的缓冲区和下载的缓冲区。高低码率文件都可以储存到在线盘阵中,也可以部署单独的高、低码率文件存储管理服务器。低码率文件除了作为编目、检索的预览文件,还可以用来对素材进行简单的粗编,所以一般不删除一直占据着相应的存储空间,如果条件允许,可以考虑单独部署一台流媒体管理服务器来对其进行存储和管理,这样对于缓冲区、流媒体存储空间的规划就相对宽松;而如果只有一个在线盘阵,其容量就要根据低码率文件的容量加上上载和下载缓冲区大小来计算。这就是一个相对不确定的数量,因为上载和下载对缓冲区的使用是不确定的,解决办法就是尽可能地扩大在线盘阵的存储容量,使其在满足较长时间内的存储任务的同时,兼顾为日常进出媒资的数据提供足够的临时空间。