安徽广电信息网络股份有限公司黄伟,对安徽广电信息网络股份有限公司和北京中视利通公司开发的数字电视用户收视行为调查系统SBSS系统的技术创新点和独有技术进行了系统的总结。 (1) SBSS提出了一种全新的、基于机项盒的用户收视行为的采集方式 系统利用有线电视双向网络,通过机顶盒进行双向数据传输,采用UDP协议实现完成端口模型,保证数据处理速度的同时对数据的准确性进行校验。为保证数据传输的可靠性,对所传递的信息使用AES加密算法进行加密。实现对用户收视行为数据的实时采集和准确传输。 (2) 系统设计采用TNA技术无关性、三层体系,分布式架构 系统架构设计吸收国际、国内同类系统的先进思想,采用了TNA技术无关性总体架构,三层体系(表示层、逻辑层、持久层),分布式集群架构,实现负载均衡,系统支持百万级用户,并可根据用户数量的增加平滑升级。 (3) 系统实现与广电运营支撑系统(BOSS)接口交互,数据共享 系统实现了和广电运营支撑系统(BOSS)的交互接口,结合BOSS系统对有线用户的标准地址管理,根据机顶盒序列号和MAC地址从BOSS系统中取得相应用户的用户信息,作为数据挖掘的依据,从而保证采集用户收视行为数据的准确性。 (4) 采用SID的方式设计共享数据核心模型 SID是共享信息模型的通用框架,为了避免出现多个版本和多个数据库及避免数据在各个系统中不一致,就要根据流程分析的结果,利用SID模型,将数据进行抽象和归类,实现用户收视行为数据与广电综合业务运营支撑系统的用户数据信息共享。 (5) 用户收视行为数据展现模块功能设计与创新 数据展现模块的功能是指收视率各项指标的计算、分析以及对收视行为数据分析结果的展现。在数据展现与数据分析的各项指标及算法上总结和借鉴了央视—索福瑞媒介研究(CSM)的技术与经验,根据不同用户收视行为的指标体系设计各指标定义及计算方法。 (6) 高效的数据存储与查询 数据存储采用文本数据库与关系数据库相结合的方式,极大提高数据接收、存储及查询的效率,同时使用多维系数矩阵映射模型,数据索引优化,极大提高数据检索速度及数据存储空间。 支持上述创新的是以下几项独特的技术: (1) 使用完成端口技术,保证传输及处理速度的高效稳定:完成端口——是一种WINDOWS内核对象。其内部提供了线程池的管理,可以避免反复创建线程的开销,同时可以根据CPU的个数灵活的决定线程个数,而且可以让减少线程调度的次数从而提高性能,其实类似于WSAAsyncSelect和select函数的机制更容易兼容Unix,但是难以实现我们想要的“扩展性”。而且windows的完成端口机制在操作系统内部已经作了优化,提供了更高的效率。所以,选择完成端口开始服务器程序的开发。 (2) 传输中使用AES,保证传输数据的安全:随着对称密码的发展,DES数据加密标准算法由于密钥长度较小(56位),已经不适应当今分布式开放网络对数据加密安全性的要求,因此1997年NIST公开征集新的数据加密标准,即AES[1]。经过三轮的筛选,比利时Joan Daeman和Vincent Rijmen提交的Rijndael算法被提议为AES的最终算法。此算法将成为美国新的数据加密标准而被广泛应用在各个领域中。尽管人们对AES还有不同的看法,但总体来说,AES作为新一代的数据加密标准汇聚了强安全性、高性能、高效率、易用和灵活等优点。AES设计有三个密钥长度:128,192,256位,相对而言,AES的128密钥比DES的56密钥强1021倍。AES算法主要包括三个方面:轮变化、圈数和密钥扩展。 (3) 系统实现与广电运营支撑系统(BOSS)交互,数据共享:结合BOSS系统对有线用户的标准地址管理,根据机顶盒序列号及MAC地址从BOSS系统中取得相应用户的用户信息,作为数据挖掘的依据,从而保证采集用户收视行为数据的准确性。 (4) 系统设计采用三层体系,分布式架构,使系统的耦合性降低、增强系统的可扩展性 (5) 采用先进的数据存储处理优化技术。如:数据库系统优化、批处理应用优化、单条sql语句优化。 本系统经过安徽省网试点用户测试,收视数据采集实时、回传稳定,收视数据能够根据用户需求自动分析,生成数据展现报表。此项目在广电行业对广电行业同类业务具备创新性及通用性,具有很高的市场推广价值。准确、有效的用户收视行为数据对于挖掘收视数据的价值、充分发挥收视数据在节目编排和节目评价以及广告投放决策中的作用具有重要意义。相信随着有线网络的不断完善,数字电视双向机顶盒的全面普及,数字电视用户收视行为的采集与分析这一应用将具有巨大的市场价值。 2009年12月08日 |
微信扫码关注公众号