誉沃非结构化数据管理平台(All-Media IPS)解决方案

         

一.需求分析

1.1 学校非结构化数据管理问题

    目前大部分院校的非结构化数据都存在着数据分散、数据孤岛众多、数据量巨大的问题。很难加以整合利用,占据90%体量的非结构化数据并没有能够充分发挥它们应有的价值,这些数据以视频、音频、图片、文档的形式存在,不仅承载教学知识、人文沉淀,同时也含有大量的教学及办公过程文档,但由于没有合理的“汇聚、管理、发现”的模式,以至于会发出学校没有数据可用、没人使用数据的感言。因此,我们需要先理清学校当前对于数字资源应用所面临的关键问题。

  1. 数据在哪

    数据资源被分别存放在不同的物理空间及应用系统中,相对孤立,形成了各类数据孤岛,导致数据无法互通,无法整合应用,无法观其全貌,形成了数据与用户之间的障碍。

  1. 如何存放

    数据存储于各部门的数据平台、个人电脑及孤立型设备(U盘、光盘、移动硬盘等),由于存储介质本身易损的特性,很容易因为硬件设备的意外损坏,而造成不可估量的损失。

  1. 如何转换

    视频数据、音频数据、图片数据和文档数据,这些数据产生于教育教学过程,不仅仅数据本身类型各不相同,数据格式也不一样。即便都是视频数据,不同码流不同编码方式都导致了数据的不一致,对统一管理提出了很高的要求。我们无法利用关系型数据库进行标签的设置,因为各种数据类型均不相同。

  1. 如何查找

    资源没有统一存储、整合,分布在不同的业务系统中,即使知道数据资源的存在,由于业务系统间使用权限的区隔,也无法查询、调用到数据。

  1. 如何共享

    建立优质教育资源共建共享环境,实现资源(如电子教案、专家讲座、精品课程、电子图书、党建思政、各类活动资料等)。

  1. 如何应用

    让非结构化数据充分的加以整合利用,挖掘数据背后的价值,让优质的校园数据资产不在沉默,为校园师生教育、教学提供优质的、开放的资源共享平台。

1.2 业务需求

    非结构化数据管理平台可以作为用户内容资源存储、管理、共享、应用的基础平台,通过对非结构化数据的抽象、描述、分类、管理、分析、挖掘、监控等,以实现学校所有内容资源的统一调配、集中管理、合理流通和一体化运作,实现内容资源整合共享,提高资源整合水平和利用能力为最终目的进行设计部署。

  1. 1、满足一线师生对资源的个性化需求

    需要为教师、学生提供个人资源管理、分类存储的功能;需要实现移动终端的访问,满足资源的应用不受时间和空间的限制。

  1. 2、部门级资源管理

    需要为学校二级学院和二级部门提供资源库管理平台,实现各部门场景级应用,如照片库、档案库、资料库、课程库等等,同时根据不同场景应用提供相应权限管理等功能。

  1. 3、全校公共资源的集中管理、分布应用

    整合学校各部门、院系的原有资源库系统,将实体数据及分类信息进行批量入库,实现校级资源的统一管理;可以实现多级管理的功能,可将不同院系的资源、管理及维护的权限下放到院系,这样教辅部门即可摆脱资源的建设任务,真正体现技术服务的特长。

  1. 4、校内统一搜索、校内资源搜索引擎

    连通各业务系统、数据源,实现结构化知识、非结构化知识、内部知识、外部知识的集中与统一,通过一站式统一搜索以挖掘数据价值。

  1. 5、提供非结构化数据中台,持续提供能力开放

    非结构化数据中台以数据架构为底座,以人工智能来驱动,打通数据孤岛,统一管理并处理、分析非结构化数据,让数据赋能业务,实现数字资产管理、内容自动化、知识运营、业务合规性管理。能够让业务产生的海量非结构化数据也能够得到有效利用。

  1. 6、提供标准化服务接口,为全校一体化服务平台提供支撑服务

    对接学校业务系统,通过API方式将业务系统数据采集,实现资源集中管理、分布应用的同时,业务系统通过微服务流程引擎,重构服务应用;提供消息类、文件类、知识类及每日资讯检索查询。

 

1.3 数据洞察

    非结构化数据洞察可以提供更广泛的业务价值实现。首先,需要获得大数据集的海量数据支撑;其次,关注技术实现细节,如:知识图谱、文件关联图谱、主题图谱、自然语言处理和人工智能引擎等方面的应用;然后,通过智能关联、智能推荐、智能搜索、智能识别、智能分类、智能问答、智能定密等多种应用,提供基于文本、单据、物体和人脸等为主体的多种应用场景,获得多种形态下的数据洞察;最后,将洞察能力与业务场景进行结合,发挥洞察创新,从而通过数据洞察实现业务价值转化的目标。

非结构化数据洞察能力主要包括以下几方面:

  1. (1)智能搜索

    基于自然语言处理、机器学习技术,结合点击反馈模型等搜索排序算法,利用大规模分布式索引与算法模型的计算与分发,构建强大的知识内容搜索引擎。同时整合人工智能能力和自然语言处理技术;结合识别分类转化、聚类回归分析算法、机器学习、用户画像、文本图像、深度学习等进一步提升能力。

  1. (2)智能推荐

    智能推荐可以基于用户属性、用户行为、业务场景进行分析,通过大数据技术,整合奇异值分解、支持向量机等尖端算法,构建数据挖掘系统,为用户主动推荐其感兴趣或与当前工作相关的知识内容,同时也可以激活整个知识库,发挥长尾效应。

  1. (3)知识图谱

    通过构建大规模语义网络,通过发掘实体之间的关联,将数据整合,帮助机器理解数据、解释现象、知识推理,从而发掘深层关系、最终实现智能交互。

  1. (4)数据分析与挖掘预测

    非结构化数据系统可以基于数据挖掘,可视化地展现数据分析成果,提供数据预测能力。

 

二.建设目标

2.1 总体架构设计

    非结构化数据中台提供基于全生命周期的数据采集、存储、保护、管理、使用、交换和归档。实现对非结构化数据的抽象、描述、分类、管理、分析、挖掘、监控等应用。

    平台具有数据采集、存储、治理、服务、应用、洞察和安全等全方面的能力支撑,具体如下:

  1. 2.1.1数据采集

    平台根据内容数据的不同存储方式,可通过不同采集方式实现数据采集;数据采集方式主要包括用户手动上传、端点自动同步采集、API 集成采集、数据爬虫等多种采集手段。

  1. 2.1.2数据存储

    非结构化数据的集中存储,基于统一的分布式对象存储方式,具备海量数据存储、高性能读写、加密存储、多副本存储、便捷的水平扩展、冷热数据分离、全类型存储接口支持等特征。

  1. 2.1.3数据管理

    数据管理包括对元数据提取、数据编目、数据标签体系、数据安全、数据流转、权限体系模型、分类模型等,提供完整的数据内容总览。

  1. 2.1.4数据应用

    提供包括师生个人数据管理、部门级资源库、校级统一资源共享、校内统一检索百度及非结构化能力开放等各种非结构化数据应用场景。

  1. 2.1.5数据洞察

    数据洞察的核心驱动是基于人工智能技术实现的非结构化数据价值应用。通过智能关联、智能推荐、智能搜索、智能识别、智能分类、智能问答、智能定密等多种应用,提供基于文本、单据、物体和人脸等为主体的多种应用场景,获得多种形态下的数据洞察;将内容深层的逻辑关系进行梳理和呈现,从而实现对非结构化数据的全面洞察。

  1. 2.1.6数据安全

    提供访问安全、内容安全等服务。其中访问安全包括权限模板、访问权限、水印、共享范围、密级权限验证等;内容安全包括敏感词、病毒扫描、智能定密、安全域、文控流程等安全能力模块。

 

2.2 中台能力设计

  1. 2.2.1数据采集能力

    提供多种数据归集方式,实现非结构化数据的全量归集。

    可以将资料(如视频、文稿、照片、音频等各种资料)上传到管理平台中,进行集中分类保存管理,其整个平台非常简洁,直观、方便、易用。上传文件(多种上传方式如WEB,PC客户端程序):

提供PC 客户端、WEB端、移动端(Andriod、IOS、企业微信)、数据库端、第三方系统API和云端六种采集能力。可以通过部署大量的数据收集器和后台多节点数据并发写入的能力来处理百万级别用户的并发数据收集,这些数据可能来自电脑、手机、平板或者各种专用设备。

 

    数据采集都可以自动指定目录及文件类型,可以实时或定时将需要的数据类型自动抓取到统一内容管理平台内;WEB 端的数据收集则由人工实现,自己选择上传的数据或指定的目录,数据一次性批量上传;

  1. 2.2.2数据存储能力

    对象存储空间访问对象只通过一个唯一的OID标识即可,不需要复杂的路径结构,没有“路径”他“文件夹”的概念,数据没有路径的层级限制和束缚,扩展和性能也就变得非常容易,且灵活性大大增强,数据可以根据业务系统可以任意划分,建立多重数据视图,如个人目录、公共目录、讨论组、时空化地图、皆是对个人以及公共资源的一种逻辑展示。

  1. 2.2.3数据管理能力

    提供非结构化数据的全生命周期管理,数据进行一系列的加工处理过程,包括数据归档、数据分类、数据转码、NLP分析、OCR识别、人像提取、场景提取、图谱关联等。

 

    实现信息采集,信息处理,信息检索功能;结合分布式对象存储的无限属性的特性,可以灵活的实现非结构化数据的高维检索、复杂条件检索、模糊搜索、范围搜索、gps搜索等功能,并且独具特色的高级语言学处理(同义词、拼音搜索、去除无用词、歧义纠正、词库学习等)、智能化搜索(智能纠错、下拉提示、个性化搜索等)、搜索结果分类、检索摘要等功能为用户提供体验更好、相关性和准确度更高的结果。

          

  1. 统计

    总览模块是以图表方式展示系统内文件概况的一个地方,用户可以在此模块查看整个资源库的上传文件的数量、类型、分布状况,以及整个空间的使用情况与最新动态等。

        

  1. All-Media IPS关键技术——数据转换与处理

    All-Media IPS产品内置的转码引擎,可采用分布式的编解码处理转码、实现对视频、音频及文档的转码,其支持文件编解码格式高达327种,29种图片格式/170种视频格式/47种音频格式/23种字幕格式/22种网络流媒体格式/6种时码格式/30种文档格式,按照任务调度的方式来执行,同一时间有多个任务需要转码时系统会按照优先级顺序进行排队处理。

    通过强大的内置数据编解码能力,可以对数据进行批量的处理和使用,减少转码周期,降低应用成本。同时,数据转码还提供了文本建立全文索引、关键帧提取、视频拼接、版权水印、音视频分离、字幕合成、序列帧合成、旋转、截取、快照、在线编辑等多种服务,进一步让数据处理变得更为简单。

    All-Media IPS还可以支持通过第三方的接入实现音频转文本、OCR识别、特征提取(性别/年龄/表情)、相似度检测和场景识别。

  1. All-Media IPS关键技术—人工智能引擎

    在All-Media IPS中,我们大量运用了人脸识别、自然语言处理、知识图谱技术,用于分析非结构化数据的价值。

    基于NLP自然语言处理中的分词技术,提取文件标题中的关键词,并且对关键词的词性做判断,识别出其中的人名、地名、机构等,这些内容被用于知识图谱的构建。

基于知识图谱构建技术,我们建立文件关键词、用户、标签三者的概念、实体、属性模型,通过知识图谱可视化技术,展示知识图谱中用户和文件的潜在关联;用户可以在图谱中发现自己关心的核心内容是什么,以及进一步发现这些核心内容涉及到哪些文件;通过图谱关联技术,以文件关键词为核心载体,发现用户和用户有共同的关注点,可以通过其他用户的关注点来找寻自己所需要的文件; 当用户通过图谱搜索搜索文件关键词,底层基于知识图谱推理技术,搜索词结合图谱内的实体、概念、属性,做进一步的解析,最终给出用户最有可能关注的内容组成新的搜索词,帮助用户快速找到需要的文件。

    基于人脸识别技术打造的人物搜索功能,底层核心技术采用深度学习人脸识别模型InsightFace进行深度优化,MegaFace 人脸识别大赛达到惊人的98%精确度,结合Redis缓存和Elasticsearch分布式高性能搜索引擎,提供了高性能的检索,在几十万张人脸下,依然保障毫秒级到秒级的检索效率。

 

  1. 2.2.4校园应用场景

  2.     持续汇聚、存储和沉淀全校非结构化数据和数字资源
  3.     建立非结构化数据治理、管理、统一服务体系
  4.     支撑智慧校园建设,为校园应用和网办服务提供数据仓库
  5.     为职能部门及学院提供平台,解决部门资源管理需求
  6.     为师生提供智能化和个性化资源检索和知识服务

 

  1. 2.2.5数据安全能力

  2. 用户管理

    用户组:可新建或删除用户组,移动用户到用户组,设置某个用户为该组管理员;

    添加用户:由管理员进行用户添加,默认需要添加用户登录名(字母数字组成),登录名为唯一标识符,不可重复;

    用户列表:显示系统当前所有的用户信息,可修改用户昵称,删除、禁用、解禁用户;

    用户对接:对接统一身份认证系统;

    用户搜索:可通过用户名、昵称搜索用户;

    密码重置:如果某个用户的密码忘记了,可由管理员把密码重置为默认密码;

    用户导入导出:支持导入或导出Excel、csv的用户信息;

    权限设置:当前门户的管理员可以设置其他用户为该门户的管理员;

  1.  用户权限管理

    用户管理:支持对用户进行分组管理、部门结构设置,可新增、修改、删除、禁用用户;

    用户搜索:可通过用户名、昵称搜索用户;

    密码重置:如果某个用户的密码忘记了,可由管理员把密码重置为默认密码;

    用户对接:对接统一身份认证系统;

    用户导入导出:支持导入或导出Excel、csv的用户信息;

    角色管理:包含系统默认角色(系统管理员、后台用户、门户用户),也可自定义角色;

    管理范围:配置用户管理时可选择管理范围,具体到用户组;

    资源库角色配置:默认包含(库管理员、库成员、访客),可自定义资源库的角色,角色也可自定义操作配置。

  1. 系统设置

    系统信息修改:修改产品的名称、公司名称、logo、封面图片;

    上传设置:系统可设置是否自动转码,以及配置转码的清晰度(标准、高清、超清);

    审核开关:开启后,用户可以直接将文件上传到资源库,默认为关闭状态,普通用户上传文件后需要管理员审批;

    日志:记录所有用户的操作记录,可按时间/用户筛选;可将日志导出为Excel格式;

    密码修改:提供正确的当前密码后,修改为新密码;

    消息通知:文件被审批通过、文件被解禁、禁用、彻底删除时发消息通知我;

    账户信息修改:可修改账户头像、用户名、简介;

  1. 安全中心--内容安全

    所有进入公共资源和资源库的数据都会通过AI系统对其进行审核,保证涉黄、涉恐、涉政和自定义屏蔽的文件内容不会再系统内出现。用户可以通过风险类型和文件类型两种筛选方式对系统检测结果文件进行查看。拥有「智能审核」权限角色的用户可审核AI处理过后的违规文件。

    在文件预览或选中多个文件后点击【禁用】,选填禁用理由后,即可对风险文件进行禁用处理。禁用后的文件将不可进行预览、分享、下载等操作。

    对系统误判的风险文件,或管理员误禁用的文件可以进行解禁操作,解禁后的文件将会恢复为普通文件,可见该文件的用户即可预览、分享、下载等。

对系统安全有威胁的文件可进行彻底删除操作,删除该文件后不会恢复。

    当文件被系统误判为风险文件,或管理员误禁用时,普通用户可以通过申诉让风险文件恢复为正常文件。

    具有智能审核管理权限的用户可以通过加入含有所需屏蔽自定义图像来对于含有目标的图片、视频进行审核。

    用户可点击【上传图片】在本地文件中上传想要屏蔽的目标图像。举例:系统中有该人物头像则在右侧枚举展示,展示出的头像可进行移除、屏蔽和名称编辑。若枚举人像数大于限制数,可点击【换一批】显示更多人像。

已屏蔽头像中的【查看待处理】会进入该人像的待处理区。

    用户还可对人像进行【解除屏蔽】和对人像名称进行【重命名】。

  1. 审核配置

    具有权限的用户可以在【审核开关】中选择是否开启AI自动审核审核,开启后会自动对系统的文件进行AI智能审核。

    具有权限的用户可以对于审核类型、审核力度、文件类型和自动禁用进行操作。用户可以选择三种审核力度,包含宽容(审核置信度高于90%将被视为违禁文件)、一般(审核置信度高于70%将被视为违禁文件)、严格(审核置信度高于50%将被视为违禁文件)。用户开启【自动禁用】重度风险文件将会被自动禁用,无法访问。

 

三. 非结构化数据管理应用场景

3.1 资源库应用

  1. 3.1.1 教师个人空间

    All-Media IPS为教师提供个人资源收藏、管理的功能。实现个人文件管理(上传、预览、搜索、收藏、分享、下载、发布),其整个平台非常简洁,直观、方便、易用。

可预览视频/音频/图片/文档类文件;可通过二维码/私密链接分享给他人;可将文件收藏至收藏夹;可删除文件至回收站;可修改个人信息等操作。用户在移动端进行的操作将与应用平台实时同步。

  1. 3.1.2 部门级资源库

    All-Media IPS为学校各学院和各职能部门提供资源库管理平台,实现各部门场景级应用,如照片库、档案库、资料库、课程库等等,同时根据不同场景应用提供相应权限管理等功能。

    提供开放给所有用户可以共同访问的资产中心,所有用户都可以将文件上传到该空间进行归档,但需经过管理员审核才可展示在资产库中。用户可在搜索中进行多条件多筛选搜索所有文件。提供丰富智能的数据管理方式。为保证数据安全,提供类似windows系统的回收站机制,确保误删数据能安全快速找回。搜索和智能图谱模块,皆在保证用户能快速准确的找到所需文件。用户可在搜索中进行多条件多筛选搜索所有文件。

  1. 3.1.3 资源库功能

    个人资源库:面向管理系统中的业务组及个人,提供面向业务/场景/功能分类的数据存储/管理/应用能力。

    公共资源库:面向管理系统中的任何角色,提供公共数据资源的集中展示,管理及应用。

 

    文件管理:新建文件夹、多文件上传、文件夹上传、下载、移动、删除、发布、复制、链接分享等功能;

    资源库管理:支持修改资源库封面、标签、属性(公开/私密)、成员权限等;

    分类查看:按照文件类型(图片、视频、文档等)进行分类查看管理;

    文件预览:支持word、ppt、pdf、图片、两百多种格式的视频进行在线预览;

    文件分享:支持文件公开/私密链接分享,生成分享二维码;

    我分享的:显示所有当前用户分享给他人的记录,并可以删除分享、修改分享的有效期、添加分享的密码;

    文件标签:给文件添加标签,并能按照标签进行搜索;

    按照用户统计:统计每个用户的文件数量、占用空间,按大小依次排列;

    文件类型统计:按照文件类型(图片、视频、音频、文档、其他)统计个数和占用的空间,按大小排列;

    编目管理:资源库用户的新建自己的模板,其他用户也能使用该用户新建的模板;

    模板修改:可修改模板名称、增删模板字段名称和类型;支持添加二级模板和子规则;支持编目模板合并

    文件编目:支持对资源库的文件进行编目;

    协同编目:支持多人协同编目

    内容审核:资源库管理员对所有进入资源库的文件进行内容审核,审核通过后进入编目和编目审核流程;

    权限设置:库管理员可审批权限范围内的资源库文件;

    流程控制:内容审核可以由管理员手动开启或关闭;

    快速审批:入库审批增加快速预览模式

    库标签:具有库标签管理权限的用户可在【资源库-创建资源库-库标签】和【数据中心-库标签】中设置库标签内容。对资源库设置库标签,可在上方【所有】点击相应的库标签内容中进行快速资源库定位。

    回收站:为了方便找回误删除的文件,All-Media IPS提供了【回收站】的功能,公共资源和资源库被删除的文件都将先放入回收站中。回收站中的文件,既可以恢复至删除前的位置,也可以由管理员彻底从系统删除。

 

3.2 校级资源共享门户

    整合学校各部门、院系的原有资源库系统,将实体数据及分类信息进行批量入库,实现教学资源的统一管理;可以实现多级管理的功能,可将不同院系的资源、管理及维护的权限下放到院系,这样教辅部门即可摆脱资源的建设任务,真正体现技术服务的特长。还能够与学校的业务系统对接,实现将多资源库统一管理、共享、发布。

  1. 3.2.1 资源门户应用

    资源门户为开放性的平台,登录后可查看其中的所有文件。可对文件进行预览、下载、收藏、分享等操作。门户的文件都来源于展示共享平台,文件在发布经过审核后,就会在门户中显示。门户中的栏目,可按文件的类型分类,如民族、流行、古典、器乐等。门户还提供所有文件的下载、浏览排行榜及基于文件内容和用户的文件推荐。在用户浏览时可基于用户信息和浏览的文件信息来推荐相关相似的文件,提高搜索文件的效率。

  1.  3.2.2 门户首页功能

    首先展示:显示logo、门户名称、用户信息,搜索框;

    轮播图:显示当前门户站点的重要资源,进行轮播展示;

    通知公告:显示当前门户站点的重要通知或公告;

    分类栏目:用户进行自定义添加栏目,如按照部门名称、院系划分,后期可手动修改;

    最新上传:显示最新上传到门户中的文件;

    浏览排行:按照浏览量显示高浏览量的文件排行;

    分类栏目文件:按照顺序显示所有二级栏目的最新文件;

    热门文件推荐:门户管理员手动指定热门文件,在明显位置显示;

 

  1. 3.2.3 门户搜索

 

    观看记录:显示当前用户的文件浏览历史纪录,按浏览时间排序,可在上次浏览的进度上继续观看

    个人信息:可修改个人头像、用户名、密码、简介等信息;

    收藏:记录和管理收藏的所有文件,并可进行二次分享;支持合集/课程的收藏

    热搜:显示门户中的热门搜索关键词;

    分享:使用连接或者二维码快速分享搜索到的文件给其他人;

    人像检索:提取图片/视频中的人像信息,搜索到所有包含此人像的图片和视频文件,准确率90%以上。

  1. 3.2.3 文件预览

    相关文件推荐:根据当前预览的文件,推荐个与之相关(文件名)的其他文件;

    文件下载:可下载当前预览文件(需要管理在后台设置开放下载);

    文件评论:登录的用户可对当前预览的文件进行评论互动;

    文件收藏:一键收藏当前预览的文件;

    大家都在看:推荐一些其他用户都在看的文件;

    文件上传者信息:显示当前预览文件的上传者基本信息,点击头像可跳转到他的个人主页;

    文件预览:可预览视频、文档、图片、音频等格式,其中视频预览时,可切换标清、高清、超清清晰度;

  1. 3.2.4 门户站点管理

    文件对接:对接其他业务系统的数据到门户中,用于后期发布;

    站点列表:列举所有门户站点,并可新建站点;

    模版切换:可根据不同的样式风格,切换门户模版;包含多媒体、党政和教育模板

    全部文件:查看所有上传到门户中的文件,并支持对接其他系统数据,可对文件进行增、删、改、查;

    热门文件:管理员指定哪些文件为门户的热门文件;

    设置轮播图:管理员可自己上传轮播图,也可使用系统自带的图片,做为文件的轮播图;

    设置通知公告:管理员可管理门户的通知公告,支持增、删、改;

    门户基本信息设置:可修改门户名称、logo、管理员;

    自定义:可自定义站点页脚模块

    二维码访问:可扫描二维码访问对应站点手机端的H5页面

    评论回复:可针对门户内容进行评论及回复

    文件拖拽:支持栏目拖拽、合集/课程中文件拖拽

    审批:门户管理员审核其他非管理员用户发布的文件、管理员自己发布的文件无需审核;

    发布文件管理:可修改已发布的文件状态和删除已发布文件;

  1. 3.2.5 客户端

    系统资产库提供Windows/Mac端,可让用户绑定自己的本地目录,随时同步本地目录至资产中心中。同时兼容iOS与安卓客户端以及移动Web,可随时随地预览、下载、分享文件。

 

3.3 校园统一资源检索中心建设

    All-Media IPS建设校园统一资源检索中心(类似“百度搜索”),满足在校师生对教学及相关数据的检索应用能力。其需要提供关键字检索能力、全文检索能力、图片检索能力、视频检索能力、文档检索能力及音频检索能力。同时嵌入大数据分析能力,可支持图谱关系检索、地图检索等功能。

  1. 3.3.1 关键词全文检索功能

    用户可以通过关键词匹配文件名称、上传者用户名、编目内容信息、OCR识别文字,从而查找自己所需的文件。还支持更细粒度的全文检索到包含关键字的文件、选择使用分词搜索的模糊搜索的方式来匹配单个词的关键词、通过OCR识别图片中的文件来查找到所需的文件。

  1. 3.3.2 人像检索功能

    上传人像图片后,在数据库中查找与上传图片相似的所有图片和相关人像的视频,按照相似度排序。

    相关人像里包含与搜索人像有关联的其他人像图片和视频,即:与搜索的人像图片有关系的其他人物图片。例如:当前搜索的人物为A,则相关人像是与A合照过的其他人像。点击头像缩略图,即可搜索对应人像。

3.4 丰富的扩展应用

    All-Media IPS为学校提供各种媒体资源融合应用场景和功能,方便学校快捷有效的利用平台部署各种教育教学应用场景。

  1. 3.4.1 录播课直播汇聚中心

 

    All-Media IPS提供丰富系统实现与学校各录播教室系统进行对接融合,可以支持录播系统将信号以RTMP协议推送至发布平台,也支持从物理视频信号通过编码器进行采集。将各录播教室系统实时课程在线直播到多教学区域,供多类型访问终端,建立校园综合在线听课、评课资源中心。也可以将精品课堂录制下来的课程文件上传至平台,作为精品课件归档、学习。

  1. 3.4.2 校园网络电视台

    All-Media IPS集合了视频点播、视频直播、时移直播、录播技术,将有线电视、卫星电视节目、无人机、演播室设备、摄像机、手机等各种信号源编转到校园IP网络上,满足校园网络内部对电视节目观看的需要,完善和提升校园网络电视节目视音频采集编辑、电视信号采集、编目检索、直播点播、互动评论、内容发布、内容管理、资源调度、用户管理、版权保护等应用功能和服务质量。

    All-Media IPS支持学校精选多套公共有线电视节目或学校宣传部、团委演播室的编播节目(如中央1套、5套或本省、市重点台套)在学校内部网络的播出;亦可同步录制采集选定的电视频道内容,编建学校内部微型IPTV平台。在授权的时间、范围内方便学校领导、职员及时了解国家时政、国际时事、体育科教、本校要闻等电视频道相关内容。

  1. 3.4.3 校园会议、文体活动直播

 

 

【图:直播活动示意】

【图:直播活动预告】

 

  1. 讲座、报告会过程直播、录制

    All-Media IPS以重点会议室、报告厅为学校位重要会议、学术讲座实时直播发布点,将学校重要会议、学术讲座、来访学术报告等实况内容在学校全网直播。相关现场活动实况可以有效突破时间、地点和终端覆盖的局限性,通过多终端发布传达到网络所及的学校教学楼、食堂、礼堂、宿舍等各个网络通达的环境。

根据讲授方式的不同平台提供单画面、多画面的同步直播,既可采集讲义电脑屏幕画面,又可以采集现场摄像机视频,并可以根据需要将两者在学员统一播放窗口呈现,学员可根据自身远程听看需要,任意调整各视频窗口位置、画中画、窗口大小等设置。可以同步录制成多画面课件文件存储到资源服务器,形成课件资源,供后续在线学习、访问。

  1. 文体活动现场的直播、录制

      

    All-Media IPS配套设备可以安置在汇演现场、运动场馆等环境,实时提供现场的音、视频图像的直播发布,为不在现场的用户提供实时的在线观看,身临其境;同时利用系统自带的时移功能,对错过的部分直播内容或精彩画面进行实时在线回顾浏览,无需等待直播结束再去翻看录像。系统支持大量并发用户的同时在线访问,支持分布式活动的现场直播,直播地点可以在网络所及的任何地方。

  1. 构建校园网上安全监管中心

    All-Media IPS可接入校园部分重点区域(食堂、操场、文体活动中心等)的监控视频信号,便于学校领导、教管部们随时随地通过普通PC或移动终端设备查看重点区域的教学、课外活动实时图像。

    平台全面支持720p/1080P高清直播信号,支持时移监看,播放流畅,不掉帧、无色快、无拖影现象;用户在直播过程中因为其他工作影响而未能看到现场实况,在系统所能提供时移监看时间段内,用户可实时进行节目回看,播放用户可以根据时间段切换,可以进行暂停、拖拽和返回直播等操作。

平台支持7天时移监看,当接到消费者投诉,监管人员可第一时间在手机、办公室电脑上回看7天内的时移画面,无需人员到达现场就可以在远端精确定位事件发生的原因。

移动端监管

    平台支持包含手机、平板电脑等移动设备,更加直接的让广大师生和相关部门能够实时查看监控现场的实时画面。当现场发生紧急事件,监管领导不在校内,可通过手机端观看现场直播画面,实时了解事件发展态势,也可视频回看,精准定位事件发生的原因,确定责任人,高效方便的处置,避免事态升级。

 

四.应用价值

4.1 产品价值

    All-Media IPS非结构化数据管理平台以智慧校园建设框架标准为基础,采用先进的、主流的云平台架构设计,结合学校非结构化数据统一管理模式,引入校园大数据分析技术、将AI人工智能技术,平台将建成一个先进的、完善的、可扩展的,面向开放架构的数据管理平台。

    All-Media IPS数据智能管理平台是以管理员或运维人员的视角来审核、管理所有的归档文件,支持发布文件到资源门户供普通用户使用,并提供多种检索手段。系统可自动审核违规文件,并结合AI的技术实现图片、视频、文档的智能分类。

    All-Media IPS可以作为用户内容资源存储、管理、再利用的基础平台。在资产管理再利用的业务需求的基础上,以实现单位内所有内容资源的统一调配、集中管理、合理流通和一体化运作,实现内容资源整合共享,提高资源整合水平和利用能力为最终目的进行设计部署。

 

4.2 产品优势

4.2.1 微服务架构

    All-Media IPS摒弃传统的整体式架构,使用微服务架构,使应用开发系统微服务可以在“自己的程序”中运行,并通过“轻量级设备与HTTP型API进行沟通”。通过Docker容器平台,我们就可以将服务公开与微服务架构区分开来。在微服务架构中,只需要在特定的某种服务中增加所需功能,而不影响整体进程,具有高伸缩性和松耦合度的特点。

    1.独立部署:基于微服务架构,只需要对需要进行特性变化或者关键bug修复的那个服务进行更新和部署,不会影响其它服务。当对一个服务的修改需要进行回滚,它能够在不影响生产环境中其他服务的情况下完成。这使得让大型应用保持敏捷,并且能够更快和更频繁的进行部署与更新。

    2.独立扩展:微服务架构能够提供使每一个服务根据需要进行扩展的能力,并且将服务部署到用户的资源要求更加匹配的实例。如果订单服务根据需要进行扩展,微服务架构能够在不需要对应用的其他组件服务进行扩展的情况下实现。如果配置服务需要更多的内存,只需要简单的将它部署到内存更多的实例上即可。

    3.不同的技术堆栈和冲突的依赖性:使用微服务架构的应用是由独立的服务组成的,这些服务可以使用不同框架、不同版本的库,甚至完全不同的操作系统平台。所以开发人员可以选择最合适的技术来实现功能特性,避免功能特性和库之间技术堆栈版本的冲突。

4.2.2 全局分布式处理

    对于一体化的设备,如果只是单机的一体化,一定会遇到规模的瓶颈,随着业务规模的扩大,数据和使用者的增加,我们需要在计算能力、存储空间、访问带宽和并发能力上进行全面的扩展。All-Media IPS支持这样的扩展,这种扩展是线性的、不停应用的方式。从三个All-Media IPS到数十个All-Media IPS,用户仅需将多个All-Media IPS加入到集群中,系统会自动全局分配计算、存储、转码、带宽和处理资源。

    从10TB级别到10PB级别规模,从数百并发用户到百万级别的并发,用户只需根据需要,横向扩展All-Media IPS数量即可。利用其支持的全局分布式处理能力,不仅仅是扩展的存储规模和并发能力,还将这种分布式处理能力体现在所有应用的分布式上,上传下载、转码、检索等等,无一不是分布式处理方式。

4.2.3 高扩展的应用平台

    大量的数据通过业务系统和生产系统产生并自动化的被收集到All-Media IPS统一数据管理平台中来,通过统一的方式将视频、图片、音频、文档和其他类型文件分类、管理,再利用数据挖掘对索引的信息进一步的挖掘。All-Media IPS已经实现了很多基于通用数据标准的索引,基于这些索引,可以为用户提供各种维度的数据报表,包括用户行为分析、数据状态分析、存储价值分析等,这些分析报表可以帮助我们进行必要的正确决策。All-Media IPS也记录下来了各种用户行为和内容识别的结果,这些信息有助于进行数据推送,自动将数据Push到用户端使用。

    同时数据中心可对接多种业务系统数据,做到统一管理、统一处理、统一检索。提供丰富的数据对接工具,如:Windows数据同步客户端、Web浏览器文件上传、Mac同步客户端,Linux数据同步客户端。并提供标准的数据交互API与其它业务系统整合,实现灵活的数据导入与导出,挖掘出更多有价值的数据分析。All-Media IPS的应用场景就是在用户正常数据应用中,大浪淘沙,提供更多有价值的数据分析。

4.2.4 多平台全流程

    用户可以将自已的资料(如视频、文稿、照片、音频等各种资料)上传到ALL-MEDIA IPS数据智能管理平台中,进行集中分类保存管理,其整个平台非常简洁,直观、方便、易用。

    All-Media IPS提供了PC 客户端、WEB端、移动端(Andriod、iOS)、数据库端和云端五种收集能力。可以通过部署大量的数据收集器和后台多节点数据并发写入的能力来处理百万级别用户的并发数据收集,这些数据可能来自电脑、手机、平板或者各种专用设备。

    数据收集都可以自动指定目录及文件类型,可以实时或定时将需要的数据类型自动抓取到All-Media IPS平台内;WEB 端的数据收集则由人工实现,自己选择上传的数据或指定的目录,数据一次性批量上传。

解决方案

SOLUTION