北京智慧眼科技股份有限公司

一、企业简介

图片9.jpg

拓尔思是一家技术驱动型企业,历经二十余年的深耕和积累,在中文检索、自然语言处理等领域始终处于行业前沿,公司2011年在深交所创业板上市,股票代码300229,是第一家在A股上市的大数据技术企业。拓尔思以大数据+人工智能为发展战略,旨在帮助客户实现从数据洞察到智慧决策的飞跃。

拓尔思的核心业务包括软件产品研发,行业应用解决方案和数据分析挖掘云服务三大板块,涉及大数据管理、信息安全、互联网营销和人工智能等应用方向。

拓尔思是自主可靠软件产品领域的领军企业,TRS中文全文检索系统、WCM内容管理平台、CKM中文文本挖掘等软件均为国内相关领域自主创新的领先产品。同时拓尔思不断拓宽产品线和综合服务能力,为政府、媒体、安全、金融等多个行业提供领先的产品、技术和解决方案。为了迎接云计算时代的来临,公司近年来加快了基于云服务的数据分析和知识服务的发展步伐,旨在实现软件企业的战略转型和升级。

拓尔思采用内生增长和外延扩张双轮驱动战略,全国设立20多个分支机构。自上市以来,相继出资设立或参股5支产业投资基金,兼并和控股5家行业公司,投资参股10多家高速成长的新兴公司,累计投资额约10亿元,实现了产业和资本的深度融合,构建起强强联合互惠互利的合作生态系统。公司TRS系列产品已经被国内外超过5000家高端企业级用户采用。

二、技术和产品介绍

1. TRS海贝大数据管理平台TRS Hybase 

TRS海贝大数据管理系统是一款基于弹性扩展架构的海量数据存储和检索系统,定位为企业级NoSQL、企业级检索平台和大数据管理集成平台。其设计目标是数据库方式的管理便捷性,搜索引擎模式的卓越体验,实现大数据存储、管理和检索的高度一体化,提供企业级应用的可靠性、安全性和易用性,满足多源异构数据仓库“非结构化数据的结构化处理、结构化数据的非结构化处理”的技术趋势。技术实现上,融合检索引擎(全文检索)、多引擎机制、分布式并行计算、索引分片、多副本机制、对等节点机制(去中心化)、新型列数据库存储机制、自然语言处理、Hadoop/HDFS等先进技术,设计新型的非结构化大数据管理系统,为各类非结构化大数据分析应用提供非结构化大数据高效管理和智能检索的平台支撑。

2. 大数据智能分析平台(TRS CKM

TRS 文本挖掘软件的主要功能包括:(1)接口层面:为中文文本挖掘应用提供强有力的开发接口;(2)工具层面:作为面向各种数据源(关系数据库、TRS 数据库、文件系统)的加工工具,为政府和企事业单位的海量文本数据提供专业的信息加工与挖掘功能。

TRS 文本挖掘软件集成了北京拓尔思信息技术股份有限公司(简称TRS 公司)推出的多项文本挖掘和中文信息处理技术,包括的构件有:文本分类、文本摘要、文本相似性检索、文本信息抽取、拼音检索、相关短语检索、文本聚类、(政治)常识校对、数据比对、高速串匹配等。

3. TRS DL-CKM基于深度学习的自然语言处理引擎

近年来,随着大数据、机器学习、人工智能的发展,特别是深度学习技术的应用,正在让自然语言处理技术取得新的突破,TRS DL-CKM就是一套基于深度学习和大数据技术的自然语言处理技术。

TRS DL-CKM,即TRS深度文本挖掘软件是基于深度神经网络技术的新一代文本挖掘软件继承了开源深度圣经网络框架TensorFlow通过新计算模型与行业大数据的结合,优化文本的智能分析水平,提升文本挖掘产品的市场竞争力。

TRS DL-CKM为海量非结构化资源提供智能加工工具,提高了信息资源的加工效率;为内容安全管理降低了监管成本,提高了监管效率;同时,还为单位内外部信息资源管理、情报和知识管理等提供现金的智能文本挖掘技术。目前提供相关产品及服务有:小思智能问答机器人、智能比对/校对服务、智能分析服务、智能协作服务、智能检索推荐及知识图谱构建等。已成功应用于新华社、人民日报、外交部、国家知识产权局、公安部等数百家单位,大大提高了各个行业的智能化水平。

4. TRS水晶分布式数据库系统(MPP

TRS水晶分布式数据库系统是新一代的、融合了AI的技术的大规模并行处理数据库(即MPP DB,简称MPP),具有强大的功能和性能,可以对PB量级的数据进行快速分析,是个强大的OLAP分析性数据仓库,用于解决大数据和人工智能时代的数据分析和决策。

从技术角度阐述,TRS水晶分布式数据库是个无共享大规模并行数据库,是第三代数据库产品。TRS水晶分布式数据库可扩展到上千个节点,每个节点管理所属的一部分数据。系统可以自动将数据分发到各个节点,并且查询也自动在各个节点并行运行。各个节点根据查询自动交换数据,并行处理,最优化的利用硬件资源,达到最高性能。TRS水晶分布式数据库的性能是Greenplum26倍,是业界MPP DB产品中的佼佼者。


三.核心技术

拓尔思目前已具备大数据整合、大数据管理和检索、数据挖掘、数据采集、数据可视化等领域的全方位核心技术,并拥有完全的自主知识产权。

1.海量文档分布式检索排重系统和方法(201210256159.0

2.基于脚本引擎的微博用户关系采集方法(201210114869.X

3.基于网页结构的信息动态采集更新调度方法(201210428272.2

4.一种高效的倒排索引结构及组织方法(201210511478.1

5.基于SIFT特征的海量图像实时检索方法(201310346542.X

6.互联网热词挖掘方法及装置(201310607937.0

7.基于OSGIETL处理装置及方法(201310607368.X

8.一种可视化的网站建设系统及方法(201310723625.6

9.一种音视频在线虚拟剪辑方法和系统(201410563990.X

10.文档图像识别方法(201410563687.X

11.一种基于通知的跨域单点登录方法及系统(201410563541.5

12.一种利用计算机自动评价科技文献新颖性的方法(201510696274.3

13.一种自助式查新方法及系统(201510696381.6

14.标题生成方法和装置(201710262158.X

15.视频关键位置定位方法和装置(201710271432.X

16.问答知识库的生成方法、神经网络的训练方法以及设备(201710295530.7

17.一种ETL作业的监控方法和系统(201710370462.6

18.一种数据处理方法和系统(201710285832.6

19.一种文本数据的聚类方法、装置和系统(201710307520.0

以上核心技术已全部取得或申请受理的专利技术使各项产品和技术能基于成熟的关键技术基础上拓展面向不同领域的军事应用,保障了各类信息系统的可靠性和自主可控性

四. 应用领域

1. 情报侦察监视

可提供面向互联网的大数据情报侦察、采集与智能分析。主要面向网络空间作战、航天侦察和指挥控制情报收集等领域,提供、实现针对开源数据的情报侦察,结合内部数据,针对特定范围的数据采集和筛选、分析等能力,具体包括智能情报监测、特定目标的动态轨迹、关联关系、异常行动发现、侦测信息采集与处理等。

2. 智能目标识别与态势生成

可实现对实时侦察采集到的、或者通过网络传输获取的实时目标的可见光影像(照片等)进行模式识别,包括判别武器装备的军用/民用类别、大型武器装备平台的型号、战场环境地形地貌,针对大场景下的战场环境侦察影像,自动识别发现特定固定目标等。

3. 大数据分析挖掘与应用

可以针对不同的军事应用需求,对拥有的各类大数据资源进行深度挖掘分析,主要包括针对武器装备、作战目标、战场环境的分析挖掘;针对重点人员、热点区域或热点事件的关联分析;针对涉军舆情的跟踪与趋势分析;针对军事法规、条令条例、战史战例等各种文件文档等非结构化信息的自动摘要、主题抽取、元数据抽取、实体挖掘等分析;对国际战略格局、国家周边动态、国际国内经济、工业、农业、科技、人口等各类大数据的综合分析。

4. 数据采集与共享

可实现对各类内部业务数据采集和整合,对国防相关领域网站和移动端、微博、微信公众号等信息源的数据采集,获取军队政治宣传反馈、涉华新闻、涉军舆情、国内外主要智库的重要文章、视频等数据的采集和共享,从而建立大数据资源目录数据平台。

5. 大数据安全反恐

用于辅助国家安全、反恐维稳等相关部门,对获取到的情报进行智能分析,分析,描绘反恐活动的时间、空间、人物、事件/行动等多种维度的内在关联与变化趋势。主要包括:获取国际反恐最新趋势动态和相关情报;实时掌控反恐态势和异动;对反恐战例、案例、演习大数据进行高效管理和深度挖掘等。

6. 装备维修与保障

对装备零配件制造商的相关信息,装备维修保障配件原材料的国际市场价格波动进行跟踪,提前预算并科学决策维修保障费用;对装备维修和保障过程中的各种客观表单数据、维修后的反馈跟踪数据进行采集和分析,实现精细化、智能化维修与保障。

五. 应用案例

1. 开源情报大数据分析平台

互联网是一个实时动态更新的信息资源巨系统,源源不断地提供着各种有用的信息情报。这些情报具有多源、异构、实时、海量等特征,是典型的大数据。传统的情报分析方法,无论是在处理效率上还是分析维度上,处理能力都无法满足对大数据的情报分析的多维、全息、高效、可靠等要求。

开源情报大数据分析平台针对从互联网上获取的各类纷繁复杂的开源情报信息,例如网站、论坛、微博、微信公众号等发布的半结构化和非结构化信息,基于自然语言处理进行文本数据深度挖掘与分析,可实现对海量开源情报的元数据提取与结构解析,实体对象识别、提取与甄别、比对,面向情报内容的分类分析、关联分析、聚类分析,图形图像提取与比对等;可实现对海量开源情报内容及其关系的多维度可视化展现与辅助决策分析。

2. 基于人工智能的图像处理和舰船目标识别项目

随着社会经济的发展,海上交通日益繁忙,能否准确识别舰船、准确跟踪舰船目标,在实现精确制导、海上交通管理、反恐、搜救等军事和民用领域具有重要的意义。我国作为传统的海洋大国,三面环海,管辖海域超过300万平方公里,海洋资源十分丰富。但是近年来,某些国家和地区的非法船只不断侵入我国海洋专属经济区进行非法活动,尤其是非法捕捞、非法资源勘探及开采,并经常与我方船只人员发生冲突,严重影响我国海域安全。因此,海洋资源的开发与保护已经上升到国家战略地位,与我国领土安全紧密相连。舰船作为主要的运输载体,在海洋活动和军事领域上占据举足轻重的地位。通过对舰船目标的识别和分类侦测,对于确保舰船的检测、识别,提取船只类型和航向等参数,第一手掌握情报资料、海上的军事主动权以及遇见军事情况第一时间采取军事措施起着至关重要的作用。

本项目开展基于深度卷积神经网络的舰船目标图像特征提取和分类识别人工智能的研究,研发基于大数据和云计算技术的TB/PB数量级舰船目标图像和特征数据的存取计算方法,并开发基于深度卷积神经网络框架的分布式舰船目标图像特征提取和分类识别框架,提升舰船目标识别能力和准确性,满足舰船目标视频规定帧图像的特征提取和分类识别的实时需求。

3. 大数据资源目录整合与共享平台

当前各级单位或部门已积累大量信息资源,但由于网络不互通、数据不匹配、信息难共享、系统不兼容,导致仍然存在资源建设分散、信息多源异构、有效服务手段缺乏等问题,各部门信息资源底数难以掌握,各类数据库数据难以集成,各类文档资料分布零散缺乏整合,严重制约了数据资源集中统筹、信息高效管理和数据共享共用。

该平台主要围绕信息资源组织运用矛盾问题研制,依托大数据技术,构建资源目录服务体系,优化信息资源组织运用模式,实现信息资源的集中统管、集成共享、融合应用,建立新型高效的信息服务运行机制,为提升信息服务保障能力提供好用、管用、可持续运用的方法手段和平台支撑。

研制内容包括大数据资源库,集中存储、处理和管理海量多源异构数据的混合型数据库;大数据资源整合分布式方法、标准规范的建设、数据交换与共享体系、资源目录服务管理系统、最终实现资源平台的知识库、数据门户、基于GIS的数据可视化展现和智能关联检索服务。

4. 军事设施大数据智慧检索项目

利用信息化手段,强化军事设施的有效管理和保障,是后勤体系工作中重要的一环,但多年来仍存在数据共享难、联动难、审批难、标准统一难等问题,如何实现横向数据联动、全程动态监控的目标,可借助数据资源整合技术、数字营区业务统筹体系和智慧检索技术的综合应用,达到以信息化管理推动营房法治化建设,进一步提升营房综合保障能力,应用大数据、物联网、信息集成、分析运算等前沿技术提供可辅助决策、管控风险、制衡权力的多元优化数据支撑。系统提供实力、设施、人、机构、工程等不同主体的联想检索、数据聚合、自动组织、智能统计及排序的智慧检索应用。

5. 某涉军舆情大数据管控系统

近年来我国网民的规模越来越大,人们接触网络的渠道也越来越多,网络的使用超越了时间与空间的限制,微信、微博等新媒体平台逐渐成立网络舆情传播的中心,但与此同时,一些不良的涉军信息与舆论严重影响或干扰部队开展正常军事活动,产生了许多负面效应。因此,必须建立一整套舆情的监测、预警和管控机制,做到发现早,应对准备及时和事后效果评估。

某涉军舆情大数据管控系统采用最先进的主流大数据技术,构建适用于涉军舆情监测预警的相关模型和技术方法,实现对涉军舆情关键人物、关键事件、关键传播路径等的自动分析,从浩如烟海的数据信息中发现涉军舆情中隐藏的舆情关联信息。利用大数据挖掘技术、自然语言处理技术、文本情感分析技术等自动挖掘网上舆论所包含的观点、态度和立场,分析网络舆情发现、发展、变化的规律,实时监测舆情的发生发展进程,为涉军舆情未来的发展趋势做出及时、全面、准确的判断,为相关机构管控涉军舆情提供重要决策支撑。

6. 水晶球情报分析师平台

进入了信息爆炸的大数据时代信息来源五花八门特别是互联网信息资源的大海各行业领域都需要专业的分析师通过数据分析来解决问题和揭示数据背后的秘密,但大数据分析师往往会面临数据种类多、运行速度慢、缺少好用的工具、无协同作战等许多实际困难和问题,迫切需要好用的好用的大数据分析工具

水晶球情报分析师平台是一套国内领先的大数据分析师工具和集成平台,通过对接大数据资源库和零散情报数据整合实现面向目标的知识管理和检索发现可以实现知识检索、文本提取、关系分析和地图分析等分析的成果可以方便地分享和输出。借助该平台用户使用多种应用和数据交互。分析师可以搜索全部相关数据、可视化关系分析、探索知识和发现未知关系挖掘隐藏的数据同事间分享成果减少用户和数据间的障碍最大程度挖掘整个资源库的智慧和数据价值。

该平台工具可广泛应用于专业情报机构情报收集和分析研判、公共安全部门案件调查和情报研判政府部门专题分析和决策研究各类执法调查工作研究调查类机构信息收集和分析研究各类企业客户分析和竞争情报媒体行业的新闻专题研究和跟踪等。

联系方式

地址:北京市海淀区中关村软件园君正大厦4层

邮编:100094

联系人:王栋

电话:010-58251828

13811811516

传真:010-58251828-6003

邮箱:wangdong1@a-eye.cn

网址:http://www.a-eye.cn/