拓尔思:拓尔思的“海贝”是一款从内核到系统完全国产自研的搜索型数据库,是构建搜索引擎应用的核心支撑软件

2023-02-13 13:22:24 来源: 同花顺金融研究中心

  同花顺300033)金融研究中心2月13日讯,有投资者向拓尔思300229)提问, chatgpt运用的核心技术正是贵司深耕的NLP方向,贵司称要做语义智能领域的领导者,贵司是否有在贵司搜索引擎中引入NLP技术计划。甚至推出新的搜索引擎与百度三六零601360)一较高下,做搜索领域的洗牌。

  公司回答表示,尊敬的投资者:您好!拓尔思的“海贝”是一款从内核到系统完全国产自研的搜索型数据库,是构建搜索引擎应用的核心支撑软件。“海贝”早已融入了自研的NLP技术,如文本分词、自动分类、相似文本检索、拼音检索提示等,也集成了深度学习引擎,支持以文搜图、以图搜图、图文融合搜索,可以对图像中的文字进行OCR识别,也可以提取图像或者文本的特征数据,通过基因编码存储到海贝数据库里,成功实现图像相似性检索功能。根据服务对象、搜索场景、搜索内容以及商业模式的不同,搜索引擎分为互联网搜索引擎、垂直搜索引擎、企业级搜索引擎。互联网搜索引擎是从互联网提取各个网站的信息(以网页的文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。垂直搜索引擎适用于有明确搜索意图情况下进行检索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。这两种搜索引擎都是面向互联网To C的应用。企业级搜索引擎是To B或To G的,需要满足企业多样化的需求,特别是各种非结构化数据的搜索使用更是重中之重。而将搜索引擎技术与人工智能技术结合,对搜索结果进行智能整理与归类,并以精准化、智能化、个性化的方式将搜索结果呈现给用户是“海贝”的产品优势。互联网搜索和企业级搜索是两个完全不一样的应用场景,侧重的技术领域也不同。虽然两种类型的搜索引擎最终目标都是从庞大的知识库里取得用户需要的答案,但各自索引的内容差异化却非常大。互联网搜索引擎主要针对的对象是internet网站,也就是关注于存储和索引HTML网页(以及网页上的内容比如文字、图片、视频等),内容相对单一。而企业级搜索针对的目标是企业内部各个应用系统中的文本文件和各类业务数据,如内网新闻、工作资讯、工作报告、专题研报、项目文档、知识库、培训音视频等网页和各类文件,还有ERP系统、CRM系统、HR系统中的业务数据等。这些数据存储结构、文件格式和来源等各不相同,不同企业的内部数据千差万别。企业级搜索的核心是提高内部员工的知识共享与工作效率,因此,对索引数据治理的高效、灵活性以及智能化,还有检索结果返回的精准性、个性化和高响应速度提出了更高的要求。企业级搜索还非常注重检索权限和访问权限的问题,需要继承各个业务系统的原子权限,对安全性要求非常高。在这方面百度和360搜索一般无法做到。总体来说,百度和360搜索属于互联网搜索。拓尔思“海贝”搜索型数据库属于企业级搜索引擎。拓尔思搜索引擎产品和前两者在应用场景、搜索技术以及安全性要求等方面存在很大差异,不属于同一类产品,不存在可比性。拓尔思对标的是Elastic Search(ES)搜索引擎数据库。2023年,拓尔思“海贝”搜索型数据库也将与业界前沿技术发展保持同频,其发展路径为两个方向:一是开发融合了类ChatGPT技术的新一代企业搜索引擎服务,并在垂直行业广泛推广。二是大力推进ES数据库的国产替代。近几年来,ES数据泄露事件频发给国内各行业用户敲响了数据安全的警钟。未来几年,我国在加快推进数字化转型,搜索引擎数据库作为大数据支撑软件的重要性越发突显,其应用场景也越来越多,搜索型数据库的安全问题也越来越受国家重视。海贝作为一款纯国产自研的搜索引擎数据库,支持所有数据类型,功能完备,安全可靠,兼容ES常用接口,对接主流生态。纯国产自研的“海贝”具备足够媲美的产品力,拓尔思公司具有众多国家标杆项目成功经验以及本土化服务能力,完全可以平滑替代ES。今年公司将加速拓展不同行业的合作渠道,加大推进ES数据库国产替代的力度。感谢您对公司的关注,谢谢。

  点击进入互动平台 查看更多回复信息

关注同花顺财经(ths518),获取更多机会

0

+1
  • 浩丰科技
  • 天和防务
  • 科大国创
  • 吉大正元
  • 国盛金控
  • 格尔软件
  • 川大智胜
  • 奥维通信
  • 代码|股票名称 最新 涨跌幅