腾讯正式发布向量数据库,用于大模型训练

猎云网韩文静2023-07-05 10:55 大公司
向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

今日,腾讯云正式发布向量数据库Tencent Cloud VectorDB,预计8月上线腾讯云官网。

腾讯介绍道,该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

据了解,该数据库面向大模型训练,可以让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。


大模型的“黄金搭档”


什么是向量数据库?

向量数据库是一种专门用于存储、 管理、查询、检索向量的数据库,可以把复杂的非结构化数据通过向量化,处理统一成多维空间里的坐标值。

目前,向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

具体来看,向量数据库被广泛地用于大模型训练、推理和知识库补充等场景:支撑训练阶段海量数据的分类、去重和清洗,给大模型的训练降本增效;通过新数据的带入,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;提供一种私有数据连接大模型的方式,解决私有数据注入大模型带来的安全和隐私问题,加速大模型在产业落地。

简而言之,向量数据库可以解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。

据第三方调研数据预测,全球向量数据库到2030年预计将迎来超过500亿美元的市场。国内也将以每年超过20%的速度在增长。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超过一半的向量数据库具有云化部署的能力。


提供10亿级向量检索能力


据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。

具体而言,腾讯发布的向量数据库有以下特点。

一是高性能向量存储、检索。腾讯云向量数据库具备高性能的向量存储和检索能力,单索引能够轻松支持10亿级别的向量规模。在分布式弹性扩展的架构下,单实例可支持百万级别QPS,AI场景下向量检索的P99响应延迟可控制在20ms以内,能够覆盖绝大多数AI场景对向量存储和检索的业务需求。

二是可视化数据管理。在向量存储、检索能力之上,腾讯云向量数据库还提供了可视化的数据管理界面,进一步降低向量数据库的接入和使用门槛。用户可以通过控制台进行数据库、集合层面的数据管理,还可以快速执行向量检索等常用操作。此外,腾讯云向量数据库还提供了可视化的数据上传能力,帮助用户快速构建专属知识库。

三是一站式向量检索方案。为了进一步提升产品的易用性,腾讯云向量数据库会提供一站式的向量检索方案,实现从文本输入到文本搜索的端到端检索能力,用户可以直接上传.pdf、.txt等原始文本文件,通过平台自动化地执行文本分割、embedding向量化,全托管地完成知识构建和检索任务。

腾讯官方信息称,使用腾讯云向量数据库后,企业接入大模型需要花费的时间,能从一个月降低至三天左右,极大降低企业的接入成本。

在具体落地应用层面,腾讯方面表示,该向量数据库目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。

数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。

腾讯方面表示,在未来“向量数据库+大模型+数据”将产生“飞轮效应”,共同助力企业步入AI Native(AI原生)时代。

【本文为合作媒体授权博望财经转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表博望财经立场,转载请联系原作者及原出处获得授权。有任何疑问都请联系(联系(微信公众号ID:AppleiTree)。免责声明:本网站所有文章仅作为资讯传播使用,既不代表任何观点导向,也不构成任何投资建议。】

猜你喜欢