腾讯正式发布向量数据库，用于大模型训练

猎云网韩文静2023-07-05 10:55 大公司

向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

今日，腾讯云正式发布向量数据库Tencent Cloud VectorDB，预计8月上线腾讯云官网。

腾讯介绍道，该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景，是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

据了解，该数据库面向大模型训练，可以让企业原先花一个月时间才能完成的大模型接入，缩短到三天时间。

大模型的“黄金搭档”

什么是向量数据库？

向量数据库是一种专门用于存储、管理、查询、检索向量的数据库，可以把复杂的非结构化数据通过向量化，处理统一成多维空间里的坐标值。

目前，向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

具体来看，向量数据库被广泛地用于大模型训练、推理和知识库补充等场景：支撑训练阶段海量数据的分类、去重和清洗，给大模型的训练降本增效；通过新数据的带入，帮助大模型提升处理新问题的能力，突破预训练带来的知识时间限制，避免大模型出现幻觉；提供一种私有数据连接大模型的方式，解决私有数据注入大模型带来的安全和隐私问题，加速大模型在产业落地。

简而言之，向量数据库可以解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题，突破大模型在时间和空间上的限制，加速大模型落地行业场景。

据第三方调研数据预测，全球向量数据库到2030年预计将迎来超过500亿美元的市场。国内也将以每年超过20%的速度在增长。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中，超过一半的向量数据库具有云化部署的能力。

提供10亿级向量检索能力

据介绍，腾讯云向量数据库最高支持10亿级向量检索规模，延迟控制在毫秒级，相比传统单机插件式数据库检索规模提升10倍，同时具备百万级每秒查询（QPS）的峰值能力。

具体而言，腾讯发布的向量数据库有以下特点。

一是高性能向量存储、检索。腾讯云向量数据库具备高性能的向量存储和检索能力，单索引能够轻松支持10亿级别的向量规模。在分布式弹性扩展的架构下，单实例可支持百万级别QPS，AI场景下向量检索的P99响应延迟可控制在20ms以内，能够覆盖绝大多数AI场景对向量存储和检索的业务需求。

二是可视化数据管理。在向量存储、检索能力之上，腾讯云向量数据库还提供了可视化的数据管理界面，进一步降低向量数据库的接入和使用门槛。用户可以通过控制台进行数据库、集合层面的数据管理，还可以快速执行向量检索等常用操作。此外，腾讯云向量数据库还提供了可视化的数据上传能力，帮助用户快速构建专属知识库。

三是一站式向量检索方案。为了进一步提升产品的易用性，腾讯云向量数据库会提供一站式的向量检索方案，实现从文本输入到文本搜索的端到端检索能力，用户可以直接上传.pdf、.txt等原始文本文件，通过平台自动化地执行文本分割、embedding向量化，全托管地完成知识构建和检索任务。

腾讯官方信息称，使用腾讯云向量数据库后，企业接入大模型需要花费的时间，能从一个月降低至三天左右，极大降低企业的接入成本。

在具体落地应用层面，腾讯方面表示，该向量数据库目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。

数据显示，使用腾讯云向量数据库后，QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。

腾讯方面表示，在未来“向量数据库+大模型+数据”将产生“飞轮效应”，共同助力企业步入AI Native（AI原生）时代。

【本文为合作媒体授权博望财经转载，文章版权归原作者及原出处所有。文章系作者个人观点，不代表博望财经立场，转载请联系原作者及原出处获得授权。有任何疑问都请联系（联系（微信公众号ID：AppleiTree）。免责声明：本网站所有文章仅作为资讯传播使用，既不代表任何观点导向，也不构成任何投资建议。】

腾讯正式发布向量数据库，用于大模型训练

大模型的“黄金搭档”

提供10亿级向量检索能力

猜你喜欢

24小时热榜

关于我们

联系我们