腾讯正式发布向量数据库,用于大模型训练
今日,腾讯云正式发布向量数据库Tencent Cloud VectorDB,预计8月上线腾讯云官网。
腾讯介绍道,该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
据了解,该数据库面向大模型训练,可以让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。
大模型的“黄金搭档”
什么是向量数据库?
向量数据库是一种专门用于存储、 管理、查询、检索向量的数据库,可以把复杂的非结构化数据通过向量化,处理统一成多维空间里的坐标值。
目前,向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。
具体来看,向量数据库被广泛地用于大模型训练、推理和知识库补充等场景:支撑训练阶段海量数据的分类、去重和清洗,给大模型的训练降本增效;通过新数据的带入,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;提供一种私有数据连接大模型的方式,解决私有数据注入大模型带来的安全和隐私问题,加速大模型在产业落地。
简而言之,向量数据库可以解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。
据第三方调研数据预测,全球向量数据库到2030年预计将迎来超过500亿美元的市场。国内也将以每年超过20%的速度在增长。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超过一半的向量数据库具有云化部署的能力。
提供10亿级向量检索能力
据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。
具体而言,腾讯发布的向量数据库有以下特点。
一是高性能向量存储、检索。腾讯云向量数据库具备高性能的向量存储和检索能力,单索引能够轻松支持10亿级别的向量规模。在分布式弹性扩展的架构下,单实例可支持百万级别QPS,AI场景下向量检索的P99响应延迟可控制在20ms以内,能够覆盖绝大多数AI场景对向量存储和检索的业务需求。
二是可视化数据管理。在向量存储、检索能力之上,腾讯云向量数据库还提供了可视化的数据管理界面,进一步降低向量数据库的接入和使用门槛。用户可以通过控制台进行数据库、集合层面的数据管理,还可以快速执行向量检索等常用操作。此外,腾讯云向量数据库还提供了可视化的数据上传能力,帮助用户快速构建专属知识库。
三是一站式向量检索方案。为了进一步提升产品的易用性,腾讯云向量数据库会提供一站式的向量检索方案,实现从文本输入到文本搜索的端到端检索能力,用户可以直接上传.pdf、.txt等原始文本文件,通过平台自动化地执行文本分割、embedding向量化,全托管地完成知识构建和检索任务。
腾讯官方信息称,使用腾讯云向量数据库后,企业接入大模型需要花费的时间,能从一个月降低至三天左右,极大降低企业的接入成本。
在具体落地应用层面,腾讯方面表示,该向量数据库目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。
数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。
腾讯方面表示,在未来“向量数据库+大模型+数据”将产生“飞轮效应”,共同助力企业步入AI Native(AI原生)时代。