腾讯云发布向量数据库产品,AI Native成关键词

2023年7月4日腾讯云举办发布会,正式对外发布了向量数据库产品Tencent Cloud VectorDB。腾讯云表示,这一数据库是AI 原生(AI Native)的向量数据库,能广泛应用于大模型的训练、推理和知识库补充等场景。
EqualOcean从腾讯云数据库副总经理罗云处获悉,从应用场景看,过去的向量数据库常和推荐、反欺诈等关系紧密。而如今随着更新模型数据、帮助模型推理等需求的出现,向量数据库正体现出新价值。在模型训练环节,向量数据库可以用于大模型预训练数据的分类、去重和清洗环节。从效果上,向量数据库相比传统的数据准备方式可以实现10倍效率的提升。另在推理环节,如果将腾讯云的向量数据库作为外部知识库使用,则能将成本降低2-4个数量级。
腾讯云向量数据库基于腾讯集团每日处理千亿次检索的向量引擎(OLAMA),经过腾讯内部海量场景的实践,数据接入AI的效率也比传统方案提升10倍,运行稳定性高达99.99%,目前已经应用在了腾讯视频、QQ浏览器、QQ音乐等30多款国民级产品中。
腾讯云向量数据库能有效助力产品提升运营效率。数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。
在我国,金融、电信、政务、制造和互联网为我国数据库应用最为广泛的领域,但是它们的应用特点各不相同,金融、电信的IT监管环境较为严格、数据业务较为复杂、核心数据业务呈现“强事务”的特点,而对成本敏感度较低。与之相反的是,互联网领域对IT监管环境较弱,但是对成本敏感度较高。
腾讯云在中国也面临着激烈的竞争。目前我国本土数据库企业类型主要分为四大类,分别是以达梦数据库、人大金库、神舟通用等为代表的传统厂商、以海量数据、极数云舟、巨衫数据库等为代表的初创厂商、以阿里云、腾讯云、华为云为代表的云厂商和以中兴、浪潮、东方国信为代表的跨界厂商。
腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。大模型加速向量数据库进入飞速发展期,据东北证券预测,到 2030 年,全球向量数据库市场规模有望达到 500 亿美元,国内向量数据库市场规模有望超过600亿人民币。