腾讯日前发布自研混元深度思考模型T1正式版
腾讯近日发布了自主研发的深度学习模型——混元深度思考模型T1正式版,该模型具备强大的自然语言处理能力和智能决策能力,可广泛应用于语音识别、自然语言生成、智能客服等领域,这一技术的推出标志着腾讯在人工智能领域取得了重要进展,将为企业和个人用户提供更加智能、高效的服务体验。
腾讯发布了其自主研发的深度学习模型——混元深度思考模型T1正式版,这款模型拥有强大的自然语言处理能力和智能决策能力,广泛应用于语音识别、自然语言生成、智能客服等诸多领域,这一技术的推出标志着腾讯在人工智能领域取得了重大进展,将为企业和个人用户提供更加智能、高效的服务体验。
日前,腾讯正式发布了其全新研发的深度思考模型——混元T1正式版,该模型基于今年3月初发布的混元Turbo S为基础打造,具备快速响应、擅长超长文处理及强大的推理能力,其创新的架构沿用了混元Turbo S,并采用了Hybrid-Mamba-Transformer融合模式。
据了解,混元T1正式版是工业界首次将混合Mamba架构无损应用于超大型推理模型的尝试,这一架构有效地降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。
该模型通过大规模强化学习,结合数学、逻辑推理、科学和代码等理科难题的专项优化,其推理能力已达到业界领先水平,特别是在解决长文推理中常见的上下文丢失和长距离信息依赖问题时,混元T1正式版展现出独特的优势,混合Mamba架构针对长序列处理的专项优化,确保长文本信息捕捉能力的同时,大幅降低了资源消耗,实现了解码速度的提升。
混元T1正式版已在腾讯云上线,并即将在腾讯元宝进行灰度测试,该模型的定价策略为每百万tokens 1元输入价格,4元输出价格,值得一提的是,腾讯混元已接入700余个腾讯内部场景,并计划于2024年实现开源,腾讯的系列产品,如元宝、微信、ima、腾讯文档等,已经批量接入DeepSeek-R1开源模型,致力于为用户提供高质量的人工智能体验。
值得关注的是,在上线全新推理模型之前,3月17日腾讯混元已在Chatbot Arena榜单上崭露头角,跻身全球大模型Top 15,这一成就充分展示了腾讯在人工智能领域的实力和不断进步的态势。
【注】文中图片均来源于网络,本文已经进行了适当的修饰和错别字修正,尽量保持了内容的原创性。