没想到,音频大模型开源最彻底的,居然是小红书
作者:joe888888 來(lái)源:北海 瀏覽: 【大中小】 發(fā)布時(shí)間:2025-09-21評(píng)論數(shù):
![]()
机器之心原创
编辑:杜伟
不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源 33 款、31 款各类型大模型。
这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小

图源:zh-ai-community
一方面是因为音频生成在技术和数据上面临着特殊挑战,音频信号的计算和建模复杂,数据获取难度更大;另一方面,出于安全、版权等风险的考量,OpenAI、ElevenLabs 等主流玩家大都选择闭源或半开源。
直到今年尤其最近一波开源潮掀起以来,AI 音频领域又热闹了起来,包括字节 MegaTTS3、阿里 Qwen2.5-Omni-7B 和 CosyVoice 3、月之暗面 Kimi-Audio、阶跃星辰 Step-Audio 2 等。
在这些国内大厂和人工智能新势力之外,我们发现,自去年开始,来自小红书的技术团队在音频领域保持了稳定的开源节奏。他们推出了一系列成果,逐步构建起了系统级音频能力,并以开放的姿态将这些成果向社区开放。
这些成果中既有 TTS(文本转语音)方向的 FireRedTTS,也有 ASR(语音识别)方向的 FireRedASR,在当时取得了 SOTA 级别的效果。在实现研究突破之外,模型也具备工业级可商用属性,在关键指标上满足了实际应用需求,并通过开放许可降低商用落地门槛。
因此,发布之后,这些模型吸引了 AI 社区大量研究者与开发者的关注与好评。很多用户在实际项目中直接部署使用并二次开发,可用性和工程化潜力得到了验证。
![]()
对于小红书来说,开放高质量音频模型不仅可以提升其在这一细分赛道的技术影响力与话语权,也释放出一个明确的信号:将开源作为长期战略来布局。通过一系列技术开放,小红书正在构建起高粘性的音频大模型开源社区。
就在过去几天,小红书智创音频团队(FireRed)又放出了多项最新开源成果。
SOTA 级音频能力持续注入开源社区
系统级音频能力并非简单地依靠堆砌模型,而需要跨越多重技术门槛。无论是语音合成还是语音识别,都要求在延迟、准确率、自然度、真实性与鲁棒性等维度进行持续优化。
小红书对音频大模型的探索始于去年 9 月开源的 FireRedTTS 语音合成系统,构建了一套由数据处理、基座系统与下游应用组成的基座语音合成框架,先训练基座模型以将文本序列转换为自然、有表现力的语音序列,后利用上下文学习、监督微调等方法高效地服务于配音、自然对话等下游应用。
效果十分显著:只需要一段给定文本和几秒参考音频,无需二次训练,F(xiàn)ireRedTTS 就可以模仿任意音色、任意说话风格,比如搞怪风、女友风等,实现自由定制
今年 2 月开源的 FireRedASR 在语音识别上带来新突破,这类技术广泛应用于智能语音交互(如语音助手)与多模态内容理解场景。该系列包含两个模型,F(xiàn)ireRedASR-LLM 追求极致的语音识别精度,F(xiàn)ireRedASR-AED 在保证语音识别准确率的同时兼顾推理效率。
结果显示,在 AISHELL-1/2、WenetSpeech 等中文普通话测试集上,F(xiàn)ireRedASR 在关键指标字错率(CER)上取得了 SOTA。FireRedASR 的 CER 为 3.05%,优于豆包的闭源大模型 ASR 方案 Seed-ASR 的 3.33%,也优于阿里通义 9 月 8 号最新发布的闭源 Qwen3-ASR-Flash 的 3.52%。
![]()
目前,该模型已在 GitHub 上收获了 1.3k 的 star。
![]()
GitHub 地址:https://github.com/FireRedTeam/FireRedASR
延续 FireRedTTS 的 SOTA 级表现,新一代的 FireRedTTS-2进一步瞄准了语音合成现有方案的痛点,包括灵活性差、发音错误多、说话人切换不稳和韵律不自然,在升级离散语音编码器与文本语音合成模型两大核心模块的基础上,为长对话语音合成提供了更优的解决方案。
![]()
FireRedTTS-2 架构概览。
FireRedTTS-2 主打上下文建模与多轮对话能力,在涉及音色克隆、交互式对话和播客生成的多项主客观测评中均实现了行业领先,让开源模型在复杂音频场景建模效果上达到新高点。
音色克隆只需提供对话中发音人的一句语音样本即可模仿其音色与说话习惯,自动生成后续整段对话;同时多说话人音色切换的稳定性与韵律自然度均处于开源模型 SOTA,为今年火热的 AI 播客场景提供了工业级解决方案,一跃成为当前最强开源播客生成大模型。
![]()
在 zero-shot 播客生成中,F(xiàn)ireRedTTS-2 全面优于 MoonCast、ZipVoice-Dialogue、MOSS-TTSD 等开源竞品。
听完下面一段关于「Taylor Swift 恋爱消息」的双人多轮对话播客,你能分得清是真人录音还是 AI 合成吗?
![]()
视频链接:https://mp.weixin.qq.com/s/0ij7-jNw3cfUvU_0Mb1NeA
目前,F(xiàn)ireRedTTS-2 可以支持 4 位说话人的多轮对话生成,还可以通过扩展数据进一步扩展至更多说话人和更长时长,从而根据实际需求进行快速适配。用户对这款新模型的反馈也不错。
![]()
论文地址:https://arxiv.org/pdf/2509.02020代码地址:https://github.com/FireRedTeam/FireRedTTS2
另一大开源新成果是FireRedChat—— 业内首个完全开源的全双工语音对话系统,它在智能判停与延迟等关键指标上也达到了开源 SOTA,端到端性能已接近工业级水准。
此次的亮点还在于:在提供完整模型之外,一站式提供 VAD、ASR、TTS、上下文感知 TTS、音频 LLM、Dify 支持等核心模块,支持私有化部署。这在业内迄今没有任何一家企业或机构将这样的一整套完整方案开源出去。
这就意味着,即使不是语音领域的专业人士,也可以直接克隆代码,快速部署一个自己的语音助手,例如豆包的「打电话」语音对话助理。
基于内置的情绪感知与情感合成能力,通过 FireRedChat 构建的不是一个冷冰冰的机器人,而是一个「知冷暖、能共情、懂表达」的好朋友,她能细腻感知你的情绪变化:在你失落时,轻声安慰、真诚鼓励;在你遇到惊喜时,和你一样心潮澎湃、享受 surprise;在你开心时,陪你分享喜悦、一起欢笑。
FireRedChat 让 AI 聊天助手不只是回应文字,更能用富有温度的声音、情感和表达方式,带给你一种被理解、被陪伴的真实感受,让 AI 真正拥有「人感」。
![]()
视频链接:https://mp.weixin.qq.com/s/0ij7-jNw3cfUvU_0Mb1NeA
短短一年时间,小红书围绕文本转语音、语音识别和语音对话形成了比较完整的技术栈,并已经探索出一些好玩的功能,比如以 FireRedASR 技术为支撑的语音评论,通过唱歌、说方言、模仿有梗台词等一系列新的玩法,让评论区的互动性与趣味性更浓,也提升了用户粘性。
![]()
音频开源的「执牛耳者」
从小红书已经开源的一系列音频大模型中,我们看到了其对开源生态的长期承诺与战略耐心。
一方面,几乎覆盖了语音交互的核心环节,从 TTS、ASR 到语音对话,技术矩阵日趋完善。由点及面的布局,显示出其在技术积累上的底气,利用系统性开源降低行业准入门槛,形成生态级的牵引力。
未来,小红书还计划推出音乐大模型 FireRedMusic、多语种高精度语音识别系统 FireRedASR-2 以及音频感知大模型,让更多细分方向的开发者用上高质量模型。
另一方面,开源正在从模型层走向体系层,不再只是停留在单一模型的开放,而是扩展到了全链路模块。这意味着,开源的价值上升到了提供系统化能力。
以全双工语音对话系统 FireRedChat 为例,VAD、ASR、TTS、对话框架等在内基础模块的开放,降低了开发者的集成与部署门槛,使他们在开箱即用的基础上快速构建应用,进而扩大音频生态的创新边界。
通过开源这个推动技术演进与生态共建的关键支点,小红书的开源「野心」已逐渐显现。
小红书智创音频团队负责人解奉龙称,他们的目标是建立首个工业级可商用的音频大模型开源社区,涵盖语音识别及理解、语音 / 音效生成、全双工语音交互、音乐理解及生成四大方向,一步步将自身打造成为开源音频领域的「执牛耳者」。
这些模型具备的工业级可商用属性将释放更大的价值。开发者和企业用户在生产环境中直接部署与使用,大大缩短从技术到产品的周期,降低试错成本。
随着语音交互赛道的参与者越来越多,应用创新与落地场景更丰富,反过来又将进一步扩展以小红书为主导的音频开源社区。
小红书智创团队负责人汤旭表示,团队将持续深耕多模态大模型,勇于突破 SOTA 边界,探索 AI 在内容理解与创作中的更多可能。我们坚持开放共享,通过开源生态与全球开发者协同进化,共同推动行业标准演进,让 AI 不仅赋能小红书,更为全球创作者创造价值,开启内容生产的新范式。
作为一种正在重塑行业格局的力量,开源让先进的 AI 能力不再被少数巨头垄断,而是沉淀为整个行业可以共享的底层资源。
从八年前的 Transformer,到年初的 DeepSeek,再到前一段的 Qwen,开源一直都是推动大模型技术跃迁的关键因素之一。在共享基线之上,开发者可以进行低成本地差异化探索。
AI 大厂选择「闭门造车」,本质上是通过技术壁垒构筑护城河,并以此维持商业模式的可持续性和竞争优势,如 OpenAI 等。在资本驱动与市场回报的逻辑下,这种路径无可厚非。然而,推动产业加速演进往往不单靠这些巨头的独角戏,更在于开源社区的多点突破与百花齐放。
在开源生态中,模型、框架和工具可以快速迭代、自由组合,通过更多创新尝试,加快新技术落地。尤其是在 AI 应用的长尾场景中,整个社区的广泛参与更有潜力让 AI 真正从实验室走向产业化。
小红书正在用自己一次次的开源践行这一切,持续推动音频大模型的技术演进,向所有人释放前沿能力,并希望通过更大的开源社区共建实现技术平权。这些 SOTA 级音频大模型为开发者和中小型企业提供了平等的技术起点,让他们在同一基准线上进行创新与应用开发。
在开源生态主导权上的长远布局,可以为小红书在未来的 AI 音频市场竞争中抢占先机。
除了音频, 小红书智创团队还在多模态、AIGC、CV、编辑渲染、算法工程等方向多有建树,并向公司内部社交、直播、电商、商业化广告和生态审核在内的各业务线提供业界领先的技术解决方案,成功落地了语音评论、文字功能等爆款功能。
目前,小红书校招正在进行中,加入智创团队,一起挑战 AI 前沿技术,推动开源生态的未来。
![]()
社招通道:https://wxaurl.cn/86Bnp6ULVjj
校招通道:https://wxaurl.cn/l8Soty5Tu0t
- {loop type="catelog" row=10}{$vo.title}
主站蜘蛛池模板:
欧美在线一级va免费观看|
亚洲精品国产精品国产|
日韩亚洲精品在线|
欧美在线播放一区|
亚洲欧美v国产一区二区|
男女午夜爽爽|
97久久国产亚洲精品超碰热|
国产一区二区三区黄|
免费毛片a|
国产呻吟高潮|
狠狠搞av|
午夜av男人的天堂|
精品99免费视频|
91精品一区二区在线观看|
欧美一区亚洲一区|
四虎国产精品永久在线国在线|
日本精品一区二区三区在线观看视频|
99国产精品丝袜久久久久久|
久久久99精品国产一区二区三区|
久久久久国产亚洲|
亚洲五码在线|
国产一级一区二区|
日韩精品中文字|
精品国产鲁一鲁一区二区三区|
狠狠色噜噜狠狠狠狠米奇7777|
综合色婷婷一区二区亚洲欧美国产
|
国产精品视频一区二区三|
88国产精品视频一区二区三区|
欧美一区二区三区免费看|
91精品国产综合久久国产大片|
男人的天堂一区二区|
国产在线一二区|
精品国产91久久久|
亚洲乱码av一区二区三区中文在线:
|
97国产精品久久|
sb少妇高潮二区久久久久|
国产偷亚洲偷欧美偷精品|
午夜私人影院在线观看|
国产欧美精品一区二区三区-老狼|
国产极品美女高潮无套久久久|
国产精品中文字幕一区二区三区|
国产精品日韩视频|
欧美网站一区二区三区|
欧美日韩国产区|
91精品国产麻豆国产自产在线|
一区二区三区欧美精品|
亚洲国产精品国自产拍久久|
亚洲综合日韩精品欧美综合区|
日韩精品一区二区亚洲|
国产91丝袜在线播放动漫|
午夜激情在线免费观看|
**毛片在线|
91精品久久天干天天天按摩|
国产一区二区三区小说|
国产精品久久久久久久四虎电影|
国产欧美一区二区三区免费看|
高清欧美精品xxxxx在线看|
欧美日韩国产色综合视频|
欧美日韩国产精品一区二区|
综合久久激情|
97午夜视频|
国产精品一级在线|
国产高清精品一区|
99热久久这里只精品国产www|
国产一区二区综合|
中文字幕一区二区三区乱码|
欧美一区二区三区久久精品|
日韩精品免费一区二区中文字幕|
少妇久久精品一区二区夜夜嗨
|
久久一区二|
国产综合久久精品|
欧美片一区二区|
午夜伦全在线观看|
国产1区2区视频|
久久久综合亚洲91久久98|
97涩国一产精品久久久久久久|
欧美日韩激情在线|
欧美日韩亚洲国产一区|
国产欧美日韩va另类在线播放|
99国产精品99久久久久久粉嫩|
国产精品久久久视频|
午夜爽爽视频|
亚洲精品国产综合|
97久久精品人人做人人爽|
狠狠色噜噜狠狠狠狠69|
一区二区三区免费高清视频|
日韩精品久久久久久久电影99爱|
国产清纯白嫩初高生在线观看性色|
国产精品乱码一区|
av中文字幕一区二区|
国产在线视频99|
国产一区二区片|
日韩午夜电影院|
91精品夜夜|
国产美女三级无套内谢|
欧美国产精品久久|
国产日韩欧美一区二区在线观看
|
淫片免费看|
狠狠色噜噜狠狠狠狠|
国产精品理人伦一区二区三区|
亚洲午夜天堂吃瓜在线|
久久免费视频一区二区|
秋霞三级伦理|
国产三级国产精品国产专区50|
一区二区三区欧美在线|
国产日韩欧美一区二区在线观看
|
99三级视频|
国产一区二区极品|
日韩精品免费一区二区在线观看|
欧美系列一区二区|
国产二区精品视频|
91精品视频在线观看免费|
欧美一区久久久|
国产精一区二区三区|
午夜一级免费电影|
日韩精品1区2区3区|
国产精品久久91|
欧美精品免费看|
毛片大全免费看|
freexxxxxxx|
亚洲欧美制服丝腿|
国产一级一区二区|
久久第一区|
99riav3国产精品视频|
日本看片一区二区三区高清|
国产91九色在线播放|
国产在线一卡二卡|
国产精品欧美一区二区三区|
高清国产一区二区|
欧美一区二区三区视频在线观看|
狠狠色狠狠色88综合日日91|
欧美综合国产精品久久丁香|
国产无套精品一区二区|
欧美3p激情一区二区三区猛视频|
色妞www精品视频|
国偷自产一区二区三区在线观看|
欧美3p激情一区二区三区猛视频|
中文字幕制服狠久久日韩二区|
老女人伦理hd|
国产区二区|
国产精品6699|
久久久久久综合网|
亚洲精品丝袜|
久久精品99国产精品亚洲最刺激|
狠狠躁夜夜躁2020|
99久久国产综合|
久久久精品欧美一区二区|
狠狠色狠狠色综合久久一|
17c国产精品一区二区
|
91麻豆国产自产在线观看hd|
亚洲精品国产主播一区|
亚洲精品丝袜|
美女销魂免费一区二区|
免费精品一区二区三区视频日产|
国产乱xxxxx97国语对白|
中文字幕在线一区二区三区|
亚州精品国产|
国产主播啪啪|
天堂av色婷婷一区二区三区|
狠狠色依依成人婷婷九月|
丰满岳妇伦4在线观看|
久久免费视频一区|
午夜激情在线|
久久精品国产精品亚洲红杏|
91麻豆精品国产91久久久更新资源速度超快
|
偷拍自中文字av在线|
午夜免费网址|
久久第一区|
美女脱免费看直播|
亚洲精品乱码久久久久久高潮|
91午夜精品一区二区三区|
国产99网站|
日本丰满岳妇伦3在线观看|
国产精品一卡二卡在线观看|
精品国产一区二区三区四区四|
亚洲欧洲日本在线观看|
欧美视屏一区二区|
国产97免费视频|
狠狠色噜噜狠狠狠狠|
亚洲精品久久久久久久久久久久久久|
在线观看v国产乱人精品一区二区|
欧美精品免费一区二区|
国产一区二区影院|
一本色道久久综合亚洲精品图片|
国产婷婷一区二区三区久久|
日本一区二区电影在线观看|
国产欧美三区|
高清国产一区二区三区|
亚洲v欧美v另类v综合v日韩v|
欧美高清性xxxx|
国产一区二区高清视频|
淫片免费看|
高清欧美精品xxxxx|
亚洲精品老司机|
久久两性视频|
欧美67sexhd|
中文字幕在线视频一区二区|
国产精品尤物麻豆一区二区三区|
在线观看黄色91|
中文字幕1区2区3区|
19videosex性欧美69|
国产日韩精品一区二区|
狠狠色噜噜狠狠狠888奇米|
综合久久国产九一剧情麻豆|
激情久久综合网|
国产伦精品一区二|
538国产精品一区二区在线|
中文字幕日韩一区二区|
91麻豆精品国产自产欧美一级在线观看|
国产欧美日韩二区|
亚洲自拍偷拍一区二区三区|
亚洲欧美国产日韩综合|
久久乐国产精品|
欧美日韩国产一区在线|
九九视频69精品视频秋欲浓|
国产精品自拍不卡|
久久免费视频一区二区|
国产伦理精品一区二区三区观看体验|
久久久久国产亚洲日本|
国产精品久久久久久久久久久久久久久久久久|
日本高清不卡二区|
久久久久久久久亚洲精品|
国产精品一二三区视频网站|
欧美日韩卡一卡二|
午夜精品99|
人人玩人人添人人澡97|
亚洲精品日本久久一区二区三区|
国产一区不卡视频|
国产一级大片|
性少妇freesexvideos高清bbw|
国产99久久九九精品免费|
香港三日本三级三级三级|
午夜激情电影在线播放|
岛国黄色网址|
欧美精品第一区|
国产乱人伦精品一区二区|
狠狠色狠狠色很很综合很久久|
亚洲欧美一卡|
免费久久一级欧美特大黄|
日韩欧美高清一区|
国产天堂第一区|
99久热精品|
欧美高清性xxxx|
日韩av片无码一区二区不卡电影|
欧美日韩一卡二卡|
欧美国产三区|