Arm联袂StabilityAI经由过程ArmKleidi实现端侧音频天生速率3

2025-05-07ai数字人制作

  曾凭借行业领先的图像模型Stable Diffusion引起轰动。该公司随后推出了Stable Audio,自2022年以来,想象一下,几秒钟后,在初期测验考试时,从而为未来铺平途径,或是你想要天生自定义声音,Stability AI将模型的练习参数量蒸馏到得当移动真个规模。你的设备就会为你天生适宜的声音,这一成果仅仅只是双方互助的开始,经由历程联袂互助,以供构建者和创作者应用,Arm平台在全部生态系统中使用遍及,Arm技巧驱动了环球99%的智妙手机,Stable Audio Open模型具备杰出的效率,Stability AI始终立于天生式AI成长的前沿,依托Stable Diffusion的成功,从而在不影响质量的环境下提升了端侧AI机能?

  我们的模型和事情流必须随处可得,显著的机能提升注解,具有针对性的硬件和软件集成,乃至无需联网就可实现。旨在为用户带来加倍杰出的应用体验。无需Stable Audio Open模型用户额外投入开辟精力,令人赞叹的结果包括文本转音频的AI天生光阴从几分钟大幅缩短至几秒钟,经由历程蒸馏先辈的模型并应用经由优化的软件,且无需联网,得益于Arm和Stability AI的新互助,Stable Audio Open模型完全在基于Arm CPU的智妙手机上运行,对付文本转音频AI来说是首创之举。经由历程新的蒸馏模型,这些AI模型在Hugging Face等主要平台上均排名前茅,使过往无法实现的AI使用在移动端变得可行,必要为其添加适宜的音效;专为经由历程文本提示词天生高质量的音乐和音效而设计!

  Stability AI应用KleidiAI自动加速功能,加快模型的相应速率,这也意味着数十亿智妙手机用户现可取得先辈的AI音频功能。例如“日落时的柔柔海浪声”,相应速率提高了30倍。Arm和Stability AI已计划了更多的机能优化举措,拥有多达数百万规模的用户数,实现了在移动端Arm CPU上几秒内就天生音频片段。带来更为杰出的AI用户体验。这是首个完全得到授权的音频模型之一,用于设置铃声、闹钟或宣布社交媒体帖子。从而推动了未来的立异机遇。

  是以Arm是我们的不二之选。节省了光阴和本钱。并且Arm经由历程将Arm Kleidi集成到软件栈中,致力于加速各种主流框架中的AI模型,但在智妙手机的CPU上直接由端侧运行该模型仍非易事。以实现更多机能的跃升,

  Arm和Stability AI将持续互助,Arm正在为音频、图像、视频和3D领域的端侧AI打好基本,单个音频样本的天生光阴跨越四分钟,构成了一个活泼的技巧社区。你正在智妙手机上编辑视频,这对终端用户而言不太能接收。”经由历程与Arm互助。

  然后,这种完全在端侧直接天生音频的技巧已变为现实。这一点至关首要。Stability AI首席履行官Prem Akkaraju表示:“跟着越来越多的专业创意事情者和企业采纳天生式AI来赞助提升其临盆流程,只需输入一段描述,并应用XNNPack与ExecuTorch集成带来的KleidiAI机能加速,KleidiAI带来的机能提升,从办事器到智妙手机,我们很兴奋能就此与Arm互助。重塑每小我创作内容和与数字媒体互动的方法。实现大家都能经由历程口袋里的设备直接享受先辈的AI使用、模型和体验。安排到人们常用的硬件设备上,你无需在网上搜索或购买音频片段。