据品玩援引 HuggingFace 报道,来自萨里大学、字节跳动和加利福尼亚大学圣迭戈分校的研究者们推出了一款生成模型产品 AudioSR。 论文显示,AudioSR 够对各种类型的音频进行稳定的音频超分辨率处理。udioSR 可以将带宽在 2 kHz 至 16 kHz 范围内的任何输入音频信号上采样为带宽为 24 kHz 且采样率为 48 kHz 的高分辨率音频信号。对各种音频超分辨率基准进行的广泛客观评估表明,所提出的模型取得了很好的效果。论文显示,研究人员的主观评估结果表明,AudioSR 可以作为即插即用模块,提高各种音频生成模型的生成质量。 原文链接 —- 编译者/作者:东寻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
萨里大学联手字节跳动等机构,推出生成模型 AudioSR
2023-09-15 东寻 来源:区块链网络
LOADING...
相关阅读:
- 数据和 AI 公司 Databricks 宣布融资逾 5 亿美元,英伟达参投2023-09-15
- a16z 发布全球访问量前五十的 AI 产品榜单:ChatGPT、Character.AI、Bard 位居2023-09-15
- 通达海:目前与一些国内知名厂商推进大模型相关产品研发2023-09-15
- 大幕拉开,AIGC商业主角在哪里?2023-09-15
- 日本政府联合多家科技公司,打造日语版“ChatGPT”2023-09-15