5月6日 消息:Supertone Shift是一款创新的实时语音变换技术产品,它允许用户即时切换到任选的声音,为虚拟主播(VTubers)、内容创作者、游戏玩家以及希望准确表达角色声音的用户提供了强大的支持。
站长之家(ChinaZ.com)5月6日 消息:英伟达的ChatRTX在其最新更新中引入了多种新功能,这些功能在3月的GTC上首次展示,显著增强了这款基于RTX加速的聊天机器人应用的能力。ChatRTX现在支持更多的大型语言模型(LLM),包括Google的Gemma和中英双语的ChatG ...
站长之家(ChinaZ.com)4月24日 消息:EVI,一款可以识别对话客户情感的人工智能,正式发布了API。自发布以来,它已经生成了大约10万次的对话,平均每次对话时长为10分钟,总计产生了超过300万条消息。
Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity ...
站长之家(ChinaZ.com)4月11日 消息:最近,一个名为Parler-TTS的全新开源项目引起了业界的广泛关注。Parler-TTS是一个高质量的文本到语音(TTS)模型,它能够生成听起来非常自然的语音,为用户提供了前所未有的语音合成体验。
划重点: - 💡 Universal-1在多语言环境中取得了行业领先的表现,提供准确且鲁棒的多语言语音转文字功能。 - 💡 Universal-1能够精确估计时间戳,提高了说话者辨识和音视频编辑等下游应用的准确性。 - 💡 AssemblyAI 利用最先进的 ASR 研究,构建了 Universal ...
【新智元导读】一家来自纽约的初创公司Hume AI发布了一款标榜为「第一个具有情商的对话式人工智能」的共情语音接口(EVI),并表示其能够从用户那里检测到53种不同的情绪。
Azure AI Studio - 语音服务是微软Azure提供的一套人工智能服务,其中包括语音服务。这些服务可能包括语音识别、语音合成、语音翻译等功能,帮助开发者在他们的应用程序中集成语音相关的智能功能。
划重点: - 💬 三星考虑将生成式人工智能技术应用于其语音助手 Bixby,以增强设备吸引力。 - 📱 Bixby 自2017年推出以来,一直是三星设备的核心工具,但缺乏像 ChatGPT 等生成式 AI 的功能。 - 🤖 三星计划通过加入生成式 AI 功能提升 Bixby,实现更自然的对 ...
Voice Engine是OpenAI推出的一种先进的语音合成模型,它仅需 15 秒的语音样本,便能生成与原始说话人极为相似的自然语音。
快科技3月31日消息,据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术Voice Engine”。
3月18日消息,本月早些时候,在山西忻州发生了一起骇人听闻的交通事故:一辆装载有49吨煤炭的大货车,在转弯时侧翻,整个压在了一辆长安深蓝S7之上。