#Ai音乐
😞 MemoTune,AI 音乐生成工具

支持文字转歌曲、歌词转歌曲,并提供 AI 人声生成、声音模型训练、AI Cover 等功能。 用 AI 把你的文字或歌词变成完整的歌曲,免费开始,无需信用卡。支持 10+ 音乐风格(流行、说唱、R&B、民谣、摇滚、电子等)。支持中文、英文、日语、韩语等 10+ 语言。可训练专属 AI 声音模型。

🧐 https://memotune.com/zh-CN
#AI #视频处理 #音频处理

🔊 Voice-Pro - 免费开源的 AI 语音识别、翻译和多语言配音解决方案

Voice-Pro 是一个开源的音频/语音处理工具集合,现已宣告完全免费(此前收费)

Features

▫️一键下载 YouTube 视频 + 人声分离:yt-dlp 下载 + Demucs 分离人声/背景乐
▫️强大的语音识别:支持 Whisper / Faster-Whisper / WhisperX / Whisper-Timestamped
▫️多语言实时/批量翻译:100+ 语言互译
▫️...


📮投稿 📢频道 💬群聊 🔎索引
#AI资讯

ChatGPT正式 登陆 Windows:该应用目前仅适用于 ChatGPT Plus、Team、Enterprise 和 Edu 用户,当前是一个早期版本,将在今年晚些时候推出「完整体验」(直达

Google 推出 AI 笔记应用「NotebookLM」:该应用由 Gemini 1.5 Pro 驱动,它可以将来自不同来源的信息汇总到一个界面中,使用户可以与收集的数据进行聊天。亮点在于它能与各种文件类型互动,包括PDF、Google文档和YouTube视频,并生成音频、摘要、问答和带有引用的想法(直达

Suno 推出「Suno Scenes」:Suno 允许以视频和图片为提示词,生成 30 秒的音乐,一个短视频,一张表情包,就能唱出一首歌。不过,目前该功能仅支持 Suno 的 iOS 客户端,并且仅在美国地区可用(link

Les Ministraux 官方宣称其边缘模型为世界上最好的:包含 3B 和 8B 两个版本,在各种基准测试中均超越了 Llama 3.2 和 Gemma 2 的同参数量模型(link
#AI资讯

OpenAI 推出 AI 搜索搜索功能「SearchGPT」:这是一款由 GPT-4 系列模型驱动、能实时访问全网信息,附带清晰来源链接的搜索引擎

谷歌母公司 Alphabet 的股价当天下跌 3%


Meta 发布 Llama 3.1 模型:是 Meta 迄今为止最强大的模型,也是全球目前最强大的开源大模型。从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负

在线体验


Mistral AI 发布 Mistral Large2 模型:该模型进行了非常大比例的代码训练,性能远优于第一代,与GPT-4o、Claude 3 Opus和Llama 3 405B等领先型号的表现不相上下

在线体验


Udio 发布新版本 v1.5 :增强了音乐生成能力,包括多语言支持(包含中文)、音质提升至48kHz立体声、调性控制等

在线体验
 
 
Back to Top