#AI资讯

Google 发布其最强图像生成模型「Nano Banana Pro」
官方正式名称为「Gemini 3 Pro Image」。它最高可输出 4K 分辨率图像、支持多轮编辑、搜索增强等功能,应该是目前全球最先进的 AI 绘画模型了![博客][直达][提示词大全]

ChatGPT 近期更新
新增全新购物助手功能,用户只需输入购物需求,ChatGPT 就会开始为用户筛选合适的产品;取消了独立的「ChatGPT Voice」入口,现在用户可以直接在聊天中使用语音功能。

Claude Opus 4.5 发布
可智能修复bug、永不遗忘对话,对标 GPT-5.1 和 Gemini Pro。

Black Forest Labs 发布全新开源大模型「FLUX.2」
FLUX.2 有 4 个不同规模和用途的模型包括 Pro、Flex、Dev、Klein,并在技术上实现了显著提升,包括引入多参考条件、更高保真度的输出以及改进的文本渲染。[开源地址][官方博客][FLUX.1介绍]

TRAE SOLO 中国版正式上线
TRAE SOLO 是一种高度自动化的开发方式,以 AI 为主导,可理解目标、承接上下文并调度工具,独立推进各阶段开发任务。且完全免费使用。(TRAE 是字节跳动旗下的 AI 编程工具)[直达]

*题图由 Nano Banana Pro 免费生成

📮投稿 📢频道 💬群聊 🔎索引
#AI资讯

ChatGPT 新推出的 AI 生成图像功能延迟对免费用户开放:奥特曼称该功能比预期要受欢迎得多[原文]

Google 发布旗舰推理模型「Gemini 2.5」:首个发布的版本被命名为Gemini 2.5 Pro Experimental,支持100万个token的上下文窗口。在各种基准测试中都处于领先地位。[官方介绍][在线使用]

Google AI Studio 现在可以通过 ai.dev 域名直接访问

DeepSeek-V3模型上线:该模型参数为6850亿,编程与数学能力大幅提升。

Ideogram发布 3.0 模型:真实感、创意设计、一致性显著提升[在线使用][APP]][介绍]

OpenAI 宣布支持 Anthropic 的MCP标准: Agent SDK已添加MCP支持。(MCP 的主要功能是允许模型从各种数据源获取信息)[官方]

开复:中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动
#AI资讯

内容比较多,点开查看

马斯克宣布 Grok 语音模式正式上线:支持10种模式,还包括18+选项。仅支持英文,貌似需要升级才能使用。

Anthropic 推出混合推理模型「Claude 3.7 Sonnet」:旨在解决更复杂的问题,并在数学和编码等领域展现出超越以往的性能。[介绍][免费使用]

​ChatGPT 新增 Safari 扩展功能:可设置 为Safari 地址栏默认搜索引擎

今天,OpenAI 免费开放了基于GPT-4o mini 的 ChatGPT 高级语音聊天模式

Perplexity AI 推出新全浏览器 Comet:专注于 “代理搜索” 功能,以「智能体搜索」为核心概念。[加入候补]

Google 推出编程助手「Gemini Code Assist」:每月 18 万次免费代码补全。[直达]

瑞典公司 lovable 推出无代码构建应用 AI 工具:无需任何编程基础,只需要提示词即可开发一个完整的应用软件。现在该平台每天生成超过25000个新产品。[直达]

Exa 发布 AI 搜索工具「Websets」:用户可以通过 Websets 执行如“美国市值前50的AI创业公司CEO信息”这样的复杂查询,可实现一次性读取并分析超过1000+网页数据并生成结构化的结果表格。[直达]
#AI资讯

ChatGPT 面向 Plus、Pro 和 Team 计划用户推出计划任务功能:可通过ChatGPT创建计划任务,任务完成后会向用户发送通知或者邮件[介绍]

Mistral 发布性能领先的编程模型「Codestral 25.01」:在同参数量模型中表现突出,目前在 LMsys Copilot 竞技场中稳居榜首[介绍][使用]

Minimax 推出开源 AI 大模型:基础语言模型「MiniMax-Text-01」、视觉多模态模型「MiniMax-VL-01」以及「S2V-01」视频生成模型[在线使用][介绍①][介绍②]

​Runway 推出电影级 AI 图像生成工具「Frames」:向更高的逼真度迈进了一大步![介绍]

Google NotebookLM 更新:可随时与 AI 主持人互动,AI 会认真倾听,然后直接回应,支持打断[本频道报道][在线使用]

造车企业图森未来改名「Create AI」转战 AIGC:发布开源图生视频模型「Ruyi-Mini-7B」,专为消费级 GPU 设计。有趣的是这家公司正在用 AI 开发 AAA 级开放世界游戏《金庸群侠传》[官网]
#AI资讯

ChatGPT APP 功能上新:除了原有的高级语音模式外,现在你可以与ChatGPT进行视频通话、共享屏幕,也可以与圣诞老人实时互动

Meta 发布开源 AI 大模型「Llama 3.3」:效率更高、成本更低。不支持中文

全球首个 AI 程序员 Devin 全面开放:能够熟练运用多种编程语言、独立完成网站和应用程序的构建与部署,甚至可以自主发现并修复代码缺陷,月费500美元(直达

Google Drive 增强了 Gemini AI 的功能:现在用户可以通过新的 “总结此文件夹” 按钮快速获取文件夹内容的概要

开源网络爬虫项目 Crawl4 AI 更新:此次新增的文本模式(Text-Only Mode)功能可以通过优化资源加载策略,将爬取效率提升至原来的3-4 倍(本频道报道
#AI资讯

ChatGPT正式 登陆 Windows:该应用目前仅适用于 ChatGPT Plus、Team、Enterprise 和 Edu 用户,当前是一个早期版本,将在今年晚些时候推出「完整体验」(直达

Google 推出 AI 笔记应用「NotebookLM」:该应用由 Gemini 1.5 Pro 驱动,它可以将来自不同来源的信息汇总到一个界面中,使用户可以与收集的数据进行聊天。亮点在于它能与各种文件类型互动,包括PDF、Google文档和YouTube视频,并生成音频、摘要、问答和带有引用的想法(直达

Suno 推出「Suno Scenes」:Suno 允许以视频和图片为提示词,生成 30 秒的音乐,一个短视频,一张表情包,就能唱出一首歌。不过,目前该功能仅支持 Suno 的 iOS 客户端,并且仅在美国地区可用(link

Les Ministraux 官方宣称其边缘模型为世界上最好的:包含 3B 和 8B 两个版本,在各种基准测试中均超越了 Llama 3.2 和 Gemma 2 的同参数量模型(link
#AI资讯

OpenAI 推出 AI 搜索搜索功能「SearchGPT」:这是一款由 GPT-4 系列模型驱动、能实时访问全网信息,附带清晰来源链接的搜索引擎

谷歌母公司 Alphabet 的股价当天下跌 3%


Meta 发布 Llama 3.1 模型:是 Meta 迄今为止最强大的模型,也是全球目前最强大的开源大模型。从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负

在线体验


Mistral AI 发布 Mistral Large2 模型:该模型进行了非常大比例的代码训练,性能远优于第一代,与GPT-4o、Claude 3 Opus和Llama 3 405B等领先型号的表现不相上下

在线体验


Udio 发布新版本 v1.5 :增强了音乐生成能力,包括多语言支持(包含中文)、音质提升至48kHz立体声、调性控制等

在线体验
 
 
Back to Top