Generative AI 技術交流中心
https://www.facebook.com/groups/gaitech
https://www.facebook.com/groups/gaitech
官网
https://www.waytoagi.com/zh
「通往 AGI 之路」知识库
https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e
标签:#AI #知识付费
特朗普宣布将全球关税从 10% 提升至 15%
美国总统特朗普 2 月 21 日在 Truth Social 发文宣布,将立即把对多国征收的 10% 全球关税提升至 15%。特朗普在声明中称,此举是基于对最高法院昨日发布的关税决定进行"彻底审查"后作出的决定。
特朗普表示,特朗普政府将在未来几个月内确定并发布新的合法关税政策。他在声明中批评许多国家"数十年来一直在占美国便宜",并称关税政策将继续推进"让美国再次伟大"的进程。
Donald J. Trump
🍀在花频道 🍵茶馆聊天 📮投稿
美国总统特朗普 2 月 21 日在 Truth Social 发文宣布,将立即把对多国征收的 10% 全球关税提升至 15%。特朗普在声明中称,此举是基于对最高法院昨日发布的关税决定进行"彻底审查"后作出的决定。
特朗普表示,特朗普政府将在未来几个月内确定并发布新的合法关税政策。他在声明中批评许多国家"数十年来一直在占美国便宜",并称关税政策将继续推进"让美国再次伟大"的进程。
Donald J. Trump
🍀在花频道 🍵茶馆聊天 📮投稿
SerpApi 申请驳回 Google 版权诉讼并称其为全球最大抓取者
SerpApi 于 2026 年 2 月 20 日提交动议,请求驳回 Google 针对其大规模抓取搜索结果的版权诉讼。Google 此前指控该公司利用欺骗手段绕过 SearchGuard 防护系统并违反版权法。SerpApi 反驳称 Google 自身是全球最大的抓取工具,且其搜索结果并不享有版权。
该公司表示其抓取并整合公开信息的行为与 Google 搜索引擎的运作逻辑完全一致。针对绕过防护系统的指控,SerpApi 主张 SearchGuard 仅为保护商业利益而非授权内容。目前双方就搜索结果的版权归属及抓取行为的合法性各执一词。
The Verge
🍀在花频道 🍵茶馆聊天 📮投稿
SerpApi 于 2026 年 2 月 20 日提交动议,请求驳回 Google 针对其大规模抓取搜索结果的版权诉讼。Google 此前指控该公司利用欺骗手段绕过 SearchGuard 防护系统并违反版权法。SerpApi 反驳称 Google 自身是全球最大的抓取工具,且其搜索结果并不享有版权。
该公司表示其抓取并整合公开信息的行为与 Google 搜索引擎的运作逻辑完全一致。针对绕过防护系统的指控,SerpApi 主张 SearchGuard 仅为保护商业利益而非授权内容。目前双方就搜索结果的版权归属及抓取行为的合法性各执一词。
The Verge
🍀在花频道 🍵茶馆聊天 📮投稿
亚马逊云服务曾因 AI 编程工具故障致两度中断
Amazon Web Services(AWS)在近几个月内因自家 AI 编程工具错误导致至少两次服务中断。去年 12 月,AWS 一套客户成本分析系统因工程师允许 Kiro AI 编程工具自主操作而中断 13 小时,因该工具判断最佳解决方案是"删除并重建环境"。亚马逊回应称这是"用户错误而非 AI 错误",12 月事件仅影响中国大陆部分地区的单一服务。
AWS 占亚马逊营业利润的 60%,正大力推广包括"智能体"在内能根据指令独立操作的 AI 工具。12 月事件后,亚马逊实施强制同行评审和员工培训等多项安全措施,意图防止类似事故再次发生。
Financial Times
🍀在花频道 🍵茶馆聊天 📮投稿
Amazon Web Services(AWS)在近几个月内因自家 AI 编程工具错误导致至少两次服务中断。去年 12 月,AWS 一套客户成本分析系统因工程师允许 Kiro AI 编程工具自主操作而中断 13 小时,因该工具判断最佳解决方案是"删除并重建环境"。亚马逊回应称这是"用户错误而非 AI 错误",12 月事件仅影响中国大陆部分地区的单一服务。
AWS 占亚马逊营业利润的 60%,正大力推广包括"智能体"在内能根据指令独立操作的 AI 工具。12 月事件后,亚马逊实施强制同行评审和员工培训等多项安全措施,意图防止类似事故再次发生。
Financial Times
🍀在花频道 🍵茶馆聊天 📮投稿
https://www.newmobilelife.com/2026/02/21/anthropic-ai-security-cybersecurity-stocks/
OpenAI 与 Paradigm 联合发布 EVMbench,这是一个专门评估 AI 代理检测、修补和利用智能合约漏洞能力的基准测试。该测试基于来自 40 次审计的 120 个精选漏洞,大部分源自开源代码审计竞赛,并包含来自 Tempo 区块链安全审计过程的多个漏洞场景。
测试涵盖三种能力模式:检测模式要求代理审计智能合约并识别已知漏洞;修补模式要求在保持功能完整性的同时消除可利用性;利用模式则要求在沙盒区块链环境中执行端到端的资金提取攻击。在利用模式中,GPT-5.3-Codex 通过 Codex CLI 运行取得 72.2% 的成绩,相比六个月前发布的 GPT-5 的 31.9% 有显著提升。OpenAI 同时宣布投入 1000 万美元 API 积分,通过网络安全资助计划加速网络防御能力建设。
OpenAI
🍀在花频道 🍵茶馆聊天 📮投稿
所以你真正該問的問題只有一個:「我的一個小時值多少錢?」如果你是開發者、是創作者、是任何用時間換錢的人,請認真算這筆帳。用便宜模型省下的 API 費用,可能還不到你多花的時間值的十分之一。
⸻
#我的模型分層策略
基於目前的測試結果,我暫時是這樣分配的:
日常快速回覆:Grok 4.1 Fast。速度快、價格低、品質堪用,適合處理不需要太高智商的日常任務。
需要深度思考的任務:看情況切回 Sonnet 4.5,或者等 DeepSeek V3.2 速度改善後再考慮。有些任務就是需要聰明的腦子,這上面不能省。
最頂級的任務:Claude Sonnet 4.5,甚至 Opus。寫長文、做複雜分析、處理需要高度理解力的工作,頂級模型的品質差距在這些場景最明顯。
核心邏輯就是:用任務的重要程度來決定用哪個等級的模型,而不是一刀切只用最便宜或最貴的。
⸻
#給同樣在找替代方案的人的建議
如果你也在考慮從頂級模型往下探索便宜的替代方案,以下是我的幾個建議:
第一,先想清楚你的時間值多少錢。這是所有決策的起點。如果你的時間很值錢,省 API 費用的同時浪費大量時間來引導模型,是一筆虧本的買賣。
第二,Benchmark 分數不等於實際使用體驗。MiniMax M2.5 的跑分看起來不錯,但實際用起來跟頂級模型差很遠。別被數字騙了,自己試過才知道。
第三,不要期待一個模型通吃所有場景。這是我目前最大的心得。不同等級的模型適合不同的任務,學會分層使用才是最有效率的策略。
第四,如果只能試一個,先試 Grok 4.1 Fast。以 Budget 等級來說,它目前是我測過最均衡的選項。速度、價格、品質三個維度都有一定水準。
我還在持續測試更多模型,之後有新的發現會再更新。對了,已經有大神問我 Qwen3 Coder Next 測過了沒,還有最近剛推出自家 Claw 的 MoonshotAI Kimi K2.5 我也還沒試。下一步可能會接著測測看這兩個,目前就先用 Sonnet 4.5 跟 Grok 4.1 Fast 撐著,等有新心得再來更新。
#OpenRouter #OpenClaw #AIAgent #Claude #Grok #DeepSeek #LLM #模型比較 #AI助理
⸻
#我的模型分層策略
基於目前的測試結果,我暫時是這樣分配的:
日常快速回覆:Grok 4.1 Fast。速度快、價格低、品質堪用,適合處理不需要太高智商的日常任務。
需要深度思考的任務:看情況切回 Sonnet 4.5,或者等 DeepSeek V3.2 速度改善後再考慮。有些任務就是需要聰明的腦子,這上面不能省。
最頂級的任務:Claude Sonnet 4.5,甚至 Opus。寫長文、做複雜分析、處理需要高度理解力的工作,頂級模型的品質差距在這些場景最明顯。
核心邏輯就是:用任務的重要程度來決定用哪個等級的模型,而不是一刀切只用最便宜或最貴的。
⸻
#給同樣在找替代方案的人的建議
如果你也在考慮從頂級模型往下探索便宜的替代方案,以下是我的幾個建議:
第一,先想清楚你的時間值多少錢。這是所有決策的起點。如果你的時間很值錢,省 API 費用的同時浪費大量時間來引導模型,是一筆虧本的買賣。
第二,Benchmark 分數不等於實際使用體驗。MiniMax M2.5 的跑分看起來不錯,但實際用起來跟頂級模型差很遠。別被數字騙了,自己試過才知道。
第三,不要期待一個模型通吃所有場景。這是我目前最大的心得。不同等級的模型適合不同的任務,學會分層使用才是最有效率的策略。
第四,如果只能試一個,先試 Grok 4.1 Fast。以 Budget 等級來說,它目前是我測過最均衡的選項。速度、價格、品質三個維度都有一定水準。
我還在持續測試更多模型,之後有新的發現會再更新。對了,已經有大神問我 Qwen3 Coder Next 測過了沒,還有最近剛推出自家 Claw 的 MoonshotAI Kimi K2.5 我也還沒試。下一步可能會接著測測看這兩個,目前就先用 Sonnet 4.5 跟 Grok 4.1 Fast 撐著,等有新心得再來更新。
#OpenRouter #OpenClaw #AIAgent #Claude #Grok #DeepSeek #LLM #模型比較 #AI助理