CodeGraph 是一个专为 Claude Code、Cursor、Codex、OpenCode 等 AI 编程 Agent 打造的预索引代码知识图谱工具。
它能让 AI 不再每次都通过 grep、read、explore 盲目扫描代码,而是直接查询一个语义化知识图谱,实现更快、更省、更准的代码理解与开发。
📮投稿 📢频道 💬吹水 🌐网站
研究团队测试七大 AI 模型学术诚信,逾三成出现造假行为
北京大学、同济大学和德国图宾根大学的研究团队近日测试了七款顶尖 AI 大模型的学术诚信。结果显示,在 231 次高压测试中,模型整体问题率达到 34%。面对空白或缺失数据,所有被测模型都曾伪造数据或参数来“完成任务”,未主动报告错误。
其中,Claude 4.6 Sonnet 表现最好,仅出现一次致命失误;ChatGPT-5.2 和 DeepSeek V3.2 各有两到三次失误;Kimi 2.5 Pro 情况最差,共失误 12 次,会捏造数据和虚假文献。研究团队指出,“完成度偏见”是问题根源,建议用户避免下达“必须完成任务”的高压指令,以降低 AI 隐瞒伪造的比例。
Now 新聞| Arxiv
🌸 在花频道 · 备用频道 · 投稿通道
北京大学、同济大学和德国图宾根大学的研究团队近日测试了七款顶尖 AI 大模型的学术诚信。结果显示,在 231 次高压测试中,模型整体问题率达到 34%。面对空白或缺失数据,所有被测模型都曾伪造数据或参数来“完成任务”,未主动报告错误。
其中,Claude 4.6 Sonnet 表现最好,仅出现一次致命失误;ChatGPT-5.2 和 DeepSeek V3.2 各有两到三次失误;Kimi 2.5 Pro 情况最差,共失误 12 次,会捏造数据和虚假文献。研究团队指出,“完成度偏见”是问题根源,建议用户避免下达“必须完成任务”的高压指令,以降低 AI 隐瞒伪造的比例。
Now 新聞| Arxiv
🌸 在花频道 · 备用频道 · 投稿通道
GitHub 确认员工设备被“投毒”扩展攻破,约 3800 个内部仓库遭外泄
GitHub 证实,其内部代码仓库发生未授权访问事件,源头是一名员工电脑安装了被投毒的 VS Code 扩展程序。公司称,攻击者声称获取的约 3800 个内部仓库数量,与当前调查判断“方向一致”。GitHub 已紧急移除恶意扩展、隔离终端并轮换关键密钥,同时强调暂无证据显示客户代码或企业仓库受到影响,相关调查仍在持续。
另外有安全圈人士和部分媒体援引黑客论坛信息称,外泄内容可能涉及 Copilot、CodeQL 等核心项目源码。
GitHub
🌸 在花频道 · 备用频道 · 投稿通道
GitHub 证实,其内部代码仓库发生未授权访问事件,源头是一名员工电脑安装了被投毒的 VS Code 扩展程序。公司称,攻击者声称获取的约 3800 个内部仓库数量,与当前调查判断“方向一致”。GitHub 已紧急移除恶意扩展、隔离终端并轮换关键密钥,同时强调暂无证据显示客户代码或企业仓库受到影响,相关调查仍在持续。
另外有安全圈人士和部分媒体援引黑客论坛信息称,外泄内容可能涉及 Copilot、CodeQL 等核心项目源码。
GitHub
🌸 在花频道 · 备用频道 · 投稿通道