DeepSeek V4 识图模式灰度上线,最后一块短板补上了
DeepSeek V4 识图模式在官方 App 灰度上线,与快速模式、专家模式并列。作者用桂林象鼻山照片测试,模型不仅能识别地标,还能推理形态特征和地理位置。这是真正的视觉理解而非 OCR。
每日筛选关键变化,保留值得继续看的内容。
DeepSeek V4 识图模式在官方 App 灰度上线,与快速模式、专家模式并列。作者用桂林象鼻山照片测试,模型不仅能识别地标,还能推理形态特征和地理位置。这是真正的视觉理解而非 OCR。
OpenAI 于 4 月 22 日发布 Workspace Agents 研究预览版,将 ChatGPT 从个人对话工具升级为团队级自动化平台。基于 GPT-5.5 的 Codex 能力,Agents 可在 Slack 中直接调用,处理长周期复杂任务。
Anthropic 在 4 月为 Claude Code 推出 Task Budgets 公测版和高分辨率视觉能力。前者让开发者可以精确控制代理的 Token 消耗上限,后者显著提升了截图分析和 UI 调试的准确率。编程代理正在从"能用"走向"可控"。
AMD 宣布 Advancing AI 2026 大会将于 7 月 23 日在旧金山举行。在 NVIDIA 主导 AI 训练芯片市场、华为昇腾在国内快速扩张的背景下,AMD 的下一步产品路线图将直接影响全球 AI 算力格局。
ComposioHQ 维护的 awesome-codex-skills 仓库今日登顶 GitHub Trending,单日新增 1177 星。该仓库系统整理了 Codex CLI 和 API 的实用技能集合,反映出 Agent 技能生态正在成为开发者基础设施的新热点。
DeepSeek V4 识图模式在官方 App 灰度上线,与快速模式、专家模式并列。作者用桂林象鼻山照片测试,模型不仅能识别地标,还能推理形态特征和地理位置。这是真正的视觉理解而非 OCR。
OpenAI 于 4 月 22 日发布 Workspace Agents 研究预览版,将 ChatGPT 从个人对话工具升级为团队级自动化平台。基于 GPT-5.5 的 Codex 能力,Agents 可在 Slack 中直接调用,处理长周期复杂任务。
Anthropic 在 4 月为 Claude Code 推出 Task Budgets 公测版和高分辨率视觉能力。前者让开发者可以精确控制代理的 Token 消耗上限,后者显著提升了截图分析和 UI 调试的准确率。编程代理正在从"能用"走向"可控"。
DeepSeek V4 Flash 发布数周后,用户实测反馈集中指向工具调用能力的大幅提升。从下载文件到自动上传分析,复杂多步工作流现在可通过自然语言指令一次性完成,且成本极低。