AI Tools Nav
首页工具对比指南快讯Skills
EN
AI Tools Nav

精选 AI 工具导航,从选工具到用工具,一站式搞定。

RSSAPI

导航

  • 首页
  • 工具
  • 对比
  • 指南
  • 快讯
  • Skills

开放平台

  • 平台概览
  • API
  • RSS
  • 提交反馈

关于

  • 关于我们
  • 更新日志
© 2026 AI Tools Nav - AI 工具导航
AI 快讯

AI 快讯日报 | 2026-05-20

Google I/O 发布 Gemini 3.5 及智能体 Gemini Spark,OpenAI 加强图像溯源;行业多款重要模型与平台更新。

2026-05-20

AI 行业综合动态

今日 AI 行业的核心焦点是 Google I/O 2026 大会。Google 正式发布新一代模型 Gemini 3.5 以及全新的 AI 智能体 Gemini Spark,同时宣布 Gemini 应用将变得更主动,提供 7×24 小时帮助。此外,OpenAI 宣布为 AI 图像添加 C2PA 元数据和 SynthID 水印,以增强内容溯源。中国方面,百度、阿里、字节跳动等公司也纷纷推出重量级模型更新,AI 竞争进入白热化阶段。


Gemini

在 Google I/O 上,Gemini 3.5 正式亮相,随后 Google 还推出了 AI 智能体 Gemini Spark,后者能自动执行多步骤任务。同时,Gemini 应用迎来重大升级,可主动为用户提供提醒、日程管理等功能,被广泛视为向“超级个人助手”迈进的关键一步。来源:CNBC | Google Blog

ChatGPT

OpenAI 宣布推出 Guaranteed Capacity 服务,允许企业客户锁定专用算力,保障模型推理稳定性。此外,OpenAI 为 DALL·E 3 生成的图像全面集成 C2PA 元数据 和 Google DeepMind 的 SynthID 水印,提升 AI 内容可信度。来源:CNBC | The Next Web

Claude

Anthropic 宣布聘请 OpenAI 联合创始人 Andrej Karpathy 担任关键顾问,此举被视为对前沿 AI 研究的重大押注。同时,Anthropic 与 Cloudflare 联合推出 Claude Managed Agents,支持云端自动化部署,并且 Claude Code 发布了 v2.1.145 版本。来源:CNBC | Cloudflare Blog

Cursor

AI 编程工具 Cursor 发布 Composer 2,大幅增强了多文件协作和上下文感知能力。同时,有报道称 SpaceX 计划在 IPO 后以 600 亿美元收购 Cursor,但尚未得到官方确认。来源:Cursor Blog | The Next Web

Devin

Cognition 发布 Devin 2.1,新增 Auto-Triage 功能,可自动分析并分类软件缺陷,进一步提升开发效率。同时,Cursor 的 Composer 2.5 也同步更新,形成编程工具间的良性竞争。来源:Cognition Labs | Code Newsletter

DeepSeek

DeepSeek 在 V4.1 更新前率先推出 图像识别功能,并大幅降价以抢占市场份额。据 Yahoo Finance 分析,DeepSeek 的扩张正越来越依赖政府资金,反映出中国 AI 产业国家队力量的崛起。来源:CnTechPost | Reuters

豆包

字节跳动旗下的 豆包 发布 全模态理解模型,进一步巩固其作为 AI 超级入口的地位。当前豆包已整合搜索、创作、对话等功能,日活用户持续攀升。来源:新浪新闻 | AI Betas

通义千问

阿里发布新一代旗舰模型 Qwen3.7-Max,在多项基准测试中表现领先。此前推出的 Qwen3.5 已聚焦 AI Agent 方向,此次升级进一步强化了推理与多模态能力。来源:网易 | CNBC

文心一言

百度推出 文心大模型 5.1,在多榜单登顶,预训练成本降至业界 6%,搜索能力在国内领先。该模型强调“写得好更懂你”,并已在百度搜索、智能云等场景落地。来源:百度ERNIE Blog | 天脉财经

可灵

快手旗下 可灵 AI 传出拆分计划:拟以 200 亿美元估值融资 20 亿美元,腾讯正在洽谈参与。若成真,可灵将成为中国视频生成领域的独角兽。来源:腾讯新闻

Kimi

Kimi(月之暗面)推出开源浏览器操作工具 WebBridge,同时 Cerebras 为企业提供 Kimi K2.6 推理服务。据 Forbes 报道,Kimi 正在以 200 亿美元估值融资。来源:Open Source For You | Forbes

Perplexity

Perplexity 近期对部分 Pro 账户实施用量限制,引发用户不满。公司解释称系促销码滥用所致,并调整了高级模型调用策略。来源:PCMag

Midjourney

Midjourney 发布 V8 Alpha 版本,带来更精细的图像生成控制与风格一致性。同时官方更新日志显示多项修复与性能优化。来源:Midjourney Updates | V8 Alpha 页面

Notion AI

Notion 推出 开发者平台,支持自定义 Agent 构建和第三方集成。管理员现在可对自定义 AI Agent 进行更细粒度的权限控制,进一步拓展 Notion 在企业协作中的应用。来源:Notion Blog | Notion Releases

GitHub Copilot

GitHub Copilot 现已支持 Gemini 3.5 Flash 模型,同时推出 Copilot Cloud Agent,提供低成本、高效率的简单任务自动完成方案。来源:GitHub Changelog | GitHub Changelog

Bolt.new

Bolt.new 集成 Claude Sonnet 4.6,显著提升代码生成质量。同时平台推出 Bolt for Teams 企业版,强化团队协作与设计系统支持。来源:Bolt Blog | Bolt Blog

Flux

Flux AI 发布 CRAISEE Teams Enterprise,主打企业级可扩展性。此外 Flux 持续更新其图像生成模型,在速度和细节上有所提升。来源:OpenPR | Flux AI News

ElevenLabs

ElevenLabs 与音乐平台 Splice 合作,共同开发 AI 音乐创作产品。同时 ElevenLabs 文档显示其语音合成 API 在 4 月底进行了更新,支持更多语言和情绪表达。来源:Billboard | ElevenLabs Changelog

Pika

Pika 完成 8000 万美元 B 轮融资,估值达 4.7 亿美元。其 AI 视频生成工具在速度与易用性上超越 OpenAI Sora,吸引大量创作者。来源:AI for Automation

Sora

OpenAI 已决定 停用 Sora 视频平台,转向更聚焦核心业务。此举引发行业对其战略调整的讨论,Sora 的用户将迁移至其他 OpenAI 产品。来源:NYT | CNN

DALL·E 3

伴随水印功能的上线,DALL·E 3 面临被 OpenAI 逐步淘汰的传闻。但当前图像生成领域仍需依赖其高质量的视觉输出,社区对其未来走向高度关注。来源:OnyxRanked

Grok

Grok 出现短暂宕机,xAI 随后发布模型弃用通知(May 15, 2026)。另一方面,Elon Musk 演示了 Grok Agent 模式,称其为“重大能力解锁”,展示了 4 分钟以上的视频自主操作。来源:Economic Times | Gate News

Ideogram

Ideogram 3.0 发布,主打逼真度、设计感和风格一致性,被誉为 ChatGPT 与 Gemini 图像生成的有力替代品。来源:Digital Trends | Ideogram 官网

HeyGen

HeyGen 的 Avatar Agent 已上线 Agent.ai 平台,用户可部署数字人助手。同时 HeyGen 发布四月产品更新,包括多语言支持与更自然的唇形同步。来源:HeyGen Blog | YouTube

Gamma

Gamma 推出 Gamma Imagine,尝试将 AI 原生设计融入演示文稿。此前 Gamma 已融资 6800 万美元,成为 PPT 赛道的挑战者。来源:Yahoo Finance | NYT

Descript

Descript 发布 API(Open Beta),并带来一系列编辑与工作流更新,让开发者能自动化音频/视频编辑。来源:Newsfile | Descript Changelog

海螺 AI

海螺 AI(Hailuo)持续推广其视频生成能力,定位“每个想法都是一部大片”。其视频生成工具已支持从文本和图片生成高质量短片。来源:海螺官网 | YouTube

讯飞听见

讯飞听见 升级语音转写引擎,支持中英粤自由说,并新增 AI 纪要功能,可自动抓取笔记中的图片重点。科大讯飞同时升级“听见 AI 的声音”公益计划,关爱听障群体。来源:讯飞听见 | ITBear

秘塔 AI

秘塔 AI 在 AI 产品榜上表现稳定,其搜索产品受到关注。此外相关报道提及 DeepSeek 的最新回应,秘塔作为中文搜索新锐持续迭代。来源:AI产品榜 | IT之家

Consensus

Consensus 利用 GPT-5 和 OpenAI Responses API 将数周研究缩短至数分钟,并为非营利组织提供定制化 AI 研究搜索引擎。来源:OpenAI | One Hundred Nights

提及的工具

Bolt.new→ChatGPT→Claude→Cursor→DeepSeek→Devin→豆包→ElevenLabs→Flux→Gemini→GitHub Copilot→Kimi→可灵→秘塔 AI→Midjourney→Notion AI→Perplexity→Pika→通义千问→Sora→Consensus→DALL·E 3→Descript→文心一言→Gamma→Grok→海螺 AI→HeyGen→Ideogram→讯飞听见→
精选
B
Freemium

Bolt.new

StackBlitz 推出的浏览器内 AI 全栈应用生成器,输入提示词即可生成可运行的 Web 应用并一键部署。

智能体编程全栈部署
精选
C
Freemium

ChatGPT

OpenAI 推出的对话式 AI 助手,支持文本生成、代码编写、创意写作等多种场景。

对话对话写作编程
精选
C
Freemium

Claude

Anthropic 开发的 AI 助手,擅长长文本分析、代码审查和复杂推理任务。

对话对话编程分析
精选
C
Freemium

Cursor

基于 VS Code 的 AI 优先代码编辑器,内置强大的 AI 补全、内联编辑和代码库对话功能。

智能体编辑器编程代码补全
精选
D
Freemium

DeepSeek

深度求索推出的高性能大语言模型,以极低成本实现 GPT-4 级别性能,支持 128K 上下文和深度推理。

对话对话编程推理
精选
D
付费

Devin

Cognition AI 推出的全自主 AI 软件工程师,可独立完成从需求分析到代码部署的完整开发流程。

智能体编程自动化全栈
精选
豆
免费

豆包

字节跳动推出的 AI 助手,集成文生图、语音对话、网页搜索等多模态能力,中文体验优秀。

对话对话多模态搜索
精选
E
Freemium

ElevenLabs

领先的 AI 语音合成平台,支持多种语言的文本转语音和声音克隆。

音频语音合成声音克隆多语言
精选
F
Freemium

Flux

Stable Diffusion 原团队 Black Forest Labs 推出的图像生成模型,画质和文字渲染能力业界领先。

图像图像生成高质量文字渲染
精选
G
Freemium

Gemini

Google 的多模态 AI 模型,深度集成 Google 生态,支持文本、图像、代码理解。

对话对话多模态搜索
精选
G
Freemium

GitHub Copilot

GitHub 出品的 AI 编程助手,深度集成 VS Code、JetBrains 等主流 IDE,支持代码补全和对话式编程。

智能体代码补全IDE 集成编程
精选
K
Freemium

Kimi

月之暗面推出的 AI 助手,以超长上下文(200万字)著称,擅长文档分析、长文摘要和深度研究。

对话对话长文本分析
精选
可
Freemium

可灵

快手推出的 AI 视频生成工具,支持文字和图片生成高质量短视频,物理效果逼真。

视频视频生成短视频物理模拟
精选
秘
免费

秘塔 AI

AI 搜索引擎,提供结构化答案和思维导图,适合深度研究和知识整理。

搜索搜索研究思维导图
精选
M
付费

Midjourney

顶级的 AI 图像生成工具,以艺术风格和高质量输出闻名。

图像图像生成艺术设计
精选
N
付费

Notion AI

Notion 内置的 AI 功能,辅助写作、总结、翻译和头脑风暴。

办公写作总结协作
精选
P
Freemium

Perplexity

AI 搜索引擎,结合大语言模型和实时网络搜索,提供带引用来源的精准回答,支持深度研究模式。

搜索搜索研究实时信息
精选
P
Freemium

Pika

Pika Labs 推出的 AI 视频生成工具,支持文字/图片转视频,创意效果丰富,操作简单。

视频视频生成创意文字转视频
精选
通
Freemium

通义千问

阿里巴巴推出的大语言模型系列,覆盖对话、编程、多模态等多个领域,支持长文本和复杂推理。

对话对话编程多模态
精选
S
付费

Sora

OpenAI 的文字转视频模型,可生成长达一分钟的高质量视频。

视频视频生成文字转视频
C
Freemium

Consensus

AI 学术搜索引擎,直接从科研论文中提取和总结研究发现。

搜索学术搜索论文研究
D
Freemium

DALL·E 3

OpenAI 的图像生成模型,擅长理解复杂提示词,生成准确且创意的图片。

图像图像生成创意
D
Freemium

Descript

AI 驱动的音视频编辑工具,像编辑文档一样编辑播客和视频,自动转录、去口癖、AI 配音。

音频播客视频编辑转录
文
Freemium

文心一言

百度推出的知识增强大模型,深度整合百度搜索生态,擅长中文理解和知识问答。

对话对话知识中文
G
Freemium

Gamma

AI 驱动的演示文稿和文档创建工具,快速生成精美的 PPT 和网页文档。

办公演示文稿文档PPT
G
Freemium

Grok

xAI 推出的 AI 助手,以实时 X 平台数据访问、幽默对话风格和深度思考模式为特色。

对话对话实时信息推理
海
Freemium

海螺 AI

MiniMax 推出的 AI 语音与创作平台,支持语音合成、AI 音乐和智能对话。

音频语音合成音乐对话
H
付费

HeyGen

AI 数字人视频生成平台,支持虚拟主播、视频翻译和口型同步,广泛用于营销和教育。

视频数字人视频翻译口型同步
I
Freemium

Ideogram

以文字渲染见长的 AI 图像生成工具,可在图片中准确生成清晰的文字和 Logo。

图像图像生成文字渲染Logo
讯
Freemium

讯飞听见

科大讯飞推出的语音转文字平台,支持实时语音识别、会议记录和多语种翻译。

音频语音转文字会议翻译
← 返回 AI 快讯列表