AI Tools Nav
首页工具对比指南快讯Skills
EN
AI Tools Nav

精选 AI 工具导航,从选工具到用工具,一站式搞定。

RSSAPI

导航

  • 首页
  • 工具
  • 对比
  • 指南
  • 快讯
  • Skills

开放平台

  • 平台概览
  • API
  • RSS
  • 提交反馈

关于

  • 关于我们
  • 更新日志
© 2026 AI Tools Nav - AI 工具导航
AI 快讯

AI 快讯日报 | 2026-05-17

OpenAI 发布 GPT-5.5 Instant 并统一产品线,Google 推出 Gemini Intelligence 迎战苹果;多家 AI 公司获融资或发布重大更新,行业竞争白热化。

2026-05-17

AI 行业综合动态

本周 AI 行业迎来密集更新。OpenAI 发布 GPT-5.5 Instant 并统一 ChatGPT、Codex 与 API 部门,同时关闭 Sora 和 DALL·E 3 API 以集中算力。Google 在 I/O 大会前预览 Android 17 的“Gemini Intelligence”功能,并测试全新 AI 代理“Gemini Spark”。此外,Intercom 更名为 Fin,推出专门管理其他 AI Agent 的 Agent;Appian 发布流程 AI 企业方案。行业关于 AI 聊天机器人导致用户认知偏差的讨论也引发关注(ABC News、Bloomberg、VentureBeat)。

OpenAI / ChatGPT

  • OpenAI 正式发布 GPT-5.5 Instant,号称更智能、更清晰、更个性化(OpenAI);同时推出 ChatGPT 个人财务管理功能,可连接银行账户提供理财建议(Times of India)。公司还宣布将 ChatGPT、Codex 和开发者 API 统一归由联合创始人 Brockman 领导,以应对 Google I/O 竞争(TechTimes)。

Google Gemini

  • Google 发布“Gemini Intelligence”,为 Android 17 带来主动式 AI 体验,可预测用户需求并执行跨应用操作(Google Blog)。同时,9to5Google 爆料称 Google 正在开发“Gemini Spark”,一款全新的 AI 代理功能(9to5Google)。

Anthropic Claude

  • Anthropic 扩展 Claude 面向律所和律师的专业工具,提供合同审查、法律研究等定制功能(Reuters)。普华永道(PwC)宣布大规模部署 Claude,用于技术构建、交易执行和企业职能重塑(Anthropic)。

Cursor

  • Cursor 发布 3.3 版本,新增并行构建、拆分 PR 及统一 PR 审查功能(Start Debugging)。另据 NBC4 报道,SpaceX 表示有意在今年晚些时候以 600 亿美元收购 AI 编程工具 Cursor(NBC4)。

DeepSeek

  • DeepSeek 在 V4.1 更新前率先推出图像识别功能,进一步提升多模态能力(CnTechPost)。中国国家 AI 基金拟以高达 40 亿美元投资 DeepSeek,挑战依赖 Nvidia 的竞争对手(TechTimes)。

Devin

  • Cognition 推出 Devin 2.1 和 2.2 版本,进一步提升自主编码 Agent 的协作与调试能力(Cognition、Cognition)。

Bolt.new

  • Bolt.new 宣布与 Pica 整合,实现无缝连接(Bolt);同时推出企业级部署方案,支持 Microsoft Azure 和 Microsoft 365(VMblog)。Bolt for Teams 也迎来重大升级(Bolt)。

ElevenLabs

  • 语音 AI 公司 ElevenLabs 年化收入(ARR)突破 5 亿美元,并宣布新一轮融资(Economic Times)。CEO 表示将为每个团队(包括销售、法务)配备工程师,推动“氛围编码”文化(Business Insider)。

Flux

  • Flux AI 发布 Spring 2026 更新,提升 AI 速度、布局优化和智能采购(Flux);同时推出 CRAISEE Teams Enterprise,首个为组织设计的可扩展生成式 AI 平台(Post-Crescent)。

GitHub Copilot

  • GitHub Copilot 推出新的个人订阅计划,Pro 和 Pro+ 引入弹性配额,并新增 Max 计划(GitHub Blog)。开发者现可通过 REST API 启动 Copilot Cloud Agent 任务(GitHub Changelog)。

Kimi

  • 月之暗面(Moonshot)旗下 Kimi 推出 WebBridge 开源方案,使 AI Agent 能够本地控制浏览器,同时保护用户数据隐私(Decrypt)。Kimi 估值已达 200 亿美元,Moonshot 完成 20 亿美元融资(Dapta)。

豆包

  • 字节跳动旗下豆包开启付费模式,被视为字节整理 Agent 生态的开端(钛媒体)。有分析认为豆包急于“收割”用户,可能面临用户流失风险(ChinaCSR)。

可灵

  • 快手旗下可灵 AI 传出独立上市计划,估值或达千亿人民币(约 200 亿美元),并考虑引入外部融资(36氪、腾讯新闻)。

秘塔 AI

  • 秘塔科技完成数千万元人民币 Pre-A 轮融资,全面推进辅助文档自动化(36氪)。秘塔 AI 搜索产品在 AI 产品榜中表现亮眼(AICPB)。

Midjourney

  • Midjourney 发布 V8 Alpha 版本,带来全新图像生成能力(Midjourney Updates)。

Notion AI

  • Notion 推出开发者平台 3.5 版本,允许开发者构建自定义集成和 Agent(Notion);同时新增自定义 Agent 控制功能,方便管理员管理(Notion)。

Perplexity

  • Perplexity 推出面向 Mac 用户的个人计算机 AI Agent,与本地 AI 助手竞争(The AI Insider)。

Pika

  • AI 视频初创公司 Pika 完成 8000 万美元融资,以应对 OpenAI 和 Google 的竞争(Washington Post via Neuron)。

通义千问

  • 阿里通义千问接入国家药监局,提升大模型权威性与责任性(新浪财经);同时接入淘宝,推出智能体式购物服务(AIbase)。

Sora

  • OpenAI 正式关闭 Sora,将算力转向编码和企业工具(Silicon Report)。

Consensus

  • AI 科研工具 Consensus 完成 3000 万美元融资,加速学术发现(Signalbase)。

DALL·E 3

  • OpenAI 按计划于 5 月 12 日关闭 DALL·E API,建议用户迁移至 GPT Image 1(Creative AI News)。

Descript

  • Descript 开放 API 公测版,同时推出编辑和工作流更新(Newsfile)。

文心一言

  • 百度发布文心 5.1,多项评测登顶,强调“写得好更懂你”(ERNIE Blog)。

Gamma

  • Gamma 推出 AI 原生设计工具 Gamma Imagine,挑战 Canva 和 Adobe(TechCrunch)。

Grok

  • 据 Tech Startups 报道,xAI 的 Grok 在 AI 竞赛中失去势头,原因是 Anthropic 抢走了 SpaceX 的计算资源(Tech Startups);xAI 于 5 月 15 日弃用部分旧模型(xAI Docs)。

海螺 AI

  • 海螺 AI 公布 AI 电影派对官方阵容,展示最新视频生成技术(traeai)。

HeyGen

  • HeyGen 发布 2026 年 4 月产品更新,持续优化数字人视频生成体验(HeyGen Blog)。

Ideogram

  • Ideogram 在 4 月更新中改进文本渲染和风格一致性(Releasebot)。

讯飞听见

  • 讯飞听见语音转写引擎升级,支持中英粤自由说,AI 纪要可自动提取图片重点(讯飞听见);PC 端升级图文并茂的 AI 记录知识库(太平洋科技)。

提及的工具

Bolt.new→ChatGPT→Claude→Cursor→DeepSeek→Devin→豆包→ElevenLabs→Flux→Gemini→GitHub Copilot→Kimi→可灵→秘塔 AI→Midjourney→Notion AI→Perplexity→Pika→通义千问→Sora→Consensus→DALL·E 3→Descript→文心一言→Gamma→Grok→海螺 AI→HeyGen→Ideogram→讯飞听见→
精选
B
Freemium

Bolt.new

StackBlitz 推出的浏览器内 AI 全栈应用生成器,输入提示词即可生成可运行的 Web 应用并一键部署。

智能体编程全栈部署
精选
C
Freemium

ChatGPT

OpenAI 推出的对话式 AI 助手,支持文本生成、代码编写、创意写作等多种场景。

对话对话写作编程
精选
C
Freemium

Claude

Anthropic 开发的 AI 助手,擅长长文本分析、代码审查和复杂推理任务。

对话对话编程分析
精选
C
Freemium

Cursor

基于 VS Code 的 AI 优先代码编辑器,内置强大的 AI 补全、内联编辑和代码库对话功能。

智能体编辑器编程代码补全
精选
D
Freemium

DeepSeek

深度求索推出的高性能大语言模型,以极低成本实现 GPT-4 级别性能,支持 128K 上下文和深度推理。

对话对话编程推理
精选
D
付费

Devin

Cognition AI 推出的全自主 AI 软件工程师,可独立完成从需求分析到代码部署的完整开发流程。

智能体编程自动化全栈
精选
豆
免费

豆包

字节跳动推出的 AI 助手,集成文生图、语音对话、网页搜索等多模态能力,中文体验优秀。

对话对话多模态搜索
精选
E
Freemium

ElevenLabs

领先的 AI 语音合成平台,支持多种语言的文本转语音和声音克隆。

音频语音合成声音克隆多语言
精选
F
Freemium

Flux

Stable Diffusion 原团队 Black Forest Labs 推出的图像生成模型,画质和文字渲染能力业界领先。

图像图像生成高质量文字渲染
精选
G
Freemium

Gemini

Google 的多模态 AI 模型,深度集成 Google 生态,支持文本、图像、代码理解。

对话对话多模态搜索
精选
G
Freemium

GitHub Copilot

GitHub 出品的 AI 编程助手,深度集成 VS Code、JetBrains 等主流 IDE,支持代码补全和对话式编程。

智能体代码补全IDE 集成编程
精选
K
Freemium

Kimi

月之暗面推出的 AI 助手,以超长上下文(200万字)著称,擅长文档分析、长文摘要和深度研究。

对话对话长文本分析
精选
可
Freemium

可灵

快手推出的 AI 视频生成工具,支持文字和图片生成高质量短视频,物理效果逼真。

视频视频生成短视频物理模拟
精选
秘
免费

秘塔 AI

AI 搜索引擎,提供结构化答案和思维导图,适合深度研究和知识整理。

搜索搜索研究思维导图
精选
M
付费

Midjourney

顶级的 AI 图像生成工具,以艺术风格和高质量输出闻名。

图像图像生成艺术设计
精选
N
付费

Notion AI

Notion 内置的 AI 功能,辅助写作、总结、翻译和头脑风暴。

办公写作总结协作
精选
P
Freemium

Perplexity

AI 搜索引擎,结合大语言模型和实时网络搜索,提供带引用来源的精准回答,支持深度研究模式。

搜索搜索研究实时信息
精选
P
Freemium

Pika

Pika Labs 推出的 AI 视频生成工具,支持文字/图片转视频,创意效果丰富,操作简单。

视频视频生成创意文字转视频
精选
通
Freemium

通义千问

阿里巴巴推出的大语言模型系列,覆盖对话、编程、多模态等多个领域,支持长文本和复杂推理。

对话对话编程多模态
精选
S
付费

Sora

OpenAI 的文字转视频模型,可生成长达一分钟的高质量视频。

视频视频生成文字转视频
C
Freemium

Consensus

AI 学术搜索引擎,直接从科研论文中提取和总结研究发现。

搜索学术搜索论文研究
D
Freemium

DALL·E 3

OpenAI 的图像生成模型,擅长理解复杂提示词,生成准确且创意的图片。

图像图像生成创意
D
Freemium

Descript

AI 驱动的音视频编辑工具,像编辑文档一样编辑播客和视频,自动转录、去口癖、AI 配音。

音频播客视频编辑转录
文
Freemium

文心一言

百度推出的知识增强大模型,深度整合百度搜索生态,擅长中文理解和知识问答。

对话对话知识中文
G
Freemium

Gamma

AI 驱动的演示文稿和文档创建工具,快速生成精美的 PPT 和网页文档。

办公演示文稿文档PPT
G
Freemium

Grok

xAI 推出的 AI 助手,以实时 X 平台数据访问、幽默对话风格和深度思考模式为特色。

对话对话实时信息推理
海
Freemium

海螺 AI

MiniMax 推出的 AI 语音与创作平台,支持语音合成、AI 音乐和智能对话。

音频语音合成音乐对话
H
付费

HeyGen

AI 数字人视频生成平台,支持虚拟主播、视频翻译和口型同步,广泛用于营销和教育。

视频数字人视频翻译口型同步
I
Freemium

Ideogram

以文字渲染见长的 AI 图像生成工具,可在图片中准确生成清晰的文字和 Logo。

图像图像生成文字渲染Logo
讯
Freemium

讯飞听见

科大讯飞推出的语音转文字平台,支持实时语音识别、会议记录和多语种翻译。

音频语音转文字会议翻译
← 返回 AI 快讯列表