AI Tools Nav
首页工具对比指南快讯Skills
EN
AI Tools Nav

精选 AI 工具导航,从选工具到用工具,一站式搞定。

RSSAPI

导航

  • 首页
  • 工具
  • 对比
  • 指南
  • 快讯
  • Skills

开放平台

  • 平台概览
  • API
  • RSS
  • 提交反馈

关于

  • 关于我们
  • 更新日志
© 2026 AI Tools Nav - AI 工具导航
AI 快讯

AI 快讯日报 | 2026-05-18

OpenAI 发布 GPT-5.5 Instant,加速多模态推理;Google 全力将 Gemini 融入 Android;多家 AI 公司迎来产品大版本更新与融资新动态。

2026-05-18

AI 行业综合动态

  • GPT-5.5 正式发布:OpenAI 推出 GPT-5.5 和 GPT-5.5 Instant,后者在推理速度、清晰度和个性化上显著提升。同时,OpenAI 正将 ChatGPT 与 Codex 合并为统一的 Agentic 平台,由 Greg Brockman 领导,并探索金融管理功能。来源 | 来源
  • AI 深伪引发社会隐忧:全球多地报告利用 AI 深度伪造针对女性的新型暴力浪潮,欧盟也在加速评估具备网络攻击能力的 AI 模型的安全准备。来源 | 来源
  • AI 致裁员潮持续:研究显示近期四分之一的裁员直接归因于 AI 替代。企业级 AI 工具加速落地,如 Mixpanel 推出 AI 产品智能平台,Coupa 发布 Compose 和 Catalyst 以加速 Agentic AI 价值交付。来源 | 来源 | 来源

ChatGPT

  • OpenAI 发布 GPT-5.5 Instant,主打更智能、更清晰、更个性化的对话体验,推理速度大幅提升。此外,OpenAI 计划将 ChatGPT 转型为个人财务助手,并推出新的金融工具。来源
  • 公司架构调整:Greg Brockman 将统一领导 ChatGPT 和 Codex 团队,整合为统一的端到端 Agentic 平台,结束之前分散的“支线任务”。来源

Claude

  • Anthropic 在旧金山举办“Code w/ Claude SF 2026”开发者活动,聚焦 AI 指数级增长的应用构建。同时,Claude Code 被发现存在远程代码执行漏洞,攻击者可利用恶意深度链接执行命令,用户需及时更新。来源 | 来源
  • 普华永道宣布与 Anthropic 扩大合作,将 Claude 部署于技术构建、交易、企业功能重构等领域,帮助客户加速数字化转型。来源

Cursor

  • Cursor 3.3 版本正式发布,新增并行构建(Build in Parallel)、拆分 PR 及统一 PR 审查功能,大幅提升开发者协作效率。来源
  • 据 Fortune 报道,SpaceX 与 Cursor 达成一笔 600 亿美元的交易,突显 Cursor 在 AI 编程领域的商业价值。(注:原文为 SpaceX strikes a $60 billion deal for Cursor deal,可能指合作或投资。)来源

DeepSeek

  • DeepSeek 在 V4.1 更新前率先推出了图像识别功能,进一步提升多模态能力。尽管新模型并未像之前那样引发市场轰动,但公司仍在积极融资。来源 | 来源
  • DeepSeek 寻求创纪录的 73 亿美元 AI 融资轮,彰显中国 AI 企业的资本野心。来源

Devin

  • Cognition 连续推出 Devin 2.1 和 Devin 2.2,持续优化了自主编程能力与团队协作体验。更新日志显示 Devin 在代码调试、任务管理和环境配置方面取得显著进步。来源 | 来源

豆包

  • 字节旗下豆包 DAU 已破亿,月活达到 3.45 亿,成为字节史上推广费用最少的破亿产品。但高增长下内部仍感焦虑,正探索付费订阅模式。来源 | 来源
  • 豆包推出付费计划,标志着国产 AI 大模型正式告别免费狂欢,进入商业化加速。来源

ElevenLabs

  • 语音 AI 公司 ElevenLabs 年度经常性收入(ARR)突破 5 亿美元,并宣布新一轮融资。CEO 表示将在销售、法务等每个团队中增加一名工程师,以推动“氛围编码”(vibe coding)理念落地。来源 | 来源
  • ElevenLabs 与 European Enterprise Evolutio 达成合作,加速在欧洲企业级 Agentic AI 的部署。来源

Flux

  • Flux 发布 Spring 2026 更新,带来了更快的 AI 处理速度、更好的布局能力以及更智能的资源定位,进一步优化电子设计自动化工作流。来源

Gemini

  • Google 正在加速将 Gemini 嵌入 Android 系统核心,在苹果 AI 重启前抢占生态优势。Gemini App 新增“思考水平”控制,并集成 Canva、Instacart、OpenTable 等第三方服务。来源 | 来源
  • “Gemini Intelligence”功能亮相 Android 平台,提供主动式 AI 体验,可预测用户需求并自动执行操作。来源

GitHub Copilot

  • GitHub Copilot 个人计划迎来重大调整:Pro 和 Pro+ 新增弹性配额(flex allotments),并推出了全新的 Max 计划,为重度用户提供更多功能。同时,REST API 现已支持启动 Copilot Cloud Agent ilot Cloud Agent 任务,实现自动化开发流水线。来源](https://github.blog/news-insights/company-news/github-copilot-individual-plans/) | 来源

Kimi

  • 月之暗面推出 Kimi WebBridge,一款开源 AI 浏览器操作代理,可自动执行复杂网页任务。此举使得开源社区能够本地运行浏览器自动化 AI,类似 Google Mariner 的思路。来源 | 来源
  • Kimi 正在进行新一轮融资,估值有望达到 200 亿美元,成为国内头部 AI 创业公司之一。公式

可灵 AI

  • 快手旗下可灵 AI 传出独立上市计划,公司正评估可能引入外部融资,估值或达千亿人民币。2025 年收入预计翻倍,二季度又增一亿。来源 | 来源

Midjourney

  • Midjourney 发布 V8 Alpha 版本,带来了全新的图像生成质量与风格控制能力。官方更新日志显示其在 AI 视觉创作领域的持续领跑地位。来源

Notion AI

  • Notion 上线 3.5 版本,正式发布 Notion 开发者平台,支持自定义 Agent 控制功能上线,为团队提供更灵活的 AI 自动化管理。来源 | 来源

Perplexity

  • Perplexity 推出面向所有 Mac 用户的个人计算机 AI Agent,可直接运行于本地,与现有 AI 桌面助手竞争。同时,Morningstar 也宣布集成 Perplexity,扩大金融服务 AI 应用场景。来源 | 来源

Pika

  • Pika 正式向所有用户开放“AI Selves”功能,允许用户创建个性化的 AI 分身视频。此前 Pika 已累计融资 1.35 35 亿美元,超越 OpenAI 的 Sora 在视频生成领域获得市场认可。来源 | 来源

通义千问千问

  • 通义千问与淘宝打通,在今年 618 购物节期间,用户可直接在淘宝内调用千问进行 AI 导购,打响 AI 购物入口争夺战。此外,千问还接入了国家药监局数据,强化权威信息查询权威药品信息,体现大模型在专业领域的责任担当。来源 | 来源 | 来源

Sora 关闭

  • OpenAI 宣布正式关闭 AI 视频生成产品 Sora,转而聚焦更高效的多模态模型 GPT Image 等新方案。用户需迁移至其它 OpenAI 视频工具。来源 | 来源

Consensus

  • AI 学术搜索工具 Consensus 完成 3000 万美元融资,以推动机器从海量研究文献中提取知识,加速科学发现的民主化。[来源](https://www.trysignalbase.com/news/funding/consensus-raises- successfully-300m-to-advance) | 来源

DALL·E 3

  • OpenAI 宣布 DALL·E API 于 2026 年 5 月 12 日正式关闭,所有图像生成需求需迁移至 GPT Image 系列 API(如 gpt-image-Image-1)。用户需尽快调整以确保服务连续性。来源 | 来源

Descript

  • 音视频编辑工具 Descript 正式开放 API(Beta 版),支持开发者集成编辑与转写工作流。同时产品持续更新,包含更好的字幕轨道和协作功能。来源 | 来源

文心一言

  • 百度正式发布文心大模型 5.1,在多榜单登顶。强调“写得好”的同时更懂用户个性化需求,加强了对中文复杂语义的理解。来源 | 来源

Gamma

  • Gamma 推出 Gamma Imagine 功能,将 AI 原生设计工具扩展到大众市场,可直接在演示文档中生成高质量图像,对标 Canva 和 Adobe。[来源](https://www. businesswire.com/news/home/20260317085752/en/Gamma-Launches-Gamma-Imagine-to-Bring-AI-Native-Design-to-the-Masses) | 来源

Grok

  • xAI 宣布将于 2026 年 5 月 15 日弃用部分旧模型,提醒开发者提前迁移。另外有报道称 Grok 在算力竞赛中失势,Anthropic 抢走了 SpaceX 的算力资源,导致 Grok 发展放缓。来源](https://docs.x.ai/developers/migration/may-15-deprecation) | 来源

HeyGen

  • HeyGen 发布 2026 年 2 月产品更新,重点包括 Avatar Agent 在 Agent.ai 平台上上线,让数字分身可在第三方 AI 系统内自主交互。一月份更新还添加了更高清的视频模板。来源heygen.com/blog/heygen-february-2026-release) | 来源

Ideogram

  • Ideogram 3.0 正式发布,在文字渲染、构图质量和手部细节方面有所改进,继续保持其在文本到图像生成领域的领先地位。来源 | 来源

听见 AI(讯飞听见)

  • 科大讯飞“听见 AI 的声音”公益项目七周年,已服务 10 万听障用户,转写时长超过 2 亿分钟。同时推出“讯飞听见会写”AI 新闻稿自动生成功能,并联合中国移动发布“灵犀·星火智盒”系列产品。来源 | 来源

提及的工具

ChatGPT→Claude→Cursor→DeepSeek→Devin→豆包→ElevenLabs→Flux→Gemini→GitHub Copilot→Kimi→可灵→Midjourney→Notion AI→Perplexity→Pika→通义千问→Sora→Consensus→Descript→文心一言→Gamma→Grok→HeyGen→Ideogram→讯飞听见→
精选
C
Freemium

ChatGPT

OpenAI 推出的对话式 AI 助手,支持文本生成、代码编写、创意写作等多种场景。

对话对话写作编程
精选
C
Freemium

Claude

Anthropic 开发的 AI 助手,擅长长文本分析、代码审查和复杂推理任务。

对话对话编程分析
精选
C
Freemium

Cursor

基于 VS Code 的 AI 优先代码编辑器,内置强大的 AI 补全、内联编辑和代码库对话功能。

智能体编辑器编程代码补全
精选
D
Freemium

DeepSeek

深度求索推出的高性能大语言模型,以极低成本实现 GPT-4 级别性能,支持 128K 上下文和深度推理。

对话对话编程推理
精选
D
付费

Devin

Cognition AI 推出的全自主 AI 软件工程师,可独立完成从需求分析到代码部署的完整开发流程。

智能体编程自动化全栈
精选
豆
免费

豆包

字节跳动推出的 AI 助手,集成文生图、语音对话、网页搜索等多模态能力,中文体验优秀。

对话对话多模态搜索
精选
E
Freemium

ElevenLabs

领先的 AI 语音合成平台,支持多种语言的文本转语音和声音克隆。

音频语音合成声音克隆多语言
精选
F
Freemium

Flux

Stable Diffusion 原团队 Black Forest Labs 推出的图像生成模型,画质和文字渲染能力业界领先。

图像图像生成高质量文字渲染
精选
G
Freemium

Gemini

Google 的多模态 AI 模型,深度集成 Google 生态,支持文本、图像、代码理解。

对话对话多模态搜索
精选
G
Freemium

GitHub Copilot

GitHub 出品的 AI 编程助手,深度集成 VS Code、JetBrains 等主流 IDE,支持代码补全和对话式编程。

智能体代码补全IDE 集成编程
精选
K
Freemium

Kimi

月之暗面推出的 AI 助手,以超长上下文(200万字)著称,擅长文档分析、长文摘要和深度研究。

对话对话长文本分析
精选
可
Freemium

可灵

快手推出的 AI 视频生成工具,支持文字和图片生成高质量短视频,物理效果逼真。

视频视频生成短视频物理模拟
精选
M
付费

Midjourney

顶级的 AI 图像生成工具,以艺术风格和高质量输出闻名。

图像图像生成艺术设计
精选
N
付费

Notion AI

Notion 内置的 AI 功能,辅助写作、总结、翻译和头脑风暴。

办公写作总结协作
精选
P
Freemium

Perplexity

AI 搜索引擎,结合大语言模型和实时网络搜索,提供带引用来源的精准回答,支持深度研究模式。

搜索搜索研究实时信息
精选
P
Freemium

Pika

Pika Labs 推出的 AI 视频生成工具,支持文字/图片转视频,创意效果丰富,操作简单。

视频视频生成创意文字转视频
精选
通
Freemium

通义千问

阿里巴巴推出的大语言模型系列,覆盖对话、编程、多模态等多个领域,支持长文本和复杂推理。

对话对话编程多模态
精选
S
付费

Sora

OpenAI 的文字转视频模型,可生成长达一分钟的高质量视频。

视频视频生成文字转视频
C
Freemium

Consensus

AI 学术搜索引擎,直接从科研论文中提取和总结研究发现。

搜索学术搜索论文研究
D
Freemium

Descript

AI 驱动的音视频编辑工具,像编辑文档一样编辑播客和视频,自动转录、去口癖、AI 配音。

音频播客视频编辑转录
文
Freemium

文心一言

百度推出的知识增强大模型,深度整合百度搜索生态,擅长中文理解和知识问答。

对话对话知识中文
G
Freemium

Gamma

AI 驱动的演示文稿和文档创建工具,快速生成精美的 PPT 和网页文档。

办公演示文稿文档PPT
G
Freemium

Grok

xAI 推出的 AI 助手,以实时 X 平台数据访问、幽默对话风格和深度思考模式为特色。

对话对话实时信息推理
H
付费

HeyGen

AI 数字人视频生成平台,支持虚拟主播、视频翻译和口型同步,广泛用于营销和教育。

视频数字人视频翻译口型同步
I
Freemium

Ideogram

以文字渲染见长的 AI 图像生成工具,可在图片中准确生成清晰的文字和 Logo。

图像图像生成文字渲染Logo
讯
Freemium

讯飞听见

科大讯飞推出的语音转文字平台,支持实时语音识别、会议记录和多语种翻译。

音频语音转文字会议翻译
← 返回 AI 快讯列表