前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

AI 前沿

前沿技术与落地实践,追踪 AI 领域最新动态

全部大模型应用技术提示词工程前沿趋势
GPT-5 破解免疫学三年谜题
2026年6月22日

GPT-5 破解免疫学三年谜题

免疫学家 Derya Unutmaz 利用 GPT-5 Pro 分析了搁置三年的 T 细胞实验数据,揭示了脱氧葡萄糖如何影响细胞分化。AI 不仅能提出深刻机制假设,还能准确预测实验结果,有望大幅加速生物学研究。

OpenAI 推出 Patch the Planet 助力开源安全维护
2026年6月21日

OpenAI 推出 Patch the Planet 助力开源安全维护

JUPITER超算展示百亿亿次科学新突破
2026年6月21日

JUPITER超算展示百亿亿次科学新突破

NAIRR计划借NVIDIA AI算力推动科研

2026年6月21日
NAIRR计划借NVIDIA AI算力推动科研

NVIDIA新AI软件加速材料模拟与天文发现

2026年6月21日
NVIDIA新AI软件加速材料模拟与天文发现

PP-OCRv6登陆Hugging Face:轻量级50语种OCR

2026年6月21日
PP-OCRv6登陆Hugging Face:轻量级50语种OCR

ChatGPT健康智能升级:GPT-5.5 Instant表现接近前沿模型

2026年6月17日
ChatGPT健康智能升级:GPT-5.5 Instant表现接近前沿模型

OpenAI o3 助力罕见儿童遗传病诊断

AI智能体基准测试:开源模型工具效率评估

AI智能体基准测试:开源模型工具效率评估

Hugging Face 发布 agent-eval 基准测试框架,评估 AI 智能体使用 transformers 等库的真实效率。研究发现,为大型模型优化的 CLI+Skill 改进能降低成本,却显著拖累小型模型(如 Qwen3-14B 准确率从100%降至0%)。该框架帮助开发者了解工具变更对智能体行为的真实影响。

2026年6月17日
AI化学家近自主改进药物合成关键反应

AI化学家近自主改进药物合成关键反应

OpenAI与Molecule.one合作,将GPT-5.4连接到全自动实验室,自主设计实验优化Chan-Lam偶联反应。系统提出使用TEMPO添加剂,将产率从16.6%提升至25.2%,人机协作验证了AI在化学研究中的潜力。

2026年6月16日
OpenAI 发布 LifeSciBench 基准测试

OpenAI 发布 LifeSciBench 基准测试

OpenAI 推出 LifeSciBench,一个由173位专家创建、包含750个任务的基准测试,用于衡量 AI 系统在真实生命科学研究任务中的表现。结果显示,前沿模型在科学交流方面取得进展,但在处理复杂数据和精确输出方面仍显不足。

2026年6月16日
MolmoMotion:语言引导的3D运动预测

MolmoMotion:语言引导的3D运动预测

AI2 发布 MolmoMotion,一种语言引导的 3D 运动预测模型。给定视频帧、物体上的 3D 点以及动作描述,它能预测未来几秒内这些点的 3D 轨迹。配合新数据集 MolmoMotion-1M 和基准 PointMotionBench,该模型在运动预测上超越现有方法,并可驱动机器人规划和视频生成等下游任务。

2026年6月16日
GLM-5.2:专为长周期任务打造

GLM-5.2:专为长周期任务打造

智谱发布 GLM-5.2,支持 100 万 token 稳定上下文,在长周期编码基准上仅次于 Claude Opus 4.8,并采用 IndexShare 架构大幅降低计算量。模型以 MIT 许可开源,无区域限制。

2026年6月16日
Agentic Resource Discovery:让AI智能体自主发现工具和技能

Agentic Resource Discovery:让AI智能体自主发现工具和技能

Hugging Face 发布了 Agentic Resource Discovery(ARD)的参考实现 Discover Tool。这一开放规范定义了智能体如何动态搜索工具、技能和其他智能体,无需预先配置。它通过 REST API 接入 Hub 上数千个 Space,让 MCP 服务器、技能和 A2A 智能体可以按需被发现,打破了传统“先安装、后使用”的限制。

2026年6月16日
部署模拟:提前预测模型行为

部署模拟:提前预测模型行为

OpenAI 开发了部署模拟(Deployment Simulation)方法,通过用新模型重放历史对话来预测其真实环境中的行为。在 GPT-5 系列部署中,该方法改善了对不良行为的估算,发现了新的对齐问题,并减少了模型识别测试的偏见,为预部署安全评估提供了更真实的信号。

2026年6月15日
最快、最大、最强:NVIDIA Blackwell 横扫 MLPerf 训练 6.0

最快、最大、最强:NVIDIA Blackwell 横扫 MLPerf 训练 6.0

MLPerf 训练 6.0 基准测试中,NVIDIA Blackwell 平台在所有 7 项基准上取得最快训练时间,并扩展到 8192 GPU。其 GB300 NVL72 性能比上一代提升 1.6 倍,展示出在混合专家模型和大规模密集模型训练中的领先地位,有助于降低训练成本、加速模型发布。

2026年6月15日
DeepMind 发布 AI 控制路线图,确保智能体安全

DeepMind 发布 AI 控制路线图,确保智能体安全

Google DeepMind 发布《AI 控制路线图》,提出将内部 AI 智能体视为潜在内部威胁的纵深防御框架。通过威胁建模、实时监控与分级响应,系统能在模型对齐不完美时提供安全保证,为行业提供可复用的安全标准。

2026年6月15日
NVIDIA Blackwell 在首个 Agentic AI 基准测试中领先

NVIDIA Blackwell 在首个 Agentic AI 基准测试中领先

Artificial Analysis 发布行业首个 AI 智能体基础设施基准测试 AgentPerf。NVIDIA Blackwell Ultra NVL72 平台在测试中表现最佳,每兆瓦能耗支持的智能体数量是上一代 Hopper 的 20 倍,为企业和开发者提供了衡量 AI 智能体部署效率的新标准。

2026年6月11日
olmo-eval:面向开发循环的评估工作台

olmo-eval:面向开发循环的评估工作台

Allen AI 发布 olmo-eval,一个面向大语言模型开发流程的评估工作台。它构建在 OLMES 标准之上,提供可复用、可组合的评估组件,支持从基准测试到模型对比的完整循环,并内置噪声分析工具,帮助开发者判断干预效果是否真实有效。

2026年6月11日
天体物理学家用Codex模拟黑洞等离子体

天体物理学家用Codex模拟黑洞等离子体

天体物理学家Chi-kwan Chan借助OpenAI的Codex开发新算法,解决了黑洞等离子体模拟中的计算瓶颈。新方法通过数学变换避免追踪每个粒子的微小螺旋运动,有望实现此前无法进行的数万亿粒子模拟,加速天体物理学发现。

2026年6月10日
DiffusionGemma:文本生成速度提升4倍的开源模型

DiffusionGemma:文本生成速度提升4倍的开源模型

Google DeepMind 推出开源实验模型 DiffusionGemma,采用文本扩散技术替代传统自回归生成,在 GPU 上实现最高 4 倍加速。该模型基于 Gemma 4 架构,激活参数仅 3.8B,适合本地实时交互场景。

2026年6月9日
NVIDIA 加速 Google DeepMind DiffusionGemma 本地运行

NVIDIA 加速 Google DeepMind DiffusionGemma 本地运行

Google DeepMind 发布 DiffusionGemma 实验性开放模型,采用扩散式并行生成文本,速度可达传统模型的 4 倍。NVIDIA 优化使其在 GeForce RTX、RTX PRO 和 DGX Spark 上高效运行,实现完全本地化、低延迟的 AI 推理。

2026年6月9日
多智能体AI安全研究获千万美元资助

多智能体AI安全研究获千万美元资助

Google DeepMind 联合 Schmidt Sciences、Cooperative AI Foundation 等机构,发起最高 1000 万美元的全球研究资助,聚焦大规模多智能体系统交互时的安全风险与行为预测,旨在从源头构建可信赖的 AI 生态。

2026年6月9日
谷歌发布Gemma 4 12B:统一无编码器多模态模型

谷歌发布Gemma 4 12B:统一无编码器多模态模型

谷歌DeepMind发布Gemma 4 12B,一款专为笔记本电脑设计的统一无编码器多模态模型。它采用创新架构,无需额外编码器即可直接处理视觉和音频输入,性能接近更大尺寸的26B模型,内存占用却不到一半,可在16GB RAM的消费级笔记本上本地运行,为AI智能体和多模态推理带来全新可能。

2026年6月8日
前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款
2026年6月17日
OpenAI o3 助力罕见儿童遗传病诊断

深度研究智能体如何泄露隐私?MosaicLeaks揭示风险

2026年6月17日
深度研究智能体如何泄露隐私?MosaicLeaks揭示风险
//

24小时热榜

Claude Tag 发布:团队协作新方式
TOP1

Claude Tag 发布:团队协作新方式

官方确认Anthropic AI发现美国机密系统漏洞
TOP2

官方确认Anthropic AI发现美国机密系统漏洞

3

字节跳动发布豆包2.1 Pro 称性能超越Claude Opus

16小时前
字节跳动发布豆包2.1 Pro 称性能超越Claude Opus
4

Legion LegalTech 起诉美政府封禁 Anthropic 模型

16小时前
Legion LegalTech 起诉美政府封禁 Anthropic 模型
5

Anthropic推出Claude Tag:Slack里的AI队友

16小时前
Anthropic推出Claude Tag:Slack里的AI队友
6

Agility Robotics借SPAC上市估值25亿美元

11小时前
Agility Robotics借SPAC上市估值25亿美元
7

Meta 推出自有品牌 AI 智能眼镜,售价 299 美元起

16小时前
Meta 推出自有品牌 AI 智能眼镜,售价 299 美元起
8

英伟达被禁AI芯片黑市价格翻倍

16小时前
英伟达被禁AI芯片黑市价格翻倍