每日AI: 01/25 - Open AI 发布第一个Web Agent:Operator / ChatGPT 的免费套餐将获得 o3-mini!/ ChatGPT Canvas 现在可以构建 React 应用程序了
过去的一天,AI 领域又有哪些新闻、进展和项目!赶紧看看吧!
Open AI 发布第一个Web Agent:Operator 。它是一个可以使用自己的浏览器为您执行任务的 Agent,基本上可以直接使用云软件来做任何事情。但是目前仅限 ChatGPT Pro 用户使用,介绍 Operator & Agents 的视频如下。官方地址
Sam 在 X 上公布 ChatGPT 的免费套餐将获得 o3-mini!在去年的 12 Days of OpenAI 活动上,OpenAI 的 o3 系列大模型在最后一天压轴登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)消息来源
ChatGPT Canvas 现在可以构建 React 应用程序了。ChatGPT Canvas 是 OpenAI 推出的一项新功能,旨在为写作和编程任务提供更高效的交互体验。它允许用户在独立的界面中与 ChatGPT 协作,直接编辑文本或代码,同时获得实时反馈和建议。消息来源 官方介绍
Runway 公布今天下午1:30(美国东部时间)举办现场Frames会议,分享如何通过提示、风格、审美范围和变化按钮等工具实现艺术创作。Runway 是一个基于人工智能和机器学习的创意工具平台,专注于为创作者提供多种 AI 驱动的功能,帮助用户轻松创作高质量的视频、图像和文本内容。它集成了多个 AI 模型,支持视频编辑(如抠像、特效、风格迁移)、图像处理(如修复、风格化、超分辨率)、文本生成(如写作、翻译)以及音频处理(如降噪、去除背景音)等功能。此外,Runway 还提供了“文本生成视频”等创新功能,用户可以通过输入文本或上传图片生成动态视频。其操作界面简洁,适合新手使用。 消息来源 官方地址
Meta AI 发布了 Llama Stack 的第一个稳定版本。 在此版本中,Llama Stack 现在包括: 简化升级,并向后兼容未来的 API 版本。 并对支持的提供商进行自动验证。Llama Stack 是由 Meta AI 发布的一个全面的开源框架,旨在简化生成式 AI 应用的开发和部署。它通过标准化的 API 和模块化设计,为开发者提供了一站式的解决方案,支持从模型训练到生产部署的全流程。消息来源 项目地址
Xenova 宣布,其开发的 Transformers.js 正在支持 Firefox 的新 AI 运行时,助力Web 扩展实现离线机器学习推理。Xenova 致力于让机器学习技术更普及,Transformer.js作为其核心工具,可直接在浏览器中运行 Transformer 模型,无需依赖后端服务器。 博客地址
上海人工智能实验室推出的 InternLM3-8B-Instruct 模型,借助PowerServe技术,可以在配备 Qualcomm NPU 的 Android 设备上运行,实现高效推理。 InternLM3-8B-Instruct 是由上海人工智能实验室开发的开源指令模型,拥有80亿参数,专为通用任务和高级推理设计。它仅用4万亿高质量词元训练,性能却超越同量级的 Llama3.1-8B 和 Qwen2.5-7B ,训练成本节省超75%。该模型还首次融合了常规对话与深度思考能力,能够通过长思维链解决复杂推理任务。 消息来源
DeepSeek R1 在 Chatbot Arena 等三项独立基准测试中取得优异成绩,证明了在有限计算资源下实现强大AI的潜力。消息来源
加州大学伯克利分校(UC Berkeley)人工智能研究实验室(BAIR)的博士生在 CountDown 游戏中重现了 DeepSeek R1-Zero。该模型通过强化学习(RL)自主发展出自我验证和搜索能力。 消息来源
MiniCPM-o 2.6 Technical Blog 公布。MiniCPM-o 2.6 是由 OpenBMB 开发的一款多模态大语言模型,专为视觉、语音和多模态直播场景设计。它具备端到端的全模态架构、直播机制以及可配置的语音建模设计,是GPT-4o级别的轻量级模型,适合在手机等移动设备上运行。 OpenBMB(Open Lab for Big Model Base)是由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起的人工智能开源社区。它致力于构建大规模预训练语言模型库及相关工具,加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛。OpenBMB的目标是推动大模型的标准化、普及化和实用化,让大模型技术惠及更多人。博客地址
NVIDIA 与 NoTraffic 合作,利用AI和加速计算技术,显著减少交通拥堵和碳排放。NoTraffic 的 AI Mobility 平台通过 NVIDIA Jetson 平台和 Metropolis 生态系统,优化交通信号,提升交通流畅度,已在亚利桑那州图森市和加拿大温哥华等地取得显著成效,减少高达46%的交通延误和大量碳排放。NoTraffic 是一家专注于智能交通管理的科技公司,成立于2016年,总部位于以色列特拉维夫。该公司开发了一种基于人工智能的自主交通管理平台,旨在通过先进的AI算法和实时数据分析,优化交通流量,减少拥堵,并提高道路安全性。博客地址
名古屋大学研究团队 发布了首个日语实时语音交互模型J-Moshi,基于Moshi开发,具备同时“说”和“听”的能力,模型大小仅7B,轻量高效,值得体验!项目地址
无需支付200美元使用Operator,用户可以结合DeepSeek R1和浏览器使用功能(免费且开源),无需编写代码即可创建智能代理,轻松实现高效操作。消息来源
Anthropic团队 推出了 Citations 功能,使 Claude 能够基于用户提供的信息生成回答,并精确引用相关句子和段落。这提升了回答的准确性和可信度。消息来源
NVIDIA 研究人员开发了一种名为动态内存压缩(DMC)的新技术,可大幅提高大语言模型(LLM)的部署效率,在不降低性能的情况下,显著减少内存占用,支持更长序列处理,提升吞吐量和响应速度。博客地址
NASA、加州大学伯克利分校和法国天文台的团队利用NVIDIA GPU加速的深度学习模型,仅用几秒就完成了对土卫六泰坦星甲烷云的复杂分析,将原本耗时数天的工作压缩到瞬间完成,为行星科学研究开辟了新路径。 博客地址









