拒绝“AI 脸”:微软 OneDrive 推出主体零失真重塑工具
在生成式 AI 绘图领域,一个长期困扰用户的痛点是“过度美化”导致的原图失真。近日,微软为旗下云存储服务OneDrive推出了名为“AI 重塑”(AI Restyle)的创意工具。该功能最大的技术亮点在于,它能在大幅改变画面艺术风格的同时,精准锁定并保留照片的核心主体,有效解决了传统 AI 修图容易...
在生成式 AI 绘图领域,一个长期困扰用户的痛点是“过度美化”导致的原图失真。近日,微软为旗下云存储服务OneDrive推出了名为“AI 重塑”(AI Restyle)的创意工具。该功能最大的技术亮点在于,它能在大幅改变画面艺术风格的同时,精准锁定并保留照片的核心主体,有效解决了传统 AI 修图容易...
在计算机视觉领域,如何让 AI 像人类一样观察并细致描述图片的每一个角落,一直是业内的难题。近日,苹果公司联合威斯康星大学麦迪逊分校,正式发布了一款名为RubiCap的全新 AI 训练框架。该框架专为“密集图像描述”设计,旨在让 AI 不再只提供笼统的概括,而是能精准捕捉并说明“桌上的红苹果”或“远...
字节跳动近日正式开源了其超级智能体编排框架 DeerFlow2.0。该项目发布后迅速走红,目前已在 GitHub 上狂揽 44k Star,并蝉联 Trending 榜首。开发者普遍认为,DeerFlow2.0凭借其深度适配本土应用场景的特性,堪称“更适合中国宝宝体质的 OpenClaw”。核心特...
AI 视频创作正在从“随机抽卡”时代,跨入专业级的“定向生产”时代。3 月 25 日,天娱数字科技(大连)集团股份有限公司 宣布,旗下影视级 AI 长视频创编平台 CineART 正式上线。该平台的核心突破在于,它不再只是简单的提示词生成器,而是依托自研大模型,以“导演逻辑”重构了 AI 的创作链路...
在 AI 应用落地的竞速赛中,钉钉正试图通过极致的“低门槛”策略,让复杂的 AI 技术变得像安装普通软件一样简单。近日,钉钉悟空 AI 正式开启初体验。与以往技术部署动辄需要专业团队、甚至引发“499元代安装”热潮的复杂产品不同,这款定位为企业级助理的 AI 产品,正凭借其安全、懂你且“傻瓜式”的操...
在全球互联网基础设施巨头 Cloudflare 的最新技术演进中,一场关于“算力性价比”的变革正在发生。据 Kimi 开放平台披露,Cloudflare 已正式将月之暗面(Moonshot AI)旗下的开源模型 Kimi K2.5引入其核心生产业务。这一决策并非心血来潮,而是基于严苛的性能评估:Ki...
在大语言模型(LLM)的推理过程中,内存瓶颈一直是制约性能的“头号杀手”。每当 AI 处理长文本或生成复杂回答时,一种被称为 KV 缓存(Key-Value Cache)的“工作内存”就会迅速膨胀,导致系统运行缓慢甚至崩溃。针对这一难题,谷歌研究院在2026年3月26日正式推出了名为 TurboQu...
工信部正式发布通知,针对**《人工智能 安全治理 模型上下文协议应用安全要求》等121项行业标准计划项目公开征求意见。此举标志着我国在AI底层协议标准化与安全监管体系建设上迈出关键一步。本次征求意见的核心指向模型上下文协议(Model Context Protocol)**的应用安全,旨在通过规范化...
3月26日消息,字节跳动旗下国际版视频剪辑工具CapCut(国际版剪映)近日上线两大 AI 重磅功能——Video Studio和AI Video,深度集成最新Dreamina Seedance2.0视频生成模型,让从创意构思到成片输出的全流程大幅简化,标志着 AI 原生视频创作进入“画布时代”。V...
全球最大的代码托管平台 GitHub 近日丢下了一枚重磅炸弹:官方宣布将从 2026 年 4 月 24 日起,开始使用用户的交互数据来训练其 AI 模型。这一举动被不少开发者戏称为“撤销键(CTRL-Z)”操作,因为 GitHub 此前曾多次在公开场合强调对用户私有数据的尊重,而新政策显然打破了这一...
人工智能在学术科研领域的进化速度,正在挑战人类的想象力。近日,哈佛大学 教授 Schwartz 完成了一项惊人的实验:他通过为期两周的“导师制”训练,成功将 AI 模型 Claude 培养成了一名具备物理专业“研二水平”的研究员。这标志着大模型正从简单的知识检索工具,演变为能够深度参与前沿科学探索的...
在OpenAI内部产品线经历剧烈震荡的当下,作为编程辅助领域“老兵”的 Codex 终于传来了让开发者安心的消息。3月26日,据媒体报道,OpenAI Codex 工程负责人公开明确表态:Codex App 将继续保留,不会进入裁撤名单。逆势加码:资源投入远超以往不同于被关停的视频生成产品,Code...
在程序员与 AI 协作的过程中,“权限确认”往往是打断心流的最大杀手。为了解决这一痛点,Anthropic 近日为其 AI 驱动的命令行采编工具 Claude Code 推出了全新的“自动模式(Auto Mode)”。这一功能旨在通过智能授权机制,减少用户在执行长任务时的频繁干预,让开发者能够真正实...
就在 OpenAI 调整自身视频战略之际,萨姆·奥特曼正将目光投向更具野心的“智能体集群”赛道。据华尔街日报最新披露,OpenAI 秘密投资了一家名为 Isara 的 AI 初创公司。这家初创公司的背景极其引人注目,其创始人是两位年仅 23 岁的 AI 研究员 Eddie Zhang 和 Henry...
在 AI 搜索重塑流量分配的 2026 年,全球在线旅游巨头 Booking Holdings 的首席执行官格伦·福格尔(Glenn Fogel)发出了严厉警告:谷歌的 Gemini 和 OpenAI 的 ChatGPT 正在利用其技术统治地位,将中小酒店逼入绝境。福格尔指出,传统的搜索模式虽然也存...
3月26日消息,阿里AI助手千问被接入红旗汽车智能座舱,加速进入物理世界。这是继AI眼镜之后,千问进一步拓展至更高复杂度的车载场景,迈向全场景AI助手。据悉,千问即将首发搭载于红旗HS6PHEV。很快,红旗汽车用户只需一句话即可完成多目标任务。例如,“你好千问,先去北京大学,中午找一家沿途方便又好吃...
生成式 AI 在音频领域的进化,正从“短乐句”迈向“全曲创作”的深水区。本周三,谷歌 旗下 AI 实验室 DeepMind 正式推出了专注于音乐创作的增强版大模型 Lyria 3 Pro。相比前代产品,该模型不仅在音质上实现了飞跃,更核心的突破在于其具备了极强的“结构意识”,能够处理并生成具有完整逻...
苹果公司正通过“知识提炼”(Knowledge Distillation)技术,将谷歌Gemini庞大的云端模型转化为适用于iPhone端侧处理的轻量化组件。据2026年3月25日披露的消息,苹果与谷歌达成的深度协议允许其工程师访问数据中心内的Gemini全量模型,以便对其运行机制进行深度检查与拆解...
3月25日晚间,高德开放平台宣布其地图能力已完成标准化封装,并以Skills(技能)形式正式适配OpenClaw智能体。这一动作标志着地理信息服务从传统的API调用模式转向自然语言驱动的智能体交互模式。此次上线的Skills涵盖了基于地理信息的生活与办公助手,以及基于高德地图的网站生成助手,旨在通过...
GitHub近日宣布将从2026年4月24日起更新其代码库政策,计划利用用户交互数据训练其AI模型。 此次数据采集范围涵盖Copilot Free、Pro及Pro+用户,具体包含模型输入输出、代码片段、上下文信息、仓库结构及聊天交互记录。GitHub首席产品官Mario Rodriguez表示,引入...