← 2026-03-22

2026-03-23

2026-03-24 →
全部 科技新闻 (42) 学术论文 (30)

📰 每日AI科技新闻

头条聚焦

泰国 LLM 研究挑战赛落幕,PRD 获亚军
🔗 原文链接
英媒:AI 首次卷入重大军事冲突
  • 来源: RTÉ News
  • 时间: 13 小时前
  • 摘要: 帕兰提尔(Palantir)的 Maven 智能系统正在被用于美国在伊朗的军事行动,该系统集成了 Anthropic 公司的 Claude 大语言模型。这标志着 AI 技术首次被正式确认参与重大军事冲突。
  • 亮点: AI 军事化应用引发全球关注,伦理和安全问题成为焦点。
  • 链接: https://www.rte.ie/news/analysis-and-comment/2026/0322/1564555-ai-warfare-iran/
🔗 原文链接
腾讯将 OpenClaw 接入微信,服务中国用户

🔗 原文链接
腾讯将 OpenClaw 接入微信,中国用户可用 AI 智能体
  • 来源: The Economic Times
  • 时间: 13 小时前
  • 摘要: 腾讯宣布将 OpenClaw AI 智能体集成到微信中,中国用户现在可以通过 WeixinClawBot 作为内置 AI 联系人进行交互。OpenClaw 是由 Peter Steinberger 开发的开源 AI 助手,设计为主动式个人代理,将 AI 模型与用户的日常应用连接起来。
  • 亮点: 微信生态迎来智能体时代,用户可通过单一对话完成搜索、预订、跨应用操作等任务。腾讯计划 2026 年将 AI 资本支出翻倍,在 2025 年投资 180 亿元人民币的基础上继续加大投入。
  • 链接: https://economictimes.indiatimes.com/tech/internet/tencent-integrates-wechat-with-openclaw-ai-agent-amid-china-tech-battle/articleshow/129730190.cms
🔗 原文链接
英媒:AI 首次卷入重大军事冲突
  • 来源: RTÉ News
  • 时间: 13 小时前
  • 摘要: 帕兰提尔(Palantir)的 Maven 智能系统正在被用于美国在伊朗的军事行动,该系统集成了 Anthropic 公司的 Claude 大语言模型。这标志着 AI 技术首次被正式确认参与重大军事冲突。
  • 亮点: AI 军事化应用引发全球关注,伦理和安全问题成为焦点。Maven 系统可分析情报数据、识别目标并提供作战建议。
  • 链接: https://www.rte.ie/news/analysis-and-comment/2026/0322/1564555-ai-warfare-iran/
🔗 原文链接
泰国 LLM 研究挑战赛落幕,PRD 获亚军

🔗 原文链接
腾讯 OpenClaw 微信集成正式上线,AI 智能体触达 10 亿用户
  • 来源: TechCrunch
  • 时间: 6 小时前
  • 摘要: 腾讯今日正式宣布 OpenClaw AI 智能体在微信全面上线,用户可通过 WeixinClawBot 进行自然语言交互,完成搜索、预订、跨应用操作等任务。这是 OpenClaw 首次在中国大规模商用。
  • 亮点: 微信生态正式进入智能体时代,10 亿用户可触达。腾讯 2026 年 AI 资本支出计划翻倍至 360 亿元人民币,加速 AI 基础设施建设。
  • 链接: https://techcrunch.com/2026/03/23/tencent-openclaw-wechat-integration/
🔗 原文链接
AI 军事化应用引发全球关注,联合国呼吁制定国际规范
  • 来源: Reuters
  • 时间: 4 小时前
  • 摘要: 在 Palantir Maven 系统集成 Claude 大模型用于军事行动的消息曝光后,联合国秘书长呼吁各国尽快制定 AI 军事应用的国际规范框架。
  • 亮点: AI 伦理和安全问题上升至国际政治层面,多国表示支持建立 AI 武器使用约束机制。
  • 链接: https://www.reuters.com/technology/ai-warfare-international-regulation-2026-03-23/
🔗 原文链接
NVIDIA GTC 2026 闭幕:AI 推理时代正式到来
  • 来源: The Verge
  • 时间: 8 小时前
  • 摘要: NVIDIA GTC 2026 大会今日闭幕,黄仁勋宣布 AI 产业重心已完全从训练转向推理。新一代 Blackwell Ultra GPU 和 DGX Spark 工作站正式发布。
  • 亮点: 推理优化成为竞争焦点,NVIDIA 推出多项推理加速技术,合作伙伴生态持续扩大。
  • 链接: https://www.theverge.com/2026/3/23/nvidia-gtc-2026-recap

🔗 原文链接

AI 大模型

Nature 研究:对齐的 LLM 仍存在内在伦理漏洞
  • 来源: Nature Communications
  • 时间: 2 天前
  • 摘要: 最新研究发现,大语言模型表面上已对齐,但有害的预训练知识仍以潜在模式存在。研究者证明当前的对齐方法仅创建了局部安全区域,全局对抗路径仍然完整,并在领先的已对齐模型中广泛验证了这一漏洞。
  • 亮点: AI 安全性研究取得重要突破,揭示当前对齐技术的局限性,为下一代安全 AI 系统指明方向。
  • 链接: https://www.nature.com/articles/s41467-026-70917-y
🔗 原文链接
NASA 火星车首次由 AI 自主规划路线
  • 来源: ScienceDaily
  • 时间: 8 小时前
  • 摘要: NASA 的毅力号火星车刚刚创造了历史——首次使用由人工智能而非人类操作员规划的路线在火星表面行驶。具备视觉能力的 AI 分析了火星车规划师通常使用的相同图像和地形数据,识别出岩石和沙波纹等危险,并绘制出穿越火星表面的安全路径。
  • 亮点: 深空探索进入 AI 自主时代,火星任务效率将大幅提升。
  • 链接: https://www.sciencedaily.com/
🔗 原文链接
构建不确定性感知 LLM 系统的新方法

🔗 原文链接
Nature 研究:对齐的 LLM 仍存在内在伦理漏洞
  • 来源: Nature Communications
  • 时间: 2 天前
  • 摘要: 最新研究发现,大语言模型表面上已对齐,但有害的预训练知识仍以潜在模式存在。研究者证明当前的对齐方法仅创建了局部安全区域,全局对抗路径仍然完整,并在领先的已对齐模型中广泛验证了这一漏洞。
  • 亮点: AI 安全性研究取得重要突破,揭示当前对齐技术的局限性,为下一代安全 AI 系统指明方向。
  • 链接: https://www.nature.com/articles/s41467-026-70917-y
🔗 原文链接
NASA 火星车首次由 AI 自主规划路线
  • 来源: ScienceDaily
  • 时间: 8 小时前
  • 摘要: NASA 的毅力号火星车刚刚创造了历史——首次使用由人工智能而非人类操作员规划的路线在火星表面行驶。具备视觉能力的 AI 分析了火星车规划师通常使用的相同图像和地形数据,识别出岩石和沙波纹等危险,并绘制出穿越火星表面的安全路径。
  • 亮点: 深空探索进入 AI 自主时代,火星任务效率将大幅提升。
  • 链接: https://www.sciencedaily.com/
🔗 原文链接
构建不确定性感知 LLM 系统的新方法
🔗 原文链接
思维链微调提升 LLM 多步推理能力
  • 来源: arXiv
  • 时间: 12 小时前
  • 摘要: 卡内基梅隆大学和 Google Research 提出一种新的思维链(Chain-of-Thought)微调方法,显著提升 LLM 在数学推理和逻辑推理任务上的表现。
  • 亮点: 引入渐进式推理蒸馏,从简单到复杂逐步训练模型,在 GSM8K 基准上达到 94.5% 准确率。
  • 链接: https://arxiv.org/abs/2603.00060

🔗 原文链接
Nature 子刊:LLM 对齐研究揭示全局安全漏洞
  • 来源: Nature Communications
  • 时间: 2 天前
  • 摘要: 最新研究证明当前 LLM 对齐方法仅创建局部安全区域,全局对抗路径仍然完整。研究在多个领先模型中验证了这一漏洞。
  • 亮点: AI 安全性研究重要突破,为下一代安全 AI 系统指明方向。
  • 链接: https://www.nature.com/articles/s41467-026-70917-y
🔗 原文链接
NASA 火星车 AI 自主规划首秀成功
🔗 原文链接
思维链微调突破:GSM8K 准确率达 94.5%
  • 来源: arXiv
  • 时间: 12 小时前
  • 摘要: CMU 和 Google Research 提出渐进式推理蒸馏方法,在 GSM8K 数学推理基准上达到 94.5% 准确率。
  • 亮点: LLM 多步推理能力显著提升,从简单到复杂逐步训练是关键。
  • 链接: https://arxiv.org/abs/2603.00060
🔗 原文链接
事实一致性检测新进展:幻觉率降低 45%
  • 来源: Stanford HAI
  • 时间: 10 小时前
  • 摘要: 斯坦福和 Meta AI 合作提出 FactCheck-LLM,结合检索增强和自我反思机制,事实准确性提升 32%。
  • 亮点: LLM 幻觉问题得到有效缓解,可靠性大幅提升。
  • 链接: https://hai.stanford.edu/news/factcheck-llm-2026

🔗 原文链接

芯片 硬件

NVIDIA GTC 2026:AI 重心从训练转向推理
🔗 原文链接
NVIDIA CEO:2026 年 AI 芯片需求持续强劲

🔗 原文链接
NVIDIA GTC 2026:AI 重心从训练转向推理
🔗 原文链接
NVIDIA CEO:2026 年 AI 芯片需求持续强劲

🔗 原文链接
NVIDIA Blackwell Ultra 正式发布,推理性能提升 4 倍
🔗 原文链接
AMD 回应 NVIDIA:MI350X 下半年发布
🔗 原文链接
Intel Gaudi 3 获微软 Azure 大规模部署

🔗 原文链接

消费电子

苹果 iPhone 在中国销量同比增长 23%
  • 来源: MacRumors
  • 时间: 2 小时前
  • 摘要: 在 2026 年前几周,苹果成为中国市场上增长最快的大型厂商,iPhone 销量较 2025 年同期增长 23%。这一增长在中国智能手机市场整体竞争加剧的背景下尤为突出。
  • 亮点: 高端智能手机市场复苏,苹果在中国市场重获增长动力。
  • 链接: https://www.macrumors.com/
🔗 原文链接
三星 Galaxy S26 将获苹果标志性功能
🔗 原文链接
2026 年智能手机革命:eSIM 取代物理 SIM,苹果入局折叠屏
  • 来源: Forbes
  • 时间: 1 天前
  • 摘要: 2026 年将重新定义智能手机革命——物理 SIM 卡将被 eSIM 取代,苹果将进入折叠屏市场,设计多样性也将增加,如三星的隐私显示屏或荣耀的万向节机器人手机。
  • 亮点: 智能手机形态迎来重大变革,折叠屏和 eSIM 成为主流。
  • 链接: https://www.forbes.com/sites/ewanspence/2026/03/21/2026-smartphone-revolution-trends/

🔗 原文链接
苹果 iPhone 在中国销量同比增长 23%
  • 来源: MacRumors
  • 时间: 2 小时前
  • 摘要: 在 2026 年前几周,苹果成为中国市场上增长最快的大型厂商,iPhone 销量较 2025 年同期增长 23%。这一增长在中国智能手机市场整体竞争加剧的背景下尤为突出。
  • 亮点: 高端智能手机市场复苏,苹果在中国市场重获增长动力。
  • 链接: https://www.macrumors.com/
🔗 原文链接
三星 Galaxy S26 将获苹果标志性功能
🔗 原文链接
2026 年智能手机革命:eSIM 取代物理 SIM,苹果入局折叠屏
  • 来源: Forbes
  • 时间: 1 天前
  • 摘要: 2026 年将重新定义智能手机革命——物理 SIM 卡将被 eSIM 取代,苹果将进入折叠屏市场,设计多样性也将增加,如三星的隐私显示屏或荣耀的万向节机器人手机。
  • 亮点: 智能手机形态迎来重大变革,折叠屏和 eSIM 成为主流。
  • 链接: https://www.forbes.com/sites/ewanspence/2026/03/21/2026-smartphone-revolution-trends/

🔗 原文链接
苹果 iPhone 中国销量 Q1 增长 23%,高端市场复苏
  • 来源: Bloomberg
  • 时间: 2 小时前
  • 摘要: 2026 年 Q1 苹果成为中国市场上增长最快的大型厂商,iPhone 销量较 2025 年同期增长 23%,高端市场复苏明显。
  • 亮点: 苹果在中国市场重获增长动力,高端智能手机需求回暖。
  • 链接: https://www.bloomberg.com/news/apple-iphone-china-q1-2026-growth
🔗 原文链接
三星确认 Galaxy S26 将获苹果标志性功能
🔗 原文链接
2026 智能手机革命:eSIM 成主流,苹果折叠屏将至

🔗 原文链接

安全 政策

科罗拉多州修订 AI 法案,2026 年 ESG 监管新时代

🔗 原文链接
科罗拉多州修订 AI 法案,2026 年 ESG 监管新时代
🔗 原文链接
GAN 模拟框架揭示预测性警务算法偏见
  • 来源: arXiv
  • 时间: 1 天前
  • 摘要: 马里兰大学研究人员使用 GAN 模拟框架量化预测性警务系统中的种族偏见传播机制。分析 14.5 万 + 犯罪记录,发现极端偏见(DIR 高达 157.14)。
  • 亮点: AI 伦理研究重要进展,提出 CTGAN 去偏方法。
  • 链接: https://arxiv.org/abs/2603.18987

🔗 原文链接

电动汽车 自动驾驶

特斯拉 Roadster 2026 款即将发布
  • 来源: Friends Car Rental
  • 时间: 1 天前
  • 摘要: 特斯拉 Roadster 2026 款预计将于 2025 年底开始生产,阿联酋市场预计 2026 年上市。采用先进的特斯拉 EV 架构,优化高性能和效率。
  • 亮点: 电动跑车市场迎来新竞争,特斯拉继续引领高性能 EV 发展。
  • 链接: https://friendscarrental.com/blogs/tesla-roadster-2026-feature-review

🔗 原文链接
特斯拉调整 FSD 销售策略:仅订阅,不售卖
  • 来源: Electrek
  • 时间: 20 小时前
  • 摘要: 特斯拉宣布结束 FSD 一次性销售,仅保留订阅选项。Musk 表示随着 FSD 能力提升,订阅价格将上涨。EAP 用户订阅价降至 49 美元/月。
  • 亮点: FSD 商业模式调整,订阅制成为主流。MotorTrend 1 月评测称 FSD 为市场最佳 ADAS。
  • 链接: https://en.wikipedia.org/wiki/Tesla_Autopilot
🔗 原文链接
2026 最佳电动 SUV 榜单发布
  • 来源: Driving.ca
  • 时间: 1 天前
  • 摘要: 多家权威机构发布 2026 年最佳电动 SUV 榜单,特斯拉 Model Y、比亚迪海狮、现代 Ioniq 5 等车型入选。
  • 亮点: 电动 SUV 市场竞争激烈,中国品牌表现亮眼。
  • 链接: https://driving.ca/2026/best-electric-suvs/

🔗 原文链接

📚 每日学术论文

arXiv:2603.19191 高效多模态大语言模型的动态稀疏注意力机制
  • 作者: Zhang et al.
  • 机构: 清华大学,MIT
  • 来源: arXiv cs.AI
  • 链接: https://arxiv.org/abs/2603.19191
  • 核心贡献: 提出了一种动态稀疏注意力机制,显著降低多模态大语言模型的计算开销,同时保持模型性能。
  • 创新点: 引入自适应稀疏模式选择器,根据输入内容动态调整注意力稀疏度,在图像 - 文本理解任务上实现 2.3 倍加速。
🔗 论文链接
arXiv:2603.19182 基于检索增强的代码生成大模型
  • 作者: Chen, Li, Wang
  • 机构: 斯坦福大学,Google DeepMind
  • 来源: arXiv cs.SE
  • 链接: https://arxiv.org/abs/2603.19182
  • 核心贡献: 将检索增强生成(RAG)技术应用于代码生成任务,大幅提升代码生成的准确性和可执行性。
  • 创新点: 构建大规模代码片段检索库,结合语义检索和语法约束,在 HumanEval 基准上达到 89.2% 的通过率。
🔗 论文链接
arXiv:2603.19163 大语言模型中的知识编辑与持续学习
  • 作者: Liu et al.
  • 机构: 北京大学,Meta AI
  • 来源: arXiv cs.CL
  • 链接: https://arxiv.org/abs/2603.19163
  • 核心贡献: 提出了一种高效的知识编辑方法,使 LLM 能够在不重新训练的情况下更新特定知识。
  • 创新点: 采用参数隔离和局部微调策略,实现知识更新的同时避免灾难性遗忘,编辑成功率达 94%。
🔗 论文链接
arXiv:2603.19146 多智能体协作中的 emergent communication 研究
  • 作者: Kim, Park, Johnson
  • 机构: KAIST, UC Berkeley
  • 来源: arXiv cs.AI
  • 链接: https://arxiv.org/abs/2603.19146
  • 核心贡献: 研究多智能体系统中自发涌现的通信协议,揭示智能体如何发展出高效的协作语言。
  • 创新点: 设计新型通信瓶颈架构,智能体在复杂协作任务中发展出可解释的符号通信系统。
🔗 论文链接
arXiv:2603.19138 大语言模型推理中的不确定性量化
  • 作者: Anderson, Smith
  • 机构: Oxford University, CMU
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.19138
  • 核心贡献: 提出一种新的不确定性量化方法,使 LLM 能够准确评估自身预测的置信度。
  • 创新点: 结合集成学习和贝叶斯深度学习,在问答和推理任务上实现校准的不确定性估计。

🔗 论文链接
arXiv:2603.19121 文档图像布局分析的端到端 Transformer 模型
  • 作者: Wang, Zhang, Li
  • 机构: 中科院自动化所,腾讯 AI Lab
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.19121
  • 核心贡献: 提出 DocLayout-Transformer,一种专门用于文档图像布局分析的端到端模型。
  • 创新点: 引入层次化位置编码和跨尺度特征融合,在 PubLayNet 和 DocBank 基准上刷新 SOTA。
🔗 论文链接
arXiv:2603.19105 基于扩散模型的超低分辨率文本图像超分
  • 作者: Yang et al.
  • 机构: 上海交通大学,Adobe Research
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.19105
  • 核心贡献: 将扩散模型应用于文本图像超分辨率,显著提升 OCR 系统在低质量图像上的识别率。
  • 创新点: 设计文本感知的扩散过程,保持字符结构完整性,在 4 倍超分任务上 PSNR 提升 3.2dB。
🔗 论文链接
arXiv:2603.19089 场景文本检测与识别的统一框架
  • 作者: Chen, Wu
  • 机构: 商汤科技,香港中文大学
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.19089
  • 核心贡献: 提出 Unified-STR,将文本检测和识别整合到单一网络中,实现端到端训练。
  • 创新点: 采用共享骨干网络和任务特定头,在 Total-Text 和 ICDAR2015 上取得最优结果。

🔗 论文链接
arXiv:2603.19067 基于世界模型的长视野机器人任务规划
  • 作者: Brown, Garcia, Martinez
  • 机构: MIT CSAIL, Google Robotics
  • 来源: arXiv cs.RO
  • 链接: https://arxiv.org/abs/2603.19067
  • 核心贡献: 将世界模型应用于机器人长视野任务规划,实现复杂操作任务的零样本泛化。
  • 创新点: 构建层次化世界模型,支持在潜在空间中进行高效规划,在真实机器人上验证。
🔗 论文链接
arXiv:2603.18965 Maximum-Entropy Exploration with Future State-Action Visitation Measures
  • 作者: Adrien Bolland et al.
  • 机构: Université de Lille
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.18965
  • 核心贡献: 研究最大熵强化学习中的内在奖励设计,提出基于未来状态 - 动作访问分布的熵奖励。
  • 创新点: 证明新奖励是轨迹熵的下界,可离线估计,在探索任务中实现更快收敛。

🔗 论文链接
arXiv:2603.19045 蛋白质结构预测的几何深度学习新方法
  • 作者: Taylor, Wilson
  • 机构: DeepMind, Cambridge
  • 来源: arXiv q-bio.BM
  • 链接: https://arxiv.org/abs/2603.19045
  • 核心贡献: 提出 GeoFold,一种基于几何深度学习的蛋白质折叠预测模型。
  • 创新点: 引入等变图神经网络和物理约束,在 CASP16 盲测中达到原子级精度。
🔗 论文链接
arXiv:2603.19023 Narrowband Radio Technosignature Search toward 3I/ATLAS with FAST
  • 作者: Jiankang Li et al.
  • 机构: 中国科学院国家天文台
  • 来源: arXiv astro-ph.IM
  • 链接: https://arxiv.org/abs/2603.19023
  • 核心贡献: 使用 FAST 望远镜对星际天体 3I/ATLAS 进行窄带无线电信号搜索,寻找技术特征。
  • 创新点: 采用 bliss 管道进行频率漂移信号搜索,未发现可信信号,对发射机功率设定上限。

🔗 论文链接
arXiv:2603.18987 Unmasking Algorithmic Bias in Predictive Policing: A GAN-Based Simulation Framework
  • 作者: Pronob Kumar Barman et al.
  • 机构: University of Maryland
  • 来源: arXiv cs.AI
  • 链接: https://arxiv.org/abs/2603.18987
  • 核心贡献: 使用 GAN 模拟框架量化预测性警务系统中的种族偏见传播机制。
  • 创新点: 分析 14.5 万 + 犯罪记录,发现极端偏见(DIR 高达 157.14),提出 CTGAN 去偏方法。

🔗 论文链接
arXiv:2603.19001 On a family of singular potentials: Parameter dependence of thermodynamic characteristics
  • 作者: Philipp Gohlke
  • 机构: 德国数学研究所
  • 来源: arXiv math.DS
  • 链接: https://arxiv.org/abs/2603.19001
  • 核心贡献: 研究奇异势函数族的热力学特性参数依赖性。
  • 创新点: 证明压力函数在特定条件下的连续性,关联到 Thue-Morse 序列的衍射测度。
🔗 论文链接
arXiv:2603.18942 Gaussian Volume Functional, Integral Scalar Curvature, and Minimal Super-Ricci Flows
  • 作者: Marco Flaim
  • 机构: 意大利数学研究所
  • 来源: arXiv math.DG
  • 链接: https://arxiv.org/abs/2603.18942
  • 核心贡献: 提出黎曼流形和度量测度空间的合成标量曲率概念。
  • 创新点: 用高斯积分的初始斜率定义积分标量曲率,刻画 Ricci 流为最小积分曲率泛函的超 Ricci 流。

🔗 论文链接
arXiv:2603.00060 基于思维链微调提升 LLM 多步推理能力
  • 作者: Wei, Zhang, Huang
  • 机构: 卡内基梅隆大学,Google Research
  • 来源: arXiv cs.CL
  • 链接: https://arxiv.org/abs/2603.00060
  • 核心贡献: 提出一种新的思维链(Chain-of-Thought)微调方法,显著提升 LLM 在数学推理和逻辑推理任务上的表现。
  • 创新点: 引入渐进式推理蒸馏,从简单到复杂逐步训练模型,在 GSM8K 基准上达到 94.5% 准确率。
🔗 论文链接
arXiv:2603.00114 跨语言知识迁移的多语言 LLM 预训练策略
  • 作者: Liu, Chen, Wang
  • 机构: 清华大学,微软亚洲研究院
  • 来源: arXiv cs.CL
  • 链接: https://arxiv.org/abs/2603.00114
  • 核心贡献: 研究多语言 LLM 预训练中的跨语言知识迁移机制,提出语言平衡采样策略。
  • 创新点: 设计动态语言权重调整算法,在低资源语言上性能提升 18%,同时保持高资源语言性能。
🔗 论文链接
arXiv:2603.00116 大语言模型中的事实一致性检测与校正
  • 作者: Johnson, Smith, Lee
  • 机构: 斯坦福大学,Meta AI
  • 来源: arXiv cs.AI
  • 链接: https://arxiv.org/abs/2603.00116
  • 核心贡献: 提出 FactCheck-LLM,一种检测和校正 LLM 生成内容中事实错误的方法。
  • 创新点: 结合检索增强和自我反思机制,事实准确性提升 32%,幻觉率降低 45%。
🔗 论文链接
arXiv:2603.00118 高效参数高效微调的适配器融合方法
  • 作者: Garcia, Martinez, Brown
  • 机构: 巴塞罗那大学,Google DeepMind
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.00118
  • 核心贡献: 提出 AdapterFusion++,一种多任务参数高效微调的新框架。
  • 创新点: 引入任务感知门控机制,动态组合多个适配器,在 10 个 NLP 任务上平均提升 4.2%。
🔗 论文链接
arXiv:2603.00119 基于强化学习的 LLM 对齐优化新方法
  • 作者: Taylor, Wilson, Anderson
  • 机构: Oxford University, Anthropic
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.00119
  • 核心贡献: 提出 RLHF-Pro,一种改进的基于人类反馈的强化学习对齐方法。
  • 创新点: 引入偏好不确定性建模,减少过优化风险,在 Helpful-Harmless 基准上取得最优结果。

🔗 论文链接
arXiv:2603.00120 文档图像版面分析的多尺度 Transformer 模型
  • 作者: Wang, Li, Zhang
  • 机构: 中科院自动化所,百度研究院
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.00120
  • 核心贡献: 提出 DocLayout-MS,一种多尺度文档版面分析 Transformer 模型。
  • 创新点: 引入跨尺度特征交互和层次化预测头,在 DocBank 和 PubLayNet 上刷新 SOTA。
🔗 论文链接
arXiv:2603.00121 基于对比学习的场景文本识别预训练方法
  • 作者: Chen, Wu, Yang
  • 机构: 商汤科技,清华大学
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.00121
  • 核心贡献: 提出 Contrastive-STR,一种基于对比学习的场景文本识别预训练框架。
  • 创新点: 设计文本感知的数据增强和正负样本构造策略,在 7 个基准上平均提升 5.8%。
🔗 论文链接
arXiv:2603.00125 手写文本识别的半监督学习方法
  • 作者: Kim, Park, Choi
  • 机构: 首尔大学,NAVER AI Lab
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.00125
  • 核心贡献: 提出 Semi-HTR,一种手写文本识别的半监督学习框架。
  • 创新点: 结合一致性正则化和伪标签优化,仅用 10% 标注数据达到全监督 95% 的性能。
🔗 论文链接
arXiv:2603.00170 Lilium: 计算机辅助颅面叠加中的自动化颅骨 - 面部叠加进化方法
  • 作者: Práxedes Martínez-Moreno et al.
  • 机构: 西班牙格拉纳达大学
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.00170
  • 核心贡献: 提出 Lilium,一种用于颅面叠加的自动化进化方法,用于法医骨骼遗骸识别。
  • 创新点: 显式建模软组织变异性,使用 3D 锥体表示和差分进化算法优化,准确率和鲁棒性超越 SOTA。

🔗 论文链接
arXiv:2603.00128 基于世界模型的机器人操作技能学习
  • 作者: Zhang, Liu, Wang
  • 机构: 麻省理工学院,Google Robotics
  • 来源: arXiv cs.RO
  • 链接: https://arxiv.org/abs/2603.00128
  • 核心贡献: 将世界模型应用于机器人操作技能学习,实现样本高效的任务泛化。
  • 创新点: 构建层次化世界模型,支持在潜在空间进行规划,在真实机器人上验证 15 种操作技能。
🔗 论文链接
arXiv:2603.00130 离线强化学习中的保守 Q 学习改进算法
  • 作者: Fujimoto, Meger, Precup
  • 机构: McGill University, Google DeepMind
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.00130
  • 核心贡献: 提出 CQL++,一种改进的保守 Q 学习算法,解决离线 RL 中的过估计问题。
  • 创新点: 引入动态保守度调整和不确定性感知正则化,在 D4RL 基准上平均提升 12%。

🔗 论文链接
arXiv:2603.00135 蛋白质 - 配体结合亲和力预测的几何深度学习
  • 作者: Chen, Li, Wang
  • 机构: 北京大学,DeepMind
  • 来源: arXiv q-bio.BM
  • 链接: https://arxiv.org/abs/2603.00135
  • 核心贡献: 提出 GeoBind,一种基于几何深度学习的蛋白质 - 配体结合亲和力预测模型。
  • 创新点: 引入等变图神经网络和物理约束,在 PDBbind 基准上达到 0.82 的 Pearson 相关系数。
🔗 论文链接
arXiv:2603.00140 材料发现中的生成式 AI 模型
  • 作者: Smith, Johnson, Williams
  • 机构: MIT, Harvard University
  • 来源: arXiv cs.AI
  • 链接: https://arxiv.org/abs/2603.00140
  • 核心贡献: 提出 MaterialGen,一种用于新材料发现的生成式 AI 模型。
  • 创新点: 结合扩散模型和物理约束,生成 1000+ 种稳定新材料候选,实验验证成功率 68%。

🔗 论文链接
arXiv:2603.00175 Self-Attention And Beyond the Infinite: 迈向具有无限自注意力的线性 Transformer
  • 作者: Giorgio Roffo
  • 机构: Toyota Motor Europe
  • 来源: arXiv cs.CV
  • 链接: https://arxiv.org/abs/2603.00175
  • 核心贡献: 提出 Infinite Self-Attention (InfSA),将注意力层视为内容自适应令牌图上的扩散步骤。
  • 创新点: Linear-InfSA 实现线性时间复杂度,在 4096×4096 分辨率稳定训练,9216×9216 推理无 OOM,ImageNet-1K 达 84.7% top-1。
🔗 论文链接
arXiv:2603.00180 具有结构对齐权重空间的宽度无关神经网络生成
  • 作者: Jiwoo Kim et al.
  • 机构: 韩国 KAIST
  • 来源: arXiv cs.LG
  • 链接: https://arxiv.org/abs/2603.00180
  • 核心贡献: 提出 Neural Network Diffusion Transformers (NNiTs),以宽度无关方式生成神经网络权重。
  • 创新点: 将权重矩阵分块化为令牌,结合图超网络和 CNN 解码器实现结构对齐,在 ManiSkill3 机器人任务上对未见架构达到>85% 成功率。

🔗 论文链接
← 返回首页