auto-arxiv web

从人类认知到神经激活：探究大语言模型中空间推理的计算基元

From Human Cognition to Neural Activations: Probing the Computational Primitives of Spatial Reasoning in LLMs

Topic · 大模型后训练Relevance · 85

该研究通过分析人类认知机制与神经激活模式，探索大语言模型在空间推理任务中的计算基础，旨在揭示模型内部表征与推理过程的关联。

Chat

基于零空间压缩的无标签跨任务LoRA合并

Label-Free Cross-Task LoRA Merging with Null-Space Compression

Topic · 大模型后训练Relevance · 85

该论文提出一种无需标签的跨任务LoRA模型合并方法，通过零空间压缩技术实现不同任务间低秩适配器的有效融合，提升大模型在多任务场景下的泛化能力与部署效率。

Chat

偏好对齐的LoRA合并：保持子空间覆盖并解决方向各向异性

Preference-Aligned LoRA Merging: Preserving Subspace Coverage and Addressing Directional Anisotropy

Topic · 大模型后训练Relevance · 90

该论文提出一种新的LoRA模型合并方法，旨在在融合多个微调模型时保持原始子空间的覆盖范围，并解决参数方向上的各向异性问题，从而提升大模型在下游任务上的性能与泛化能力。

Chat

findsylls：一种语言无关的音节级语音标记化与嵌入工具包

findsylls: A Language-Agnostic Toolkit for Syllable-Level Speech Tokenization and Embedding

Topic · 其他Relevance · 60

该论文提出了一个名为 findsylls 的工具包，支持跨语言的语音音节级标记化与嵌入表示。

Chat

PhysVid：面向生成式视频模型的物理感知局部条件控制

PhysVid: Physics Aware Local Conditioning for Generative Video Models

Topic · 其他Relevance · 65

PhysVid 提出一种物理感知的局部条件控制方法，用于提升生成视频的物理合理性。该方法通过引入物理约束作为局部条件，引导视频生成过程更符合真实世界的物理规律，从而改善生成视频的动态一致性和真实感。

Chat

Knowdit：基于审计知识总结的自主智能体智能合约漏洞检测

Knowdit: Agentic Smart Contract Vulnerability Detection with Auditing Knowledge Summarization

Topic · AgentRelevance · 95PDF Deep Digest

本文提出了一种基于审计知识总结的代理式智能合约漏洞检测方法Knowdit。该方法通过构建审计知识图谱，将去中心化金融（DeFi）语义与漏洞模式关联，并利用多智能体框架进行迭代式规范生成、测试 harness 合成、模糊执行和结果反思。在包含12个项目和75个真实漏洞的数据集上，Knowdit成功检测出全部14个高危漏洞和77%的中危漏洞，仅产生2个误报，显著优于现有基线工具。在6个真实项目中进一步发现22个未知漏洞，验证了其高效性和实用性。

Chat

GeoGuide：面向开放词汇3D语义分割的分层几何引导方法

GeoGuide: Hierarchical Geometric Guidance for Open-Vocabulary 3D Semantic Segmentation

Topic · 其他Relevance · 70

本文提出GeoGuide，一种基于分层几何引导的开放词汇3D语义分割方法，通过结合多层次几何信息提升对未知类别的语义理解能力。

Chat

关于晚期交互动力学的分析：研究晚期交互模型的目标行为

Working Notes on Late Interaction Dynamics: Analyzing Targeted Behaviors of Late Interaction Models

Topic · 大模型底座Relevance · 85

本文探讨了晚期交互模型在特定任务中的行为模式，分析了其内部动力学机制，旨在提升模型在复杂交互场景下的表现。

Chat

ARTA：面向高效密集特征提取的自适应混合分辨率令牌分配

ARTA: Adaptive Mixed-Resolution Token Allocation for Efficient Dense Feature Extraction

Topic · 大模型底座Relevance · 85

本文提出了一种自适应混合分辨率令牌分配方法（ARTA），旨在提升密集特征提取的效率。通过动态调整不同区域的令牌分辨率，该方法在保持高精度的同时显著降低了计算开销，适用于大规模视觉基础模型。

Chat

以残障为中心的协作：三层人机协作框架

Channelling, Coordinating, Collaborating: A Three-Layer Framework for Disability-Centered Human-Agent Collaboration

Topic · AgentRelevance · 90PDF Deep Digest

该论文提出了一个三层框架——引导（Channelling）、协调（Coordinating）和共创（Co-Creating），用于重新构想人工智能在残障人士与能力多样人群协作中的角色。传统AI辅助工具多聚焦个体功能补偿，而此框架强调协作本身作为获取可访问性的基础设施，主张AI应支持信息共享、协调工作流程，并作为有边界的共创伙伴参与目标实现。框架基于能力多样协作理论、 grounding 理论和Carlile的3T知识边界模型，推动从‘独立使用’向‘三方协作’的设计范式转变，呼吁在HCI和可访问性研究中重视 interdependence 与 triadic collaboration。

Chat

濒危语言记录的自动语音识别：以池名方言为例

Automatic Speech Recognition for Documenting Endangered Languages: Case Study of Ikema Miyakoan

Topic · 其他Relevance · 60

该研究探讨了自动语音识别技术在记录濒危语言中的应用，以池名方言为案例，展示了技术如何辅助语言保存工作。

Chat

对话蒸馏：基于LLM的语音识别中对话音频上下文的抽象压缩

Distilling Conversations: Abstract Compression of Conversational Audio Context for LLM-based ASR

Topic · 大模型后训练Relevance · 85

该论文提出一种对话蒸馏方法，用于压缩对话音频上下文，以提升基于大语言模型（LLM）的自动语音识别（ASR）性能。

Chat

物理信息神经网络与序列编码器：在热冲压加热与早期冷却阶段的应用

Physics-Informed Neural Networks and Sequence Encoder: Application to heating and early cooling of thermo-stamping process

Topic · 其他Relevance · 60

该论文提出了一种结合物理信息神经网络（PINN）与序列编码器的混合模型，用于模拟热冲压过程中的加热与早期冷却阶段。模型通过嵌入物理方程约束提升预测精度，并利用序列编码器捕捉时间依赖性，适用于工业制造中的热过程建模。

Chat

自动化领域驱动设计：提示框架的经验

Automating Domain-Driven Design: Experience with a Prompting Framework

Topic · 其他Relevance · 60

本文探讨了一种基于提示框架的自动化领域驱动设计方法，通过结构化提示引导模型生成符合DDD原则的代码与架构设计，展示了在软件工程实践中提升设计一致性与效率的潜力。

Chat

利爪与危险：我们能否信任开放式智能体系统？

Clawed and Dangerous: Can We Trust Open Agentic Systems?

Topic · AgentRelevance · 95PDF Deep Digest

本文系统性地分析了开放代理系统（如OpenClaw）的安全挑战，指出其与传统软件在安全假设上的根本差异：计划生成是概率性的，执行环境不确定，且权限由用户委托。作者提出一个六维分析框架，涵盖生命周期阶段、信任边界、能力表面等维度，并综合50篇相关文献，揭示当前研究在攻击表征和基准测试方面较成熟，但在部署控制、操作治理、持久内存完整性和能力撤销方面存在显著空白。基于此，论文提炼出五层‘安全构建’参考原则，涵盖意图分离、策略中介、隔离执行、溯源审计和供应链治理，并呼吁建立更全面的平台工程评估体系。

Chat