从人类认知到神经激活:探究大语言模型中空间推理的计算基元
From Human Cognition to Neural Activations: Probing the Computational Primitives of Spatial Reasoning in LLMs
Topic · 大模型后训练Relevance · 85
该研究通过分析人类认知机制与神经激活模式,探索大语言模型在空间推理任务中的计算基础,旨在揭示模型内部表征与推理过程的关联。
基于零空间压缩的无标签跨任务LoRA合并
Label-Free Cross-Task LoRA Merging with Null-Space Compression
Topic · 大模型后训练Relevance · 85
该论文提出一种无需标签的跨任务LoRA模型合并方法,通过零空间压缩技术实现不同任务间低秩适配器的有效融合,提升大模型在多任务场景下的泛化能力与部署效率。
偏好对齐的LoRA合并:保持子空间覆盖并解决方向各向异性
Preference-Aligned LoRA Merging: Preserving Subspace Coverage and Addressing Directional Anisotropy
Topic · 大模型后训练Relevance · 90
该论文提出一种新的LoRA模型合并方法,旨在在融合多个微调模型时保持原始子空间的覆盖范围,并解决参数方向上的各向异性问题,从而提升大模型在下游任务上的性能与泛化能力。
findsylls:一种语言无关的音节级语音标记化与嵌入工具包
findsylls: A Language-Agnostic Toolkit for Syllable-Level Speech Tokenization and Embedding
Topic · 其他Relevance · 60
该论文提出了一个名为 findsylls 的工具包,支持跨语言的语音音节级标记化与嵌入表示。
PhysVid:面向生成式视频模型的物理感知局部条件控制
PhysVid: Physics Aware Local Conditioning for Generative Video Models
Topic · 其他Relevance · 65
PhysVid 提出一种物理感知的局部条件控制方法,用于提升生成视频的物理合理性。该方法通过引入物理约束作为局部条件,引导视频生成过程更符合真实世界的物理规律,从而改善生成视频的动态一致性和真实感。
Knowdit:基于审计知识总结的自主智能体智能合约漏洞检测
Knowdit: Agentic Smart Contract Vulnerability Detection with Auditing Knowledge Summarization
Topic · AgentRelevance · 95PDF Deep Digest
本文提出了一种基于审计知识总结的代理式智能合约漏洞检测方法Knowdit。该方法通过构建审计知识图谱,将去中心化金融(DeFi)语义与漏洞模式关联,并利用多智能体框架进行迭代式规范生成、测试 harness 合成、模糊执行和结果反思。在包含12个项目和75个真实漏洞的数据集上,Knowdit成功检测出全部14个高危漏洞和77%的中危漏洞,仅产生2个误报,显著优于现有基线工具。在6个真实项目中进一步发现22个未知漏洞,验证了其高效性和实用性。
GeoGuide:面向开放词汇3D语义分割的分层几何引导方法
GeoGuide: Hierarchical Geometric Guidance for Open-Vocabulary 3D Semantic Segmentation
Topic · 其他Relevance · 70
本文提出GeoGuide,一种基于分层几何引导的开放词汇3D语义分割方法,通过结合多层次几何信息提升对未知类别的语义理解能力。
关于晚期交互动力学的分析:研究晚期交互模型的目标行为
Working Notes on Late Interaction Dynamics: Analyzing Targeted Behaviors of Late Interaction Models
Topic · 大模型底座Relevance · 85
本文探讨了晚期交互模型在特定任务中的行为模式,分析了其内部动力学机制,旨在提升模型在复杂交互场景下的表现。
ARTA:面向高效密集特征提取的自适应混合分辨率令牌分配
ARTA: Adaptive Mixed-Resolution Token Allocation for Efficient Dense Feature Extraction
Topic · 大模型底座Relevance · 85
本文提出了一种自适应混合分辨率令牌分配方法(ARTA),旨在提升密集特征提取的效率。通过动态调整不同区域的令牌分辨率,该方法在保持高精度的同时显著降低了计算开销,适用于大规模视觉基础模型。
以残障为中心的协作:三层人机协作框架
Channelling, Coordinating, Collaborating: A Three-Layer Framework for Disability-Centered Human-Agent Collaboration
Topic · AgentRelevance · 90PDF Deep Digest
该论文提出了一个三层框架——引导(Channelling)、协调(Coordinating)和共创(Co-Creating),用于重新构想人工智能在残障人士与能力多样人群协作中的角色。传统AI辅助工具多聚焦个体功能补偿,而此框架强调协作本身作为获取可访问性的基础设施,主张AI应支持信息共享、协调工作流程,并作为有边界的共创伙伴参与目标实现。框架基于能力多样协作理论、 grounding 理论和Carlile的3T知识边界模型,推动从‘独立使用’向‘三方协作’的设计范式转变,呼吁在HCI和可访问性研究中重视 interdependence 与 triadic collaboration。
濒危语言记录的自动语音识别:以池名方言为例
Automatic Speech Recognition for Documenting Endangered Languages: Case Study of Ikema Miyakoan
Topic · 其他Relevance · 60
该研究探讨了自动语音识别技术在记录濒危语言中的应用,以池名方言为案例,展示了技术如何辅助语言保存工作。
对话蒸馏:基于LLM的语音识别中对话音频上下文的抽象压缩
Distilling Conversations: Abstract Compression of Conversational Audio Context for LLM-based ASR
Topic · 大模型后训练Relevance · 85
该论文提出一种对话蒸馏方法,用于压缩对话音频上下文,以提升基于大语言模型(LLM)的自动语音识别(ASR)性能。
物理信息神经网络与序列编码器:在热冲压加热与早期冷却阶段的应用
Physics-Informed Neural Networks and Sequence Encoder: Application to heating and early cooling of thermo-stamping process
Topic · 其他Relevance · 60
该论文提出了一种结合物理信息神经网络(PINN)与序列编码器的混合模型,用于模拟热冲压过程中的加热与早期冷却阶段。模型通过嵌入物理方程约束提升预测精度,并利用序列编码器捕捉时间依赖性,适用于工业制造中的热过程建模。
自动化领域驱动设计:提示框架的经验
Automating Domain-Driven Design: Experience with a Prompting Framework
Topic · 其他Relevance · 60
本文探讨了一种基于提示框架的自动化领域驱动设计方法,通过结构化提示引导模型生成符合DDD原则的代码与架构设计,展示了在软件工程实践中提升设计一致性与效率的潜力。
利爪与危险:我们能否信任开放式智能体系统?
Clawed and Dangerous: Can We Trust Open Agentic Systems?
Topic · AgentRelevance · 95PDF Deep Digest
本文系统性地分析了开放代理系统(如OpenClaw)的安全挑战,指出其与传统软件在安全假设上的根本差异:计划生成是概率性的,执行环境不确定,且权限由用户委托。作者提出一个六维分析框架,涵盖生命周期阶段、信任边界、能力表面等维度,并综合50篇相关文献,揭示当前研究在攻击表征和基准测试方面较成熟,但在部署控制、操作治理、持久内存完整性和能力撤销方面存在显著空白。基于此,论文提炼出五层‘安全构建’参考原则,涵盖意图分离、策略中介、隔离执行、溯源审计和供应链治理,并呼吁建立更全面的平台工程评估体系。
迈向GUI智能体:用于GUI定位的视觉-语言扩散模型
Towards GUI Agents: Vision-Language Diffusion Models for GUI Grounding
Topic · GUI AgentRelevance · 95
该论文提出了一种基于视觉-语言扩散模型的方法,用于实现图形用户界面(GUI)的智能定位与交互,推动GUI智能体的发展。
稀疏自编码器与大语言模型的整体性
Sparse Auto-Encoders and Holism about Large Language Models
Topic · 大模型底座Relevance · 85
本文探讨稀疏自编码器在理解大语言模型内部表示中的作用,强调从整体性视角分析模型行为,揭示其潜在结构与知识编码机制。
一个技术对话的回响:对象网络研讨会的回顾
An Object Web Seminar: A Retrospective on a Technical Dialogue Still Reverbarating
Topic · 其他Relevance · 30
本文回顾了一场关于‘对象网络’(Object Web)的技术研讨会,探讨其在分布式系统、语义网和早期Web架构发展中的影响。尽管该概念未成为主流,但其思想在后续技术演进中持续产生回响。
MemCam:用于一致视频生成的记忆增强相机控制
MemCam: Memory-Augmented Camera Control for Consistent Video Generation
Topic · 记忆Relevance · 90
MemCam 提出了一种记忆增强的相机控制方法,用于提升视频生成的一致性。通过引入记忆机制,模型能够记住并复用先前帧中的相机参数和场景信息,从而在长视频生成中保持视角和运动的连贯性。
基于解剖先验的渐进式学习用于晚期钆增强MRI左心房瘢痕可靠分割
Progressive Learning with Anatomical Priors for Reliable Left Atrial Scar Segmentation from Late Gadolinium Enhancement MRI
Topic · 其他Relevance · 65
该论文提出一种结合解剖先验知识的渐进式学习方法,用于从晚期钆增强MRI中准确分割左心房瘢痕。通过引入解剖结构约束和分阶段训练策略,提升分割的可靠性与泛化能力。