ArXiv Intelligence

How LoRA Remembers? A Parametric Memory Law for LLM Finetuning

Topic · 记忆

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Same Evidence, Different Answers: Canonical-Context On-Policy Distillation for Multi-Turn Language Models

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Reinforcement Learning with Robust Rubric Rewards

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Do Language Models Track Entities Across State Changes?

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Beyond 3D VQAs: Injecting 3D Spatial Priors into Vision-Language Models for Enhanced Geometric Reasoning

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Unifying Temporal and Structural Credit Assignment in LLM-Based Multi-Agent Prompt Optimization

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

BORA: Bridging Offline Reinforcement Learning and Online Residual Adaptation for Real-World Dexterous VLA Models

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Automating Low-Risk Code Review at Meta: RADAR, Risk Calibration, and Review Efficiency

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

HPO: Hysteretic Policy Optimization for Stable and Efficient Training under Sparse-Reward Regime

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

What drives performance in molecular MPNNs? An operator-level factorial benchmark

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Token-Level Generalization in LoRA Adapter Backdoors: Attack Characterization and Behavioral Detection

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

CalArena: A Large-Scale Post-Hoc Calibration Benchmark

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

iLoRA: Bayesian Low-Rank Adaptation with Latent Interaction Graphs for Microbiome Diagnosis

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

On Distributional Reinforcement Learning in Chaotic Dynamical Systems

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Neural Network Verification using Partial Multi-Neuron Relaxation

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Do Proactive Agents Really Need an LLM to Decide When to Wake and What to Anchor?

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Overcoming Forgetting in LLM Fine-Tuning with Evolution Strategies

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

DAMEL: Dual-Axis Multi-Expert Learning for Class-Imbalanced Learning

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

PARCEL: Pool-Anchored Resampling with Conditioned Elastic Queries for Efficient Vision-Language Understanding

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

2026-05-29 · 354 篇

How LoRA Remembers? A Parametric Memory Law for LLM Finetuning

Same Evidence, Different Answers: Canonical-Context On-Policy Distillation for Multi-Turn Language Models

Reinforcement Learning with Robust Rubric Rewards

Do Language Models Track Entities Across State Changes?

Beyond 3D VQAs: Injecting 3D Spatial Priors into Vision-Language Models for Enhanced Geometric Reasoning

Unifying Temporal and Structural Credit Assignment in LLM-Based Multi-Agent Prompt Optimization

BORA: Bridging Offline Reinforcement Learning and Online Residual Adaptation for Real-World Dexterous VLA Models

Automating Low-Risk Code Review at Meta: RADAR, Risk Calibration, and Review Efficiency

HPO: Hysteretic Policy Optimization for Stable and Efficient Training under Sparse-Reward Regime

What drives performance in molecular MPNNs? An operator-level factorial benchmark

Token-Level Generalization in LoRA Adapter Backdoors: Attack Characterization and Behavioral Detection

CalArena: A Large-Scale Post-Hoc Calibration Benchmark

iLoRA: Bayesian Low-Rank Adaptation with Latent Interaction Graphs for Microbiome Diagnosis

Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

On Distributional Reinforcement Learning in Chaotic Dynamical Systems

Neural Network Verification using Partial Multi-Neuron Relaxation

Do Proactive Agents Really Need an LLM to Decide When to Wake and What to Anchor?

Overcoming Forgetting in LLM Fine-Tuning with Evolution Strategies

DAMEL: Dual-Axis Multi-Expert Learning for Class-Imbalanced Learning

PARCEL: Pool-Anchored Resampling with Conditioned Elastic Queries for Efficient Vision-Language Understanding