ArXiv Intelligence

Parallax: Parameterized Local Linear Attention for Language Modeling

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

CA-AC-MPC: CUDA-Accelerated Actor-Critic Model Predictive Control

Topic · 具身智能

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Unveiling Multi-regime Patterns in SciML: Distinct Failure Modes and Regime-specific Optimization

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Real-rootedness of the Poincaré polynomials of $\overline{\mathcal M}_{0,n}$: an AI-assisted proof

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

SafeRx-Agent: A Knowledge-Grounded Multi-Agent Framework for Safe and Explainable Medication Recommendation

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Toward User Preference Alignment in LLM Recommendation via Explicit Context Feedback

Topic · 大模型后训练

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Multi-Resolution End-to-End Deep Neural Network for Optimizing Latency-Accuracy Tradeoff in Autonomous Driving

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

When and How Long? The Readout-Mediator Angle in Temporal Reasoning

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

A Minimal Bifurcation Model of Load Imbalance in a Softmax Mixture-of-Experts Router

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

unix-ctf: Procedural Environments for Unix-Competence Reinforcement Learning

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

GEO-Bench: Benchmarking Ranking Manipulation in Generative Engine Optimization

Topic · 具身智能

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

OISD: On-Policy Internal Self-Distillation of Language Models

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Same Question, Different Source, Different Answer: Auditing Source-Dependence in Medical Multi-Source RAG

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Structured Prompt Optimization Meets Reinforcement Learning for Global and Local Interpretability over Complex Text

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

SCDBench: A Benchmark for LLM-Based Smart Contract Decompilers

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Return-to-Go Is More Than a Number: Q-Guided Alignment for Return-Conditioned Supervised Learning

Topic · 大模型后训练

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Label-Free Reinforcement Learning via Cross-Model Entropy

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

LoRe: Adaptive Interaction-Evaluation Routing with Per-Step Interaction Budgets for Iterative Graph Solvers

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

FormInv: A Measurement Protocol for Semantic Invariance in Mathematical Reasoning Benchmarks

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Measuring Real-World Prompt Injection Attacks in LLM-based Resume Screening

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

2026-05-29 · 354 篇

Parallax: Parameterized Local Linear Attention for Language Modeling

CA-AC-MPC: CUDA-Accelerated Actor-Critic Model Predictive Control

Unveiling Multi-regime Patterns in SciML: Distinct Failure Modes and Regime-specific Optimization

Real-rootedness of the Poincaré polynomials of $\overline{\mathcal M}_{0,n}$: an AI-assisted proof

SafeRx-Agent: A Knowledge-Grounded Multi-Agent Framework for Safe and Explainable Medication Recommendation

Toward User Preference Alignment in LLM Recommendation via Explicit Context Feedback

Multi-Resolution End-to-End Deep Neural Network for Optimizing Latency-Accuracy Tradeoff in Autonomous Driving

When and How Long? The Readout-Mediator Angle in Temporal Reasoning

A Minimal Bifurcation Model of Load Imbalance in a Softmax Mixture-of-Experts Router

unix-ctf: Procedural Environments for Unix-Competence Reinforcement Learning

GEO-Bench: Benchmarking Ranking Manipulation in Generative Engine Optimization

OISD: On-Policy Internal Self-Distillation of Language Models

Same Question, Different Source, Different Answer: Auditing Source-Dependence in Medical Multi-Source RAG

Structured Prompt Optimization Meets Reinforcement Learning for Global and Local Interpretability over Complex Text

SCDBench: A Benchmark for LLM-Based Smart Contract Decompilers

Return-to-Go Is More Than a Number: Q-Guided Alignment for Return-Conditioned Supervised Learning

Label-Free Reinforcement Learning via Cross-Model Entropy

LoRe: Adaptive Interaction-Evaluation Routing with Per-Step Interaction Budgets for Iterative Graph Solvers

FormInv: A Measurement Protocol for Semantic Invariance in Mathematical Reasoning Benchmarks

Measuring Real-World Prompt Injection Attacks in LLM-based Resume Screening