ArXiv Intelligence

Physics Is All You Need? A Case Study in Physicist-Supervised AI Development of Scientific Software

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

SchGen: PCB Schematic Generation with Semantic-Grounded Code Representations

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Tiny but Trusted: Efficient Vision-Language Reasoning for Time-Series Anomaly Detection

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Demystifying Data Organization for Enhanced LLM Training

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

ProjectionBench: Evaluating Scientific Hypothesis Generation in LLMs Under Progressive Information Disclosure

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

mcp-proto-okn: Natural-language access to open scientific knowledge graphs through the Model Context Protocol

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

When Should Models Change Their Minds? Contextual Belief Management in Large Language Models

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Double-Edged Sword or Sharp Tool? Designing and Evaluating Triadic LLM-Teacher Collaboration for K-12 Writing at Scale

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Modularizing Educational LLM-Agency for Fostering Responsible Learning Assistance

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

BioRefusalAudit: Auditing Biosecurity Refusal Depth Using General and Domain-Fine-Tuned Sparse Autoencoders

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Temporal Stability and Few-Shot Prompting in Math Task Assessment

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Anchorless Diversification for Parallel LLM Ideation

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

AgentSchool: An LLM-Powered Multi-Agent Simulation for Education

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Enhancing Multi-Agent Communication through Attention Steering with Context Relevance

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

VLA-Trace: Diagnosing Vision-Language-Action Models through Representation and Behavior Tracing

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

PokerSkill: LLMs Can Play Expert-Level Poker without Training or Solvers

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

2026-05-29 · 354 篇

Physics Is All You Need? A Case Study in Physicist-Supervised AI Development of Scientific Software

SchGen: PCB Schematic Generation with Semantic-Grounded Code Representations

Tiny but Trusted: Efficient Vision-Language Reasoning for Time-Series Anomaly Detection

Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents

Demystifying Data Organization for Enhanced LLM Training

MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection

ProjectionBench: Evaluating Scientific Hypothesis Generation in LLMs Under Progressive Information Disclosure

mcp-proto-okn: Natural-language access to open scientific knowledge graphs through the Model Context Protocol

When Should Models Change Their Minds? Contextual Belief Management in Large Language Models

Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit

Double-Edged Sword or Sharp Tool? Designing and Evaluating Triadic LLM-Teacher Collaboration for K-12 Writing at Scale

Modularizing Educational LLM-Agency for Fostering Responsible Learning Assistance

BioRefusalAudit: Auditing Biosecurity Refusal Depth Using General and Domain-Fine-Tuned Sparse Autoencoders

Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents

Temporal Stability and Few-Shot Prompting in Math Task Assessment

Anchorless Diversification for Parallel LLM Ideation

AgentSchool: An LLM-Powered Multi-Agent Simulation for Education

Enhancing Multi-Agent Communication through Attention Steering with Context Relevance

VLA-Trace: Diagnosing Vision-Language-Action Models through Representation and Behavior Tracing

PokerSkill: LLMs Can Play Expert-Level Poker without Training or Solvers