ArXiv Intelligence

Do Physics Foundation Models Learn Generalizable Physics? A Bias-Aware Benchmark Across Physical Regimes and Distribution Shifts

Topic · 大模型底座

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

LoopFM: Learning frOm HistOrical RePresentations of Foundation Model for Recommendation

Topic · 大模型底座

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Code-QA-Bench: Separating Code Reasoning from Documentation Memorization in Repository-Level QA

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Causal Label Recovery in Payment Networks

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Compute Allocation in Evolutionary Search: From Depth-Breadth to Multi-Armed Bandits

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

KLAS: Using Similarity to Stitch Neural Networks for Improved Accuracy-Efficiency Tradeoffs

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

DynSess: Dynamic Session-Level Evaluation and Optimization Framework for Role-Playing Agents

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Extreme dynamic symmetry enables omnidirectional and multifunctional robots

Topic · 具身智能

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Wait! There's a Way Out: A Decision Mechanism for Forecasting Conversational Derailment

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Toward Ethical Facial Age Estimation: A Generalized Zero-Shot Benchmark Without Training on Children's Data

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Stochastic Lifting for Generating Trajectories of Stochastic Physical Systems

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Sustainable Metal-Organic Framework Water Harvesters in the Artificial Intelligence Era

Topic · 机器学习框架

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

UA-Legal-Bench: A Benchmark for Evaluating Large Language Models on Ukrainian Legal Reasoning

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Domain-Informed Representation for Evolutionary Sieving in Integral and Module Lattices

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Evolutionary Refinement of Generative Graph Topologies: A Hybrid WGAN-GA Approach

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

2026-05-29 · 354 篇

Do Physics Foundation Models Learn Generalizable Physics? A Bias-Aware Benchmark Across Physical Regimes and Distribution Shifts

LoopFM: Learning frOm HistOrical RePresentations of Foundation Model for Recommendation

Code-QA-Bench: Separating Code Reasoning from Documentation Memorization in Repository-Level QA

Causal Label Recovery in Payment Networks

Compute Allocation in Evolutionary Search: From Depth-Breadth to Multi-Armed Bandits

KLAS: Using Similarity to Stitch Neural Networks for Improved Accuracy-Efficiency Tradeoffs

DynSess: Dynamic Session-Level Evaluation and Optimization Framework for Role-Playing Agents

Extreme dynamic symmetry enables omnidirectional and multifunctional robots

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

Wait! There's a Way Out: A Decision Mechanism for Forecasting Conversational Derailment

BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference

Toward Ethical Facial Age Estimation: A Generalized Zero-Shot Benchmark Without Training on Children's Data

Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents

Stochastic Lifting for Generating Trajectories of Stochastic Physical Systems

Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback

TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints

Sustainable Metal-Organic Framework Water Harvesters in the Artificial Intelligence Era

UA-Legal-Bench: A Benchmark for Evaluating Large Language Models on Ukrainian Legal Reasoning

Domain-Informed Representation for Evolutionary Sieving in Integral and Module Lattices

Evolutionary Refinement of Generative Graph Topologies: A Hybrid WGAN-GA Approach