The Research Desk.

The most upvoted and starred AI research crossing the community today.

Last Updated: Mar 14, 2026, 11:55 AM PT

X.com Research Buzz

Natural Emergent Misalignment from Reward Hacking in Production RL

X.com

19523

Natural Emergent Misalignment from Reward Hacking in Production RL

Monte MacDiarmid, Benjamin Wright, Jonathan Uesato +19 more

#reinforcement-learning#safety-alignment

AlphaXiv Trending

OpenClaw-RL: Train Any Agent Simply by Talking

AlphaXiv

194

OpenClaw-RL: Train Any Agent Simply by Talking

Yinjie Wang, Xuyang Chen, Xiaolong Jin

#reinforcement-learning#alphaxiv

AlphaXiv

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

Changyao Tian, Danni Yang, Guanzhou Chen

#reasoning#multimodal#alphaxiv

AlphaXiv

How Far Can Unsupervised RLVR Scale LLM Training?

Bingxiang He, Yuxin Zuo, Zeyuan Liu

#machine-learning#nlp#alphaxiv

AlphaXiv

Thinking to Recall: How Reasoning Unlocks Parametric Knowledge in LLMs

Zorik Gekhman, Roee Aharoni, Eran Ofek

#nlp#reasoning#alphaxiv

AlphaXiv

Lost in Backpropagation: The LM Head is a Gradient Bottleneck

Nathan Godey, Yoav Artzi

#alphaxiv

AlphaXiv

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

Yulu Gan, Phillip Isola

#alphaxiv

HuggingFace Daily Papers

HuggingFace

CREATE: Testing LLMs for Associative Creativity

Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman +2 more

#nlp#ManyaWadhwa

HuggingFace

RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning

Tzu-Heng Huang, Sirajul Salekin, Javier Movellan +2 more

#computer-vision#reinforcement-learning

HuggingFace

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

Teng Xiao, Yige Yuan, Hamish Ivison +2 more

#reinforcement-learning#retrieval

HuggingFace

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

Yulu Gan, Phillip Isola

#sunrainyg

HuggingFace

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss +1 more

#reasoning#Shahriarnz14

HuggingFace

WaDi: Weight Direction-aware Distillation for One-step Image Synthesis

Lei Wang, Yang Cheng, Senmao Li +2 more

#computer-vision#efficiency#gudaochangsheng