The Research Desk.

The most upvoted and starred AI research crossing the community today.

Last Brew Time: Jun 24, 2026, 7:31 AM PT

X.com Research Buzz

Reinforcement Learning

Sakana Fugu — Multi-Agent System as a Model

X.com

45295

Sakana Fugu — Multi-Agent System as a Model

Sakana AI

AlphaXiv Trending

Reinforcement Learning

Tmax: A Simple Recipe for Terminal Agents

AlphaXiv

124

Tmax: A Simple Recipe for Terminal Agents

Hamish Ivison, Junjie Oscar Yin, Rulin Shao

AlphaXiv

Unlimited OCR Works

Youyang Yin, Huanhuan Liu, Qunyi Xie

AlphaXiv

World Action Models: A Survey

Qiuhong Shen, Shihua Zhang, Yue Liao

National University of Singapore

NLP

AlphaXiv

ParallelKernelBench: Can LLMs Write Fast Multi-GPU Kernels?

Willy Chan, Nathan Paek, Simon Guo

Stanford University, University of California, San Diego

Reinforcement Learning

AlphaXiv

Qwen-AgentWorld: Language World Models for General Agents

Yuxin Zuo, Zikai Xiao, Li Sheng

NLP

AlphaXiv

Tapered Language Models

Universite de Montreal, Reza Bayat, Ali Behrouz, Aaron Courville

Cornell University

HuggingFace Daily Papers

NLP

HuggingFace

LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis

Shihao Xu, Tiancheng Zhou, Jiatong Ma, Yanli Ding, Yiming Yan

Lyncia

Computer Vision

HuggingFace

Semantic Browsing: Controllable Diversity for Image Generation

Sara Dorfman, Maya Vishnevsky, Omer Dahary, Or Patashnik, Daniel Cohen-Or

Retrieval

HuggingFace

ChartWalker: Benchmarking the Cross-Chart RAG Task

Ning Tang, Chenghan Xie, Hanyang Yuan, Yi Li, Renhong Huang

Beijing Academy of Artificial Intelligence

Computer Vision

HuggingFace

EventVLA: Event-Driven Visual Evidence Memory for Long-Horizon Vision-Language-Action Policies

Ganlin Yang, Zhangzheng Tu, Yuqiang Yang, Sitong Mao, Junyi Dong

shanghai ailab

NLP

HuggingFace

QG-MIL: A Gated Transformer Aggregator for Domain-Agnostic Multiple Instance Learning in Medical Imaging

Luca Zedda, Davide Antonio Mura, Cecilia Di Ruberto, Maurizio Atzori, Muhammed Furkan Dasdelen

Reinforcement Learning

HuggingFace

AGORA: An Archive-Grounded Benchmark for Agentic Workplace Document Reasoning

Honglin Guo, Qi Zhang, Yu Zhang, Weijie Li, Rui Zheng