菜单

Research
- Research Index
- Demo
Blog
About
Career

Language

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

PoliCon: Evaluating LLMs on Achieving Diverse Political Consensus Objectives

Adaptive Preference Optimization with Uncertainty-aware Utility Anchor

Reinforced Query Reasoners for Reasoning-intensive Retrieval Tasks

Understanding and Leveraging the Expert Specialization of Context Faithfulness in Mixture-of-Experts LLMs

Enhancing LLM-Based Social Bot via an Adversarial Learning Framework

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

VideoLLaMB: Long-context Video Understanding with Recurrent Memory Bridges

How to Synthesize Text Data without Model Collapse?

Lossless Acceleration of Ultra Long Sequence Generation

文章分页

1 2 … 4 后一页 →

Copyright © 2023 BIGAI:Beijing Institute for General Artificial Intelligence

Facebook-f Twitter Google-plus-g Pinterest

Scroll to Top