3

Sampling from Your Language Model One Byte at a Time

Tokenization is used almost universally by modern language models, enabling efficient text representation using multi-byte or …

Jonathan Hayase, Alisa Liu, Noah A. Smith, Sewoong Oh

Tuning Language Models by Proxy

We develop an algorithm for “tuning” language models at decoding-time!

Alisa Liu, Xiaochuang Han, Yizhong Wang, Yulia Tsvetkov, Yejin Choi, Noah A. Smith