NEE's Blog

使用 PPO 进行语言模型的树搜索蒸馏

15 Mar 2026

探讨如何将 AlphaZero 风格的蒙特卡洛树搜索(MCTS)应用于语言模型推理,通过 PPO 在线强化学习进行知识蒸馏,在 Countdown 组合数学任务上取得了优于 GRPO 的效果。

Han:一门用韩语关键词编程的编译型语言

14 Mar 2026

Han 是一门静态类型的编译型编程语言,所有关键词都使用韩语书写。它通过 LLVM IR 编译为原生二进制文件,使用 Rust 完全重写,让编程不再局限于英语世界。

是时候把文档放进代码仓库了

14 Mar 2026

在 AI 时代,将文档与代码放在一起管理变得前所未有的重要。本文探讨为什么应该把文档移入代码仓库,以及 AI 如何改变文档管理的游戏规则。

bzip:被遗忘的压缩算法之光

14 Mar 2026

一篇深入探讨 bzip 压缩算法的文章,解释了为什么基于 BWT 的 bzip 在压缩文本和代码方面依然具有独特优势,以及它与现代 LZ77 系算法的本质区别。