在 Hacker News 的「Microsoft Phi-2 model changes licence to MIT (huggingface.co)」這邊看到的消息,連結是改成 MIT License 的 commit:「Upload 3 files · microsoft/phi-2 at 7e10f3e」。
看了一下 model 的參數是 2.7B,宣稱在 13B 以下 model 中是前段班:
Phi-2 showcased a nearly state-of-the-art performance among models with less than 13 billion parameters.
再回頭查一下這段宣稱的時間,當初發表的時間是 2023/12/12:「Phi-2: The surprising power of small language models」。
應該是希望在行動裝置上用更少的運算量達到效果...
另外找了一下 GGUF 格式,看起來 TheBloke/phi-2-GGUF 這邊已經有轉好的了,可以直接上 llama.cpp 跑。