GitHub
前微软亚洲研究院院长、创投家李开复创立的AI新创公司零一万物(01.AI),本周宣布开发大型语言模型Yi-6B及34B并将之开源出来。
李开复旗下的私募基金创新工场於今年3月,成立开发生成式AI包括大型语言模型(LLM)及聊天机器人的新创公司零一万物(01.AI),如同中国版的OpenAI,他本人则兼任这家公司的执行长。在成立8个月後,李开复在与彭博的访谈中公布名为Yi的首个LLM,包含60亿及340亿参数训练的2个版本 。这个模型已透过GitHub开源给社群。
李开复并指出,零一万物获得阿里巴巴控股及其他几家金主的资金後,目前市值已突破10亿美元。
根据零一万物在Hugging Face的介绍,Yi是一组LLM,为上下文长度200K的基础模型。它的特色之一是双语(中/英文)模型。此外,虽然比起其他开源模型小得多,但根据Hugging Face列出的标竿测试,Yi-34B效能在数个指标例如在常识推理、阅读理解及数学&编程测试中,效能比阿拉伯联合大公国的Falcon-180B和Meta的Llama2-70B等大型模型还好。MMLU、CMMLU、C-Eval等测试中,也都拿下第一名位子。
这家业者目标市场不只是中国,也放眼全球。李开复说Meta Llama 2是开原码社群的黄金标准,而Yi模型想提供另一选项。零一万物预计12个月、18个月将再公告1,000亿到4,000亿参数的LLM。