只有27亿参数,性能却高25倍!微软发布Phi-2_全球资讯热分享网(专注热点收集平台)

只有27亿参数,性能却高25倍!微软发布Phi-2


只有27亿参数,性能却高25倍!微软发布Phi-2

  2023-12-17 20:25:25     简体|繁體
http://refenxiang.com/1019953.html

原文来源:AIGC开放社区

图片来源:由无界 AI生成

12月13日,微软在官方网站正式发布了,27亿参数的大语言模型—Phi-2。

Phi-2是基于微软的Phi-1.5开发而成,可自动生成文本/代码、总结文本、数学推理等功能。

虽然Phi-2的参数很小,性能却优于130亿参数的Llama-2和70亿参数的Mistral,以及谷歌最新发布的Gemini Nano 2。

值得一提的是,Phi-2没有进行过RLHF(人类反馈强化学习)和指令微调只是一个基础模型,但在多个任务评测中,其性能可以媲美或超过25倍参数的模型。

目前,微软已经开源了Phi-1.5和Phi-1,帮助开发者们深度研究和应用小参数模型。

Phi-1.5开源地址:https://huggingface.co/microsoft/phi-1_5‌

Phi-1开源地址:https://huggingface.co/microsoft/phi-1‌

Phi-1.5论文地址:https://arxiv.org/abs/2309.05463‌

目前,大模型界有一个很怪的现象,就是出的模型参数越来越大,几百亿参数只能算刚入门,上千亿的比比皆是,有的模型甚至已经达到上万亿。

参数高的模型并非不好,而是要看应用场景。对于像微软、OpenAI、百度、科大讯飞这样的基础模型服务商来说,参数越高覆盖能力就越广,例如,ChatGPT已经进化到多模态,除了生成文本,还能生成图片听懂声音等。

Phi-2评测数据

但参数高的模型同样也有很多缺点:过拟合,如果训练数据较差会出现能力不升反降的现象;算力成本巨大,用户每一次的提问都像是在“燃烧金钱”;预训练时间长,每一次模型的迭代需要耗费大量训练时间。

调优困难,高参数的模型拥有庞大且难控制的神经元,想进行部分功能调优和控制非常困难,最近变懒的GPT-4便是最好的案例。

所以,微软开发Phi系列模型的主要目的是研究,小参数模型如何在保证功能的前提下,也能与大参数的模型相媲美甚至超越,这对于企业和应用者来说是一个双赢的局面。

Phi-2简单介绍

Phi-2和Phi-1.5一样采用了24层的Transformer架构,每个头的维度为64,并使用了旋转嵌入等技术来提升模型性能。

Phi-2只是一个基础模型,没有进行过人类反馈强化学习和指令微调。但在文本生成、数学推理、代码编程方面丝毫不比大参数的模型差,甚至比他们更好。

训练数据和流程方面,Phi-2使用了1.4T超高质量的“教科书级”数据进行了预训练,并非是网络爬取的杂乱、黑箱数据。微软表示,这也是小参数模型比大参数模型性能高的关键原因之一。

Phi-2 在 96 个 A100 GPU上一共训练了14天。

Phi-2实验数据

微软在MMLU、BBH、PIQA、WinoGrande、ARC easy、Challenge、SIQA和GSM8k等主流测试平台对Phi-2进行了测试。

数据显示,在各种聚合基准上的测试超过了,Mistral -7B和Llama-2-13B。

值得一提的是,在多步推理测试任务中,例如,编码和数学,Phi-2的性能超过了700亿参数的Llama-2。



编辑:web3528btc 来源:加密钱包代币

分享到:

  • 上一篇
    下一篇

  • 分享知识|收获智慧

    全球资讯热分享网(专注热点收集平台)
    手机查看(二维码扫一扫)

    全球资讯热分享网,最有影响力热点信息分类网站,主要集合图文、知识、日常、娱乐、财经、文化、生活、致富、女性、地区、科技等多类信息分享交流,免费提供最有价值的头条信息平台。
    « 2024年 » « 05月 »
    12345
    6789101112
    13141516171819
    20212223242526
    2728293031

    最新资讯

    [开户]:各种媒体代播 真人直播 价格合理 可长期 推流直播
  • 2024-05-17 13:25:21

     

    [代运营]百度(baidu)大搜、信息流、健康商城
  • 2024-05-17 13:19:16

     

    [开户]支付宝全行业收量对公25+ 对公25+
  • 2024-05-17 13:13:12

     

    富德生命鑫禧年年尊享版年金保险怎么买?如何购买最划算?
  • 2024-05-17 13:07:07

     

    [代运营]快手一代高点收量:逾期,债务,中医养生,祛斑祛痘,手机租赁,运势测算,教育,家装
  • 2024-05-17 13:01:02

     

    [开户]全国企业贷。xyk。婚恋。兼职(有户可跑)
  • 2024-05-17 12:54:57

     

    [代运营]各媒体贷款户, 抖音.百度(baidu).腾讯.快手.政策好成本稳定.可全国
  • 2024-05-17 12:48:52

     

    [开户]快手全行业高返点欢迎二代来咨询 稳定不割 新开2开头
  • 2024-05-17 12:42:48

     

    [代运营] 百度(baidu)小病种二跳 放户代运营,有小病种二跳解析资质,需要的可联系。
  • 2024-05-17 12:36:43

     

    [代运营]抖音综合律师 债务逾期 口腔 专业代运营 成本低 质量优 欢迎各位老板们加我
  • 2024-05-17 12:30:38

     

    [代运营]搜索竞价信息流广告/短视频广告投放运营推广,精准投放、按效果付费!助力企业获客盈利
  • 2024-05-17 12:24:33

     

    [代运营]百度(baidu)招商加盟 工具类app 跨境电商行业代运营 可对公开票!
  • 2024-05-17 12:18:28

     

    映月小说全文 云映月无删减无弹窗阅读
  • 2024-05-17 12:12:24

     

    女儿死时,丈夫还在直播捞金小说全集免费阅读 叶灵王彦峰结局免费看
  • 2024-05-17 12:06:19

     

    许墨染顾怀景是什么小说 许墨染顾怀景全本免费阅读
  • 2024-05-17 12:00:14