性能优于GPT4-V,华为、港大开源几何数学模型G-LLaVA_全球资讯热分享网(专注热点收集平台)

性能优于GPT4-V,华为、港大开源几何数学模型G-LLaVA


性能优于GPT4-V,华为、港大开源几何数学模型G-LLaVA

  2024-01-06 09:26:01     简体|繁體
http://refenxiang.com/1032322.html

原文来源:AIGC开放社区

图片来源:由无界 AI生成

大型语言模型在内容生成、逻辑推理等方面展示了强大的能力,但在处理专业几何数学难题时效果不佳。

这是因为,与文本数学题相比,几何空间数学题对模型的视觉理解和逻辑思维能力更高要求。目前,多模态大语言模型仍无法准确解析几何图形中的基本要素及其关系。

为了解决这一难题,华为诺亚方舟实验室、香港大学、香港科技大学联合开源了专业几何数学模型G-LLaVA。

为了测试G-LLaVA的性能,研究人员在知名数学测试平台 MathVista上,与其他大模型进行了深度评估。结果显示,G-LLaVA的性能超过了GPT-4-V、LLaVA1.5、MiniGPT-4等模型。

开源地址:https://github.com/pipilurj/G-LLaVA‌

论文地址:https://arxiv.org/abs/2312.11370‌


整体架构


G-LLaVA的整体架构主要包含大语言模型、图像编码器和投影层三大模块。

1)大语言模型使用的是LlAMA模型,用于理解和生成文字序列。相比通用模型,G-LLaVA的语言模型通过几何数据获得了数学和视觉领域的适配。

2)图像编码器利用预训练的视觉ViT等,进行特征提取和图像理解,可将输入的几何图像和问题转化为向量表示并生成答案。

3)投影层是一个线性层,作用是将图像编码器输出的视觉特征投影和映射到语言模型的嵌入空间中。这实现了不同模态特征的对齐融合,让大语言模型可以识别几何图像的关键所在。


训练方法


G-LLaVA使用的是双阶段渐进式训练方法:几何视觉语言对齐,这一阶段专注于增强模型对几何图像的理解,令其准确解释几何图形基本要素。

构建的对齐数据集包含图像描述和判断对比问答。只优化投影层参数进行对齐训练。

几何指令调优,在调整阶段,利用变量建模、数据增强等策略生成大规模几何问题解答数据。通过解题过程的复现,提高G-LLaVA的数学建模建、关系、符号推理的能力。调优后的模型可接收几何图像和自然文本提示并输出内容。

构建Geo170K数据集

G-LLaVA能具备强大的几何理解能力,这个Geo170K数据集是关键。

Geo170K的数据来源包括多个已有的开源几何QA数据集,例如,Geometry3K、GeoQA和GeoQA+。

这些数据集提供了丰富的几何图像样例和部分注释, Geo170K的总规模超过17万条。

包含约6万张几何图像及匹配描述,和11万多个问题-解答语言配对。这远超过此前最大的图形问答集GeoQA+。数据分布覆盖了基本几何要素的判定、定量关系的符号推理等多个方面。

为了评估G-LLaVA的性能,研究人员在MathVista等测试平台进行了一系列实验,与其他现有的知名大语言模型进行了比较。

实验结果显示,G-LLaVA与GPT-4-V和其他MLLMs相比,G-LLaVA的性能超过了GPT-4-V、LLaVA1.5、MiniGPT-4等模型。显著提高了几何难题的解决准确率和效率。

这表明通过引入对齐的多模态数据集,可以有效地提升大语言模型在处理几何问题时的能力。

此外,研究人员还对G-LLaVA模型进行了进一步的分析,以探索其在各个几何问题类型上的性能差异。

实验结果显示,G-LLaVA模型在处理点、线、角等基本几何元素的问题时表现仍然出色。



编辑:web3528btc 来源:加密钱包代币

分享到:

  • 上一篇
    下一篇

  • 分享知识|收获智慧

    全球资讯热分享网(专注热点收集平台)
    手机查看(二维码扫一扫)

    全球资讯热分享网,最有影响力热点信息分类网站,主要集合图文、知识、日常、娱乐、财经、文化、生活、致富、女性、地区、科技等多类信息分享交流,免费提供最有价值的头条信息平台。
    « 2025年 » « 08月 »
    123
    45678910
    11121314151617
    18192021222324
    25262728293031

    最新资讯

    [代运营]磷虾油/石斛原浆/海参/驼奶/血糖,高投产,打回0.8+,稳定输出中,来私
  • 2025-08-22 02:15:57

     

    [代运营]百度(baidu)直播量,不限行业,可cpa,可cpc
  • 2025-08-22 02:07:51

     

    [代运营]视频号ADQ代运营,广点通K6,千川,金牛代运营
  • 2025-08-22 02:00:05

     

    [代运营]腾讯朋友圈广告全行业都能做 微信广告推广加白 全行业包过审 免保证金
  • 2025-08-22 01:52:02

     

    [代运营]千川白牌1.5 品牌2.5 稳定到年底
  • 2025-08-22 01:43:53

     

    [代运营]出手一个停息挂账、逾期的百度(baidu)信息流的账户,日产100条,几十条也可以出。甲方换项目了
  • 2025-08-22 01:35:47

     

    [代运营]腾讯房产授权给后台
  • 2025-08-22 01:27:41

     

    [代运营]三品一械29 43 电商对公56
  • 2025-08-22 01:19:34

     

    [代运营]美妆个护订单粉
  • 2025-08-22 01:11:28

     

    [代运营]个债加粉
  • 2025-08-22 01:03:22

     

    [代运营]电销股票粉,寻绿色甲方,有录音,量级稳定
  • 2025-08-22 00:55:16

     

    [代运营]:B站媒体全行业开户代运营,高返点、大健康、医药保健、减肥祛痘、生发植发
  • 2025-08-22 00:47:10

     

    [代运营]朋友圈全行业投放,不卡资质,无需保证金,不卡资质
  • 2025-08-22 00:39:04

     

    [代运营]品专24 现金点千川公3快手cid8本地推新客40+ad信息流7红书聚光20
  • 2025-08-22 00:30:57

     

    [代运营]朋友圈广告圈加白渠道,全行业现户,禁投行业均可,专接疑难杂症
  • 2025-08-22 00:22:51